博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
不用一行代码,就写了个爬虫!这款谷歌插件已经打包好了!
阅读量:4094 次
发布时间:2019-05-25

本文共 854 字,大约阅读时间需要 2 分钟。

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!

前言

前几天发现了一个比较有用的谷歌插件,大家看标题也许已经知道它有啥用了。下面给大家介绍一下这款插件的用法,文末也提供了下载链接。

使用

首先简单介绍一下是个啥插件:

如图所示

确保安装成功插件后,我们就可以愉快的玩耍了。

第一步,打开熟悉的开发者工具。

可以看到,最右边多了一个 Web Scraper 的选项栏。

找到地方后,我们找个网站来爬爬。

我这里找的是菜鸟笔记的网站,地址扔给大家,大家可以先拿它练练手。

https://www.runoob.com/w3cnote

接下来怎么做呢?

点击Create Sitemap创建一个项目。

填写相关信息,在开始url那个框里,可能大家注意到后面加了个[1-10:1]这代表着我要爬取前十页的数据。这里也是对url进行了一个简单的分析。

创建完成,增加一个选择器。

由于,我这里只是简单的给大家操作一下怎么爬取,所以我这里就爬取前十篇文章中的标题,插件了也有很多的爬取方式,大家可以试一试。

首先我们锁定外面的红框

大家按照我的图片上操作,选择自己要爬取的元素。

保存之后

点击id,进行下一步选定爬取元素。

选定标题后,记得选择父节点,保存。

完事之后,我们就可以愉快的运行了!

点击爬取。等待它自动爬取。

过一小会就可以看到数据了,数据支持导出!

总结

这个插件对于一些简单的静态爬虫还是处理的很不错的。不用写一行代码,可以节省我们的时间,直接点几下鼠标就能写个简单的爬虫,所以推荐给大家。

获取方式

① 可以去谷歌拓展程序商城下载

② 我也给大家打包好了,直接在公众号后台发送爬虫即可领取。

推荐阅读:这款超级搜索神器,我爱了!太赞了,《深入浅出 Java 多线程》书籍正式开源!没用过这些 IDEA 插件?怪不得你写代码头疼...连苹果都在用的开源库:core-js 作者被判入狱 18 个月!天秀!GitHub 硬核项目:动漫生成器让照片秒变手绘日漫风!!!

转载地址:http://azvii.baihongyu.com/

你可能感兴趣的文章
处理大并发之二 对epoll的理解,epoll客户端服务端代码
查看>>
一个简单的linux线程池
查看>>
基于epoll的简单的http服务器
查看>>
Linux C++ 实现线程池
查看>>
c,c++中字符串处理函数strtok,strstr,strchr,strsub
查看>>
链表逆序的原理及实例
查看>>
strtok函数及其实现
查看>>
Linux网络编程“惊群”问题总结
查看>>
yfan.qiu linux硬链接与软链接
查看>>
Linux C++线程池实例
查看>>
shared_ptr简介以及常见问题
查看>>
【C++11新特性】 C++11智能指针之weak_ptr
查看>>
【C++11新特性】 C++11智能指针之unique_ptr
查看>>
【C++11新特性】 C++11智能指针之shared_ptr
查看>>
C++ — 智能指针的简单实现以及循环引用问题
查看>>
C++开发者都应该使用的10个C++11特性
查看>>
c++11 你需要知道这些就够了
查看>>
c++11 你需要知道这些就够了
查看>>
shared_ptr的一些尴尬
查看>>
C++总结8——shared_ptr和weak_ptr智能指针
查看>>