时间:2021-05-26
1.前言分析
往常都是利用 Python/.NET 语言实现爬虫,然现在作为一名前端开发人员,自然需要熟练 NodeJS。下面利用 NodeJS 语言实现一个糗事百科的爬虫。另外,本文使用的部分代码是 es6 语法。
实现该爬虫所需要的依赖库如下。
request: 利用 get 或者 post 等方法获取网页的源码。 cheerio: 对网页源码进行解析,获取所需数据。
本文首先对爬虫所需依赖库及其使用进行介绍,然后利用这些依赖库,实现一个针对糗事百科的网络爬虫。
2. request 库
request 是一个轻量级的 http 库,功能十分强大且使用简单。可以使用它实现 Http 的请求,并且支持 HTTP 认证, 自定请求头等。下面对 request 库中一部分功能进行介绍。
安装 request 模块如下:
npm install request在安装好 request 后,即可进行使用,下面利用 request 请求一下百度的网页。
const req = require('request');req('http:///StartAction/SpliderQB.git克隆之后,进入项目目录,运行下面命令即可。
node app.js5. 总结
通过实现一个完整的爬虫功能,加深自己对 Node 的理解,且实现的部分语言都是使用 es6 的语法,让自己加快对 es6 语法的学习进度。另外,在这次实现中,遇到了 Node 的异步控制的知识,本文是采用的是 async 和 await 关键字,也是我最喜欢的一种,然而在 Node 中,实现异步控制有好几种方式。关于具体的方式以及原理,有时间再进行总结。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
糗事百科怎么看附近的人?糗事百科查看附近的人方法介绍。糗事百科是一款十分好玩的娱乐软件,在糗事百科中你可以查看附近的人,邀请ta来一起逗逼搞笑,那么糗事百科
糗事百科怎么签到?糗事百科签到方法介绍。糗事百科是一款给大家打来快乐的软件,在糗事百科中各式各样好玩有趣的段子,让你爆笑不断,在糗事百科中还有签到功能,签到
糗事百科怎么发小纸条?糗事百科发小纸条方法介绍。糗事百科是一款款娱乐爆笑软件,在糗事百科中有个小纸条的功能,法小纸条给小伙伴可以互相吐槽,那么糗事百科怎么发
糗事百科怎么发糗事?糗事百科发糗事方法。糗事百科是一款可以看很多糗事段子的娱乐平台,当然你也可以把自己身边的糗事发布出去,让更多人看到有有趣的事情,那么糗事
项目内容:用Python写的糗事百科的网络爬虫。使用方法:新建一个Bug.py文件,然后将代码复制到里面后,双击运行。程序功能:在命令提示行中浏览糗事百科。原理