时间:2021-05-18
Puppeteer 介绍
Puppeteer 翻译是操纵木偶的人,利用这个工具,我们能做一个操纵页面的人。 Puppeteer 是一个 Nodejs 的库,支持调用 Chrome的API来操纵Web ,相比较 Selenium 或是 PhantomJs ,它最大的特点就是它的操作 Dom 可以完全在内存中进行模拟既在 V8 引擎中处理而不打开浏览器,而且关键是这个是Chrome团队在维护,会拥有更好的兼容性和前景。
Puppeteer 用处
Puppeteer 使用
安装 Puppeteer
由于封网,直接下载 Chromium 会失败,可以先阻止下载 Chromium 然后再手动下载它
# 安装命令npm i puppeteer --save# 错误信息ERROR: Failed to download Chromium r515411! Set "PUPPETEER_SKIP_CHROMIUM_DOWNLOAD" env variable to skip download.# 设置环境变量跳过下载 Chromiumset PUPPETEER_SKIP_CHROMIUM_DOWNLOAD=1 # 或者可以这样干,只下载模块而不buildnpm i --save puppeteer --ignore-scripts# 成功安装模块+ puppeteer@0.13.0added 1 package in 1.77s手动下载 Chromium,下载完后将压缩包解压,会有个 Chromium.app,将其放在你喜欢的目录下,例如 /Users/huqiyang/Documents/project/z/chromium/Chromium.app。正常安装包后 Chromium.app 会在 .local-chromium中
Tip:下载 Chromium 失败解决办法
更换国内Chromium源
PUPPETEER_DOWNLOAD_HOST=https://storage.googleapis.com.cnpmjs.orgnpm i puppeteer或者用 cnpm 安装
npm install -g cnpm --registry=https://registry.npm.taobao.orgcnpm i puppeteer点击查阅 Puppeteer API
初试 Puppeteer,截个图吧
知识点
运行结果
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
简介Puppeteer是Google开发并开源的一款工具,可用代码驱动浏览器操作。由于诸多优秀的特性,Puppeteer常被用在爬虫与自动化测试上。详细介绍参见
爬虫利器BeautifulSoup中find和find_all的使用方法二话不说,先上段HTML例子indexfirstitemseconditemthirdi
背景在使用puppeteer进行访问页面的时候,有时候需要用到代理。环境:centos7chrome安装puppeteer使用chrome。参考chrome的命
puppeteer是谷歌官方出品的一个通过DevTools协议控制headlessChrome的Node库。可以通过Puppeteer的提供的api直接控制Ch
1、Puppeteer简介Puppeteer是一个node库,他提供了一组用来操纵Chrome的API,通俗来说就是一个headlesschrome浏览器(当然