基于Python采集爬取微信公众号历史数据

时间：2021-05-22

鲲之鹏的技术人员将在本文介绍一种通过模拟操作微信App的方式采集指定公众号的所有历史数据的方法。

通过我们抓包分析发现，微信公众号的历史数据是通过HTTP协议加载的，对应的API接口如下图所示，其中有四个关键参数（__biz、appmsg_token、pass_ticket以及Cookie）。

为了能够拿到这四个参数，我们需要模拟操作App，让其产生这些参数，然后我们再抓包获取。对于模拟App操作，前面我们曾介绍过通过Python模拟安卓App的方法(详见http:///mp/profile_ext?action=home应答数据里会暴漏这三个参数 data['__biz'] = 'MjM5MzQyOTM1OQ==' data['appmsg_token'] = '993_V8%2BEmfVD7g%2FvMZ****4DNUJNFkg~~' data['pass_ticket'] = 'Rr8cO5c23ZngeQHRGy8E7gv*****pvrK+1uHHmHYQGL2WFdKIE' url = url + urllib.urlencode(data)

以"数字工厂"这个微信公众号为例，采集过程运行截图如下所示：

输出结果截图如下所示：

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

声明：本页内容来源网络，仅供用户参考；我单位不保证亦不表示资料全面及准确无误，也不保证亦不表示这些资料为最新信息，如因任何原因，本网内容或者用户因倚赖本网内容造成任何损失或损害，我单位将不会负任何法律责任。如涉及版权问题，请提交至online#300.cn邮箱联系删除。

基于Python采集爬取微信公众号历史数据

相关文章

从零开始学淘宝数据运营01—数据营销的重要性

python爬取微信公众号文章

python使用webdriver爬取微信公众号

Scrapy 入门教程

python爬取指定微信公众号文章