如何爬取微信文章数据(爬取微信公众号文章)
试了多种方法,发现还是使用自己创建一个公众号再搜索的方式最有用。
有三种方法,
第一种:用搜狗微信公众号搜过,这个只能收到前10条;
第二种:用fiddler或手机抓包,从访问链接去获得appmsg_token,发现虽然这个值就在html页面里,但只有抓包的数据里含有效值,直接访问的是空的,而且还有时效性。这样,每次都要抓包获取,就很麻烦。
第三种:就是这种用公众号搜公众号的,虽然速度慢点,但便捷了不少。
* 程序原理:
>> 通过selenium登录获取token和cookie,再自动爬取和下载
* 使用前提: *
>> 电脑已装Firefox、Chrome、Opera、Edge等浏览器
>> 下载selenium驱动放入python安装目录,将目录添加至环境变量
(https://www.seleniumhq.org/download/)
>> 申请一个微信公众号
(https://mp.weixin.qq.com)
演示视频:
效果如下:
py源码和exe程序:
github:https://github.com/1061700625/WeChat_Article
若下载链接被屏蔽,可私聊小编获取。
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com