20210706公众号集体炸号事件
- 需要通过各种方式获取文章URL(链接)列表,详细方法建议网上搜索。
- 简易获取方法代码可见getjson.js,该方法需要拥有微信号,结束后请把文件集中在
json
文件夹 - 推荐方式1 微信公众号的素材管理,获取公众号文章
- 推荐方式2 抓包
- 推荐方式3 搜狗微信搜索
- 简易获取方法代码可见getjson.js,该方法需要拥有微信号,结束后请把文件集中在
- 利用
b002JsonFilesToTXT
,将json
文件夹下的文件提取成为URLs.txt
- 将URL链接保存在
URLs.txt
,一行一个 - 打开
a001mainpro.py
根据情况修改PubVar
部分信息 - 将第一步取得的URL填写在
PubVar.URLList
,需要按照List语法填写 - Python3 环境下直接在目录下运行
a001mainpro.py
- 如果被访问控制,可通过切换IP方式(proxy等)进行处理后再次运行。运行时会自动检查是否已经保存,如已经保存则自动跳过
- 打开
a002rename.py
会自动根据公众号文章名称修改文件名 - 打开
a003htmltopdf.py
会自动根据HTML文件转换为PDF文件
-
部分参考GitHub:LeLe86/vWeChatCrawl
-
潦草生成,面向谷歌编程,建议自行优化
-
可能触发微信反爬虫机制
-
文章列表获取方式请参考其他文章
-
仅建议在类Unix(darwin/Linux/FreeBSD/WSL)下使用
-
文件自带URL为搜狗微信推荐前4篇
- Python3
- bs4
pip3 / pip install bs4
- pdfkit
pip3 / pip install pdfkit
- wkhtmltopdf https://wkhtmltopdf.org
文件读取URLOK- CSV读取URL
- 自动化获取文章列表
- 错误后自动恢复运行
- 等等