Skip to content

Latest commit

 

History

History

ZhihuSpider

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 

网络爬虫之用户名密码及验证码登陆:爬取知乎网站

一些说明:

  • 使用requests包来爬取。首先尝试用用户名密码自动登陆,如果失败,则需要采用cookie登陆。

  • 配置文件config.ini,其中包括用户名密码信息,如果有验证码情况,需要手动登陆一次网站获取cookie信息。

  • 判断登陆成功与否,看生成的html文件中有没有用户信息。