仅供练习使用,代码注释很详细
收集了一些各大网站登陆方式, 和一些网站的爬虫程序,有的是通过 selenium 登录,有的是通过抓包直接模拟登录,有的是利用 scrapy,希望对小白有所帮助,本项目用于研究和分享各大网站的模拟登陆方式,和爬虫程序,会持续更新。。。
昨天加了个班,对一些老代码进行了重构和测试,大部分都可以用。
欢迎 star
模拟登陆基本采用的是直接登录或者使用 selenium+webdriver 的方式,有的网站直接登录难度很大,比如 qq 空间,B 站,如果采用 selenium 就相对轻松一些。
虽然在登录的时候采用的是 selenium,为了效率,我们可以在登录过后得到的 cookie 维护起来,然后调用 requests 或者 scrapy 等进行数据采集,这样数据采集的速度可以得到保证。




101
CriseLYJ OP 顶一下
|
102
guanhui07 2019 年 3 月 8 日
赞一个
|
105
Zeham 2019 年 3 月 8 日
大佬
|
106
airdge 2019 年 3 月 8 日
qzone 有验证码 这里面好像没有验证码模块 放服务器用不了的
|
108
CriseLYJ OP 顶
|
109
veeupup 2019 年 3 月 8 日
顶
|
111
CriseLYJ OP 顶一下在
|
112
fakeman 2019 年 3 月 9 日
能研究下 google 的 requests 登陆方式么
|
114
pythonee 2019 年 3 月 10 日
验证码是不是还是关键?
这些网站是否有一定频率或反爬措施,这些是怎么处理呢? |
118
Sxxiong 2019 年 4 月 26 日
想问一下大佬 有 google 登录的经验么? 这几天卡在验证码那块了 谢谢
|