selenium 天猫爬虫登陆

1.获取 cookies:
使用 selenium 打开 chrome 访问天猫登陆界面，接着扫码登陆并保存 cookies，
2.使用 cookies:
再用 selenium 打开一个 chrome 访问天猫登陆界面，给 driver 添加刚才保存的 cookies，此时再访问某个商品界面时还会要求登陆
这两步间隔比较短，cookies 应该没有过期
求问，为什么 cookies 没有效果 /哭

Selenium

登陆

天猫

19 条回复 • 2019-07-06 23:05:09 +08:00

cxbanana

2019-07-02 11:16:54 +08:00

因为天猫对 selenium 有指纹信息识别，可以尝试捕获下天猫发送过来的 js 文件，修改检测代码，拦截替换下……

youxiachai

2019-07-02 11:17:05 +08:00

天猫的防爬很先进的.....
你这个模型太简单了...一下下就被设别了..

zr8657

2019-07-02 11:17:44 +08:00

天猫 cookie 很多的，你确定你添加全了吗，你都用 selenium 了直接登陆完开爬不行吗，一个账号爬个 5、6 页大概就会出验证了

yaoye555

2019-07-02 11:23:15 +08:00

selenium 已经被淘宝系产品防死了,目前暂时能解决的就是修改 window.navigator.webdriver

hoyixi

2019-07-02 11:26:18 +08:00

能请教下，爬这些电商爬来的数据，怎么变现？很好奇

2019-07-02 11:32:10 +08:00

可以考虑用测试框架来干这种事，比如在真机上用 airtest

di1012

2019-07-02 11:41:28 +08:00

@hoyixi 可以做国内代购

misaka19000

2019-07-02 11:43:24 +08:00 via Android

试下 puppeter

di1012

2019-07-02 11:44:20 +08:00

其实你要是想搞到淘宝商品的数据，还不如直接爬一些做代购的公司的网站，人家用的是接口，还稳定

lusi1990

2019-07-02 11:48:56 +08:00

换成 firefox，或者使用 puppeteer 试试
https://www.jianshu.com/p/afdabf486b54(然后参考这个)

yanheqi

2019-07-02 15:23:24 +08:00

如果要抓 cnbeta 这种网站，能做到吗？

annielong

2019-07-02 15:34:51 +08:00

天猫正常访问还时不时来个验证，

smallhaes

2019-07-02 16:30:59 +08:00

谢谢大家的回复, 果然用天猫作为练习太难了, /哭没把握好难度. 实验室的师兄师姐推荐换个网站练习
3 楼说的是 OK 的, 可以登录后直接开爬, 不方便的地方是得显示浏览器界面. 如果不显示浏览器界面的话, 登录这块也是个大难点, 所以我才想着用 cookie 跳过登录,同时不再显示浏览器界面
同时也感谢其他小伙伴们提出的建议, 我会去尝试哒~
再次感谢大家!!