V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
hlyzh
V2EX  ›  Python

请教一个 Python 爬虫的问题

  •  
  •   hlyzh · 2018-06-17 10:36:40 +08:00 · 3016 次点击
    这是一个创建于 2350 天前的主题,其中的信息可能已经有所发展或是发生改变。
    准备爬一个网站,用的 selenium 遇到 google 的 recaptcha 当我用 chromedrive 打开网页的时候他就知道我是 bot 了原理应该跟 Distil Networks 差不多用 JS 检测浏览器指纹 网上查了半天没有什么好的解决方法不知道各位有没有遇到这个问题
    7 条回复    2018-06-17 19:14:54 +08:00
    vansl
        1
    vansl  
       2018-06-17 11:29:24 +08:00 via iPhone
    打码平台?
    ihancheng
        2
    ihancheng  
       2018-06-17 11:35:03 +08:00 via Android   ❤️ 1
    能打一个标点吗🙃
    geekcorn
        3
    geekcorn  
       2018-06-17 11:41:25 +08:00 via iPhone
    mark
    hlyzh
        4
    hlyzh  
    OP
       2018-06-17 12:01:27 +08:00
    @vansl 检测到是 bot 后验证码无论正确都不会被通过的。
    lhx2008
        5
    lhx2008  
       2018-06-17 12:11:46 +08:00 via Android
    好像是说 chromedrive 有指纹,不好搞,除非能自己重新修改编译一个 chromedrive
    vansl
        6
    vansl  
       2018-06-17 14:06:10 +08:00 via iPhone
    @lhx2008 指纹是啥意思?第一次听说....无法修改 /删除的 header ?
    golmic
        7
    golmic  
       2018-06-17 19:14:54 +08:00 via Android
    关键词 chrome driver detection 能搜出一些资料,不过我把已知的检测处理之后还是没法避免触发淘宝登录的滑块。自己编译的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2459 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 01:16 · PVG 09:16 · LAX 17:16 · JFK 20:16
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.