利用 selenium 和 ocr 破解文字点击验证码,用 ocr 计算出文字位置,再利用 selenium 模拟点击操作
1
rap16 2019-02-22 14:50:08 +08:00
你这个思路灰产早就应用上啦!
|
3
qq316107934 2019-02-22 15:00:58 +08:00
字体不同,有倾斜变形就凉了,OCR 识别率很低
|
4
alvin666 2019-02-22 15:11:24 +08:00 via Android
现在都用机器学习了,稍微复杂一点的 ocr 都不行
顺便说好歹验证码用 tesseract 啊,ocr 太弱了 |
5
ctro15547 2019-02-22 15:24:14 +08:00
ocr 不好用的,很多验证码都会有删除线扭曲等各种干扰,除非把每个字的每种干扰都记录了,不然还是打码平台吧,他们的数据足够大
|
6
nfroot 2019-02-22 16:23:43 +08:00
@frankyxu 这可未必,据说,有些技术,比如在线支付,在线视频。。。是成人网站开创并引领潮流的。。。。但是这些技术成熟后,自然不会提成人网站了。。。(时间久了可能有点偏差,不过大致上差不多)
我倒觉得成人网站要创收,还要安全收款。。。。还是很厉害的。。 |
7
jerseyhero 2019-02-22 18:04:26 +08:00
@ctro15547 打码平台只是靠数据量么,毕竟验证码图片是可以随机生成的啊
|
8
Mavious 2019-02-22 18:21:11 +08:00 via iPhone
前阵子看到当当的码,是给 4 张图叫找出“正”的那一张,其他图都是左旋右旋上下旋的。
黄易的感知式验证码更可恶,查鼠标轨迹的,完全过不了。 |
10
reus 2019-02-23 10:11:13 +08:00
……这算啥技术前沿
|
11
dorothyREN 2019-02-23 16:59:10 +08:00
@nfroot #6 pornhub 简直就是运维界的标杆。
|