1
scnace 2016-07-24 10:09:17 +08:00 via Android
尝试一下 ocr
|
2
int64ago 2016-07-24 10:11:05 +08:00 via Android
不需要 OCR ,这种是最简单的,过滤背景-分割-对比
|
3
jswh 2016-07-24 11:29:23 +08:00
|
4
niboy 2016-07-24 11:36:06 +08:00
PIL
|
5
dotpig OP 发现有 PyTesser 可用。悲剧的是,我发现人民日版数字版其实要钱的,下了三页以后就要求输入订阅帐号了。那我只能上网学习人民日报了。
|
6
Garantion 2016-07-24 12:14:31 +08:00
最简单的 KNN 即可 Github 上一搜一大把
|
7
yangxiongwei 2016-07-24 12:15:28 +08:00
|
8
tscat 2016-07-24 12:17:56 +08:00
二值化之后 ocr 就行
|
9
klesh 2016-07-24 13:16:33 +08:00
会 python 不会编程?
|
10
bazingaterry 2016-07-24 13:22:52 +08:00 via iPhone
这个和我校的教务系统很像,我处理的时候直接 OCR 就有 70% 成功率。
|
11
popok 2016-07-24 13:50:21 +08:00
|
12
popok 2016-07-24 14:04:59 +08:00
新建工程,然后每个数字都做一个字模,然后生成 cds 文件,用 python 调用一个 dll ,加载这个字模文件,就能识别了 |
13
coolzjy 2016-07-24 14:15:02 +08:00 1
这种类型的验证码,曾经用 JavaScript 搞了一个在浏览器环境中识别的。
http://coolzjy.github.io/captcha-reader/ |
15
fusae 2016-07-24 16:12:15 +08:00
|
16
fusae 2016-07-24 16:13:46 +08:00
|
17
DaCong 2016-07-24 16:30:00 +08:00
我记得我曾经搞过一个类似的,好像是教务系统的。
说一下大致思路: 1. 图片降噪 2. OCR 识别 |
20
panda0 2016-07-25 08:36:24 +08:00
tesseract 我刚试了下,好像毫无难度。
|
21
dotpig OP 各位,看到大家的回复,很感谢。我在 5 楼说了,找到 PyTesser 了(基于 tesseract )。但是现在找到也没用,因为人民日报电子版需要订阅才能看。
|