已更新支持手机浏览器进行ocr,并优化大PDF处理过程
1
justincnn 2023-06-12 17:47:16 +08:00
准确率很高,支持 pdf 转 excel 么?
|
3
EmpCold 2023-06-12 17:51:23 +08:00
|
5
itxh 2023-06-12 17:54:55 +08:00
已收录到 https://www.wangdu.site/software/566.html ,希望对你有所帮助
|
8
kebamt 2023-06-12 18:35:04 +08:00
稍微复杂的就处理不了,而且太慢了
|
10
oneisall8955 2023-06-12 19:13:58 +08:00
支持直接粘贴吗?
|
11
oneisall8955 2023-06-12 19:14:32 +08:00
@oneisall8955 不好意思,没看到下面的小技巧
|
12
fox 2023-06-12 20:33:43 +08:00
支持一下,蛮好
|
13
vueli 2023-06-13 09:16:11 +08:00
我记得之前有个事情,说什么 orc 的问题坐牢的。具体什么东西我忘记了,楼主留个心眼
|
16
yqf0215 2023-06-13 10:00:47 +08:00
非常好,请教一下,ocr 有办法识别相应文字的字体、字体大小、粗细、颜色这些信息吗?
|
17
subframe75361 2023-06-13 10:09:37 +08:00
可以支持一下 pwa 吗
|
18
subframe75361 2023-06-13 10:11:26 +08:00
非常好用
|
20
dassh OP @subframe75361 感谢支持,近期可能不会弄 pwa ,因为不太懂这块,目前的最优先的是使用多 worker 加速识别速度、尝试支持手机浏览器,后续弄完我学学看。
|
21
yuanchao 2023-06-13 11:11:13 +08:00
如果要支持表格提取识别,可以弄吗
|
22
fakecoder 2023-06-13 11:12:06 +08:00
优秀!
|
25
monkey110 2023-06-13 11:38:20 +08:00 via Android
@vueli shuax 作者用自己开发的软件 ocr 群里裸,贷链接然后又发到群里的这事吧 主打一个分享
|
26
hteen 2023-06-13 16:00:58 +08:00
|
28
RatioPattern 2023-06-13 22:53:20 +08:00
英文效果很好,比 python-docr 和 tesseract 默认都好多了
|
29
RatioPattern 2023-06-13 22:57:49 +08:00
没有做任何微调达到的效果吗
|
30
dassh OP @RatioPattern 是的
|
31
jzyzcz 2023-06-14 00:01:52 +08:00
速度很快!后面会推出收费模式吗?
|
32
dassh OP @jzyzcz
关于收费: 短期不考虑,一是做 ocr 的网站太多,又没什么杀手级功能,二是接入支付挺麻烦(没做过),三是用户量没几个,收费都跑了。一开始想法是接入 adsense 看能收回服务器成本不,但 adsense 不给新站过,先等等 关于速度: 目前都是单线程预测的,计划增加配置使用多线程预测,配置越多,速度越快,当然你 cpu 和内存也占用越多 近期规划: 1. 网站是 23 年 5 月 21 日上线的,google search console 配置了,但 ocr 网站太多,搜索 online ocr 前 8 页都找不到(没有第 9 页,只有 8 页),我有在后台统计 ocr 的图片数量、pdf 页数(也仅限于此),在 v2 发这贴之前,这个数字基本每天都是 0 ,所以我得学学怎么宣传,seo ,做外链这些 2. 上面提到的速度优化 3. 注意到有人尝试了 ocr 一个几百页的 pdf ,一本书?我也试了下,直接快卡死一段时间,后面在预测第二页时崩了,分析了下当前是用同步的方法将所有图片加载到内存,所以一次性加载几百张图片撑不住,不知道这个是不是强需求,我会尝试解决 |
33
kangyangqishi 2023-06-14 09:38:36 +08:00
|
34
LavaC 2023-06-14 10:30:44 +08:00
好奇问一下 op ,如果想做一个适配异型字体(异型到看不出是什么)的 ocr 工具,也可以应用你这套开发流程吗?
只需要识别 26 个英文字母就好了。 |
35
dassh OP @LavaC 可以的,“异型到看不出是原字母”的话,就需要单独训练一个识别模型,只有 26 个字母的话大概 10k 的训练样本吧(经验之谈)。
然后针对你说的:“我这套开发流程”,可能并不适用,因为这个网站是针对通用 web 场景的,然后为了省服务器成本,把预测步骤放到了端侧,开发时间全耗在这里面( onnx ,web worker, opencvjs )。你可能更需要的是只是一个 restful 接口,有基础的可以看看 PaddleOCR 文档 |
37
92Developer 2023-09-19 23:34:28 +08:00 via Android
|