V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
leogcry22
V2EX  ›  程序员

针对手写的纸质文件,目前有没有 OCR 厂家能做到准确识别的呢?

  •  
  •   leogcry22 · 2023-10-31 10:00:55 +08:00 · 3451 次点击
    这是一个创建于 370 天前的主题,其中的信息可能已经有所发展或是发生改变。
    22 条回复    2023-11-01 10:16:03 +08:00
    hauibojek
        1
    hauibojek  
       2023-10-31 10:03:49 +08:00   ❤️ 2
    不可能完全识别的,那医生的字 肉眼都看不懂,ocr 怎么识别
    leogcry22
        2
    leogcry22  
    OP
       2023-10-31 10:05:19 +08:00
    @hauibojek 那目前市面上有没有相对能够识别大部分内容的厂家呢
    yhm2046
        3
    yhm2046  
       2023-10-31 10:14:28 +08:00
    个人理解需要有个容错率,比如 70%以上算合格,80%是优秀,90%是顶级
    xxq2334
        4
    xxq2334  
       2023-10-31 10:15:39 +08:00 via Android
    mathpix ,识别手书公式,然后还有文字都不错,汉语试的少,op 可以试试
    zjsxwc
        5
    zjsxwc  
       2023-10-31 10:20:07 +08:00
    百度的还行,我自己潦草的手写能识别
    https://ai.baidu.com/tech/ocr/general
    realpg
        6
    realpg  
       2023-10-31 10:42:18 +08:00
    没有
    potatowish
        7
    potatowish  
       2023-10-31 10:48:54 +08:00 via iPhone
    手写文字识别应该只有百度好使,但是有生僻字的情况会识别成其他常见形近字,合合识别生僻字的概率高,但是手写文字准确率就不好高了,你可以结合这两个服务来识别。
    leogcry22
        8
    leogcry22  
    OP
       2023-10-31 11:08:38 +08:00
    cctv180
        9
    cctv180  
       2023-10-31 11:33:30 +08:00
    试玩过汉王的手写板,想一个字瞎画都行。
    hatw
        10
    hatw  
       2023-10-31 13:22:22 +08:00
    @cctv180 #9 手写板识别字应该是考虑了你写的笔画顺序的。OCR 纸张这种后识别的没办法识别笔画顺序
    buliugu
        11
    buliugu  
       2023-10-31 13:23:56 +08:00
    目前用过最强的还是百度
    wanwaneryide
        12
    wanwaneryide  
       2023-10-31 14:55:26 +08:00
    别人写的东西人都不一定能认清楚,只能靠上下文推断之类的,机器不可能做到准确识别
    Selenium39
        13
    Selenium39  
       2023-10-31 15:39:03 +08:00
    google
    Chingim
        14
    Chingim  
       2023-10-31 16:46:35 +08:00   ❤️ 5
    HancockXu
        15
    HancockXu  
       2023-10-31 16:48:22 +08:00
    未来应该是 OCR+AI 纠错了,单独靠 OCR 不行
    hoythan
        16
    hoythan  
       2023-10-31 16:52:16 +08:00
    百度也很拉胯,之前做活动用手机端写一个字。然后需求是需要识别是不是月亮的月字。

    结果手写的月,横向只要超出 横竖勾 一部分,就无法识别出这是一个文字,实际上人工非常好辨认。

    最后通过改变文字颜色和背景颜色到一个合适的值才勉强解决识别失败的问题。

    总之就是很拉胯。
    raycool
        17
    raycool  
       2023-10-31 17:53:06 +08:00
    这个在多模态大模型下大概率能解决
    目前单纯的 OCR 应该无法完美解决。
    sevncy12
        18
    sevncy12  
       2023-10-31 19:07:01 +08:00
    可以看看 abbyy, 我之前调研过, 他们家应该是目前市面上最好的了
    Verx0
        19
    Verx0  
       2023-10-31 20:54:32 +08:00
    @Chingim 哈哈哈😁😁没绷住😂😂
    cocang
        20
    cocang  
       2023-10-31 21:22:19 +08:00
    好像没有识别率很可用的吧,难度太高了
    xinyu391
        21
    xinyu391  
       2023-11-01 09:40:50 +08:00
    合合信息的 ocr 也挺厉害的,在线 demo ,可以体验下
    https://www.textin.com/experience/text_recognize_3d1
    leogcry22
        22
    leogcry22  
    OP
       2023-11-01 10:16:03 +08:00
    @xinyu391 谢谢,我研究一下
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1222 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 18:18 · PVG 02:18 · LAX 10:18 · JFK 13:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.