目前最好的开源手写体 ocr 识别是什么

11 小时 44 分钟前
 hmxxmh
1141 次点击
所在节点    程序员
16 条回复
daodao
11 小时 33 分钟前
PaddleOCR
Suonna
11 小时 25 分钟前
汉王可以了解一下,目前遇到过最强的手写 OCR ,软件还良心

其次就是直接用 gemini 做 ocr
zzfer
11 小时 19 分钟前
对过几家 SDK ,百度和微软的表现还不错
realJamespond
11 小时 10 分钟前
最新的 gemeni2.5 pro 变态强, 国内就是 internvl3 14b 非常强
ma46
10 小时 46 分钟前
@Suonna 普通 ocr 用大模型非常不划算
Suonna
9 小时 52 分钟前
@ma46 请教是哪方面不划算?
clf
9 小时 50 分钟前
@Suonna #6 应该指 token 消耗吧,得最好把图片先降低分辨率,不然 token 烧的有点多。
luchenwei9266
9 小时 36 分钟前
之前简单对比过:百度、腾讯、讯飞、阿里、有道。百度的效果会稍微好一点。
lee88688
9 小时 29 分钟前
#4 说的 internvl3 14b 我也看过一些测评确实可以,但不知道具体场景情况,op 可以去试试。
kuonkuon
9 小时 20 分钟前
做过测试,手写这东西,只有大模型识别率最高,但是也只有 70 几。测试数据是初中生的数学考试手写笔记
hmxxmh
8 小时 58 分钟前
@Suonna 大模型太慢了,我们的业务场景要求响应速度,而且大模型成本高,1 张 t4 卡,小模型可支持 8 并发差不多,换大模型只能部署小参数的,大参数的至少 4 张卡,并发数还少
hmxxmh
8 小时 52 分钟前
@kuonkuon 用的是哪家大模型
yoghurtguy
8 小时 49 分钟前
@kuonkuon 请问"初中生的数学考试手写笔记"是随便找了一张图片还是有相关的数据集吗? 我现在刚好希望使用开源大模型识别手写数学公式
xiaomushen
8 小时 48 分钟前
PaddleOCR 或 RapidOCR
其实是一个东东
hmxxmh
8 小时 44 分钟前
@Suonna 这个我体验了一下,确实很准,不过是根据手写轨迹来识别的好像,如果输入是图片不行
hmxxmh
8 小时 43 分钟前
@xiaomushen 这个我用来表格识别了,属于是开源最好的表格识别

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/1130435

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX