关于 OCR 以及以图找图识别

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

我现在使用 com.google.mlkit:text-recognition:16.0.1 ，com.google.mlkit:text-recognition-chinese:16.0.1 这个库进行 OCR 提取，在确认使用这个库的情况下有什么方法可以提高 OCR 识别的正确率呢？ opencv 的图片匹配是否也可以同理提升正确率？

OCR

以图找图

mlkit

2 条回复 • 2025-05-27 16:49:55 +08:00

NoOneNoBody

10 天前

OCR 是边缘识别，思想是让文字部分的边缘清晰，例如提高对比度

以图找图不是这个思想，有多种方式
1. 哈希，将大矩阵浓缩为只有极少像素的小矩阵，快但不太准确，适用于“一找多”的模糊匹配
2. 色彩匹配，整体均值或分布情况
3. 特征匹配，就是识物，比较准确，但慢些，sift / orb 这些
4. 局部匹配，就是 opencv 的模板匹配，准确，但要求尺寸接近，如果两图不知尺寸的情况下，自动调整尺寸就是个繁杂的工作

fenglirookie

10 天前

@NoOneNoBody 好的感谢解惑