我现在使用 com.google.mlkit:text-recognition:16.0.1 ,com.google.mlkit:text-recognition-chinese:16.0.1 这个库进行 OCR 提取,在确认使用这个库的情况下有什么方法可以提高 OCR 识别的正确率呢? opencv 的图片匹配是否也可以同理提升正确率?
1
NoOneNoBody 10 天前
OCR 是边缘识别,思想是让文字部分的边缘清晰,例如提高对比度
以图找图不是这个思想,有多种方式 1. 哈希,将大矩阵浓缩为只有极少像素的小矩阵,快但不太准确,适用于“一找多”的模糊匹配 2. 色彩匹配,整体均值或分布情况 3. 特征匹配,就是识物,比较准确,但慢些,sift / orb 这些 4. 局部匹配,就是 opencv 的模板匹配,准确,但要求尺寸接近,如果两图不知尺寸的情况下,自动调整尺寸就是个繁杂的工作 |
2
fenglirookie OP @NoOneNoBody 好的 感谢解惑
|