V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
fenglirookie
V2EX  ›  机器学习

关于 OCR 以及以图找图识别

  •  
  •   fenglirookie · 10 天前 · 480 次点击

    我现在使用 com.google.mlkit:text-recognition:16.0.1 ,com.google.mlkit:text-recognition-chinese:16.0.1 这个库进行 OCR 提取,在确认使用这个库的情况下有什么方法可以提高 OCR 识别的正确率呢? opencv 的图片匹配是否也可以同理提升正确率?

    2 条回复    2025-05-27 16:49:55 +08:00
    NoOneNoBody
        1
    NoOneNoBody  
       10 天前
    OCR 是边缘识别,思想是让文字部分的边缘清晰,例如提高对比度

    以图找图不是这个思想,有多种方式
    1. 哈希,将大矩阵浓缩为只有极少像素的小矩阵,快但不太准确,适用于“一找多”的模糊匹配
    2. 色彩匹配,整体均值或分布情况
    3. 特征匹配,就是识物,比较准确,但慢些,sift / orb 这些
    4. 局部匹配,就是 opencv 的模板匹配,准确,但要求尺寸接近,如果两图不知尺寸的情况下,自动调整尺寸就是个繁杂的工作
    fenglirookie
        2
    fenglirookie  
    OP
       10 天前
    @NoOneNoBody 好的 感谢解惑
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2680 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 11:29 · PVG 19:29 · LAX 04:29 · JFK 07:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.