当前位置: 首页> 文旅> 酒店 > OCR的基本概念和开源项目介绍

OCR的基本概念和开源项目介绍

时间:2025/7/11 14:52:43来源:https://blog.csdn.net/weixin_38566632/article/details/140321346 浏览次数:0次

深度学习和OCR

  • OCR基本概念
  • 开源项目
  • 多模态大模型——OCR free

  • 在当今多模态大模型横行的时代,已经没有人再去研究OCR了

OCR基本概念

  • OCR是目标检测类项目,但又不完全是目标检测。它是 行级语义
  • OCR问题最有效解决方案:
  • OCR问题:
    • 第1阶段: 检测出行级文本区域
    • 第2阶段: 识别这行的文字

开源项目

  • 做的最好的开源项目:PaddleOCR
    • https://gitee.com/paddlepaddle/PaddleOCR/
  • 也可以在 ModelScope上面找到开源项目:
    • 读光-文字检测-DBNet行检测模型-中英-通用领域

多模态大模型——OCR free

  • 文心一言:https://yiyan.baidu.com/
  • 通义千问:https://tongyi.aliyun.com/qianwen/
  • 大模型已经基本统一 LP ,即将统一 CV 。所以,拥抱大模型吧。
关键字:OCR的基本概念和开源项目介绍

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

责任编辑: