当前位置:
首页>
文旅>
酒店 > OCR的基本概念和开源项目介绍
OCR的基本概念和开源项目介绍
时间:2025/7/11 14:52:43来源:https://blog.csdn.net/weixin_38566632/article/details/140321346 浏览次数:0次
深度学习和OCR
- OCR基本概念
- 开源项目
- 多模态大模型——OCR free
- 在当今多模态大模型横行的时代,已经没有人再去研究OCR了
OCR基本概念
- OCR是目标检测类项目,但又不完全是目标检测。它是 行级语义
- OCR问题最有效解决方案:
- OCR问题:
- 第1阶段: 检测出行级文本区域
- 第2阶段: 识别这行的文字
开源项目
- 做的最好的开源项目:PaddleOCR
- https://gitee.com/paddlepaddle/PaddleOCR/
- 也可以在 ModelScope上面找到开源项目:
- 读光-文字检测-DBNet行检测模型-中英-通用领域
多模态大模型——OCR free
- 文心一言:https://yiyan.baidu.com/
- 通义千问:https://tongyi.aliyun.com/qianwen/
- 大模型已经基本统一 LP ,即将统一 CV 。所以,拥抱大模型吧。
关键字:OCR的基本概念和开源项目介绍
版权声明:
本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。
我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com
责任编辑: