当前位置: 首页> 汽车> 行情 > 河北邯郸疫情最新情况 最新消息_官方网站找工作公众号_网络公司网络推广_免费写文案神器

河北邯郸疫情最新情况 最新消息_官方网站找工作公众号_网络公司网络推广_免费写文案神器

时间:2025/7/11 14:52:41来源:https://blog.csdn.net/yingang2009/article/details/147621506 浏览次数: 0次
河北邯郸疫情最新情况 最新消息_官方网站找工作公众号_网络公司网络推广_免费写文案神器

一、Tesseract:

1.下载windows版: tesseract
2. 安装并记下路径,等会要填

3.保存.py文件

import pytesseract
from PIL import Image
def ocr_local_image(image_path):try:pytesseract.pytesseract.tesseract_cmd = r'D:\Programs\Tesseract-OCR\tesseract.exe'img = Image.open(image_path)text = pytesseract.image_to_string(img, lang='eng')return text.strip()except Exception as e:return "error"   if __name__ == "__main__":result = ocr_local_image('1.jpg')  # 只使用英语模型,简化测试print(result)

4.运行代码,搞定

二、PaddleOCR

tesseract中文支持不好,我们再玩下PaddleOCR,据说中文牛P:

安装CPU版环境:

python -m uv pip install paddlepaddle==3.0.0rc1 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

安装GPU版环境:

python -m uv pip install paddlepaddle-gpu==3.0.0rc1 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/

 安装依赖:

uv pip install paddleocr

终端中输入指令回车,搞定: 

paddleocr --image_dir 1.jpg

如果嫌结果太乱,代码中提取一下:

from paddleocr import PaddleOCR
ocr = PaddleOCR(lang='ch') # ch,en
img_path = '3.jpg'
result = ocr.ocr(img_path)
for idx in range(len(result)):res = result[idx]for line in res:# 只输出文本内容(通常在line[1][0]位置)而不是整个lineprint(line[1][0])

GTX1660Ti-6G,识别时间:0.6s

关键字:河北邯郸疫情最新情况 最新消息_官方网站找工作公众号_网络公司网络推广_免费写文案神器

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

责任编辑: