百度飞桨 — 试玩PaddleOCR

AI应用信息9个月前发布 XIAOT
216 0
百度飞桨 — 试玩PaddleOCR

简介

介绍「PaddleOCR」之前,先来介绍一下百度的飞桨项目:

「百度飞桨(PaddlePaddle)」 是百度推出的开源深度学习平台。作为国内领先的深度学习框架之一,飞桨提供了丰富的工具和资源,帮助开发者和研究者轻松地构建、训练和部署各种深度学习模型。他有非常全面的深度学习库,提供了广泛的深度学习库和工具,涵盖了图像处理、自然语言处理、推荐系统等多个领域。开发者可以轻松地使用这些工具构建复杂的深度学习模型。并且它支持灵活的模型定义和训练,使其适用于各种深度学习任务。

而今天我们要来试玩一下他的文字识别模块 — 「PaddleOCR」

PaddleOCR是一个非常优质的OCR工具包(实用的超轻量级OCR系统),基于PaddlePaddle,支持80多种语言的识别,提供数据标注和合成工具,支持在服务器、移动设备、嵌入式和物联网设备之间进行训练和部署。旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。

百度飞桨 — 试玩PaddleOCR 百度飞桨 — 试玩PaddleOCR

特性

支持多种OCR相关前沿算法,在此基础上打造产业级特色模型PP-OCR和PP-Structure,并打通数据生产、模型训练、压缩、预测部署全流程。

百度飞桨 — 试玩PaddleOCR

小试牛刀

接下来我们来试玩一下这个PaddleOCR。

百度飞桨 — 试玩PaddleOCR

切记一定要勾选最下方”Add python.exe to PATH“,添加环境变量,否则需要手动添加环境变量。

百度飞桨 — 试玩PaddleOCR

安装完毕后可以再任意位置打开CMD,输入python ,如下则环境安装完成:

百度飞桨 — 试玩PaddleOCR

安装PaddlePaddle:

python -m pip install paddlepaddle -i https://mirror.bAIdu.com/pypi/simple
百度飞桨 — 试玩PaddleOCR

安装PaddleOCR whl包:

pip install "paddleocr>=2.0.1" --upgrade PyMuPDF==1.21.1

默认安装的PyMuPDF版本有问题,如果不加 --upgrade PyMuPDF==1.21.1 ,则会报错, PaddleOCR whl包含很多依赖包,如下如图中红框所示,所以下载时间较长,可能需要十几二十分钟。

百度飞桨 — 试玩PaddleOCR
    © 版权声明

    相关文章