Python构建快速高效的中文文字识别OCR_中文ocr python-程序员宅基地

技术标签: python  Python  ocr  

感谢李奥诃弗斯基的悉心教导完成编译部分工作,万分感谢!





本文使用开源项目chineseocr_lite,已上传百度网盘(2020/3/16),提取码:oade

以下适合Windows系统,需要使用VS进行简单编译,若用Linux系统可直接参考原项目,应该更简单。

在这里插入图片描述

在这里插入图片描述




安装

1. PyTorch

进入PyTorch官网,选择合适自己的版本。

如笔者使用pip且仅CPU环境,执行命令安装:pip install torch==1.4.0+cpu torchvision==0.5.0+cpu -f https://download.pytorch.org/whl/torch_stable.html
在这里插入图片描述

2. Python库

pip install web.py==0.40.dev0

3. VS2015及以上

必须装上VC++模块,用于后面编译。




编译PSENET

本人编译好的pse.pyd已上传CSDN,在Win7和Win10的Python3.6版本下测试通过,需要的亲自取。

这步是重头戏

1.打开VS2015→新建项目→Visual C++→项目命名为pse
在这里插入图片描述
2.勾上空项目
在这里插入图片描述
3.配置属性(常规):右键项目pse→属性→配置Release→平台x64→目标文件扩展名.pyd→配置类型动态库(.dll)
在这里插入图片描述
4.配置属性(VC++目录):包含目录添加C:\chineseocr_lite-master\psenet\pse\include(项目文件)和C:\Users\Administrator\AppData\Local\Programs\Python\Python36\include(你的Python),库目录添加C:\Users\Administrator\AppData\Local\Programs\Python\Python36\libs(注意,是libs不是Lib)
在这里插入图片描述
5.附加依赖项:添加python3.lib;python36.lib;
在这里插入图片描述
4.配置管理器→活动解决方案配置Release→活动解决方案平台x64
在这里插入图片描述
5.把项目\psenet\pse\pse.cpp复制到源文件里→右键项目pse→重新生成
在这里插入图片描述
6.在VS项目pse\x64\Release就编译好了我们要的库文件pse.pyd
在这里插入图片描述
7.将pse.pyd复制到与项目\psenet\pse\pse.cpp同一文件夹下




运行app.py

访问http://127.0.0.1:8080/ocr


1.报错RuntimeError: Cannot compile pse: C:\chineseocr_lite-master\psenet\pse
注释掉psenet\pse\__init__.py的两行代码
在这里插入图片描述
2.报错UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xab in position 551: illegal multibyte sequence
点进报错所在代码,添加编码, encoding='UTF-8'
在这里插入图片描述
3.报错UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xa7 in position 982: illegal multibyte sequence
同上,添加编码, encoding='UTF-8'
在这里插入图片描述

封装接口

原项目使用和未使用的文件较多,本人封装好了接口
GitHub自取:vba34520/chineseocr_lite: Python构建快速高效的中文文字识别OCR

调用ocr.result()即可进行文本预测

在这里插入图片描述




GPU版本

  1. 安装CUDA+cuDNN
  2. GPU版本PyTorch
  3. 执行命令nvidia-smi查看GPU的ID
  4. 修改config.py的GPU_ID




参考文献

  1. ouyanghuiyu/chineseocr_lite: 超轻量级中文ocr,支持竖排文字识别, 支持ncnn推理 , psenet(8.5M) + crnn(6.3M) + anglenet(1.5M) 总模型仅17M
  2. pybind/pybind11: Seamless operability between C++11 and Python
  3. 根据显卡型号选择CUDA和cuDNN进行TensorFlow GPU版本安装
  4. python如何编译py文件生成pyc、pyo、pyd以及如何和C语言结合使用
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/lly1122334/article/details/104752851

智能推荐

pycharm使用心得-程序员宅基地

文章浏览阅读156次。调试,使用debug类似于matlab,先设置断点,然后再F7单步运行

Corel VideoStudio(会声会影2023) V26.0.0.136 官方破解版_会声会影 2023 v 26.1.0.268整合盘-程序员宅基地

文章浏览阅读913次,点赞20次,收藏9次。会声会影(Corel VideoStudio)为加拿大Corel公司发布的一款功能丰富的视频编辑软件。会声会影2023简单易用,具有史无前例的强大功能,拖放式标题、转场、覆叠和滤镜,色彩分级、动态分屏视频和新增强的遮罩创建器,超越基本编辑,实现影院级效果。优化分屏剪辑功能,简化多时间轴编辑的工作流程,让创作更轻松。添加趣味性3D标题,内置NewBlueFX和proDAD转场和防抖插件,一键防抖和校准色彩。使用MultiCam Capture Lite可以轻松录制并编辑视频教程、产品演示、游戏视频、在线课程。_会声会影 2023 v 26.1.0.268整合盘

Adobe(Pr & Ae)动态图形模板-程序员宅基地

文章浏览阅读1.5k次。动态图形模板 Motion Graphics Templates是一种可在 Pr 或者 Ae 中创建的文件类型 (.mogrt), 以供将来重复使用或合作共享。.mogrt 文件格式可以让使用 Ae 的动画设计人员保持对作品风格的控制,同时还可以让使用 Pr 的编辑人员能够在编辑项目上下文中自定义运动图形。◆◆◆在Ae中创建动态图形模板动态图形模板可以在 Ae 或 Pr 的基本图形面板..._通过工作区域创建受保护区域

项目版本号管理说明-程序员宅基地

文章浏览阅读3.5k次。软件版本简介Alpha(α)Beta(β)RC(Release Candidate)StableGA(General Availability)简介在使用jar包的时候经常看到一些特殊版本,例如这次log4j的JNDI注入漏洞,发布的版本log4j-2.15.0-rc2这个rc2代表什么呢?Alpha(α)预览版,也叫内部测试版,一般不向外部发布,会有很多Bug,主要是内部人员用于测试。很多开源软件的大版本也会释放出来,让大家一起来找茬。例如:<dependency> _项目版本号管理

[发送AT指令配置a7670C模块上网]-程序员宅基地

文章浏览阅读2k次。2.1 如果内核配置和代码修改正确,设备启动后,ifconfig -a可以看到usb0节点。1.1按照芯片data sheet修改kernel代码,添加PID和VID。概要:基于rv1126平台调试SIMCOM 7670C 4G模块。1.2.3,使能USB network,配置rndis host。发送如下指令,如果看到回复OK,就证明4G模块与主控通讯正常。此处根据不同的芯片按照其datasheet进行修改。2.2 用AT指令测试4G模块与主控是否通讯正常。1,内核配置及内核代码修改。_a7670c

qiime安装_qiime1安装包下载-程序员宅基地

文章浏览阅读1.5k次。参考网址:https://forum.qiime2.org/t/qiime2-chinese-manual/838http://qiime.org/install/install.html 安装好qiime后,脚本的运行必须在qiime环境下输入:source activate qiime1 ..._qiime1安装包下载

随便推点

EtherCAT学习之路——概述_ethercat demo-程序员宅基地

文章浏览阅读1.1w次,点赞54次,收藏275次。首发于知乎最近在做基于EtherCAT的项目,看了一些网上的博客,感觉写的都比较松散。虽然,自己也是才开始学习,希望能把这段时间学到的东西总结一下。1.EtherCAT简介EtherCAT是由德国BECKHOFF自动化公司于2003年提出的实时工业以太网技术。它具有高速和高数据有效率的特点,支持多种设备连接拓扑结构。其从站节点使用专用的控制芯片,主站使用标准的以太网控制器。Et..._ethercat demo

QT简介及QT环境搭建-程序员宅基地

文章浏览阅读2k次。QT简介及QT环境搭建文章目录QT简介及QT环境搭建一、QT简介1. 什么是QT?2. QT的发展史3. QT支持的平台4. QT的优点5. QT开发工具二、QT环境搭建(CentOS7)一、QT简介1. 什么是QT?Qt是一个1991年由Qt Company开发的跨平台C++图形用户界面应用程序开发框架 它既可以开发GUI程序,也可用于开发非GUI程序,比如控制台工具和服务器。Qt是面向..._qt环境

win10 设置任务栏时钟显示到秒_win10任务栏显示秒数-程序员宅基地

文章浏览阅读188次。win10 设置任务栏时钟显示到秒_win10任务栏显示秒数

.NET系统框架-程序员宅基地

文章浏览阅读124次。本书是一本讲解.NET技术的书籍,目标读者群也是在.NET框架(.NET Framework)下进行开发的程序员,因此我们无法回避的问题就是:什么是.NET框架?它包含了哪些内容?为开发程序提供了哪些支持?很多朋友对这类个问题的第一反应可能是.NET框架所提供的庞大类库及编写代码所采用的C#语言,实际上远不止这些。要描述.NET框架,自然会遇到与其相关的一系列专业的技术术语和缩写,相信大家已经..._目标框架 目标操作系统版本

基于单链表、环形队列(并发有锁)的多线程生产者消费者模型_并发环状加锁-程序员宅基地

文章浏览阅读2.2k次,点赞3次,收藏11次。在这之前的我已经介绍过生产者消费者模型,不懂的可以下跳地址: http://blog.csdn.net/quinn0918/article/details/728259921、环形缓冲区缓冲区的好处,就是空间换时间和协调快慢线程。缓冲区可以用很多设计法,这里说一下环形缓冲区的几种设计方案,可以看成是几种环形缓冲区的模式。设计环形缓冲区涉及到几个点,一是超出缓冲区大小的的索引如何处理,二是如何表示缓_并发环状加锁

别光看世界杯 7月还有一场音视频技术盛宴等着你-程序员宅基地

文章浏览阅读226次。在全世界球迷的瞩目下,2018世界杯在上周激情上演,相信接下来的一个月时间里无数球迷又将守在电视前为自己喜欢的球队摇旗呐喊。当然,在移动互联网发达的今天,即使不在电视前,..._移动咪咕 张云天