范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

用Python写了一个图像文字识别OCR工具

  人生苦短,快学Python!
  在之前的文章里,我们多次尝试用Python实现文本OCR识别!
  今天我们要搞一个升级版:直接写一个   图像文字识别OCR工具   !  引言
  最近在技术交流群里聊到一个关于图像文字识别的需求,在工作、生活中常常会用到,比如   票据、漫画、扫描件、照片的文本提取   。
  博主基于 PyQt + labelme + PaddleOCR 写了一个桌面端的OCR工具,用于快速实现图片中   文本区域自动检测+文本自动识别   。
  识别效果如下图所示:  干货主要有:
  ① 200 多本 Python 电子书(和经典的书籍)应该有
  ② Python标准库资料(最全中文版)
  ③ 项目源码(四五十个有趣且可靠的练手项目及源码)
  ④ Python基础入门、爬虫、网络开发、大数据分析方面的视频(适合小白学习)
  ⑤ Python学习路线图(告别不入流的学习)
  私信小编01即可获取大量Python学习资源
  OCR工具识别效果
  所有框选区域为OCR算法自动检测,右侧列表有每个框对应的文字内容;点击右侧"识别结果"中的文本记录,然后点击"复制到剪贴板"即可复制该文本内容。  功能列表文本区域检测+文字识别  文本区域可视化  文字内容列表  图像、文件夹加载  图像滚轮缩放查看  绘制区域、编辑区域  复制所选文本识别结果  OCR部分
  图像文字检测+文字识别算法,主要借助   paddleocr   实现。
  创建或者选择一个虚拟环境,安装需要用到的第三方库。  conda create -n ocr conda activate ocr 安装框架
  如果你没有NVIDIA GPU,或GPU不支持CUDA,可以安装CPU版本:  # CPU版本 pip install paddlepaddle==2.1.0 -i https://mirror.baidu.com/pypi/simple
  如果你的GPU安装过CUDA9或CUDA10,cuDNN 7.6+,可以选择下面这个GPU版本:  # GPU版本 python3 -m pip install paddlepaddle-gpu==2.1.0 -i https://mirror.baidu.com/pypi/simple 安装 PaddleOCR
  安装paddleocr:  pip install "paddleocr>=2.0.1" # 推荐使用2.0.1+版本
  版面分析,需要安装 Layout-Parser:  pip3 install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl 测试安装是否成功
  安装完成后,测试一张图片   --image_dir ./imgs/11.jpg   ,采用中英文检测+方向分类器+识别全流程: paddleocr --image_dir ./imgs/11.jpg --use_angle_cls true --use_gpu false
  输出一个list:
  在python中调用from paddleocr import PaddleOCR, draw_ocr  # Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换 # 例如`ch`, `en`, `fr`, `german`, `korean`, `japan` ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # need to run only once to download and load model into memory img_path = "./imgs/11.jpg" result = ocr.ocr(img_path, cls=True) for line in result:     print(line)
  输出结果是一个list,每个item包含了文本框,文字和识别置信度:
  [[[24.0, 36.0], [304.0, 34.0], [304.0, 72.0], [24.0, 74.0]], ["纯臻营养护发素", 0.964739]] [[[24.0, 80.0], [172.0, 80.0], [172.0, 104.0], [24.0, 104.0]], ["产品信息/参数", 0.98069626]] [[[24.0, 109.0], [333.0, 109.0], [333.0, 136.0], [24.0, 136.0]], ["(45元/每公斤,100公斤起订)", 0.9676722]] ......  界面部分
  界面部分基于pyqt5实现,其中pyqt GUI程序开发入门和环境配置,详见一篇博客(具体见文末)。
  主要步骤:  界面布局设计
  在QtDesigner中拖拽控件,完成程序界面布局,并保存   *.ui   文件。
  利用 pyuic 自动生成界面代码
  在 pycharm 的项目文件结构中找到   *.ui   文件,右键——External Tools——pyuic,会在ui文件同级目录下自动生成界面 ui 的 Python 代码。
  编写界面业务类
  业务类 MainWindow 实现程序逻辑和算法功能,与前面第2步生成的ui实现解耦,避免每次修改ui文件会影响业务代码。ui界面上的控件可以通过   self._ui.xxxObjectName   访问。 class MainWindow(QMainWindow):  FIT_WINDOW, FIT_WIDTH, MANUAL_ZOOM = 0, 1, 2   def __init__(self):   super().__init__()  # 调用父类构造函数,创建QWidget窗体   self._ui = Ui_MainWindow()  # 创建ui对象   self._ui.setupUi(self)  # 构造ui   self.setWindowTitle(__appname__)    # 加载默认配置   config = get_config()   self._config = config          # 单选按钮组         self.checkBtnGroup = QButtonGroup(self)         self.checkBtnGroup.addButton(self._ui.checkBox_ocr)         self.checkBtnGroup.addButton(self._ui.checkBox_det)         self.checkBtnGroup.addButton(self._ui.checkBox_recog)         self.checkBtnGroup.addButton(self._ui.checkBox_layoutparser)         self.checkBtnGroup.setExclusive(True)      实现界面业务逻辑
  对主界面上的按钮、列表、绘图控件进行   信号槽连接   。自定义的槽函数不用专门声明,如果是自定义的信号,需要在类__init__()前加上   yourSignal= pyqtSignal(args)   。
  这里以按钮响应函数、列表响应函数为例。按钮点击的信号是   clicked   ,listWidget列表切换选择的信号是  itemSelectionChanged   。 # 按钮响应函数 self._ui.btnOpenImg.clicked.connect(self.openFile) self._ui.btnOpenDir.clicked.connect(self.openDirDialog) self._ui.btnNext.clicked.connect(self.openNextImg) self._ui.btnPrev.clicked.connect(self.openPrevImg) self._ui.btnStartProcess.clicked.connect(self.startProcess) self._ui.btnCopyAll.clicked.connect(self.copyToClipboard) self._ui.btnSaveAll.clicked.connect(self.saveToFile) self._ui.listWidgetResults.itemSelectionChanged.connect(self.onItemResultClicked) 5. 运行看看效果
  运行   python main.py   即可启动GUI程序。
  打开图片 选择语言模型ch(中文) 选择文本检测+识别 点击开始,检测完的文本区域会自动画框,并在右侧识别结果——文本Tab页的列表中显示。
  所有检测出文本的区域列表,在识别结果——区域Tab页:
  软件代码
  由于时间有限,软件细节功能还需进一步完善。代码已开源到 gitee 上,欢迎感兴趣的朋友提pull request,共同修改完善。
  代码开源地址: https://gitee.com/signal926/ocr-gui-demo

呼伦贝尔宋Pro限时特惠10。78,欢迎到店赏车手握购车款犹豫不决的你是不是还在为买车而观望,当前比亚迪益丰祥泰店宋Pro限时特惠10。78颜色可选,现车充足,优惠时间10月11日10月11日,犹豫不决的朋友不妨到店亲身试驾一下比亚迪汽车远销国内外日前,我们从比亚迪官方了解到,将有450台比亚迪唐(参数询价)EV车型在广州港集结,启程前往挪威。至此,比亚迪已累计向挪威发运超1000台唐EV。今年5月,比亚迪对外宣布,将挪威作呼伦贝尔宋Pro限时大促,降价1。0万元本周宋Pro最新报价比亚迪益丰祥泰店即日起到10月12日限时促销,购车优惠1。0万元,如此优惠的降幅,大家可千万不要错过,店铺地址内蒙古自治区呼伦贝尔市鄂温克族自治旗巴彦托海镇南工淘宝的描述视频怎么保存,如何把淘宝商品描述视频保存我们在浏览淘宝的时候,会发现许多商品页面都有关于商品的描述视频。相比较图片而言,这些视频很显然能够更加生动形象的体现商品的价值,但与之对应的是这些商品描述视频的制作难度也要高出不少搜狐影视提取器,教你快速提取视频搜狐影视里面,我们该如何下载视频呢?怎么保存到我们电脑里面呢?这时候我们就需要安装这个下面这个软件,这个软件可以帮助我们下载搜狐视频里面的短视频,这个软件就是固乔视频助手,下面小编如何批量京东采集商品主图,多个主图采集攻略浏览京东商城经常会看到设计精美的宝贝图片,通过这些图片可提高成交量,如果你也喜欢这些图片,想把图片批量下载的电脑,下载时要掌握一定的技巧,不要再傻傻的一个个保存啦。今天小编要为大家最新群互动h5页面制作攻略!网友快说,正愁不知如何活跃微信群做社群运营,适当应用互动营销小游戏,吸粉引流必备,也能让参与者快速记住产品的品牌,在乔拓云平台的互动小游戏的模板大全里面,各种类型的小游戏,让用户在参与游戏时,不知不觉记住品牌,创虾皮网商品评论图片获取攻略虾皮网的商品评论区中不乏大量客户对于商品的评论图片等图片信息。利用这些虾皮网商品评论图片,我们能够更好的获取这些商品的评价信息,但我们在获取这些虾皮网商品评论图片时并不是那么的方便有没有什么办法能够给多个视频同时静音在剪辑的过程中我们经常会需要对视频添加背景音乐,但是每一段视频都会有原声,合并在一起的时候声音就会非常杂乱,很多用户都会选择手动将视频静音,但视频量多的话一个一个处理是不太实际的,下载淘宝图片有快速办法吗,淘宝怎么下载别人的主图视频做电商最重要的是什么,肯定是销量!想要好的销量就必须要有好的营销方法和好的产品,好的产品图片,如果商品图片如果我们自己亲手去拍摄,不经花费了大量的金钱还会浪费大量的时间在上面,今天怎么批量查询邮政快递并一键导出表格现在很多行业都会跟快递打交道,那么在快递数量多的情况下我们怎么样能够快速处理各种情况呢?今天小编给大家推荐一个硬核快递查询工具,能够有效的帮助大家,提高工作效率。1该软件叫做固乔快
报告显示五成网民担心手机App不安全来源经济日报新闻客户端12月28日,360公司在京举办开启数字安全元年360集团战略发布会。会上,由北京大学互联网发展研究中心与360联合制作的首份中国大安全感知报告(2021)(酷安评选2021年度旗舰手机,iPhone13ProMax稳居第一,谷歌垫底在今年最后几天时间里,酷安发起了一场2021年度旗舰手机评选活动,根据当前的投票情况来看,iPhone13ProMax可以说遥遥领先,共获得了7582票,占比高达40。相比之下,三大洋电机公布员工持股计划加强核心研发人员激励本报见习记者张军兵12月27日,大洋电机公布了员工持股计划,参加对象为公司新能源汽车电驱动动力总成系统及氢燃料电池系统业务(含下属子公司)的核心研发人员。参加本次持股计划的总人数不我的桌面补完计划2。0,从小地方入手前段时间重新布置了桌面,原本的原木色桌面容易反光,就换上了白色的磨砂桌垫,桌面上的物品也根据自己的使用习惯重新布置,粗看自己还是比较满意的,只是细看下来有些地方还是不太方便。这次能求推荐几个录音转文字的软件,最好是免费的,准确率高的也可以付费?感谢邀请,语音转文字的免费软件个人推荐息息语记,这个软件我在以前发表的文章里推荐过,简单介绍一下息息语记是一款非常良心的免费语音转文字软件,划重点免费软件支持安卓和苹果版本。这款软iQOO9主摄曝光,使用三星的GN5iQOO9看起来这次对拍照有信心,但从配置看,这个手机的定位是游戏手机,这个定位也许是对的,简单看看最近曝光的配置吧。终于看到一个换主摄的了,这个手机使用三星的GN5,也是一个50传销究竟有多迷人我是一名90后,但是接触传销却有十几年之久,无他,因家里的长辈被各种传销或者杀猪盘蒙蔽至今,所以被迫了解到很多,人际网1040阳光工程资本运作民间资产解冻,再到如今的云数贸北斗网络网约车女乘客跳车暴露平台安防漏洞然玉近日,记者从河北省保定市容城县警方获悉,因网约车司机持续偏航,女乘客跳车一事,警方已介入调查。12月4日晚,魏女士乘坐网约车时突然跳车。女乘客丈夫王先生称,事发当晚,他突然接到万物追踪随按随拍,小米12相机快得业届没对手,唯有单反一战?随着手机拍照拍照能力也有质的飞跃,越来越多人旅游时,都喜欢用手机代替数码相机设备来拍照记录生活。因此,华为小米vivo等手机厂商十分舍得在手机成像质量方面下功夫。然而大家不知道的是从6299跌至4049,小米Mix4一夜迎来交友价,等等党又赢了对于大部分米粉而言,小米Mix4不仅仅是一部高端旗舰机,它还是米粉们积攒了几年的情怀。但由于价格原因,部分米粉当起了等等党,没想到仅发布3个月,小米Mix4就迎来了它的交友价,等等OPPOK9x评测6nm制程天玑810芯片长续航的优秀新品在近期OPPO再一次推出了K系列的全新产品OPPOK9x,这一款产品进一步丰富了OPPOK系列在千元级价位段的产品布局,配备了5000mAh的大电池,配合天玑810芯片与90Hz高