童话说说技术创业美文职业
快好知
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

OCR在资产管理系统的应用

12月12日 长歌行投稿
  OCR是通过算法识别出图像中的文字内容,算是图像识别的一个分支。那为什么固定资产管理系统中会用到OCR呢?
  一、从业务说起:为什么需要OCR?
  为什么固定资产管理系统中会用到OCR呢?就得从梳理需求时遇到的问题说起。
  固定资产的全生命周期管理的第一步是“资产入库”,而入库是一个非常繁琐的过程,需要将大量信息录入系统。通过前期调研发现录入过程费时费力,还经常出现录入错误的问题(比如设备型号、序列码是较长的数字、字母序列,人工录入很容易出错)。
  有没有办法解决这个痛点呢?受证件识别的启发,我们想到了OCR辅助人工录入,那么接下来就是调研这种方案的可行性了。
  二、关于OCR
  OCR,也就是opticalcharacterrecognation(光学字符识别),是通过算法识别出图像中的文字内容,算是图像识别的一个分支。OCR对纯文本的识别已经比较成熟,识别率普遍可以达到90以上,百度、阿里、腾讯等各大厂都有相应的服务可以直接调用。
  1。OCR分类
  OCR技术可以按字体类别、识别语言、识别场景进行细分,每个细分的算法有所不同,现在暂时还没有非常通用的算法同时适用于多个分类。
  其中:
  印刷体识别成熟度要高于手写体(原因也比较好理解,印刷体比较规范,手写体五花八门有时候人都难以辨认)。
  中文和西文的识别成熟度高于小语种,中英文混合识别也能比较好的解决。
  自然环境中的文字识别难度也要大于文档图片识别,因为自然环境中文字所处环境要更加复杂,文字检测难度要大于文档图片。
  对特定格式文档(如身份证、发票、成绩单)的识别要好于自由文档(文字、表格、图片、公式混排)。
  调研到这里,我们可以发现:OCR辅助资产入库的需求,属于上述分类里的【自然环境】下的【中英文混合】【印刷体】识别。目前文字识别印刷体识别已经比较成熟,但自然环境下的拍照可能会给识别带来一些难度,初步判断OCR辅助人工进行资产入库信息录入是可行的。
  2。OCR算法理解
  既然OCR是图像识别的一种,那么处理的流程就和大多数图像识别算法是一致的,即预处理图像检测图像识别。以自然环境下的文字识别为例,OCR算法的工作流程大概是这样的:
  预处理:文本经过扫描或拍照后会发生形变等问题,会对识别造成干扰,预处理就是通过灰度化、二值化,倾斜校正等方式消除这种干扰,以提高识别准确率。其中倾斜矫正的常见算法有投影法、hough法等。
  文字检测:目的在于找出文字的区域,是文字识别的基础。简单背景(e。g。扫描、截屏)和复杂背景(e。g。广告牌、说明书)下的文字检测方法差异较大,实现算法可以分为传统CV算法和DL算法两大类。
  形态学方法:通过膨胀腐蚀等操作找到文字区域,只适用于简单背景。
  MSER:常用的传统文字检测算法,检测速度快,在简单背景和部分复杂背景中适用。但背景特别复杂时,检测效果可能较差。
  CTPN:是CNN和RNN相结合的算法,适用于简单和复杂背景的文字检测,但文字倾斜时的检测效果较差。
  SegLink:可以用于检测倾斜文字(但文字间隔不能太大)。
  EAST:端到端文本检测方法,也可用于检测倾斜文字,检测的准确性和速度都不错。
  文字识别:文字识别又根据文字的长度分为定长(e。g。验证码)和不定长。不定长文字识别现在主要是通过DL算法实现,目前两大主流技术是CRNNOCR和attentionOCR。由于文字识别的特殊性,虽然其表现形式是图像,但本质是序列化的文本。所以不论是CRNN还是attention,思路其实都是用CNN提取特征,然后用RNN处理序列化,充分运用了文本图像的所有信息。
  通过对OCR工作流程以及主流算法的了解,我们能对后续技术实现有个大概的认识,和RDbattle时候也更加有底了。
  三、功能设计
  1。核心场景
  最近公司采购了一批新的办公电脑,资产管理部门的小方来到仓库打算对这批电脑进行入库登记,他拿出手机打开app,对着每台电脑上的标签进行拍照,标签上的信息就被识别出来填入相应的输入框,很快小方就完成了入库登记的工作。
  2。业务流程
  对用户来说OCR识别的过程是无感的,操作上只是用拍照代替了手工填写某些字段的步骤。
  3。OCR实现中的几点考虑
  1)输入和输出
  在本需求中,OCR算法的输入就是用户拍摄的照片,然后需要把算法的识别结果填写到资产登记表单中相应的输入框中,所以需要确定:a)识别哪些字段;b)每个字段识别出的结果。
  a)识别哪些字段:综合考虑了常见的资产标签类型,结合最开始我们遇到的问题“字母数字序列输入容易出错且效率低”,确定了【资产名称】【型号】【SN码】三个需要识别的字段,也就是OCR处理完的结果只是中间结果,后边还需要做一个类似标注问题的处理(标注问题的处理方法暂不在这里展开)。
  b)文字识别的结果反映到页面上就是把识别出来的字段填到相应的文本框中,所以需要算法部分输出的结果是“型号:LenovoIdeaPadY580”这样的kv形式。
  细化一下可以得到下图:
  2)服务端or客户端
  模型直接放在客户端的好处是可以离线使用,缺点也十分明显:一是识别准确率会受影响;二是安装包会变大;三是算法迭代必须等软件整体更新。所以除非是特殊的离线要求,还是把识别放在服务端好一点。
  3)技术选型
  实现途径无非两种:自研或者调用第三方服务。
  自研的话,也不太可能从轮子造起,一般是在成熟的开源项目(如chineseocr)或者是团队已有的算法基础上优化,最后得到的模型在特定场景的准确度肯定会比通用服务好。
  自研算法主要包括两方面的工作:一是数据集获取、标注;二是模型优化,时间和人力成本都较高。但出于团队发展、算法积累以及后续可能需要私有化部署的考虑,我们最后还是选择了自研的形式。
  为了给自研提供支撑和帮助,我对第三方服务也做了一些调研,如果有小伙伴恰好有类似的需求也可以参考。百度、阿里、腾讯三个开发平台都没有针对我们这种需求的特定解决方案,所以只能使用通用OCR模型。
  以同一张标签图片为例(实际中试验了不同分辨率、不同品牌的资产标签),三个平台通用OCR识别结果如下:
  (百度AI开发平台)
  (阿里云)
  (腾讯AI开放平台)
  可见通用OCR模型已经能比较好的识别出资产标签信息,所以调用第三方服务的方案也是可行的。
  4)性能需求
  由于用户需要即时获得识别结果,正常网络环境下,处理单张图片请求到返回结果应该在2s以内;
  由于后续流程中有人工确认、更正信息的步骤,所以在平衡精度和召回率时,可以适当地提高召回率。
  4。优化思路:批量处理
  个人认为批量操作是2B业务的一个核心思想。设备特别多的情况下每个设备拍照录入这种流程也会比较慢,而且一批设备很大概率上是同一品牌型号的,所以批量录入的需求是存在且可以实现的(比如输入相同信息,然后批量识别SN码)。
  实现批量录入的需求,一方面前端业务流程需要调整,另一方面OCR算法为适应批量识别在速度上也需要提升。这也是这个功能点后续优化的方向
  参考资料
  大话文本检测经典模型:CTPN
  大话文本识别经典模型:CRNN
  自然场景OCR检测(YOLOv3CRNN)
  端到端不定长文字识别CRNN算法详解
投诉 评论 转载

如何搭建数据监控体系?对于做数据的同学来说,如何搭建出有效的数据监控体系呢?如何找准监控关键,明确我们要控制谁、什么时候控制、控制力度以及控制效果呢?面对这一系列的问题,笔者将一一作出解答。做……医疗问诊系统的MVP设计本文着重在于医疗问诊系统的MVP设计,该系统的初衷旨在将医疗资源留给最有需要的人,以线上问诊代替线下问诊,有效隔离病毒,达到“在家也能看病”的目的。MVP(Minimum……一款本地化风控产品的业务功能说明书构建完善的风控体系是平台运营的核心,也是保障投资人资金安全,有效降低平台逾期和坏账率的关键举措。本文主要讲讲一款本地化风控产品的业务功能说明书。XX决策系统……指引设计的11种模式、5种场景和6个思考点指引并不是在产品设计完之后才打上去的“补丁”,而是在开始设计的时候就需要思考的事情。在设计核心功能的时候,不要忘了去消灭用户触达核心功能前的层层障碍。“无论你使用一样工具……经验方法:如何有效描述设计改版的价值?设计改版,绝大部分场景下,并非是只改视觉那么简单,改视觉只能从感官层带来变化。在做改版的时候,一定多需要再开阔一下视角,多从用户角度及业务角度考虑,这样最后产出的结果,拿到的价……从三个板块出发,看项目验证基本思路本文作者将项目验证切分成三个板块:BRD、MRD、方案验证。按照这个思路来给大家讲解关于项目验证的内容,enjoy我这几年一直在创业公司工作的核心产品岗位工作,有在线教育……实例解析:收银台支付流程介绍本文主要以app端的聚合收银台为例进行介绍(大家可以直接用京东app的收银台为例子进行理解),来看看收银台的支付流程到底是怎样的。一、收银台及支付方式介绍(1)收银……OCR在资产管理系统的应用OCR是通过算法识别出图像中的文字内容,算是图像识别的一个分支。那为什么固定资产管理系统中会用到OCR呢?一、从业务说起:为什么需要OCR?为什么固定资产管理系统中……解析Fintech程序的设计准则出于金融科技领域的行业特性,所以Fintech产品与普通产品不同,需要重视数字与符号的价值、保持一致与简单设计、保持有限的颜色对比度。我在IT行业的第一次工作是从一家大型……今日头条、微信、支付宝疫情专题背后的产品逻辑自从疫情波及全国,并得到广泛关注后,大厂们出于社会责任与商业价值推出了对应疫情信息板块,例如今日头条、微信、支付宝就纷纷上线了疫情专题。那么通过对这些专题进行盘点后,我们能得到……掌握6条心得,避免产品设计疏漏初级产品经理或许都有这样的遭遇由于产品规划与设计时,覆盖得不够全面与严谨,导致产品方案错漏百出。继而陷入了低落与沮丧,不知道从何入手做出改进。而笔者就针对这一现象,总结出了六点……如何让产品光明正大地涨价?生活中,大家大多都遭遇过TONY老师理发涨价、爱去的餐馆涨价等经历不过,在商户的套路之下,有时我们不仅没觉得自己亏,甚至还觉得自己血赚!?这究竟是为什么呢?这么机智的涨价策略又……
通过功能拆解来分析:如何打造商业平台的持久生命力外卖产品优惠券功能设计(一)从URL输入到页面展现,这中间到底发生了什么?在开发MVP的关键功能集时,创业公司该关注什么?看这17个成精准评论,为何广受娱乐类产品的欢迎?张小龙如何建立起微信这个庞大的商业帝国?在金融数字产品设计中,如何营造“安全感”?从7方面解析:设计思维101是什么?如何做新功能引导,才不会被用户忽略?全面复盘数据管理系统如何从0到1失败产品手册二:一款游戏租号产品的败局后台产品经理:三步教你打造简单的营销平台(二)
孕妇如何减轻分娩恐惧心理在带孩子去看心理医生之前你必须注意的问题真的很冷冬季的小兴安岭尝到英超球员的甜头,孔蒂下一个目标为马蒂奇阿隆索汽车点烟器烧了还能开车吗为什么点烟器保险经常烧广发银行上海分行荣获上海地区“网络安全微视频”最佳创意奖热博 那一抹微笑典范工程评委批公益行政化母亲节的礼物六年级优秀作文1000字妈妈我想跟您说句心里话如何把话“说明白”:多点真诚,少点套路!?吉利18亿美元收购沃尔沃,长安1块钱收购铃木在华股份,都赚了

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界