从传统图像算法到深度学习,文字识别技术经历了这些变化
文字识别的发展大致可以分为两个阶段,分别是传统图像算法阶段和深度学习算法阶段。 传统图像算法
2012年之前,文字识别的主流算法都依赖于传统图像处理技术和统计机器学习方法实现,利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。传统的文字识别方法可以分为图像预处理、文字识别、后处理三个阶段:
图像预处理:完成文字区域定位,文字矫正,字符切割等处理,预处理一般包括灰度化、二值化,倾斜检测与校正,行、字切分,平滑,规范化等等,核心技术包括连通域分析,MSER,仿射变换,图像二值化,投影分析等。
文字识别:对切割出的文字进行识别,一般采用提取人工设计特征(如HOG特征等)或者CNN提取特征,再通过机器学习分类器(如SVM等)进行识别;
后处理:利用规则,语言模型等对识别结果进行矫正。
传统的文字识别方法,在简单的场景下能达到不错的效果,但是不同场景下都需要独立设计各个模块的参数,工作繁琐,遇到复杂的场景,难以设计出泛化性能好的模型。 深度学习算法
2012年之后,随着深度学习在计算机视觉领域应用的不断扩大,工业场景下的图像文本识别更为复杂,它会出现在许多不同的情景下,如医药包装上的文字、各类钢制零部件上的字符、集装箱表面喷印的字符、商铺Logo上的个性化字符等等。
文字识别逐渐抛弃了原有方法,过渡到深度学习算法方案。在深度学习时代,文字识别框架也逐渐简化,目前主流的方案主要有两种,一种是文本检测与文字识别的两阶段方案,另一种是端到端的文字识别方案。
1)两阶段文字识别方案
主要思路是先定位文本行的位置,然后再对已经定位的文本行内容进行识别。文本行检测从方法角度主要分为基于文本框回归的方法,基于分割或实例分割的方法,以及基于回归、分割混合的方法,从检测能力上也由开始的多向矩形框发展到多边形文本,现在的热点在于解决任意形状的文本行检测问题。文本识别从单字检测识别发展到文本序列识别,目前序列识别主要又分为基于CTC的方法和基于Attention的方法。
2)端到端的文字识别方案
使用文字检测加文字识别两步法虽然可以实现场景文字的识别,但融合两个步骤的结果时仍需使用大量的手工知识,且会增加时间的消耗。
而端对端文字识别能够同时完成检测和识别任务,极大地提高了文字识别的实时性。通过一个模型同时完成文本检测和文本识别的任务,既可以提高文本识别的实时性,同时因为两个任务在同一个模型中联合训练,两部分任务可以互相促进效果。
Python数据分析笔记8。2。2索引上的合并目录数据规整聚合合并和重塑DataWranglingJoin,Combine,andReshape8。1层次化索引8。2合并数据集数据库风格的DataFrame合并索引上的合并8。
滴滴为什么接不到长途单?首先,长单的出现是有概率的,按照经验平均20多单派一单比较正常。其次,派单有倾斜的,如果最近有单被评为五星好评,紧跟着就有长单优先派的顺位。再其次,市场竞争激烈,很多长单都被特惠一
为什么微信支付变服务了?更精准定性的需要。原因如下1微信支付变服务,更容易被用户接受体验,言语用词比较温馨。2支付涵盖范围太窄,服务涵盖范围广。而且原有支付里边不仅具备支付功能,也有手机充值,生活缴费等功
嘿,Siri,我多大了?iOS用户在语音助手的回答中被算错岁数如果你问Siri你多大了,在你今年的生日还没过的情况下,这一语音助手有很大的可能会把你的年龄搞错。例如,某人的生日是在4月,再过几个月才到27岁,但问Siri这个问题时会回答说已经
KTV效果器怎么调试?安装完一整套KTV系统,效果器该如何调试?建议先调输出通道1主音箱和低音的压限,保护音箱。2低切,防止喇叭做无用功。3延时,使各个音箱都能同步工作。4均衡,使整个系统的曲线更加平坦
goprintf小技巧go语言里面,三种打印结构体的方式,原来没有注意,今天觉得v看起来感觉不好,认真看了下文档,写一篇记录一下。1,v仅打印结构体的值2,v打印结构体的字段名字段值3,v在2的基础上加
自主品牌乘政策东风集中闯入,混动或成今年竞争最激烈细分市场2022年被认为是混动汽车爆发的元年。日前,工信部财政部国家税务总局等三部门调整享受车船税优惠的节能新能源汽车产品技术要求。全国乘用车市场信息联席会秘书长崔东树表示,这一政策的调整
春节自驾新能源车回家?超六成人说不考虑春节即将到来,自驾成为返乡的重要交通方式。1月28日,有汽车垂直媒体平台发布的虎年春节返乡报告显示,有约23的人回家要跨越上千公里。其中,报告还就用户对自驾新能源车返乡的态度进行了
好好收藏中国移动回复信息指令查询或办理相关业务看看电话号码是中国移动的回复以下数字或英文指令查询1。查询服务2。最新热点3。流量业务4。资费套餐5。其他业务6。已开通业务7。功能服务8。取消业务9。帮助101。话费查询102。
浅谈数字化网络化机器人化对现实社会的影响及对策数字人民币跟纸币一样,只是一种货币,随着数字人民币的推出,中国或将成为第一个同时面对数字化网络化机器人化对现实社会产生重大影响的挑战和考验的国家。数字人民币只是数字化的一角,随着各
5部委16部门连发政策力度加码,区块链今再起风口财政部等5部门联合发文部署开展银行函证试点工作中央网信办等16部门联合发文推广区块链技术今天消息可谓重磅,对于区块链板块尤其是金融科技细分板块是重大利好,数字经济作为2022年最大