近期因为公司有个微信答题活动,答题完成后,需要将结果得分发到公司群里进行统计。每一张截图都需要按照截图中的姓名进行更名并完成统计,完成后将图片保存到公司服务器。所以我想试着做一个小程序可以对截图进行图像识别并提取图像中姓名,然后将其自动保存到一个EXCEL表。完成结果统计的同时,再由程序修改图片名称,并保存到公司服务器上。所以最近计划学习一点图像识别来完成这个小目标,如有更简单的实现方法,可以评论区告诉我一声,谢谢。(我之前看网上有tesseractocr可以完成,但是安装环境始终配置不对,有没有这个配置好的,可以联系我,万分感谢!)
1。图像的基本表示方法
1。二值图像:指含有黑色和白色的图像。在计算机中,图像的处理是通过矩阵来实现的。计算机在处理该图像时,先将其划分为若干个小方块,每一个小方块就是一个独立的处理单位,可以称之为像素点。然后,计算机会将白色的像素点处理为1,将黑色的像素点处理为0,由于图像只使用两个数字就可以表示,因此,计算机使用一个比特位表示二值图像。
2。灰度图像:计算机会将灰度处理为256个灰度级,用数值区间〔0,255〕来表示。其中,数值255表示纯白色,数值0表示纯黑色,其余的数值表示从纯白到纯黑之间不同级别的灰度。用于表示256个灰度级的数值0255,正好可以用8位二进制来表示。有时也会使用8位二进制来表示二值图像。其中,0表示黑色,255表示白色。
3。彩色图像:与二值图像和灰度图像相比,彩色图像明显可以表示出更多的图像信息。有研究发现,人类的视网膜能够感受到红色、绿色和蓝色三种不同的颜色,即三基色。在自然界中,各种常见的不同颜色的光都可以通过三基色按照一定的比例混合而成。从人的视觉角度来看,可以将颜色解析为色调、饱和度和亮度等,在RGB色彩空间中,存在R(red,红色)通道、G(...
(全文)