深度学习引入身份证中男女性别识别的问题01
前言
我们都知道身份证由18位数字组成,倒数第2位数字代表男女性别,如果是奇数,表明持有身份证的人事男性;如果是偶数,则表明为女性。假如事先不知道这个规则,但是收集了一大堆身份证,在收集过程中通过身份证上的照片知道持有者的性别,现在我们希望通过神经网络来寻找这个规律。问题分析
初步分析这个问题可以得到下面几条思路已知的信息包括身份证号和对应的持有者身份,显然身份证号可以作为神经网络的输入,而持有者性别则是神经网络计算结果的目标值,因此,我们已经拥有完备的训练数据。由于性别一般分为男、女两类,本问题显然是一个二分类问题。本问题只有两个结果值,初步判断,本问题显然不是一个线性问题;因为线性问题一般会随权重值的变化有一个线性变化的范围。如果我们预知这个与性别有关的编号规则,会发现这个也不是一个跳变的非线性问题,因为它不像我们之前处理的三好学生评选结果问题那样只有一个门槛且门槛内外分别代表两个分类,而随着的变化"上下跳动",一会是男性,一会是女性。可以预想到,用原来的单神经元(单层)的结构恐怕难以解决这个问题。单层网络的模型
根据问题分析,我们可以先采用与图5.4类似的神经网络进行尝试,为了简化起见,我们取身份证号码的后4位作为演示。那么,这个神经网络将有4个数字作为输入,4个数字的范围都是[0,9]之间;输出结果是男性(0)和女性(1)。显而以见,我们需要sigmoid函数把输出结果收敛到[0,1]的范围内。如图1.1所示
图1.1 身份证问题的单层神经网络模型
我们根据图1.1的神经网络模型进行代码的实现,具体如下:# Author:北京 # time:2021/4/20 import tensorflow as tf import random random.seed() x = tf.placeholder(tf.float32) yTrain = tf.placeholder(tf.float32) # random_normal函数是一个产生随机数的函数,本问题中w的形态是[4],是一个4维的向量,使用random_normal赋初值后,其中每一个数字都将被置为随机数。 # random_normal函数产生的随机数服从正态分布,我们设置平均值(mean)为0.5,stddev指定这个波动范围 w = tf.Variable(tf.random_normal([4], mean=0.5, stddev=0.1), dtype=tf.float32) b = tf.Variable(0, dtype=tf.float32) n1 = x * w + b y = tf.nn.sigmoid(tf.reduce_sum(n1)) loss = tf.abs(y - yTrain) optimizer = tf.train.RMSPropOptimizer(0.01) train = optimizer.minimize(loss) sess = tf.Session() sess.run(tf.global_variables_initializer()) # 记录训练误差总和,在每次训练后,将它的值除以训练次数得到平均误差作为信息来输出以便参考 lossSum = 0.0 for i in range(5000): # 随机产生[0,9]的4位整数,模拟身份证后4位 xDataRandom = [int(random.random() * 10), int(random.random() * 10), int(random.random() * 10), int(random.random() * 10)] # 判断倒数第2位数字奇数或者偶数来模型对应的性别男女 if xDataRandom[2] % 2 == 0: yTrainDataRandom = 0 else: yTrainDataRandom = 1 result = sess.run([train, x, yTrain, y, loss], feed_dict={x: xDataRandom, yTrain: yTrainDataRandom}) lossSum = lossSum + float(result[len(result) - 1]) print("i:%d,loss:%10.10f,avgLoss:%10.10f" % (i, float(result[len(result) - 1]), lossSum / (i + 1)))
运行结果:
我们发现在训练5000次后,平均误差会在0.46左右,基本稳定下来,再加多训练次数也并不会使误差越来越小。说明目前的神经网络模型无法解决当前这个问题,需要进一步优化。i:4990,loss:0.0000288486,avgLoss:0.4647823456 i:4991,loss:0.0002346635,avgLoss:0.4646892872 i:4992,loss:0.0011085739,avgLoss:0.4645964411 i:4993,loss:0.9992531538,avgLoss:0.4647035009 i:4994,loss:0.0000253916,avgLoss:0.4646104722 i:4995,loss:0.3684671521,avgLoss:0.4645912282 i:4996,loss:0.0379816890,avgLoss:0.4645058550 i:4997,loss:0.9515267611,avgLoss:0.4646032982 i:4998,loss:0.9845128655,avgLoss:0.4647073009 i:4999,loss:0.0000001192,avgLoss:0.4646143595 常见的优化神经网络结构的方法增加神经元节点数量增加隐藏层的数量隐藏层采用全连接方法,全连接层应该是前后两层所有的节点之间都是连线
现代将召回部分进口起亚索兰托嘉华汽车!部分存在溜车隐患9月23日,南都记者从国家市场监督管理总局获悉,现代汽车(中国)投资有限公司日前决定,自10月17日起,召回2015年4月27日至2015年7月25日生产的部分进口起亚索兰托2。0
日本在小行星龙宫岩石样本中发现液态水日本宇宙航空研究开发机构23日宣布,日本隼鸟2号探测器采集并通过回收舱带回地球的小行星龙宫岩石样本中含有液态水。日本宇宙航空研究开发机构23日发布消息说,该机构和日本东北大学等组成
百万网红,都要以露来吸人眼球?近日,台媒爆出台湾百万女网红Yumi。k吃火锅的照片,让人怀疑她的百万粉丝都是靠着流量密码来的么?但单看也没多大的用处啊,很多东西不得实践才知道好不好!而回看百万女网红Yumi。k
新车售63。18万元起,2023款奥迪S5到店,4。9秒破百文懂车帝原创陈旭明2023款奥迪S5Sportback四门轿跑车到店懂车帝原创产品作为奥迪品牌旗下性能轿跑车型,2023款奥迪S5已于近日上市销售,推出双门四门以及敞篷版,售价区间
关于小黄我脑子里一直在浮现他吃包子那样,我从他去包子店把车支那,到买包子,到买了包子把车子骑过来,到坐车上吃包子,一直看着他。人家吃个包子都那么好看。一手拿着手机翻着,一手拿着包子大口大口
婴幼儿抚触好处多多,家长们快来学起来给自家宝贝安排上吧婴儿抚触也就是婴儿按摩,是一种医疗方法。人体皮肤是接受外界刺激的最大的感觉系统,是神经系统外在的感受器。早期的抚触可以在婴儿脑发育的关键期给脑细胞和神经系统适当的刺激,促进婴幼儿的
资讯丨尚未出生的宝宝能感知味道,并做出表情反应头条创作挑战赛我们挑食的习惯或许有更早的起源你还记得自己是什么时候开始挑食的吗?小编我面对胡萝卜可能也是哭脸科研人员在本周四(9。22)发表的一项新研究中表示,在子宫内的宝宝似乎非
我的10月怀胎之旅第十九周当天晚上我约了产检医生的号,在6月23日(19周)时我去做产检。约号一般是下午5,6点左右约,得提前约一个星期约,这样主任或副主任的号才能约到,像我明天去检今天约号很难有好的号了,
一洋课堂孕期饮食,一定要做好计划怀孕是快乐的,孕育着新的生命。怀孕后,孕妇的饮食至关重要。但孕期是不快乐的,不仅要注意慢慢长大的肚子,还要注意饮食问题。前三个月没有胃口中间四个月慢慢好转,开始有食欲,那怎么吃成了
研究显示胎儿也有口味偏好据新华社专特稿你对食物味道的偏好始于何时?英国杜伦大学牵头的一项研究显示,胎儿对母亲吃下的不同味道食物反应各异。研究人员由此认为,孕妇饮食可能会影响宝宝出生后的口味偏好,如适当引导
打开盲盒孩子看到了什么8月16日,市场监管总局发布盲盒经营活动规范指引(试行)(征求意见稿),向社会公开征求意见,拟对盲盒销售的内容形式销售对象等方面作出规定。盲盒经营乱象,已引起国家重视。在最高检第九