童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

AI入门:卷积神经网络

9月17日 孤小单投稿
  讲到AI不得不讲深度学习,而讲到深度学习,又不能不讲卷积神经网络。如果把深度学习比作中国的互联网界,那卷积神经网络和循环神经网络就是腾讯和阿里级别的地位。今天我们主要讨论的卷积神经网络,到底卷积神经网络能解决什么问题,它的结构是怎样的?是怎么学习的?应用在哪些具体的产品上?本文将为大家一一解答。
  如果对深度学习还不了解的同学,建议你先看下之前的文章《深度学习到底有多深?》,对深度学习有一定的认知,对接来了的讨论可能会更容易理解。
  以下是本文讨论内容的大纲:
  下文的卷积神经网络,我们用简称CNN表示。
  01为什么需要用到CNN?
  1。普通的神经网络会遇到什么问题?
  假设我们要做图像识别,把一张图片丢到机器,机器能理解的就是每个像素点的值,如下图:
  我们在搭建好神经网络模型之后,需要做的就是用数据训练,最终需要确定的是每一个神经元参数w和b,这样我们就可以确定模型了。
  假设我们输入的是5050像素的图片(图片已经很小了),这依然有2500个像素点,而我们生活中基本都是RGB彩色图像,有三个通道,那么加起来就有250037500个像素点。
  如果用普通的全连接,深度比较深时,那需要确认的参数太多了,对于计算机的计算能力,和训练模型来说都是比较困难一件事。
  因此,普通神经网络的问题是:需要确认的参数太多。
  那CNN是怎么解决这个问题的呢?请接着往下看。
  2。CNN是怎么解决这个问题的?
  第一步:局部监测
  假设我们要看一张图片中有没有猫耳朵,也许我们不需要看整张图片,只需要看一个局部就行了。因此看是否是一只猫,只需要看是否有猫尾、是否有猫嘴、是否有猫眼,如果都有,那机器就预测说这张图片是一只猫。
  因为这种方法看的是图片的局部,而不是全部,也就是说神经元连接的是部分的特征变量,而不是全部的特征变量,因此参数比较少。(如果这里看不懂没关系,我们后面会详细解释)。
  看到这里你可能会疑问,我怎么知道取哪个局部,我怎么知道猫耳在图片的哪个部位?不着急,后面会讲到。
  第二步:抽样,缩小图片
  假设我们要识别一张5050像素的猫相片,如果我们把图片缩小到2525个像素点,那其实还是能看出这是一只猫的照片。
  因此,如果把图片缩小了,就相当于输入的特征变量变少了,这样也能减少参数的量。
  卷积神经网络就是用上面这两步的思想来减少参数,那具体CNN的架构是怎样的?又是怎么运行的?我们接下来详细讨论。
  02CNN的架构
  CNN的架构流程图:
  第一步:卷积,即局部监测。
  第二步:特征抽样,即缩小图片。
  然后重复第一、第二步(具体重复多少次,人为决定)。
  第三步:全连接,把第一、二步的结果,输入到全连接的神经网络中,最后输出结果。
  1。卷积(Convolution)
  首先,把图片转化成机器可以识别的样子,把每一个像素点的色值用矩阵来表示。这里为了方便说明,我们就简化,用66像素来表示,且取只RGB图片一层。
  然后,我们用一些过滤器跟输入的图片的矩阵做卷积。(如果不知道卷积怎么运行的话,可以去问下百度)
  那过滤器是什么呢?
  过滤器就是用来检测图片是否有某个特征,卷积的值越大,说明这个特征越明显。
  说到这里,我们回顾一下前面提到的问题:我怎么知道取哪个局部,我怎么知道猫耳在图片的哪个部位?
  用的办法就是:移动窗口卷积。
  同一个过滤器,会在原图片矩阵上不断的移动,每移动一步,就会做一次卷积。(每一移动的距离是人为决定的)
  因此移动完之后,就相当于一个过滤器就会检测完整张图片,哪里有相似的特征。
  卷积跟神经元是什么样的关系呢?
  上图所示有3点需要说明:
  1)每移动一下,其实就是相当于接了一个神经元。
  2)每个神经元,连接的不是所有的输入,只需要连接部分输出。
  说到这里可能你又会有疑问了,移动一下就是一神经元,这样不就会有很多神经元了吗?那不得又有很多参数了吗?
  确实可能有很多神经元,但是同一个过滤器移动时,参数是强行一致的,公用参数的。
  3)所以同一个过滤器移动产生的神经元可能有很多个,但是他们的参数是公用的,因此参数不会增加。
  跟不同过滤器卷积:
  同一层可能不止是跟一个过滤器卷积,可能是多个。
  不同的过滤器识别不同的特征,因此不同的过滤器,参数不一样。但相同的过滤器,参数是一样的。
  因此卷积的特点是:
  局部检测
  同一个过滤器,共享参数
  3。池化(Maxpooling)
  先卷积,再池化,流程图:
  用过滤器1卷积完后,得到了一个44的矩阵,假设我们按每4个元素为一组(具体多少个为一组是人为决定的),从每组中选出最大的值为代表,组成一个新的矩阵,得到的就是一个22的矩阵。这个过程就是池化。
  因此池化后,特征变量就缩小了,因而需要确定的参数也会变少。
  4。全连接
  经过多次的卷积和池化之后,把最后池化的结果,输入到全连接的神经网络(层数可能不需要很深了),最后就可以输出预测结果了。
  那到这里,我们把CNN的工作流程就讲完了,但是每一步具体的意义是什么,怎么理解?
  可能你还不太理的顺,接下来我们会用一些可视化的方式帮助大家理解。
  03CNN是怎样学习的?
  我们以AlexNet为例,给大家展示下CNN大致的可视化过程。
  AlexNet是AlexKrizhevsky等人于2012年的ImageNet比赛中提出了新型卷积神经网络,并获得了图像分类问题的最好成绩(Top5错误率为15。3)。
  AlexNet的网络架构:
  其实AlexNet的结构很简单,输入是一个224224的图像,经过5个卷积层,3个全连接层(包含一个分类层),达到了最后的标签空间。
  AlexNet学习出来的特征是什么样子的?
  第一层:都是一些填充的块状物和边界等特征。
  中间层:学习一些纹理特征。
  更高层:接近于分类器的层级,可以明显的看到物体的形状特征。
  最后一层:分类层,完全是物体的不同的姿态,根据不同的物体展现出不同姿态的特征了。
  所以,它的学习过程都是:边缘部分整体。
  关于卷积神经网络的可视化,大家想了解更多的话,可以参考文章《卷积神经网络超详细介绍》。
  04AlphaGo
  前面我们提到了AlphaGo有用到CNN,那具体是怎么应用的呢,这里简答给大家科普下:
  我们把围棋看成是一个1919像素的图片,,每个像素点的取值:有黑子是1、有白子是1,空为0。
  因此,输入棋盘就是所有像素点的矩阵值,输出是下一步落子的位置。
  那这个跟CNN有什么关系?
  我们知道CNN擅长做的事情就是检测局部特征,那也可以把这项技能运用到下围棋上。
  比如说上图这种特征,检测盘面上有没有这样的特征,如果有的话,通常下一步的落子是怎样。就好比玩剪刀石头布,检测到对方出剪刀,那机器的应对策略就是出石头。
  同样可能有很多不同的特征,因此需要用不同的过滤器去检测。
  而且,同一个特征可能会出现在不同的位置,因此也可以用过滤器移动的方法去检测。
  AlphaGo有没有池化?
  讲到这里你会不会好奇,AlphaGo到底有没有用到CNN的池化。因为池化是把图片缩小的,围棋是1919个点,如果缩成1010个点,能行吗?
  实际上AlphaGo是没有用到池化这一步的,所以说CNN也未见得一定要使用池化,还是需要实际问题实际解决,灵活应用。
  好了,到这里就介绍完了CNN,后续我会写一篇文章介绍深度学习的另一大门派:循环神经网络RNN,感兴趣的同学记得关注哦。
投诉 评论

“大案牍术”救不了在线招聘笔者将目光聚焦于在线招聘,并分析总结了在线招聘领域的发展弊端与顽疾,并讲了如何利用AI技术改进在线招聘,以及在线招聘的破局点在何处。求职者:千里马常有,而伯乐不常有。……语音交互的三驾马车:ASR、NLP、TTS语音交互是AI最重要的领域之一,也是目前落地产品比较成熟的领域,比如说智能客服、智能音箱、聊天机器人等,都已经有成熟的产品了。语音交互主要由哪些部分组成?各自主要处理什么任务?……智能安防机器人概述本篇文章主要关注基于安防任务的机器人,笔者为我们详细介绍了安防机器人的发展现状、类别以及它的技术难点。安防行业是随着现代社会安全需求应运而生的产业。可以说,社会只要还有犯……AI入门:循环神经网络今天我们主要讨论的循环神经网络,到底循环神经网络能解决什么问题,它的结构是怎样的?有什么优缺点?应该在那些领域上上?本文将跟大家一起探讨。讲到AI不得不讲深度学习,而讲到……AI入门:卷积神经网络讲到AI不得不讲深度学习,而讲到深度学习,又不能不讲卷积神经网络。如果把深度学习比作中国的互联网界,那卷积神经网络和循环神经网络就是腾讯和阿里级别的地位。今天我们主要讨论的卷积……如何建立人和AI协同工作中的信任?随着技术的发展,AI这个“聪明的工具”出现了,它不再是简单被操作,具有全新的性质。那我们今天就来聊聊怎样建立人与AI协同中的信任。一直以来我们都在尝试更多的利用AI算法分……AI时代的中层支柱:统计学本文笔者将通过对统计学和AI的关系进行分析,追溯他们的发展史,去探究:如何将对统计学如何应用到人工智能领域?AI不过是统计学ThomasJ。Sargent:人工智能……深度学习到底有多深?现在搞AI的公司,不管用什么样的算法,都想让自己跟深度学习扯上点关系,因为这样好像显得逼格够高。目前比较前沿的语音交互、计算机视觉等,就连神坛的AlphaGo的算法都是用深度学……我们访谈了117位家长,发现了儿童手表的秘密儿童手表如何在眼花缭乱的同类产品中赢得家长的认可?消费决策者最看重儿童手表哪些功能?如何在白热化的市场竞争中突出重围?儿童诱拐、丢失事件频发,一则则消息牵……AI时代人车交互体验:从“被动”到“主动”、从车内到车外AI时代,人与车的交互将打破由人来发起再逐层深入的方式,在用户需要的时候AI主动的把对应的服务放到用户面前。7月3日4日,“BaiduCreate2019”百度AI开发者……亚马逊Alexa语音交互设计四范式(下)本文笔者将与大家分享Alexa技能设计的四大范式中的两大范式BeAvailable(设计易用性)、BRelatable(设计亲和力)。BeAvailable(……亚马逊Alexa语音交互设计四范式(上)本文笔者将与大家分享Alexa技能设计的四大范式中的两大范式BeAdaptable(设计可适应),以及BePersonal(设计个性化)。较之已有相当成熟,且被业界广泛应……
小红书直播带货的主播和商家有哪些规范要遵守?小红书这个深度“种草”平台,早就顺势推出了直播带货的“转化”功能。和其它直播电商平台一样,小红书也为自己平台中的主播和商家制定了直播规范。接下来就让我们一起来看看,小红书直播带……快手电商启动“116品质购物节”商家和主播多项扶持力度翻倍站长之家(ChinaZ。com)9月10日消息:今日,“燃2021快手电商116商家大会”在杭州举行,并公布了公布了今年“116品质购物节”(以下简称“116”)的商家激励策略……北京广电局:坚决抵制造星炒星等畸形价值观站长之家(ChinaZ。com)9月10日消息:据北京市广播电视局消息,9月8日下午,北京市广播电视局召开专题会,传达中宣部开展文娱领域综合治理工作情况并就下一步治理工作进行部……月销破千万,获高樟500万元投资,小鹿母婴创始人刘晓璐的“远“我一直有颗想创业的心,够努力跟有天分的人是很多的,抓住风口再持续打造可累积的竞争优势,才有可能比别人跑得快、跑得远”。在直播电商的赛道上,小鹿母婴创始人刘晓璐是一位与众……快手发布“反诈”专项治理报告:永久封禁涉嫌诈骗帐号超3万个站长之家(ChinaZ。com)9月11日消息:今日,快手官方发布了7月8月期间的“反诈”专项治理报告,治理期间快手社区安全和风险控制团队通过风控识别模型,对平台内“免费送”、……iPhone13可以用以前的充电器吗苹果13可以用什么充电器苹果iPhone13系列手机今年不仅电池要变大,同时官方也会支持速度更高的充电器。那么如果以前用户已经有了iPhone11、iPhone12系列手机的充电器可以给iPhone1……三星GalaxyM525G通过认证:支持双卡搭载骁龙778G据外媒发现,GalaxyM525G已经通过了蓝牙技术联盟(BluetoothSIG)认证,表明该机即将上市发售。在认证页面上,GalaxyM525G有两款型号,分别为SM……“快意不限速,灵感不设限”,雷鸟科技发布雷鸟FF1系列5G手2021年9月6日,雷鸟科技正式发布全新5G智能终端雷鸟FF1系列5G手机。雷鸟FF1配备6。67英寸120Hz高刷无界屏幕,64MPAI三摄系统,为用户呈现超清画质影像;66……释放5G更多潜能!高通骁龙X65测试终端展示毫米波部署新进展作为发展5G技术的核心企业,高通在5G毫米波领域的技术实力不容小觑。日前,高通联合中兴通讯又一次实现了毫米波的新进展,双方合作完成了国内头次采用5GNR独立组网双连接(NRDC……轻薄版“小米11”!小米11Lite5GNE获认证今年上半年,小米上市了小米11系列4款机型:小米11、小米11Lite(国行版命名为小米11青春版)、小米11Pro和小米11Ultra。其中小米11Lite定位是轻薄机……TCL正式推出20R5G手机价格低廉如今,TCL凭借TCL20R5G在欧洲市场进一步扩展了其20系列智能手机。该设备以低廉的价格进入该系列,成为迄今为止最便宜的TCL20设备。它有一个6。52英寸720x1……高通5G基带支持毫米波技术,为各行各业带来深度变革打下基础无线通讯技术的发展,不仅让人与人之间的沟通更加紧密,而且还让自动驾驶、机器人、云服务、敏捷工厂、智慧农业等一系列全新的事物出现在每个人的生活中。而这一切美好的变化,都需要5G技……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界