范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

策略产品经理必读系列第六讲深度学习与神经网络

  一、人工智能、机器学习、深度学习是什么1.1 人工智能是什么
  在介绍深度学习之前,先和大家介绍一下AI和Machine Learning,才能理清AI、Machine Learning、Deep Learning三者之间的关系。
  1956年8月,在美国汉诺威小镇的达特茅斯学院中,几位科学家在会议上正式提出了"人工智能"这一概念,这一年也被称为人工智能元年。在此之前,人类已经制造出各类各样的机器如汽车、飞机等,但这些机器都需要经过人来操作使用,无法自己具备操作的能力。科学家探讨能不能制造出一个可以像人类大脑的一样思考的机器,拥有人类的智慧,这就是人工智能。
  同时科学家们也对AI未来的发展畅想了三个阶段:
  大家在电影上看到的各种AI都是强人工智能,但目前我们仍处在弱人工智能阶段,什么时候进入强人工智能阶段未知。强人工智能阶段,机器可以完美媲美人脑,像人类一样有情感地、批判性地去思考。同时可以快速学习,拥有极强的自学能力。
  那么如何实现人工智能了,实现人工智能的方法是什么了?
  1.2 机器学习是什么
  实现人工智能的方法我们统称为"机器学习"。同样是1956年的美国达特茅斯会议上,IBM的工程师Arthur Samuel正式提出了"Machine Learning"这个概念,1956年真的是特殊的一年。
  机器学习既是一种实现AI的方法,又是一门研究如何实现AI的学科,你可以理解为和数学、物理一样的学科。机器学习,简单来说就是从历史数据中学习规律,然后将规律应用到未来中。国内大家一致推荐的,南京大学周志华教授的机器学习教材西瓜书里面如此介绍机器学习。
  机器学习是机器从历史数据中学习规律,来提升系统的某个性能度量。其实人类的行为也是通过学习和模仿得来的,所以我们就希望计算机和人类的学习行为一样,从历史数据和行为中学习和模仿,从而实现AI。
  简单点讲,大家从小到大都学习过数学,刷过大量的题库。老师和我们强调什么?要学会去总结,从之前做过的题目中,总结经验和方法。总结的经验和方法,可以理解为就是机器学习产出的模型,然后我们再做数学题利用之前总结的经验和方法就可以考更高的分。有些人总结完可以考很高的分,说明他总结的经验和方法是对的,他产出的的模型是一个好模型。
  既然有了机器学习这一方法论,科学家们基于这一方法论,慢慢开始提出了各类各样的算法和去解决各种"智能"问题。就像在物理学领域,物理学家们提出了各种各样的定理和公式,不断地推动着物理学的进步。牛顿的三大定律奠定了经典力学的基础。而传统机器学习的决策树、贝叶斯、聚类算法等奠定了传统机器学习的基础。
  1.3 深度学习是什么
  但是随着研究的不断深入,传统机器学
  习算法在很多"智能"问题上效果不佳,无法实现真正的"智能"。就像牛顿三大定律,无法解释一些天文现象。在1905年,爱因斯坦提出了"相对论",解释了之前牛顿三大定律无法解释的天文现象。同样2006年,加拿大多伦多大学教授Geoffrey Hinton对传统的神经网络算法进行了优化,在此基础上提出了Deep Neural Network的概念,他们在《Science》上发表了一篇Paper,下面链接是那篇文章:http://www.cs.toronto.edu/~hinton/science.pdf
  引起了Deep Learning在学术界研究的热潮。2012年Geoffrey Hinton老爷子的课题组,在参加业界知名的ImageNet图像识别大赛中,构建的CNN网络AlexNet一举夺得冠军,且碾压第二名(SVM方法)。也正是因为该比赛,Deep Learning引起了工业界的关注,迅速将Deep Learning引进到工业界的应用上。深度学习技术解决了很多传统机器学习算法效果不佳的"智能"问题,尤其是图片识别、语音识别和语义理解等。某种程度上,深度学习就是机器学习领域的相对论。
  将人工智能和机器学习带到了一个新高度的技术就是:Deep Learning。深度学习是一种机器学习的技术。
  同时大家应该听到过一大堆的"学习"名词:机器学习、深度学习、强化学习等等。在这里面机器学习是"爸爸",是父节点;其他都是它"儿子",是子节点。AI、Machine Learning和Deep Learning的关系可以通过下图进行描述。
  让机器实现人工智能是人类的一个美好愿景,而机器学习是实现AI的一种方法论,深度学习是该方法论下一种新的技术,在图像识别、语义理解和语音识别等领域具有优秀的效果。
  那么深度学习到底是一门什么技术?"深度"到底代表什么?
  二、深度学习与神经网络
  介绍深度学习就必须要介绍神经网络,因为深度学习是基于神经网络算法的,其实最开始只有神经网络算法,上文也提到2006年Geoffrey Hinton老爷子提出了Deep Learning,核心还是人工神经网络算法,换了一个新的叫法,最基本的算法没有变。学过生物的都知道神经网络是什么?下图是生物神经网络及神经元的基本组成部分。
  人类的大脑可以实现如此复杂的计算和记忆,就完全靠900亿神经元组成的神经网络。那么生物神经网络是如何运作的了?可以参照下图:
  通过神经元接收外界信号,达到一定阈值,触发动作电位,通过突触释放神经递质,可以是兴奋或抑制,影响突触后神经元。通过此实现大脑的计算、记忆、逻辑处理等,进行做出一系列行为等。同时不断地在不同神经元之间构建新的突触连接和对现有突触进行改造,来进行调整。有时候不得不感叹大自然的鬼斧神工,900亿神经元组成的神经网络可以让大脑实现如此复杂的计算和逻辑处理。
  科学家们从生物神经网络的运作机制得到启发,构建了人工神经网络。其实人类很多的发明都是从自然界模仿得来的,比如飞机和潜艇等。下图是最经典的MP神经元模型,是1943年由科学家McCulloch和Pitts提出的,他们将神经元的整个工作过程抽象为下述的模型。x_1,x_2,x_3,x_n:模拟生物神经网络中来自其他神经元的输入;ω_1,ω_2,ω_3,ω_n:模拟生物神经网络中每个神经元对外接收的突触强度不同,所以外界接收的输入乘以一定权重;Σ-Sum:模拟生物神经网络中神经元对外接收的信号进行累加汇总;Bias:模拟生物神经网络中神经元的一般敏感性。每个神经元的敏感性不同,所以需要一定的偏差来调整汇总值;Activation Function:模拟生物神经网络中信号累积到一定程度产生的动作电位,当累积到一定程度就会"激活"动作电位。实际使用时我们一般使用Sigmoid函数;Output:模拟生物神经网络中神经元对外释放的新的信号;
  现在我们知道了最简单的神经元模型了,我们如何使用该模型从历史数据中进行学习,推导出相关模型了。我们使用上述MP模型学习一个最简单的二分类模型。
  如上图,为了训练简单,我们训练集里面只有两条数据。同时激活函数,我们也是最简单的激活函数,当φ( ) > 0时输出为1,当φ( )   0时输出为0。然后对于参数的更新规则Updated Rule,我们使用的Sequential Delta learning rule和Back Propagation算法,该规则和算法不详细介绍了,可以理解为就像物理、数学领域一些科学家发现的普适性定理和公式,已经得到了证明,用就完事了。
  因为Input只有1个值x_1,所以初始设定参数ω_1,同时还需要一个Bias,我们将Bias设定为ω_0。上述两个参数,我们需要从历史数据中学习出来,但是最开始我们需要一个初始值,假设初始值为ω_1 = 2, ω_0 = 1.5 ;然后我们通过不断地更新迭代最终ω_1和 ω_0 将稳定在两个固定的值,这就是我们最终通过一个简单MP模型学习出来的参数。下图是整个更新迭代学习的过程:
  大家可以看到上图最后一次循环ω已经不再发生变化,说明[0.5,-1]就是最终我们学习出来的固定参数。那么上述整个过程就是一个通过神经网络MP模型学习的全过程。下图是最终学习出来的Classifier分类器,我们带入一个新的数据,就可以进行Class预测了。
  2.3 何为"深度"
  上文我们已经介绍了人工神经网络经典的MP模型,那么在深度学习里面我们使用的是什么样的神经网络了,这个"深度"到底指的是什么了?其实就是如下图所示的,输入层和输出层之间加更多的"Hidden Layer"隐藏层,加的越多越"深"。
  最早的MP神经网络实际应用的时候因为训练速度慢、容易过拟合、经常出现梯度消失以及在网络层次比较少的情况下效果并不比其他算法更优等原因,实际应用的很少。中间很长一段时间神经网络算法的研究一直处于停滞状态。人们也尝试模拟人脑结构,中间加入更多的层"Hidden Layer"隐藏层,和人脑一样,输入到输出中间要经历很多层的突触才会产生最终的Output。加入更多层的网络可以实现更加复杂的运算和逻辑处理,效果也会更好。
  但是传统的训练方式也就是我Part 2.2里面介绍的:随机设定参数的初始值,计算当前网络的输出,再根据当前输出和实际Label的差异去更新之前设定的参数,直到收敛。这种训练方式也叫做Back Propagation方式。Back Propagation方式在层数较多的神经网络训练上不适用,经常会收敛到局部最优上,而不是整体最优。同时Back Propagation对训练数据必须要有Label,但实际应用时很多数据都是不存在标签的,比如人脸。
  当人们加入更多的"Hidden Layer"时,如果对所有层同时训练,计算量太大,根本无法训练;如果每次训练一层,偏差就会逐层传递,最终训练出来的结果会严重欠拟合(因为深度网络的神经元和参数太多了)。
  所以一直到2006年,Geoffrey Hinton老爷子提出了一种新的解决方案:无监督预训练对权值进行初始化+有监督训练微调。
  归纳一下Deep Learning与传统的神经网络算法最大的三点不同就是:训练数据:传统的神经网络算法必须使用有Label的数据,但是Deep Learning下不需要;训练方式不同:传统使用的是Back Propagation算法,但是Deep Learning使用自下上升非监督学习,再结合自顶向下的监督学习的方式。对于监督学习和非监督学习概念不清楚的读者可以阅读我上文引用的强化学习文章,里面有详细介绍。层数不同:传统的神经网络算法只有2-3层,再多层训练效果可能就不会再有比较大的提升,甚至会衰减。同时训练时间更长,甚至无法完成训练。但是Deep Learning可以有非常多层的"Hidden Layer",并且效果很好。
  不管怎么样Deep Learning也还是在传统神经网络算法基础上演变而来的,它还是一种基于神经网络的算法。
  三、深度学习框架
  大家了解了深度学习和神经网络以后,相信大家也经常听到如下的英文单词:Tensorflow、Caffe、Pytorch等,这些都是做什么的了。Tensorflow是Google旗下的开源软件库,里面含有深度学习的各类标准算法API和数据集等,Pytorch是Facebook旗下的开源机器学习库,也包含了大量的深度学习标准算法API和数据集等。Caffe是贾扬清大神在UC Berkeley读博士时开发的深度学习框架,2018年时并入到了Pytorch中。
  因为深度学习发展至今,很多算法都已经是通用的,而且得到过验证的了。
  那么有些公司就希望将一些标准算法一次性开发好,封装起来,后面再使用时直接调用引入即可,不需要再写一遍。就像大家小时候学习英文一样,英文字典有牛津版本的,也有朗文版本的。对于收录的英文单词,英文单词如何使用,如何造句等,已经有了标准的用法。我们只需要查阅这些字典即可,而Tensorflow、Caffe、Pytorch做的其实也就是计算机届的牛津、朗文英文大词典。国内百度目前也有自己的深度学习框架Paddle-Paddle。
  目前一般是学术界用Pytorch较多,Pytorch更适合新手入门,上手快。工业界用Tensorflow较多,更适合工业界的落地和部署等。
  四、深度学习在工业界主要应用领域
  目前深度学习应用最广泛的就是传统机器学习算法解决不了的领域或者是效果不佳的领域:视觉、自然语言和语音识别领域。当样本数量少的时候,传统机器学习算法还可以通过一些结构化特征组合在一起然后区分出来。
  比如区分汽车和摩托车,可以通过轮子数量。但对于人脸,千万张人脸相似的太多,已经完全无法通过鼻子、头发、眼睛这些简单的特征组合进行区分了。需要探索更多更复杂的特征,组合在一起才能将千万张人脸区分开来。
  所以这时候就需要Deep Learning构建多层神经网络,探索组合更多的特征,才能识别区分千万级别甚至亿万级别的人脸。这在传统神经网络算法和机器学习算法是完全实现不了的。
  当然实现上述功能,也是因为现阶段有了更多的数据可以进行训练,同时有了更好的算力可以快速完成训练。传统的CPU进行训练,可能训练几个月都训练不出来结果。GPU的出现和改进加速了上述训练过程。
  目前应用最广的一些领域:CV:计算机视觉领域。随处可见的人脸识别、物体识别和文字识别OCR。广泛应用于安防领域,同时零售行业也在通过CV技术实现线下门店的数字化。目前国内头部公司就是CV四小龙:商汤、旷视、云从、依图;NLP:自然语言处理领域。目前整体的NLP技术还是不够成熟,无法实现人们设想的机器人可以完全智能对话,机器人目前只能做一些简单的信息提取和检索整合的事情。NLP目前也是最难做的,同样一句话可能会有不同种意思。人有时都很难理解,更何况机器。目前国内头部公司主要是百度和达观;ASR:语音识别领域。目前国内独一档就是科大讯飞,尤其是能够做到很多地方方言的精准识别。语音识别目前主要主要用在语音客服上,有时候大家接到的推销电话其实背后都是电话机器人打的。电话机器人能够完全和用户进行对话,一定程度上也需要NLP的技术,因为它需要理解用户的意思。Autopilot:自动驾驶其实也是CV的衍生领域,目前世界上做自动驾驶最好的其实还是汽车公司比如特斯拉。因为没有车,自动驾驶想获得训练数据都很困难。没有车,自动驾驶技术想实验都跑不通。目前国内百度差不多算第一档。推荐:传统的推荐都是用GBDT+LR模型来做的,目前深度学习在推荐领域也得到了广泛的应用,下面是深度学习在美团点评里搜索推荐的应用可以阅读一下。
  本文由 @King James 原创发布于人人都是产品经理。未经许可,禁止转载。
  题图来自 Unsplash,基于 CC0 协议

主打真实对话练习,这家AI导师英语学习平台,最新获投2700万美元,团队只有40人Edu指南讯11月21日人工智能英语学习平台Speak今天宣布,在OpenAI创业基金领投的B轮融资中筹集了2700万美元,LachyGroomJoshBuckleyJustinM人工智能又来抢饭碗?这东西到底行不行呀02年,机器人代替人工的话题开始出现05年,机器人必将取代人类的论调开始发声06年,相关文档浮出水面时间一直到现在机器人是否会替代人工论调仍在持续而如今让这个话题再次引爆的导火索就博雅博雅斗地主小课堂顺子玩法保姆级教程,新手必看想要地主玩得好,打好顺子不可少。顺子在游戏中占有重要的战略地位,所以掌握好它尤为重要。斗地主的玩家都知道,顺子绝对是斗地主中变化最多的一款牌型,顺子的技巧玩法也可谓是多样。顺子出牌日本球迷不远万里去卡塔尔球场捡垃圾,其实没那么简单在卡塔尔世界杯东道主对阵厄瓜多尔的揭幕战后,日本球迷清理了整个卡塔尔体育场,2018俄罗斯世界杯,他们也因离场时清理垃圾被媒体报道,这次他们也被网红拍到一排一排地捡拾垃圾,装入垃圾日本首个登月探测器放弃实施登月任务新华社东京11月22日电(记者钱铮)日本宇宙航空研究开发机构22日宣布,本月16日搭乘美国新一代登月火箭太空发射系统升空的日本首个登月探测器好客因未能与地面建立通信,所以放弃实施本CBA消息前火箭旧将加盟新疆全明星即将开放超三联赛出丑闻CBA全明星周末将开放观众入场北京时间11月22日,CBA联盟官方发布最新消息2022年CBA全明星周末将对普通观众开放入场。具体时间地点为2022年12月13日在浙江省诸暨市暨阳北欧神话与战神真正的北欧神话是如何诞生的?文艾渴echo随着战神诸神黄昏的推出,奎爷的北欧之旅算是告一段落了,除了冰天雪地的壮丽景象,作为系列传统的魔改神话剧情也是让人欲罢不能,虽说总感觉北欧这帮诸神总比希腊那边弱了不少,爆炒鸭胗的家常做法,鲜香爽口脆嫩无腥味,下酒下饭都很美味人们常说没有什么事情是一顿美食解决不了的,如果有,那就再吃两顿,虽然说得有点夸张,但确实美食是每个人抵挡不了的。不论生活中遇到什么烦恼,美食就是人们最好的慰藉,味蕾上的满足能够让人毛呢大衣的搭配大法秋冬时尚,必备毛呢大衣。你有想过怎么搭配吗?其实就是内搭裤子鞋子,选择好了,你一样很好看。以下为几点指南内搭部分,黑色的毛呢大衣,内搭可以是是黑色,白色,卡其色打底衫白色的毛呢大衣凯特王妃用过4次的香奈儿包包,裙子裤子都能搭关注我,看王室八卦!凯特王妃作为英国王室的王妃,使用香奈儿包包的次数似乎并不多,毕竟香奈儿是法国的奢侈品牌。凯特平时使用的包包大多为英国的品牌,比如Mulberry,L。K。Ben人人都在穿的黑色呢大衣,学会这几点,配鞋配靴都更优雅时髦秋日生活打卡季提到冬季最受欢迎的单品,毋庸置疑是黑色呢大衣了。黑色呢大衣不仅比黑色羽绒服更显瘦大气,而且比很多其他颜色的呢大衣更经典实用,可谓是每个人都要有的全员单品。到了冬季,像
秦岚的孤独美导语孤独也是一种美,能忍受孤独的人都是最优秀的人。当你和我一样打开片属于你我的世界开始,就注定我们再大千的世界开始了联系。或许你爱的是我的文字,或者是文字中美丽的秦岚,但改变不了的值得摘抄在笔记本上的温柔励志句子豁出去一点地活着吧因为这是我仅有一次的人生如果不断尝试会变得优秀那很好如果还是觉得自己平凡也没关系已经少了很多遗憾了啊你努力了,成绩没有多大改观,这并不能证明你没用,而是代表你在赎钱学森受邀参加国宴,到场后却发现没自己座位,毛主席坐我旁边1956年2月1日晚,钱学森受邀拿着大红请柬前往中南海怀仁堂参加国宴。当他走进大厅,便有人热情亲切地向他挥手打招呼,旁边的同伴好奇地问这位先生是谁?钱学森啊!就那个一个人能抵五个师10张记录历史的照片1967年,玻利维亚政府和革命者切格瓦拉尸体的合影。我们走后,他们会给你们修学校和医院,会提高你们的工资,这不是因为他们良心发现了,也不是因为他们变成了好人,而是因为我们来过。19毛遂自荐成功后,死得有多惨?老师可不会告诉你这些战国时期,每个国家都有着至少一位厉害无比的政治家,赵国最出色的政治家当属平原君莫属,齐国有大名鼎鼎的孟尝君,魏国有慧眼识珠的信陵君,楚国则是足智多谋的春申君。平原君家中坐有门客无数女排小可爱王梦洁整容啦!网友还是原来的样子好看前不久的全运会结束后,女排国手们就进入了休假模式。随着新赛季的女排超级联赛即将开幕,参赛的各队都在秣兵历马,加紧备战。在开赛之前,女排国家队兼山东队的主力自由人王梦洁曝出了整容的消日本森林覆盖率67,中国仅23。04,为什么内行人说中国更优秀?当下,环境问题可以说是世界上大多数国家都在面临的一个严峻问题。不少西方国家在经济发展起来之后,就开始大力重视环境保护,虽然其中不乏一些双标行为的存在,但总体而言它们对于环境的看法还陈坤拿耳机怒砸谢霆锋,儿子生母成迷,真是当年19岁的小保姆?马桶和大便,你总要成为其中一个2013年快乐男声正在录制时,台上的选手正在唱歌,台下的陈坤却抓起耳机怒砸谢霆锋,把坐在两人中间的陶晶莹吓得一激灵,当时究竟发生了什么事?陈坤砸谢霆锋陈小芸在社交平台发言暗讽杨幂,网友怎么茶里茶气的?娱乐圈里的耿直女星非常多,但是有的是真性情,有得就被吐槽绿茶了。近日,陈小芸在社交平台回复粉丝的一句话,就被很多网友嘲笑,得了便宜还卖乖。陈小芸社交平台发言暗讽杨幂,茶言茶语被网友全华班RA下赛季彻底起飞,顶级国产中单加入,网友为何却不看好?相信关注LPL转会的小伙伴们都知道,随着S11全球总决赛结束,LPL赛区各战队都把重心放在转会期战队补强上。作为全华班一员的RA战队虽然一直处于联赛的中上游,但难以实现更大的突破。比行星水星还胖,太阳系内最大卫星是?行星依附恒星运转,卫星又依附行星绕转,因此尺寸也长幼有序,恒星最大卫星最小。然而气态巨行星木星由于吃得太营养,身躯庞大,连带卫星都比其他天体大一号,如直径比水星还大的太阳系最大卫星