范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

Hinton,Lecun和Bengio三巨头联手再发万字长文

  2018图灵奖获得者Yoshua Bengio, Yann LeCun和Geoffrey Hinton再次受ACM邀请共聚一堂,共同回顾了深度学习的基本概念和一些突破性成果,讲述了深度学习的起源、发展及未来的发展面临的挑战。
  2018年,ACM(国际计算机学会)决定将计算机领域的最高奖项图灵奖颁给Yoshua Bengio、Yann LeCun 和 Geoffrey Hinton,以表彰他们在计算机深度学习领域的贡献。
  这也是图灵奖第三次同时颁给三位获奖者。
  用于计算机深度学习的人工神经网络在上世纪80年代就已经被提出,但是在当时科研界由于其缺乏理论支撑,且计算力算力有限,导致其一直没有得到相应的重视。
  是这三巨头一直在坚持使用深度学习的方法,并在相关领域进行了深入研究。通过实验发现了许多惊人的成果,并为证明深度神经网络的实际优势做出了贡献。
  所以说他们是 深度学习之父 毫不夸张。
  在AI界,当Yoshua Bengio、Yann LeCun 和 Geoffrey Hinton 这三位大神同时出场的时候,一定会有什么大事发生。
  最近,深度学习三巨头受ACM通讯杂志之邀,共同针对深度学习的话题进行了一次深度专访,提纲挈领地回顾了深度学习的 基本概念、最新的进展,以及未来的挑战。
  广大的AI开发者们,看了高人指点之后是不是对于未来之路更加明晰了?下面我们来看看他们都聊了些什么。  深度学习的兴起
  在2000年代早期,深度学习引入的一些元素,让更深层的网络的训练变得更加容易,也因此重新激发了神经网络的研究。
  GPU和大型数据集的可用性是深度学习的关键因素,也得到了具有自动区分功能、开源、灵活的软件平台(如Theano、Torch、Caffe、TensorFlow等)的增强作用。训练复杂的深度网络、重新使用最新模型及其构建块也变得更加容易。而更多层网络的组合允许更复杂的非线性,在感知任务中取得了意料之外的结果。
  深度学习深在哪里?有人认为,更深层次的神经网络可能更加强大,而这种想法在现代深度学习技术出现之前就有了。但是,这样的想法其实是由架构和训练程序的不断进步而得来的,并带来了与深度学习兴起相关的显著进步。
  更深层的网络能够更好地概括「输入-输出关系类型」,而这不仅只是因为参数变多了。深度网络通常比具有相同参数数量的浅层网络具有更好的泛化能力。例如,时下流行的计算机视觉卷积网络架构类别是ResNet系列,其中最常见的是ResNet-50,有50层。
  图源:知乎@臭咸鱼
  深度网络之所以能够脱颖而出,是因为它利用了一种特定形式的组合性,其中一层的特征以多种不同的方式组合,这样在下一层就能够创建更多的抽象特征。
  无监督的预训练。 当标记训练示例的数量较小,执行任务所需的神经网络的复杂性也较小时,能够使用一些其他信息源来创建特征检测器层,再对这些具有有限标签的特征检测器进行微调。在迁移学习中,信息源是另一种监督学习任务,具有大量标签。但是也可以通过堆叠自动编码器来创建多层特征检测器,无需使用任何标签。
  线性整流单元的成功之谜。 早期,深度网络的成功,是因为使用了逻辑sigmoid非线性函数或与之密切相关的双曲正切函数,对隐藏层进行无监督的预训练。
  长期以来,神经科学一直假设线性整流单元,并且已经在 RBM 和卷积神经网络的某些变体中使用。让人意想不到的是,人们惊喜地发现,非线性整流通过反向传播和随机梯度下降,让训练深度网络变得更加便捷,无需进行逐层预训练。这是深度学习优于以往对象识别方法的技术进步之一。
  语音和物体识别方面的突破。 声学模型将声波转换为音素片段的概率分布。Robinson、Morgan 等人分别使用了晶片机和DSP芯片,他们的尝试均表明,如果有足够的处理能力,神经网络可以与最先进的声学建模技术相媲美。
  2009年,两位研究生使用 NVIDIA GPU ,证明了预训练的深度神经网络在 TIMIT 数据集上的表现略优于 SOTA。这一结果重新激起了神经网络中几个主要语音识别小组的兴趣。2010 年,在不需要依赖说话者训练的情况下,基本一致的深度网络能在大量词汇语音识别方面击败了 SOTA 。2012 年,谷歌显着改善了 Android 上的语音搜索。这是深度学习颠覆性力量的早期证明。
  大约在同一时间,深度学习在 2012 年 ImageNet 竞赛中取得了戏剧性的胜利,在识别自然图像中的一千种不同类别的物体时,其错误率几乎减半。这场胜利的关键在于,李飞飞及其合作者为训练集收集了超过一百万张带标签的图像,以及Alex Krizhevsky 对多个 GPU 的高效使用。
  深度卷积神经网络具有新颖性,例如,ReLU能加快学习,dropout能防止过度拟合,但它基本上只是一种前馈卷积神经网络,Yann LeCun 和合作者多年来一直都在研究。
  计算机视觉社区对这一突破的反应令人钦佩。证明卷积神经网络优越性的证据无可争议,社区很快就放弃了以前的手工设计方法,转而使用深度学习。
  深度学习近期的主要成就
  三位大神选择性地讨论了深度学习的一些最新进展,如软注意力(soft attention) 和 Transformer 架构。
  深度学习的一个重大发展,尤其是在顺序处理方面,是乘法交互 的使用,尤其是软注意力的形式。这是对神经网络工具箱的变革性补充,因为它将神经网络从纯粹的矢量转换机器,转变为能够动态选择对哪些输入进行操作的架构,并且将信息存储在关联存储器中。这种架构的关键特性是,它们能有效地对不同类型的数据结构进行操作。
  软注意力可用于某一层的模块,可以动态选择它们来自前一层的哪些向量,从而组合,计算输出。这可以使输出独立于输入的呈现顺序(将它们视为一组),或者利用不同输入之间的关系(将它们视为图形)。
  Transformer 架构已经成为许多应用中的主导架构,它堆叠了许多层"self-attention"模块。同一层中对每个模块使用标量积来计算其查询向量与该层中其他模块的关键向量之间的匹配。匹配被归一化为总和1,然后使用产生的标量系数来形成前一层中其他模块产生的值向量的凸组合。结果向量形成下一计算阶段的模块的输入。
  模块可以是多向的,以便每个模块计算几个不同的查询、键和值向量,从而使每个模块有可能有几个不同的输入,每个输入都以不同的方式从前一阶段的模块中选择。在此操作中,模块的顺序和数量无关紧要,因此可以对向量集进行操作,而不是像传统神经网络中那样对单个向量进行操作。例如,语言翻译系统在输出的句子中生成一个单词时,可以选择关注输入句子中对应的一组单词,与其在文本中的位置无关。 未来的挑战
  深度学习的重要性以及适用性在不断地被验证,并且正在被越来越多的领域采用。对于深度学习而言,提升它的性能表现有简单直接的办法——提升模型规模。
  通过更多的数据和计算,它通常就会变得更聪明。比如有1750亿参数的GPT-3大模型(但相比人脑中的神经元突触而言仍是一个小数目)相比只有15亿参数的GPT-2而言就取得了显著的提升。
  但是三巨头在讨论中也透露到,对于深度学习而言仍然存在着靠提升参数模型和计算无法解决的缺陷。
  比如说与人类的学习过程而言,如今的机器学习仍然需要在以下几个方向取得突破:
  1、监督学习需要太多的数据标注 ,而无模型强化学习又需要太多试错。对于人类而言,像要学习某项技能肯定不需要这么多的练习。
  2、如今的系统对于分布变化适应的鲁棒性比人类差的太远 ,人类只需要几个范例,就能够快速适应类似的变化。
  3、如今的深度学习对于感知而言无疑是最为成功的,也就是所谓的系统1类任务,如何通过深度学习进行系统2类任务 ,则需要审慎的通用步骤。在这方面的研究令人期待。
  在早期,机器学习的理论学家们始终关注于独立相似分布假设,也就是说测试模型与训练模型服从相同的分布。而不幸的是,在现实世界中这种假设并不成立:比如说由于各种代理的行为给世界带来的变化,就会引发不平稳性;又比如说总要有新事物去学习和发现的学习代理,其智力的界限就在不断提升。
  所以现实往往是即便如今最厉害的人工智能,从实验室投入到实际应用中时,其性能仍然会大打折扣 。
  所以三位大神对于深度学习未来的重要期待之一,就是当分布发生变化时能够迅速适应并提升鲁棒性(所谓的不依赖于分布的泛化学习),从而在面对新的学习任务时能够降低样本数量。
  如今的监督式学习系统相比人类而言,在学习新事物的时候需要更多的事例,而对于无模型强化学习而言,这样的情况更加糟糕——因为相比标注的数据而言,奖励机制能够反馈的信息太少了。
  所以,我们该如何设计一套全新的机械学习系统,能够面对分布变化时具备更好的适应性呢? 从同质层到代表实体的神经元组
  如今的证据显示,相邻的神经元组可能代表了更高级别的向量单元,不仅能够传递标量,而且能够传递一组坐标值。这样的想法正是胶囊架构的核心,在单元中的元素与一个向量相关联,从中可以读取关键向量、数值向量(有时也可能是一个查询向量)。 适应多个时间尺度
  大多数神经网络只有两个时间尺度:权重在许多示例中适应得非常慢,而行为却在每个新输入中对于变化适应得非常快速。通过添加快速适应和快速衰减的"快速权重"的叠加层,则会让计算机具备非常有趣的新能力。
  尤其是它创建了一个高容量的短期存储,可以允许神经网络执行真正的递归,,其中相同的神经元可以在递归调用中重复使用,因为它们在更高级别调用中的活动向量可以重建稍后使用快速权重中的信息。
  多时间尺度适应的功能在元学习(meta-learning)中正在逐渐被采纳。
  更高层次的认知
  在考虑新的任务时,例如在具有不一样的交通规则的城市中驾驶,甚至想象在月球上驾驶车辆时,我们可以利用我们已经掌握的知识和通用技能,并以新的方式动态地重新组合它们。
  但是当我们采用已知的知识来适应一个新的设置时,如何避免已知知识对于新任务带来的噪音干扰?开始步骤可以采用Transformer架构和复发独立机制。
  对于系统1的处理能力允许我们在计划或者推测时猜测潜在的好处或者危险。但是在更高级的系统级别上,可能就需要AlphaGo的蒙特卡罗树搜索的价值函数了。
  机械学习依赖于归纳偏差或者先验经验,以鼓励在关于世界假设的兼容方向上学习。系统2处理处理的性质和他们认知的神经科学理论,提出了几个这样的归纳偏差和架构,可以来设计更加新颖的深度学习系统。那么如何训练神经网络,能够让它们发现这个世界潜在的一些因果属性呢?
  在20世纪提出的几个代表性的AI研究项目为我们指出了哪些研究方向?显然,这些AI项目都想要实现系统2的能力,比如推理能力、将知识能够迅速分解为简单的计算机运算步骤,并且能够控制抽象变量或者示例。这也是未来AI技术前进的重要方向。
  听完三位的探讨,大家是不是觉得在AI之路上,光明无限呢?

神秘的行星一直在绕太阳公转,被称为第九大行星人类却看不见科学家称,在我们的太阳系边缘,可能存在着一颗神秘的行星,它一直都在围绕着我们的太阳公转,但是从未被人类发现。科学家预计,这颗传说中的行星将在未来10到15年内被发现,它在太阳系深处人类对太空探索的热情是不是在渐渐消逝?谢谢邀请,人类对于太空探索的热情是不是在渐渐消逝?这是不可能的,因为人类社会的发展历史,就是一部不断探索发现的实践史,对未知事物有强烈的好奇心,是推动人类社会进步的重要基础。人类在科学家发现地球近亲,浩劫来临人类不用带着地球流浪了星际移民是人类讨论最多的话题,可除了地球人类又能去哪呢,目前在太阳系科学家并没有发现可供人类居住的行星了。先说金星二氧化碳浓度极高,地表全是火山熔岩,木星气态行星,表面风暴狂怒,水地球有46亿岁,但人类才几万岁,在这之前会有上古文明吗?地球有46亿岁,但人类才几万岁,在这之前会有上古文明吗?作为地球上的一个物种,人类的确是非常的不容易,在几十万年以前,我们还是生物链的一个中层位置,但经过漫长时间的发展,我们一点点再过100万年,人类将变成什么模样?科学家体型或不断变小人类自诞生之时起到如今已走过300多万年,在这漫长的几百万年时光中,人类不断改变,不断进步,最终成功地从原始生命个体成长为极具智慧的现代生命体,人类的技能也从只懂运用简易器具上升为研究人员提出大胆猜测认为人类可能在12万年前抵达澳大利亚据外媒NewAtlas报道,澳大利亚原住民所创造的文明被认为是世界上最古老的具有延续性的文明。但究竟有多古老?目前认为原住民的祖先在大约65000年前抵达澳大利亚,但是在该大陆东南人类能够长生不死吗?人体内的这种物质,是控制寿命的关键人类能够长生不死吗?人体内的这种物质,是控制寿命的关键在这个浩瀚无垠的宇宙中,基本上所有的物体,都是会有一个存在的时间限度。就像在一直在我们地球上空,为我们地球提供光和热的太阳。我当海洋渔业资源越来越匮乏,建设海洋牧场是人类唯一的选择地球是人类唯一的家园,人类为了生存需要向自然界索取食物,而大自然也毫不吝啬的向人类提供各种动植物资源,作为我们的食物。不过,在数百万年的人类发展历史中,随着人口规模的不断扩大,人类我国只有两个航天英雄,其余都是英雄航天员有什么不同?同是英雄,为啥我国的航天员只有两个是航天英雄,其余的都是英雄航天员。他们有什么不同?我国的航天事业发展迅速,截止神舟13号,按发射时间的先后顺序,我国飞上太空的航天员分别是杨利伟(华罗庚我愿工作到生命最后一天在美国芝加哥科学技术博物馆中,展列了人类历史上88位最重要的数学伟人,中国数学家华罗庚就是其中之一。有位著名数学史家曾这样评价他华罗庚是中国的爱因斯坦,足够成为全世界所有著名科学院SpaceX将4名游客送往国际空间站,计划停留约8天美国东部时间周五上午,SpaceX利用猎鹰9号火箭和载人龙飞船成功将四名私人宇航员送入太空,预计飞船将于当地时间周六早上抵达国际空间站。此次任务名为公理1号(AX1),由Space
压力变送器选型参数表压力变送器选型原则压力变送器选型参数表压力变送器选型原则压力变送器是一种接受压力变量,经传感转换后,将压力变化量按一定比例转换为标准输出信号的仪表。下面小编给大家介绍一下压力变送器选型参数表压力变送生命有长度,心胸有宽度,境界有高度,思想有密度人心惟危道心惟微惟精惟一允执厥中,一语道破天机人性本贪顺其所欲投其所好为我所用,一言参透人性。人性是自然我当然我超然我的三我一体。当然我(名利情权钱色)(自我为中心名利最大化)人性积极乐观,身体健康自寻烦恼,伤心伤脑人类能战胜自然,却战胜不了自己人体能抵抗病菌,却抵抗不了情绪。发脾气所分泌的毒素,对大脑和心脏伤害特别大,所以,积极乐观,身体健康自寻烦恼,伤心伤脑。你得学会用理性来平衡自心的欲望飞行高度585千米在轨飞行3天SpaceX全平民太空团顺利返航9月18日,SpaceX灵感(Inspiration)4龙飞船携带4名业余宇航员完成3天的地球轨道飞行后,平安降落在佛罗里达海岸附近的大西洋,这也是有史以来首次全部由平民执行的载人中考化学推断题的技巧,学会了轻松得满分中考的推断题对很多学生来说,都是感觉很难,其实它是有规律可寻的。首先对化学推断题做个简单的分析,一般是4小问,分别涉及到的是物质的化学式俗名用途以及化学方程式的书写等,考试的范围也人类身体结构有什么不合理之处?其实人体结构有许多不合理之处,但也正是这些不合理之处,才演化成了今天的人类。直立行走相比于别的动物而言,只有人类使用直立行走,然而人类直立行走的速度,相比于四肢行走而言慢了许多,在响应新时代,创立平衡论,共筑中国梦一般平衡论的基本概念以天道自衡为核心,由五大平衡法则三个存在模式三个平衡层次三个平衡工具,以及九组平衡方法等簇概念组成。有了这些,平衡之道,既可意会,也可言传。一般平衡论是研究一般新时代中国梦,老夫有话要说为解决新时代不平衡的主要矛盾,实现民族伟大复兴的中国梦,老夫在此有几句话要说1。三十年前提出保护生态环境和建设山区生态县,2。二十年前提出并应用金融生态概念,3。出版商业银行审计内新时代中国梦,老夫有话要说为解决新时代不平衡的主要矛盾,实现民族伟大复兴的中国梦,老夫在此有几句话要说1。三十年前提出保护生态环境和建设山区生态县,2。二十年前提出并应用金融生态概念,3。出版商业银行审计内一语道破天机,一言参透人性,一算发现人生人际关系铁律互有需要双方得利相互包容。用人定律满足需求让其得利容人所短。个人价格定律有利有用不可替代不确定性。他人对你的满意度你实现的利益他的期望值100。别人满意你才有价值,当期安规电容型号参数安规电容是指用于这样的场合,即电容器失效后,不会导致电击,不危及人身安全。安规电容通常只用于抗干扰电路中的滤波作用。1。安规电容型号参数安规电容安全等级应用中允许的峰值脉冲电压过电