范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

深度学习?不一定非得搞黑箱

  深度神经网络的参数网络极其庞大复杂,也因此让机器得以实现以往难以想象的各类功能。然而,这种复杂性也成为制约其广泛应用的祸根:神经网络的内部工作机理一直是个谜,就连创建者自己也搞不清它到底怎么做出决策。自深度学习在2010年初全面流行以来,这个难题一直困扰着人工智能业界。
  随着深度学习在各个领域及应用中的拓展,人们对根据神经网络的结果以及学习到的参数组合来解释神经网络技术原理的兴致也越来越高。然而,这些解释方法往往并不靠谱,甚至充满种种误导性。更要命的是,这一切对于在训练过程中修复深度学习模型内的偏差/偏见几乎没有任何实际意义。
  最近,《自然:机器智能》杂志发表了一篇经过同行评审的论文,杜克大学的科学家们在其中提出了"概念白化(concept whitening)"技术,希望在不牺牲性能的前提下引导神经网络学习特定概念。概念白化将可解释性引入深度学习模型,而不再由模型自主在数百万训练得出的参数中寻找答案。这项技术适用于卷积神经网络,展示出令人鼓舞的结果,亦有望为人工智能的未来发展及研究产生重大影响。
  深度学习模型的特征与潜在空间
  面对质量过硬的训练示例,拥有正确架构的深度学习模型应该有能力区分不同类型的输入素材。例如,在计算机视觉任务场景下,经过训练的神经网络能够将图像的像素值转换为相应的类别。(由于概念白化主要适用于图像识别,因此我们这里主要讨论机器学习任务的这一特定子集。当然,本文涉及的很多内容同样适用于整个深度学习领域。)
  在训练期间,深度学习模型的每一层都会将训练图像的特征编码为一组数值,并将其存储在参数当中。这个过程,即AI模型的潜在空间。通常,多层卷积神经网络中的较低层负责学习基本特征,例如角度和边界。神经网络的较高层则学习检测更复杂的特征,例如人脸、物体、完整场景等。
  图注:神经网络中的各层都会对输入图像中的特定特征进行编码。
  在理想情况下,神经网络的潜在空间应代表与待检测图像类别相关的概念。但我们并不确定,因为深度学习模型往往倾向于学习最具区分性的特征——即使这些特征与结论并无因果关联。
  例如,以下数据集中包含小猫的每一张图像,右下角都恰巧有个徽标。人类能够很快发现,徽标跟小猫没有任何关系。但深度学习模型却很可能选择取巧路线,即认定右下角有徽标的就是包含小猫的图像。同样的,如果训练集中所有包含绵羊的图像都有草地背景,那么神经网络学会的很可能是检测草地、而非绵羊。
  图注:在训练期间,机器学习算法会搜索最容易将像素与标签关联起来的访问模式。
  因此,除了深度学习模型在训练与测试数据集上的实际表现之外,更重要的是理解模型到底学会检测出哪些概念与特征。经典解释技术也正是从这个角度试图解决问题。
  神经网络的事后解释
  大部分深度学习解释技术都具有事后特性,意味着只能通过检查输出结果及参数值对经过训练的神经网络加以评估。例如,目前一种用于确定神经网络在图像中到底在观察哪些对象的流行技术,就尝试遮挡住输入图像中的不同部分,并观察这些变化会给深度学习模型的输出造成哪些影响。这项技术有助于创建热图,突出显示与神经网络相关度最高的各项图像特征。
  图注:显著性图示例
  其他事后技术还包括开启及关闭不同人工神经元,检查这些调整如何影响AI模型的输出。这些方法同样有助于找到相关特征与潜在空间之间的映射关系。
  虽然这些方法效果不错,但本质上仍是在以"黑箱"形式看待深度学习模型,无法真正描绘出神经网络的确切情况。
  白皮书作者写道,"「解释」方法通常属于性能的摘要统计信息(例如局部逼近、节点激活的总体趋势等),而非对模型计算的实际解释。"
  例如,显著性图的问题在于,它们往往无法发现神经网络学习到错误信息的问题。当神经网络的特征分散在潜在空间中时,解释单一神经元的作用将变得极为困难。
  图注:显著性图解释,无法准确表示黑箱AI模型如何做出最终判断。
  杜克大学计算机科学专业学生、概念白化论文第一作者在采访中表示,"深度神经网络(NN)在图像识别方面非常强大,但由于极为复杂,我们无法理解神经网络隐藏层中的学习过程。这种可解释性缺失,导致神经网络变得不可信且难以实际应用。以往大部分事后解释只是在努力分析模型学到了什么,例如各个神经元具体学到了什么概念。但这些方法仍然严重依赖于这样一个假设:这些概念已经被网络所学会(并不一定),而且只集中在一个神经元上(同样并不一定)。"
  杜克大学计算机科学教授、概念白化论文联合作者Cynthia Rudin之前曾就信任黑箱解释技术的危险性发出警告,并表示此类方法有可能给出错误的神经网络解释。在之前发表在《自然:机器智能》杂志上的另一篇论文中,Rudin鼓励使用并开发天然具有可解释性的AI模型。作为博士导师,Rudin领导着杜克大学的预测分析实验室(此实验室专注于研究机器学习的可解释性课题)。
  概念白化的目标在于开发神经网络,其潜在空间将与训练过程中学会的概念相匹配。这种方法使深度学习模型真正具有可解释性,同时也极大降低了在输入图像的特征与神经网络输出之间建立关系映射的难度。
  Rudin在采访中表示,"我们的工作直接改变了神经网络处理潜在空间的方式,让关系轴真正与已知概念对应起来。"
  将概念融入神经网络
  深度学习模型通常会在经过标记的单一数据集上完成训练。概念白化则引入了包含概念示例的第二套数据集。这些概念与AI模型的核心任务有关。例如,如果您的深度学习模型给出"卧室"这一检测结果,则相关概念将涵盖床、冰箱、灯、窗户及门等。
  Chen指出,"代表性样本可以手动选择,因为它们有望构建我们对可解释性的定义。机器学习从业者可以通过任何方式收集这些样本,借此建立起适合自身应用的具体概念数据集。例如,我们可以要求医师选择具有代表性的X光片来定义各项医学概念。"
  通过概念白化,深度学习模型将经历两个并行的训练周期。神经网络会调整自身总体参数以表示主要任务中的类,而概念白化技术则调整各层中的特定神经元,使其与概念数据集中包含的类对齐。
  这样的结果,就是造成一个纠缠的潜在空间,其中各个概念将在每层中整齐分布,神经元的激活也与其各自概念相对应。Chen表示,"这种纠缠使我们能够对网络如何一层层学习概念拥有更清晰的理解。"
  为了评估这项技术的有效性,研究人员通过深度学习模型(在不同层上插入概念白化模块)运行一系列验证图像。接下来,他们根据每一层上激活的概念神经元对图像进行分类。在较低的层中,概念白化模块能够捕捉到低级特征,例如颜色及纹理。举例来说,网络能够通过较低层意识到蓝色背景下的白色物体可能与"飞机"概念紧密相关,而带有暖色的图像则更可能包含"床"的概念。在较高层中,网络将学习如何对代表该概念的对象进行分类。
  图注:概念白化会在较低层学习低级信息(例如颜色、纹理),在较高层学习高级信息(例如对象、人)。
  概念纠纷与对齐的一大优势,是保证神经网络不会犯下太过低级的错误。当图像通过网络运行时,较高层中的概念神经元会纠正较低层中可能发生的钷。例如,在下图当中,由于密集存在大量蓝色与白色像素,因此神经网络的较低层错误将图像与"飞机"概念关联了起来。但当图像转移到较高层中时,概念神经元开始帮助模型将结果导向正确的方向(右图为可视化纠正过程)。
  图注:当图像从神经网络的较低层转移至较高层时,概念白化有助于纠正误解和错误。
  以往的模型可解释性尝试往往强调创建分类器,利用这些分类器通过神经网络潜在空间中的值推理概念。但根据Chen的解释,在不存在纠缠潜在空间的情况下,通过这类方法学习到的概念并不纯粹,很可能将概念神经元的预测分数关联起来。"以往人们虽然尝试用监督方式破解神经网络之谜,但他们并没有真正解开谜题本身。另一方面,概念白化则通过白化转换对各关系轴进行关联性分解,借此真正理解模型的概念映射思路。"
  将概念白化引入深度学习应用
  概念白化是一类能够插入卷积神经网络的模块,而非批量归一化模块。批量归一化技术诞生于2015年,这是一种流行技术,能够调整用于神经网络训练的数据分布,借此加快训练速度并避免出现过度拟合等问题。目前最流行的卷积神经网络均已在各层中使用批量归一化技术。
  除了批量归一化功能之外,概念白化还能让数据沿着代表相关概念的多条轴实现对齐。
  概念白化架构的优势在于,它能够轻松被集成至多种现有深度学习模型当中。通过研究,科学家们使用概念白化替代批量归一化模块,借此修改了多种经过预训练的流行深度学习模型,并仅用一轮训练就达到了预期效果。(一个轮次,代表深度学习模型通过完整训练集进行训练的整个周期。深度学习模型在从零开始进行训练时,往往需要经历多个轮次。)
  Rudin指出,"概念白化有望被广泛应用于医学成像等高度强调可解释性的领域。"
  在实验当中,研究人员将概念白化应用于皮肤病变诊断深度学习模型当中。他们在论文中写道,"概念白化潜在空间上测量出的概念重要性评分能够提供重要的洞见,帮助我们了解哪些概念在皮肤病变诊断中更具意义。"
  Chen表示,"为了未来的持续发展,我们认为可能应该脱离预定义的概念,转而从数据集中发现这些概念——特别是那些尚未被发现的重要概念。以此为基础,我们能够以纠缠方式在神经网络的潜在空间内明确表示这些概念,进一步提高模型的可解释性。"
  目前研究的另一个重要方向,是在分层结构中组织概念,由此建立起概念集群以替代彼此孤立的个体概念。
  深度学习研究带来的启示
  随着深度学习模型变得越来越庞大、越来越复杂,业界对于如何实现神经网络透明性也开始产生明显的意见分歧。
  一种意见强调观察AI模型的行为,而非徒劳地观察黑箱内部。这种方法也是人们研究动物乃至人类大脑、设计实验并记录激活方式时采取的思路。这种理论的支持者们认为,任何对神经网络施加可解释性设计约束,都必然会导致模型质量下降。如果大脑能够从无到有经过数十亿次迭代进化出智能,神经网络也应该可以通过这种纯进化途径达成相同的效果。
  概念白化的出现反驳了这一理论,并证明我们能够在不造成任何性能损失的前提下,对神经网络施加自上而下的设计约束。有趣的是,实验表明深度学习模型在引入概念白化模块后确实能够提供可解释性,且核心推理任务的准确性不会发生任何显著下降。
  Rudin总结道,"概念白化以及我们乃至更多其他研究实验室的成果已经全面证明,构建可解释模型又不损害其性能确有客观可行性。我们希望这项工作能够改变人们对黑箱模型机制的盲目推崇,吸引更多参与者立足各自领域建立起具备可解释性的机器学习模型。"

取向电纺纳米纤维支架结合间充质干细胞改善半月板损伤修复半月板在膝关节中起着重要的作用,包括力的传递关节的协调性关节的润滑和关节稳定性的提供。半月板撕裂是最常见的膝关节损伤,无论年龄大小,有效的治疗方法仍然具有挑战性。这一挑战的部分原因静电纺丝与水凝胶制备技术结合构建高强度光控智能水凝胶驱动器易丝帮讯近日,吉林大学赵骞等人公开了一种高强度光控智能水凝胶驱动器的制备方法,其特征是将静电纺丝技术与水凝胶制备技术相结合,选取聚乙烯醇缩丁醛纤维和纳米木浆纤维素作增强相,分别在材电纺丝纤维中白藜芦醇与siRNA联合控制释放对白血病细胞的影响白藜芦醇是一种存在于红葡萄酒,葡萄,花生,水果,桑椹和松树中的多酚化合物,已引起人们的极大关注。在20世纪90年代早期,法国红葡萄酒的消费量归因于心血管疾病的低发病率,尽管饱和脂肪西南交大杨维清PVDFZnO纳米纤维柔性自驱动压电传感器交互式人机界面(iHMI)使人类能够控制硬件和收集反馈信息,是人与机器之间的桥梁,近几年引起了广泛的关注和迅速的发展。在iHMI中,柔性压力传感器和弯曲角度传感器被认为是机器人和手木质素修饰多壁碳纳米管在聚乙烯醇纳米复合材料中的抗菌性能木质素在各种应用中受到很多关注,例如生物合成,抗菌活性,以及作为碳纤维的资源。木质素的物理性质和生物医学性质是由其酚类结构所产生的固有功能所决定的,即由三种苯丙烷类单体组成的芳香立中科大俞书宏电纺金属有机骨架纳米粒子纤维及其衍生电催化剂探索具有足够活性和耐久性的无贵金属催化剂以取代基于铂的氧还原反应催化剂,是大规模商业化的技术挑战。具有超分子结构的金属有机框架(MOF)由多种金属离子和有机配体构成,具有特殊的多孔改性ZnOCo3O4异质结纳米纤维用于湿度传感器金属氧化物半导体(MOS)纳米材料具有优良的感受器和换能器功能,被广泛应用于开发低成本的传感器件。最近,研究工作集中在通过调整其组成,孔结构和形态来提高MOS的传感能力。在各种类型电纺纳米纤维在神经肌肉连接方面的研究进展神经肌肉连接(NMJ)是运动神经元和它们支配的肌肉纤维之间一个特殊的突触。由于各种信号分子和通路的复杂性,体内NMJs难以研究。因此,体外运动神经元肌肉共培养在研究神经退行性疾病N电纺丝法制备管状PTFEFEP超细纤维多孔膜用于连续高效油水分离中空纤维膜技术在解决严重的水资源短缺环境污染和能源短缺问题中发挥重要作用。油水分离,特别是乳化油水分离一直是世界各国面临的一项紧迫任务和挑战。传统的油水分离技术,如重力分离撇油和浮脂肪干细胞在聚己内酯纳米纤维上生长可诱导干细胞成骨分化考虑到常见的成骨生长因子无法使用干细胞移植给患者,许多研究正在寻找这些因子的替代品。最近,已经确定间充质干细胞(MSC)衍生的条件培养基(CM)在骨形成过程中含有有效因子。本研究中北京化工大学张立群教授静电纺丝构建可降解过滤除菌膜易丝帮讯近期,北京化工大学张立群教授等人涉及发明一种可降解的过滤除菌膜及制备方法。所述过滤除菌膜是静电纺丝而得,各组分按重量份数计可降解高分子材料100重量份抗菌纳米辅料160重量
热点航天员的太空生活作息是怎么样的?6月17日,航天员聂海胜刘伯明汤洪波,顺利进驻中国空间站,3名航天员将在轨驻留3个月。相信很多小伙伴都对他们的生活饮食作息都充满好奇和疑问,那下面我们就来科普一下一些太空舱的知识。科普长期玩手机,真的会让你变丑吗?这个姿势我真的接受不了此时此刻的你,正在以什么姿势看这篇文章呢?躺着,坐着,趴着,还是站着呢?如今的生活,人们越来越离不开手机,要是让你1小时不碰手机,可能会让你浑身不自在,甚至有点发狂。如果你认真观察正能量当儿子确诊自闭症,TVB名嘴老爸与音乐人妈妈的决定最好的亲子关系父母和孩子相互成长,而不是彼此束缚!No。1TVB名嘴主持遇上了自闭症儿子无言语,没有眼神交流,行为刻板,偏执,都是小儿子的行为标签。他2岁时被诊断为疑似自闭症,幸运美国网红博主领养中国自闭症男孩,赚足人气又弃养近日,美国油管上一位网红育儿博主MykaStauffer遭到网友的指责谩骂。Myka和James这一场风波,起源于5月26日,她与丈夫James一起发布的一条视频我们家的最新动态(正能量她,带一群自闭症家庭创业,年收入超10万元今日要说的主人公,徐旭,东北人。既不是谱系家长,也不是特教老师,却深刻地跟谱系圈产生了连结。她组织发起的长春新区喜爱加关爱心智障碍者家庭社会工作服务中心(以下简称喜爱加),以提升心正能量身患癌症,我依然可以带着阿斯伯格儿子自驾游如果有这样一位妈妈,没有稳定收入,离了婚,又身患癌症,还有一个可能随时被学校劝退的阿斯伯格儿子,你觉得她的生活会是什么样?现实中,这位妈妈正开着车带着儿子在中国的河山道路中奔行,尽正能量苹果工程师讲述自闭症儿子他让我看到生活中简单快乐MarkRober有很多身份美国航天航空局(NASA)的前工程师,苹果工程师,Youtube上坐拥千万粉丝的科技博主,以及一名自闭症儿童的父亲。他在近期的一个视频中,首次介绍了患自留学生有望数周内返澳!大学自费包机接人,将在指定设施隔离2周为了拯救陷入困境的高等教育行业,新州政府或将在数周之内允许留学生入境。报道称,新州政府在周三上午举行的疫情应对会议上讨论了留学生返澳。首批入境的留学生人数或为250人,他们将搭乘包萌翻了!维州人评选出2021年百个最可爱宝宝维州2021年100个最萌宝宝评选榜单出炉,本文展示前十名萌娃的照片。据先驱者太阳报,一个有着神圣名字的小女孩被评为维州最萌宝宝,这名FrankstonNorth婴儿在500人中脱澳洲房地产热潮持续升温,经济学家警告明年房价可能逆转澳大利亚新冠疫情下的房地产热潮仍在继续,5月份房价上涨逾2,自疫情爆发以来房价上涨幅度更是超过10。上月房价上涨2。2,标志着房地产价格增速再次加快。之前的4月份房价的增幅放缓,上墨尔本新增5例,提前解封没戏。新变种病毒扩散,传染源成迷墨尔本又是新增5例的一天!封城4。0之Part2,从这几天的情况来看,疫情控制应该是好转了的,而且封城限制也有所放宽,代表着卫生部门也觉得控制的差不多了。但是这个新消息又让人非常担