范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

科学家正研究以避免AI走捷径从而实现更可靠的预测

  一种新的方法迫使机器学习模型在学习一项任务时关注更多的数据,这可以带来更可靠的预测。如果你的Uber司机走了一条捷径,你可能会更快到达目的地。但如果一个机器学习模型走捷径,它可能会以意想不到的方式毁了你要做的事情。
  在机器学习中,当模型依靠数据集的一个简单特征来做决定,而不是学习数据的真正本质时,就会出现捷径方案,这可能导致不准确的预测。例如,一个模型可能通过关注照片中出现的绿草,而不是牛的更复杂的形状和图案来学习识别牛的图像。
  麻省理工学院研究人员的一项新研究探讨了一种流行的机器学习方法中的捷径问题,并提出了一个解决方案,通过迫使模型在其决策中使用更多的数据来防止AI走捷径。
  通过删除模型所关注的较简单的特征,研究人员迫使它关注它没有考虑过的数据的更复杂的特征。然后,通过要求模型以两种方式解决同一任务--一次使用那些较简单的特征,然后也使用它现在已经学会识别的复杂特征--他们减少了捷径解决方案的倾向,提高了模型的性能。
  麻省理工学院的研究人员开发了一种技术,通过迫使模型关注数据中它之前没有考虑过的特征,来减少对比学习模型使用捷径的倾向。
  这项工作的一个潜在应用是提高用于识别医学图像中疾病的机器学习模型的有效性。在这种情况下的捷径解决方案可能会带来错误的诊断,并对患者产生危险的影响。
  了解捷径的漫长道路
  研究人员将他们的研究集中在对比学习上,这是一种强大的自我监督机器学习的形式。在自我监督的机器学习中,使用没有来自人类的标签描述的原始数据来训练一个模型。因此,它可以成功地用于更多种类的数据。
  自监督学习模型学习有用的数据表征,这些数据被用作不同任务的输入,如图像分类。但如果该模型走捷径,未能捕捉到重要的信息,这些任务也将无法使用这些信息。
  例如,如果一个自监督学习模型被训练来对来自一些医院的X射线中的肺炎进行分类,但是它学会了根据一个标签来进行预测,这个标签可以识别扫描件来自特定的医院(因为有些医院的肺炎病例比其他医院多),那么当它被赋予来自新医院的数据时,这个模型就不会有好的表现。
  对于对比学习模型,一个编码器算法被训练来区分相似的输入对和不相似的输入对。这个过程将丰富而复杂的数据,如图像,以对比性学习模型可以解释的方式进行编码。
  研究人员用一系列图像测试了对比学习编码器,发现在这个训练过程中,他们也会陷入捷径解决方案。编码器倾向于关注图像中最简单的特征,以决定哪些输入对是相似的,哪些是不相似的。理想情况下,编码器在做决定时应该关注数据的所有有用特征。
  因此,研究小组使相似和不相似的数据对之间的区别变得更难分辨,并发现这改变了编码器将看哪些特征来做出决定。
  如果你让区分相似和不相似项目的任务变得越来越难,那么系统就被迫在数据中学习更多有意义的信息,因为不学习就无法解决这个任务。但是,增加这种难度导致了一种权衡--编码器在关注数据的某些特征方面变得更好,但在关注其他特征方面变得更差,似乎几乎忘记了更简单的特征。
  为了避免这种权衡,研究人员要求编码器以原来的方式,使用较简单的特征,并在研究人员删除它已经学到的信息之后,对这些配对进行区分。以两种方式同时解决任务,使编码器在所有特征方面都得到了改善。
  他们的方法被称为隐性特征修改,自适应地修改样本,以去除编码器用来区分配对的较简单特征。该技术不依赖于人类的输入,这很重要,因为现实世界的数据集可能有数百个不同的特征,它们可能以复杂的方式组合在一起。
  可以解决的问题从汽车到慢性阻塞性肺病
  研究人员用车辆的图像对这种方法进行了一次测试。他们使用隐性特征修改来调整颜色、方向和车辆类型,使编码器更难区分相似和不相似的图像对。编码器同时提高了其在所有三个特征--纹理、形状和颜色--上的准确性。
  为了了解该方法是否能经受住更复杂的数据,研究人员还用慢性阻塞性肺病(COPD)的医学图像数据库中的样本对其进行测试。同样,该方法使他们评估的所有特征都得到了同步的改善。
  虽然这项工作在了解捷径解决方案的原因和努力解决这些问题方面迈出了一些重要的步伐,但研究人员表示,继续完善这些方法并将其应用于其他类型的自我监督学习将是未来进步的关键。
  【来源:cnBeta.COM】

天文学家利用高级行星探测技术发现了300多颗新潜在系外行星美加州大学洛杉矶分校的天文学家已经确定了366颗新的系外行星,这在很大程度上要归功于加州大学洛杉矶分校的一名博士后学者开发的算法。在他们最值得注意的发现中,有一个由一颗恒星和至少两延伸11多万亿英里哈勃在NGC1977中发现脉冲式恒星喷流在下面这张哈勃图像中,来自一颗新形成的恒星的喷流向反射星云NGC1977的深处闪耀。喷流(图像底部中心的橙色物体)是由年轻的Parengo2042号恒星发出,它被嵌入到一个可能产生我国建设首个即时遥感星座数分钟内观测全球任意地区据央视报道,第七届中国(国际)商业航天高峰论坛上,我国一批空间基础设施建设正在有序推进,其中首个即时遥感星座启动建设,具备数分钟内观测全球任意地区的能力。在本次论坛上,航天科工集团NASA月球勘测轨道飞行器从月球上空56英里处拍摄土星图像2021年10月13日,美国宇航局月球勘测轨道飞行器(LRO)上的相机从距离LacusVeris(春之湖)约90公里(56英里)的地方拍摄了土星的图像。月球勘测轨道器相机(LROC快舟一号甲火箭13次飞行我国试验十一号卫星成功发射据中国航天报消息,11月25日7时41分,我国在酒泉卫星发射中心用快舟一号甲运载火箭,成功将试验十一号卫星发射升空,卫星顺利进入预定轨道,发射任务获得圆满成功。此次任务是快舟一号甲NASA公布关于詹姆斯韦伯望远镜发射任务的最新情况NASA詹姆斯韦伯太空望远镜的发射准备日期将不早于12月22日,此次的延迟则是为了在最近韦伯发射准备期间发生事故后对该观测站展开额外的测试。该事件发生在法属圭亚那库鲁的卫星准备设施Astra在成功的入轨发射后全力推进期待明年测试Rocket4。0据TechCrunch报道,火箭初创公司AstraSpace公司周一上午股价高歌猛进,由于该公司周六晚间的首次成功轨道飞行,其股价最高涨幅一度超42。但现在真正的工作开始了,因为该科学家发现一颗恒星正撕裂其伴星或预示着太阳系的未来据CNET报道,使用美国宇航局(NASA)的一个X射线观测站的天文学家发现了一颗小而活泼的恒星正在缓慢地ldquo撕裂rdquo附近的一颗恒星或行星,这为我们自己的太阳系的未来提供NASA地球之眼实时3D可视化工具迎更新据悉,NASA的实时3D可视化工具EyesontheEarth(地球之眼)最近进行了升级包括纳入了更多的数据集。通过使用该工具,用户可以跟踪地球的生命体征从二氧化碳和一氧化碳到海平SpaceX猎鹰9号火箭静态发射成功预估本月23日将DART送入轨道NASA的DART任务已经交由SpaceX公司进行发射。昨天,SpaceX成功静态发射了猎鹰9号火箭,该火箭即将于11月23日把DART送入轨道。随着静态发射测试的完成,猎鹰9号已NASA公布毅力号拍摄到的火星直升机挑战飞行视频NASA火星车ldquo毅力号rdquo于美国时间9月4日展开的第13次飞行的视频录像提供了迄今为止最详细的旋翼机的运行情况。目前,Ingenuity正在为其第16次飞行做准备,计
今日大雪雪纷飞,仲冬始IT之家12月7日消息今天是二十四节气中的第21个节气大雪,也是冬季的第3个节气,标志着仲冬(即农历十一月)时节的正式开始,气温将更低,白昼也将更短。大雪的意思是天气更冷,降雪的可今日小雪雨凝为雪,地气冻结IT之家11月22日消息今天是2018年11月22日,同时也是节气中的小雪,真正的寒冬即将到来。小雪为二十四节气中的第20个。具体的时间为11月22或23日,此时太阳到达黄经240囧科技HTC在线客服回复您好,暂无客服在线IT之家3月14日消息去年12月,IT之家发现,HTC手机先后在官方店下架。最先消失的是最新一代旗舰手机HTCU12,到12月24日,HTC天猫官方旗舰店已经下架了全部手机,仅剩下一起去看流星雨!双子座流星雨今夜迎来极大IT之家12月14日消息今晚2030,双子座流星雨迎来极大,届时,每小时天顶峰值流星数量可以达到120颗。此次双子座流星雨较适合在我国观测,从今晚到15日凌晨,都是观测双子座流星雨猎户座流星雨光临地球21日凌晨观测最佳IT之家10月20日消息据中新网报道,本月21日,有着哈雷彗星血统的猎户座流星雨将迎来极大,每小时流星数20颗左右。对于我国公众来说,最佳观测时间段为21日凌晨至黎明之前。天文资料最佳表白月10月将迎来三场大型流星雨IT之家10月6日消息根据新京报的报道,10月份将会成为浪漫的表白月,本月会有三场流星雨轮番划破天际,最近的天龙座流星雨今日就会率先登场。根据新京报的报道,中科院紫金山天文台10月失忆症有救了?日本研制出新药或可恢复记忆IT之家1月11日消息据日本媒体报道,日前,日本东京大学和北海道大学等组成的研究团队宣布,他们成功进行了通过药物使人恢复记忆的测试。据了解,这是世界上首次发明具有让人恢复记忆效果的随寿命增长,美国老年痴呆者40年或将增900万人阿尔茨海默氏症(俗称老年痴呆症)是一种毁灭性的脑部疾病。它不仅剥夺了患者思考,记忆和推理的能力。它还给家庭,看护人和社会经济带来了沉重的负担。护理负担根据美国疾病控制和预防中心(C