范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

麻省理工学院人工智能全新突破,零数据样本的算法学习成为可能

  孩子们有时不需要任何实例就能认出一头独角兽,人工智能(AI)算法能做到这一点么?全新的"次单样本"学习使算法模型能够识别的对象远多于它所训练的样本量,数据样本的需求甚至可以接近为零。
  机器学习通常需要海量的数据样本。要让AI模型识别一匹马,你需要向它展示数千张马的图片。这就是该项技术计算成本高昂并且与人类学习截然不同的原因。而一个孩子通常只需看到一个物体的几个甚至一个实例,就一辈子都能认出它来。
  事实上,孩子们有时不需要任何实例就能辨别事物。当他们看到一匹马和一头犀牛的照片,并被告知独角兽介乎两者之间时,他们第一次在绘本中看到这个神秘生物就能认出它。
  嗯,好吧,也不全都是这样。
  现在来自安大略省滑铁卢大学的一篇新论文指出,AI模型也应该能做到这一点,研究者称之为"次单样本"学习( "Less than one"-shot learning)。换句话说,AI模型应该能准确识别出比它所训练的样本数量更多的对象。这对于一个越来越昂贵和难以达到的领域来说可能是件大事,因为所用的数据集变得日益庞大。
  "次单样本"学习的工作原理
  研究人员首次证明这一想法,是在实验被称为MNIST的流行计算机视觉数据集时。MNIST包含6万张从0到9的手写数字训练图像,常被用来测试该领域的新想法。
  在此前的一篇论文中,麻省理工学院研究人员引入一项技术,将海量数据集"蒸馏"成小数据集,作为概念验证,他们将MNIST压缩到只有10张图片。图片不是从原始数据集中选择,而是经过精心设计和优化,包含了完整数据集的同等信息量。因此,当专门训练这10张样本图片时,AI模型能实现的精度与训练MNIST的全部图片几乎相同。
  MNIST数据集中的样本图片
  新技术使AI模型的手写数字识别精度达到94%
  滑铁卢大学的研究人员想进一步研究这种蒸馏过程。如果能把6万张图片压缩到10张,为什么不把它们压缩到5张呢?他们意识到,诀窍在于创建混合多个数字的图片,然后将它们输入带有混合或"软"标签的AI模型。(想想带有部分独角兽特征的马和犀牛。)
  滑铁卢大学博士生、该论文第一作者Ilia Sucholutsky说:"想想数字3,它也有点像数字8,但一点也不像数字7。软标签试图捕捉这些共有特征。因此,我们不是告诉机器,‘这张图片是数字3,’我们会说,‘这张图片是数字3的可能性是60%,是数字8的可能性是30%,是数字0的可能性是10%。’"
  "次单样本"学习的局限性
  当研究人员成功地使用软标签在MNIST上实现"次单样本"学习时,他们开始琢磨这个想法究竟能走多远。能够让AI模型从小样本量中识别的类别数量有限制吗?
  令人惊讶的是,答案似乎是否定的。使用精心设计的软标签,即使只有两个样本,理论上也能编码出任意数量的类别。Sucholutsky说:"通过两个点,你可以分出一千个类别、一万个类别或一百万个类别。"
  按重量和颜色为苹果(绿点和红点)和橙子(橙点)绘图
  这正是研究人员在其最新论文中用纯数学探究所展示的。他们用一种最简单的机器学习算法K近邻算法(K-nearest neighbors, KNN)来实现这一概念,该算法使用图形方法对对象进行分类。
  要理解KNN的工作原理,让我们以水果分类为例。如果你想训练KNN模型理解苹果和橙子之间的差异,就必须首先选择你打算用来代表每个水果的所有特征。
  或许你会选择颜色和重量,将每个苹果和橙子的颜色作为x值、重量作为y值给KNN 提供一组数据点。KNN算法再将所有数据点绘制在一个2D图表上,并沿着苹果和橙子的中间直线画出一条边界线。
  在这一点上,图被整齐地分成两类,算法现在能根据新的数据点落在直线的哪一边来决定它们是代表这一类还是那一类。
  为了探究使用KNN算法的"次单样本"学习,研究人员创建了一系列小型合成数据集并精心设计其软标签。然后他们让KNN绘制它看到的边界线,发现它成功地将该图分成了更多类别而不是数据点。研究人员对边界线落在何处也有严格的控制。通过对软标签进行各种调整,他们能让KNN算法绘制出花朵形状的精确图案。
  如上图,研究人员用软标签样本训练KNN算法来给日益复杂的边界线编程,将图表分割成更多类别而不是数据点。图中的每个有色区域代表一个不同的类别,而每个图旁边的饼图显示了每个数据点的软标签分布情况。
  当然,这些理论探索也有一定的局限性。尽管"次单样本"学习的理念应该转移到更复杂的算法,但设计软标签样本的任务实际上更困难了。
  KNN算法具有可解释性和可视性,这使由人类来设计标签成为可能。神经网络既复杂又难以理解,这意味着同样的情况可能不是真的。
  用于为神经网络设计软标签样本的数据蒸馏还有个重大缺陷:它要求从一个海量数据集开始,以便将其缩小为更高效的数据集。
  Sucholutsky说,他现在正致力于寻找其他方法来设计这些小型合成数据集,不管是人工设计还是使用其他算法。尽管存在这些额外的研究挑战,然而,这篇论文为"次单样本"学习提供了理论基础。他说:"结论取决于你拥有哪种类型的数据集,你也许能获得巨大的效率提升。"
  这正是王同州(音)最感兴趣的,他是麻省理工学院博士生,领导了早期的数据蒸馏研究。"这篇论文建立在一个真正新颖而重要的目标之上:从小数据集学习强大的算法模型,"他谈到Sucholutsky的贡献时说。
  蒙特利尔人工智能伦理研究所(Montreal AI Ethics Institute)研究员Ryan Khurana也赞同这种观点:"最重要的是,‘次单样本’学习将从根本上减少构建可运行模型的数据需求。"这将使人工智能更容易被迄今为止受该领域数据需求阻碍的公司和行业获得。它还可以提高数据的隐私性,因为只需从个人身上提取更少的信息就能训练出有用的模型。
  Sucholutsky强调,这项研究还处于早期阶段,但他很兴奋。他说每次他开始向同事们展示他的论文时,他们的第一反应都是说这个想法是不可能的。当他们突然意识到事实并非如此时,就会打开一个全新的世界。
  来源:麻省理工学院技术评论,作者:Karen Hao
  译者:Sail2008
  声明:著作权所有,转载需授权
  更多精彩内容,请关注我们。
  Come on,给你的灵魂充充电!

斯威本科技大学PQPPQP(PostgraduateQualifyingProgram)硕士资格课程专为那些学术条件未达到直接申请斯威本硕士课程的国际学生而设,课程教学内容涵盖英语语言培训以及专业课,爷爷回忆录(爷爷的视角看世界)一位白发苍苍的老人正躺在病床上,他已经快90岁了,也算高龄了。爷爷吃过饭,躺在床上回忆起自己小时候家庭国家发生的事情。爷爷的一身正经历着祖国的沧桑巨变。爷爷生于1931年,家里独子北约司令写回忆录在我40年军旅生涯中,当志愿军战俘最难忘1979年,法勒霍克利(FarrarHockley)出任北约北欧方面军总司令,同时被授予上将军衔,达到了他40年军旅生涯的巅峰。在这几十年中,最让他印象最深刻的,就是1951年成为哈里王子将出版两本回忆录,一本明年出版,一本待女王去世后出版2021年7月24日,据英国媒体报道,哈里王子要出回忆录,消息一出,众多媒体立刻陷入狂躁状态,纷纷等着哈里王子泄露更多的王室密文。而英国王室却陷入警戒状态,担心哈里王子再度将王室置36岁的哈里王子花一年写回忆录,爆点多多梅根的生父成预言家据英国镜报7月20日报道,英国王子哈里真是闷声干大事的人才,在过去的一年里,只有36岁的他竟然写就了自己的新书又一本王宫回忆录!据王室专家猜测,在王子的新书中,将有许多爆炸性的看点哈里王子密撰回忆录,1年后问世,再靠消费王室赚得千万美元据雅虎新闻网7月20日消息,美国最著名的企鹅兰登出版社表示,他们与哈里王子签约了一本他个人的回忆录,现在正在写作当中,将于2022年出版。此消息一出,无疑又向英国王室放了一枚定时炸哈里王子好友如果哈里在回忆录中乱说话,我们会曝光他的丑事2021年7月29日,据美国媒体报道,哈里将出回忆录,一时引起了轩然大波。哈里的同学和战友,都担心他会泄露关于自己的丑闻。毕竟身为王子的哈里,朋友圈里的人也是非富即贵的。他们都害怕哈里彻底露馅,写回忆录缺乏资料,只得变相求助于安德鲁王子一家众所周知,哈里王子已经与企鹅兰登出版社签订了一份包括四本书在内的出版协议,其中的第一本就是让英国王室深感不安的回忆录。哈里王子之所以在7月上旬高调宣布他在写回忆录,那是因为此前他秘哈里回忆录大爆王室内幕,将引爆核炸弹,彻底摧毁与王室关系英国王室的前苏塞萨斯公爵哈里王子,在与妻子梅根马克尔一起从王室出走,辞去王室职务,下海经商之后,就一直做出很多让英国王室十分尴尬的事情。比如他与妻子梅根马克尔参加美国影视名人奥普拉为什么邦德学子能脱颖而出?奥秘就在这里世界上有两种大学,普通的那种和特别突出的那种!恰巧,邦德大学就属于后者!为什么邦德大学能如此出众?为何从邦德走出的学子能脱颖而出?答案即将揭晓!邦德大学作为澳洲第一所私立非营利性大大学排名常见误区Top5!你也进坑了吗?相信你在留学前肯定是经过了多重的准备,把澳洲各大学的排名摸得一清二楚。这所学校会计专业排名第一据说这个专业就业率不太好那所学校的酒店管理排名全澳第一相信这是很多留学党在留学之前必走
捷途X90PLUS多项贴心设计10万元就能拥有一个家吗?也许真可以,新上市的大家庭欢乐座驾捷途X90PLUS融入家文化,凭借超大空间及诸多贴心设计全面提高了用户出行的驾乘感受,称之为移动House毫不为过。全系致命开门杀,蜀黍教你规避它致命开门杀也就是在车辆停稳之后,你去开车门时,没有注意后方的来车情况。你一开车门,就导致后面驶来的车辆直接撞在了你的车门上面,进而引发更严重的交通事故。文明行为促进条例在维护交通安全秩深度体验捷途X90PLUS却只卖10多万真香X70的成功让捷途汽车一炮而红,这款车高性价比的属性可以说是深入人心,这也是捷途汽车留给我们的印象。看到捷途X70不错的销量表现,捷途趁热打铁,推出了级别更高的捷途X90。如今的捷十万级大SUV新选择捷途X90PLUS捷途X90PLUS将于9月17日上市。据此前的预售消息来看,捷途X90PLUS共计5款车型,预售价格区间为10。29万14。09万元。在外观上,新车前脸延续了捷途家族式的徽城翘楚设BLACKPINK朴彩英Ros和Lisa因向伴舞者赠送奢华礼物而大受表扬BLACKPINKLisa和Ros因向后备舞者赠送奢侈品而受到称赞。继续阅读所有的细节。BLACKPINKRos和Lisa因为给他们的伴舞送上昂贵的礼物而受到表扬2021年,两名B澳大利亚房产太疯狂,每隔40秒涨1元钱,看过本篇文章已涨4元钱疫情肆虐之下,全球为了保经济都在加大货币放水,没想到全球房价狂涨。除了中国在严控房价,其他很多国家的房价都在猛涨,比如新加坡首尔中国香港地区美国和澳大利亚。澳大利亚的楼市涨得尤为凶总有人纠结国企和外企怎么选。。国企和外企怎么选?这个话题太大,今天肯定聊不透,也肯定会有很大分歧,我们就聊三块钱的,聊到哪算哪。。1)薪资待遇底薪方面,外企相对高一点,但是具体根据跳槽前一家公司的水平,一般会有即日起,医药商业贿赂案件将通报医保局!最近,最高人民法院国家医保局中纪委相继发文,多个信息渠道显示,打击医药商业贿赂将从顶层设计开始推动,信息共享,强化监督,深入治理!9月17日,国家医保局发布消息,最高人民法院国家医太真实!1年药代与10年药代国庆和中秋双节之前,国家药监局发布医药代表备案管理办法(试行)的公告(2020年第105号),其中七不准成为业界所关注的点,医药代表不得有下列情形(一)未经备案开展学术推广等活动(聊聊药企裁员的四大骚操作最近药圈裁员的消息是一出接一出,W司的N4和N6,以及R司的N3让很多小伙伴觉得被裁也不是坏事,大把赔偿拿到手,转身再找一家他香的很。然而事实上,除了部分有良心的公司是老老实实赔偿有一种夺金速度叫中国赛艇,iQOO野性艇你剑指东京奥运会,在7月28日女子四人双桨决赛上,中国队选手陈云霞张灵吕扬崔晓桐以6分05秒13的成绩获得冠军,这是中国赛艇队时隔13年再次夺下奥运冠军,并且创造了新的世界最好成绩,