范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

很遗憾,自然语言理解是AI尚未攻克的领域

  短短几年之内,深度学习算法得到了长足发展,不仅在棋类游戏中击败了全球最顶尖的选手,也能够以等同于、甚至超越人类的准确率识别人脸。但事实证明,人类语言仍是一项独特且深邃的难题,亦是AI技术所面对的最为艰巨的挑战之一。
  但是,突破能否如期而至?
  一旦计算机可以有效理解人类语言内容,则必将彻底颠覆全球各品牌、企业与组织之间的交互方式。如今,大多数企业拿不出充裕的资源为每位客户提供一对一解答服务。但在语言AI真正成熟之后,企业将能够在任意时间通过任意渠道听取、理解并回应每一个问题。这是一项激动人心的发展愿景,但距离达成目标仍有漫长的道路要走。
  直到2015年,人们才构建出一种足以在准确率方面与他类相匹敌的人脸识别算法。Facebook的DeepFace准确率为97.4%,仅略低于人类的97.5%。作为参考,FBI以往的人脸识别算法准确率仅为85%,意味着其做出的判断有超过七分之一概率是错的。
  FBI算法是由一组工程师手工开发而成。其中每项特征(例如鼻子大小以及眼睛的相对位置)皆由手动编程而来。Facebook算法则真正实现了特征学习,其利用一种被称为卷积神经网络的特殊深度学习架构,模拟出人类视觉皮层通过复杂的多层结构处理图像内容。事实上,我们并不清楚这些皮层之间是如何联系的,因此一切"奥秘"都由算法自主探索得来。
  Facebook之所以能够达成这一成就,依靠的正是实现类人级人工智能的两个基本思路:首先建立一套能够学习特征的架构,再将数百万张经过标记的高质量图像作为训练素材供其学习。
  语言难关就在眼前
  视觉的诞生虽然困难,但已经有数百万种物种在进化过程中攻克了这道难关。相比之下,语言似乎更为复杂。据我们所知,人类是目前唯一能够使用复杂语言交流想法的物种。
  不到十年之前,出现了单凭某些词汇的出现频率即可大致推理出语义的AI算法。但这种方法显然忽视了同义词元素的存在,也无法应对某些表达在不同上下文中具有不同表意的问题。
  2013年,Tomas Mikolov和他的谷歌团队创造出一种能够学习单词含义的架构。他们的word2vec算法能够将同义词相互映射,借此对大小、性别、速度等语义进行建模,甚至能够将国家与首都等特征关联起来。
  但其中仍然缺少至关重要的一环——理解上下文。语言理解领域的真正突破诞生于2018年,谷歌公司在这时推出了BERT模型。Jacob Devlin和他的团队仍然沿用传统机器翻译中的架构,但向其中引入了学习句子内上下文信息的能力。
  通过教育该模型填补维基百科文章中的遗漏单词,该团队得以将语言结构嵌入BERT模型。只需要使用数量有限的高质量标记数据,他们就成功完成了对BERT的调优,借此完成从为问题找到正确答案、到真正理解句子表意的多种任务。也凭借这一壮举,他们成为破解语言理解谜题的先驱:正确架构,加上大量可供学习的高质量数据。
  2019年,Facebook的研究人员在此基础上又更进了一步。他们同时使用100种语言训练出类似的BERT模型。此模型能够以一种语言(例如英语)进行特征学习,再将成果应用于其他任意一种语言(例如阿拉伯语、汉语及北印度语)。这种具有语言中立性的模型能够在实际训练所选定的语种上实现与BERT完全一致的性能,并在迁移至另一种语言时将影响控制在较低程度。
  这些技术本身确实给人留下了深刻印象。但在2020年初,谷歌研究人员最终得以在广泛的语言理解任务上超越了人类的表现。谷歌引入规模更大的网络架构与更多训练数据,终于将BERT架构推向了极限。如今,这套被命名为T5的架构在标记句子与寻找答案方面的表现已经超越人类。去年10月发布的多语种mT5模型已经能够在双语种间互译方面实现与人类相近的表现,更恐怖的是它能够支持多达100种语言。谷歌本周又公布了新的万亿级参数模型,整体架构规模更上一层楼,性能也进一步提升。
  可能性
  设想一下,未来的聊天机器人也许能够理解您用任何一种语言书写的内容,真正理解上下文并记住之前聊过的内容。这意味着我们得到的不再只是几条简单粗暴的预定义回应,而是真正的关切与解答。
  搜索引擎也将能够理解您的问题,给出正确答案,而且不再纠结于您的用词是否严格准确。您可能还会迎来一位AI同事,它了解关于业务流程的所有知识。更重要的,如果能够使用正确的术语,那么单靠谷歌搜索没准就能解决客户的具体问题。连篇累牍的内部文档终将成为过去,留给AI模型快速浏览即可。
  数据库的新时代即将来临。我们将彻底告别构造数据的繁琐工作——一切备忘录、电子邮件、报告都将由AI模型自动解释、存储与索引。由于数据库能够理解人类表达,您不需要求助于IT部门即可直接查询并创建报告。
  这一切还只是冰山一角。目前一切依赖于人类语言理解能力的流程,都有可能被自动化功能所彻底颠覆。
  没那么简单
  但这里还有个问题。既然这么出色了,为什么这些算法还没得到普遍应用?因为单靠云计算资源训练T5算法,就花掉了谷歌约130万美元。幸运的是,谷歌研究人员慷慨地分享了这些模型。但如果要对当前任务进行调优,还需要额外承担一大笔资源开销,外加漫长的训练周期。
  不过随着时间的推移,企业对于调优工作的不断探索,相信未来会有更多应用方案陆续涌现。另外,如果大家相信摩尔定律,那么五年左右之后我们就会迎来更复杂的语言AI应用,届时也会有新的模型全面超越T5算法。
  2021年,我们距离AI技术的转折性突破还有遥远的距离。但只要能够迈过这道难关,AI技术必将释放出无穷的可能性。

南仁东仰望星空的老人2018年10月15日,中科院国家天文台宣布,将一颗国际永久编号的小行星正式命名为南仁东星。科学家将中国天眼第一次收到的脉冲星信号,发射到这颗小行星。从此,浩瀚宇宙中,永远有了南仁新疆陨石与远古神话新疆陨石多,这无庸置疑。最著名的,是被世界公认的银骆驼,重二十八吨,为全国第一,世界第三。现收藏于新疆地矿局。地质学家在阿勒泰牧民的引导下,在阿尔泰山中证实有一块大陨石,估计重量二航天器工作寿命结束以后的命运如何?会成为太空垃圾吗?使命结束后,会因低地球大气环境阻力而离轨衰降,当其轨道高度低于120km,将面临再入坠毁处置问题。航天器离轨到再入过程是一个轨道高度和能量逐渐降低连续变化的过程。这个过程可以划分为为何所有生命最终都会走向死亡,宇宙的终极到底是什么?寄蜉蝣于天地,渺沧海之一粟,我们就如同蜉蝣生物一般置身于这广袤的天地之间,像茫茫沧海中的一粒粟米一样渺小!我们的生命终将结束,可能我们对于这个世界来说不过是一个小小的过客!那么,宇用于寻找太空生命痕迹的微型激光系统火星上有生命吗?这是欧洲航天局(ESA)准备通过其ExoMars任务来回答的问题。俄罗斯参与的这项任务计划于今年秋天启动,尽管最近的政治事态发展引发了关于这是否可能的问题。该任务的网红甜甜圈,你真的了解吗?最近,银河系中心超大质量黑洞照片的公布又引发了大家讨论黑洞的热潮,很多网友亲切地把这位新晋网红称为甜甜圈。相比2019年的第一张黑洞照片,银心黑洞虽然离我们更近,但是它的质量更小,星系的产生星系,简单的理解,就是无数本身能发光发热的天体所组成的一个集合体。我们所熟悉的银河系只是宇宙中一个普通的星系。关于星系的产生,说法不一,比较被人们接受的说法有两种一种认为星系是在数散人嗝言(六二三)对所谓宇宙超光速膨胀的一种解释(9)时空是无限的,无限时空提供了无限可能,或者说,无限时空使得任何事情都可以成为可能,无限是一切的源泉。时空的无限性表现为向内无限性和向外无限性。但我们无法直接把握无限,因为我们的理解时间在宇宙中是绝对的吗?无论时间是相对时间还是绝对时间,仍有许多类型的研究仍在进行中。(来自地球的宇宙图像)但是如果我们在地球上,这意味着您将计算任何对象或其他任何东西的参考框架上的时间,那么它会使时间相马克扎克伯格MetaFacebook和元宇宙莱克斯弗里德曼播客近日,人工智能研究科学家莱克斯弗里德曼(LexFridman)在其播客中与Facebook母公司Meta首席执行官马克扎克伯格(MarkZuckerberg)进行了有关元宇宙话题的微型铷原子钟介绍关键词铷钟铷原子钟微型铷原子钟铷原子钟由铷量子部分和压控晶体振荡器组成。压控晶体振荡器的频率经过倍频和频率合成,送到量子系统与铷原子跃迁频率进行比较。误差信号送回到压控晶体振荡器,
民间故事老汉在香炉里发现一条鱼,将其放生,隔年竟多了个儿子赵老汉,在小镇之中,不算名人,虽说叫做老汉,其实他也只有四十岁而已,只是长得有些苍老而已。赵老汉无儿无女,只有一个老伴儿,两人相依为命。因为赵老汉的妻子,一直有病,身体太过虚弱,根四大银行正式宣布,推出数字人民币,没有网络也能付款大家都知道,随着移动互联网的迅速发展,也成功的带动了许多相关领域的发展,如电子商务移动支付共享出行等等,都是近年来伴随着网络的发展而迅速兴起的几个领域,自从有了这些新的科技手段,也100年出现3次的水怪,最终在鲸鱼肚子中发现,被证实是存在的在世界许多地区都在流传着水怪的故事,在我国,长白山天池中有水怪的谜,媒体也将其作为噱头大肆宣传。不仅想找到谁的身影,还想用这样的方法带动当地旅游业的发展。尼斯湖中出现的水怪也是如此渔民捡到死亡鲸鱼尸体,切开其肚子发现龙涎香,转手卖了1000万也门35名渔民意外发现一具抹香鲸尸体,在其体内发现了价值110万英镑(约合人民币1000万元)的鲸鱼呕吐物,也就是龙涎香,从而摆脱了贫困。大家最终平分了奖金,并表示会继续捕鱼。据英如何看待德国博主海雯娜因驳斥涉华谣言,遭外媒抹黑和网络暴力?近日,一名21岁的德国姑娘在中国网络上引起了强烈关注。因为这位过去1年里一直在勇敢驳斥西方媒体对中国的抹黑,并为此遭到了大量网络暴力的女孩,居然遭到了一家德国大媒体,以及一家与欧美国家广电总局自即日起,停止利用广播电视和网络视听节目宣传推销槟榔及其制品智通财经APP获悉,9月17日,国家广播电视总局办公厅发布关于停止利用广播电视和网络视听节目宣传推销槟榔及其制品的通知。通知指出,广电总局决定,自即日起,停止利用广播电视和网络视听美国网友热议一个中国网络新词白左,称赞中国网民眼光犀利最近有一个中国网络新词白左攻入在线俚语词典UrbanDictionary,这是继土豪辣条NOZUONODAIYOUcanYOUup成功打进美帝人民的生活的新词,是中国逆向价值传输的资讯华为ampampamp三维六度5G影视制发云助力网络大电影半狼传说5月7日,由烈日星光影业(北京)有限公司山东卓格影视传媒有限公司出品,米禾影业(青岛)有限公司承制东方影都融创影视产业园管理有限公司联合承制科幻悬疑电影半狼传说在青岛东方影都举行开2。4亿年前的一条鱼为什么上了热门?2。4亿年前的一条鱼为什么上了热门?2021年4月7日,中国古生物学家命名了一条发现于中国贵州的古老鱼类。这条看上去并没有什么特别之处的古鱼竟然上了热门,这是为什么呢?上了热门的古中国一地主在临死之前,将300箱金子藏起来,却至今无人找到!提起地主人们都没什么好印象,很多人虽说没有见过,也听说过这些地主是如何为富不仁,欺压老百姓的。在封建社会,老百姓种的粮食大部分都要上交给地主,自己只能留下一小部分勉强糊口,农民种地当史上最强海怪遇到史上最大动物会怎样?当史上最强海怪遇到史上最大动物会怎样?巨齿鲨大家都不陌生吧,它可是已知地球上曾经出现过的最强掠食者,一张血盆大口能够吞下一辆小汽车,一枚牙齿我们得张开双手才能捧住。我们应该庆幸巨齿