亲爱的,你已经连阅读理解都做不过AI了
4月8日 霸鲸观投稿 机器理解力,让我们在未来面前不止是个孩子。
提起“阅读理解”这四个字,你会想到什么?
被四六级雅思托福支配的恐惧?语文试卷上连原作者都搞不懂的选择题?
不管哪种答案,肯定都逃不出一个规律:进行阅读理解这项有益身心运动的主体,必然是跟你我一样的人类。
毕竟嘛,这东西需要阅读一大段文字,然后理解了意义之后再做题目,堪称一场考试中最复杂最费脑筋,也最考验综合能力的一个环节。所以你的英语老师一定说过这样一句话:得阅读理解者得天下。
然而,可是,但是,如果告诉你今天得这个天下的已经不再是人类,而是AI了,你会怎么想?也许此前我们想象过单词听写、句子翻译甚至写作都可以被AI完成,但是阅读理解这件事人类已经被甩在了AI身后,大概很多人都没想到。
可事实就是这样:
1月11日,斯坦福大学著名的机器阅读理解赛事SQuAD刷新了全球排名,阿里巴巴凭借82。440的精准率打破了世界纪录,超越了人类82。304的平均得分。
当然了,AI是不会去跟你比托福刷分的,这件事的背后,脑洞有点大哦
什么是机器阅读理解?
机器阅读理解,虽然看起来只是让AI上阵来一场考试。但是却是自然语言处理技术中,继语音判断、语义理解之后最大的挑战:让智能体理解全文语境。
而斯坦福大学发起的SQuAD挑战赛,则是业内公认的机器阅读理解最高水平赛事。
SQuAD挑战赛的基本规则,是通过众包的方式构建一个包含10万个问题左右的大规模数据集,并给出来源于维基百科长度大约在几百个单词左右的文章。参赛者提交的AI模型在阅读完数据集中的一篇短文之后,回答若干个基于文章内容的问题,答案与标准答案进行比对,最终得出成绩。
由于阅读理解这项“智能”调整,需要运用到大量逻辑、细节和结构分析能力,并且直接作用于现实中的文本资料,所以实际价值很大。
比如说,我们首先要面对的问题就是,假如人工智能已经比人类平均水平更擅长在对文本中精准信息进行理解和回答,会带给我们什么呢?
当AI的“阅读理解”得分超越人类,意味着什么
举个例子或许可以很简单的理解这个问题:英语考试上,当机器可以翻译单词的时候,我们一点都不惊奇;但机器可以听写整句话的时候,我们会感叹技术进步了;当机器自己做阅读理解的时候,我们大概会想:还要我考这个试干什么?
这里面的差别,在于处理阅读理解相关问题时,AI不只是要运算和记录,而是要主动去分析和理解,所以阅读理解问题一直被人问是NLP的标志性临界点。但这个点被AI破解,直接意味着很多必须人类才能完成的工作已经正式能够被AI接管。
因为阅读理解问题,不只是要处理语音和简单的语义,而是要理解和关注词汇、语句、篇章结构、思维逻辑、辅助语句和关键句等等元素构成的复杂组织网络。
机器阅读理解“达标”,最直接的产业影响,是大多数今天还必须由人工完成的规则、对话、服务信息类的相关理解工作,都可以被人工智能所取代。比如说客服、信息管理和推荐类的工作,都可以考虑用不妙不休、高运算速度的机器来取代。
机器阅读理解如何工作
或许我们都注意到了这样一个问题:今天的互联网世界,在变得越来越多文本内容,各种各样的信息爆炸而来。太多你知道的、你不知道的、你以为自己知道的却实际不知道的事情呼啸而过。甚至你双11想要剁个手,都有各种各样的游戏规则等着你。自己读吧,太累太痛苦还没时间,问客服吧,很可能出错还很慢,简直是薛定谔式问题。
这里或许就可以用机器阅读理解来解决了。比如客户对某个电商促销规则有疑问,就可以直接向AI提问,而AI就可以把这个问题当做一道阅读理解问题来进行解决方案回馈。
机器阅读理解能力,将在如何向客户提供非模板式的智能客服服务中发挥作用。而当AI在这些能力上超越人工,那么机器客服的利用价值将可能快速提升。换句话说:机器客服终于可以不那么机器了。。
由此不难看出,这种关键能力的标杆性突破,对大量强调与普通消费者交互的产业线益处最多。
推而广之,机器阅读能力也是文娱领域进行内容寻找和推荐的有效方式,比如阅读用户提出的复杂需求,进行精准推荐;与IoT产品相结合,给出对用户大段语言的回馈,乃至对话互动,都必须以机器理解能力为依托。
理解力,让我们在未来面前不仅是个孩子
除了知道AI可以充当更好的客服之外,究竟我们为什么应该关注机器阅读理解这件事?或许关键,是我们应该知道“理解力”在目前AI世界中的重要程度和期待指数。
AI作为一种从计算机科学下的分支,一个智能体先天具备的是运算能力,而希望进行仿人类智慧的智能模拟,第二步就是模仿人类的感知。今天我们看到的机器视觉、语音识别、语义理解,都是在做这件事。而第三步,就是让AI产生理解力。
显然,识别有着庞大的应用场景,并会在接下来很长一段时间内占据主流。但是AI的理解能力是大多数识别能力的进化,假如单纯的识别出却无法产生输出,那么AI无非是更灵活的传感器而已。
从这个逻辑上看,阅读理解这道题绝不仅仅是个测试,或者商业应用的技术加持,更重要的是开启AI纪元里理解力的加速器。
更广阔的意义在于,我们或许距离永远不用测试机器阅读理解更近了一步。当我们不再考虑机器是否能理解人类文本和语言,那么DeepNLP将可能达成,人机交互的范围将级扩大。机器智能可以开始捕捉人类的逻辑和函指。
可能那还很远,也可能很近,但机器理解力让我们在未来面前不止是个孩子,应该是毫无疑问的。
投诉 评论
变老的艺术一天晚上下班后,他决定把车骑得更远,在本该拐弯的路口他选择了直行。在自行车道上,送外卖的电动车通常比送快递的电三轮跑得更快,如果遇到正要倒进停车位的小汽车,它们就只能和他身下的……
黄家琪高考682分上清华年仅14岁,黄家琪学习方法经验分享导读:清华大学一直是众多顶尖学子报考的重要选择。3300多名清华新生昨天起正式开始报到。这其中共有35名“00”后、3对双胞胎,年龄最小新生仅14岁。3300多名清华新生……
周鸿祎:重启是为了出发,360要像阿甘一样奔跑继雷军、贾跃亭之后,红衣教主周鸿祎也发布了内部信,周鸿祎表示,在2015年360要像阿甘一样奔跑,阿甘不聪明,但他倔强、执着、坚韧。无论其他人怎么看,怎么想,他都会坚持奔跑下去……
团购网站的终极出路一个流传很广的故事:北极的旅鼠是一种极普通、可爱的小动物,常年居住在挪威北部和欧亚大陆的高纬度针叶林。在条件适宜的时候,一个旅鼠种群的数量一年内可以增长超过10倍。据说每当它们……
海法,每个人心中都有一座花园告别凯撒利亚,沿着与以色列海岸线平行的2号公路前行,一路海风轻拂,亚热带的斜阳由黄变红,徐徐地扑面而来,这让已经习惯了几个月华北寒冷季风的我们惬意而温暖。大概一个小时,眼前一边……
时尚连体裤怎么穿搭率性时尚连体裤街拍赏时尚,就是人们对社会某项事物一时的崇尚,这里的“尚”是指一种高度。在如今社会里,多指流行得体的一些东西,时尚连体裤怎么穿搭,率性时尚连体裤街拍赏时尚,就是人们对……
最IN最时尚的花衬衫怎么搭配时尚花衬衫搭配大全时尚其实在这个时代而言的,不仅仅是为了修饰,甚至演化成了一种追求真善美的意识,最IN最时尚的花衬衫怎么搭配,时尚花衬衫搭配大全时尚其实在这个时代而言的,不仅仅是……
揭秘苹果内部保密细节:运营如恐怖组织《财富》2月6日杂志刊发资深编辑亚当拉辛斯基(AdamLashinsky)文章《苹果保密》。秘密会议,秘密产品开发。作为世界最成功企业,苹果的保密让人困扰。在拉辛斯基的新书中,……
【人人早报】第344期:AppleWatch就要来了早报导语苹果公司日前更新了美国和欧洲多个国家地区的官方网站,其中最大变化来自于苹果智能手表AppleWatch页面从过去的“Availablein2015”,变成了“Co……
【便宜包包】有哪些价格便宜包包的品牌给初入职场的你最实惠的便适合自己的便宜包包,便宜包包是不是急着寻找一款,给初入职场的你一个时尚好看又实惠的价钱,就能买到大牌质量的便宜包包,而轻奢品牌便宜包包能刚好满足你的包包梦,那么今天小编就给你们……
社交网站2。0:专注用户兴趣而非真实社交圈北京时间12月31日早间消息,comScore本月发布了2011年社交网络报告。其中有趣的一点在于,专注于用户兴趣而非真实社交圈的社交网站获得新的发展。尤其值得注意的是,Twi……
怎么选择一双好的跑步鞋6点注意事项你不得不知道跑步鞋还能干什么?当然是跑步啊!除了跑步呢?你会发现上班上学、旅游逛街,跑步鞋已经变成不少人的日常鞋。小编的建议是,如果想要选购当作日常鞋穿的跑步鞋,只要按照下面提到的根据自己……