自然语言理解新突破科学家让AI不止看懂字面意思

　　据外媒报道，近日，伦斯勒理工学院的两位科学家撰写了一本名为《人工智能时代语言学（Linguistics for the Age of AI）》的书。
　　该书探讨了目前的人工智能学习方法在自然语言理解 (natural language understanding，NLU) 中的瓶颈，并尝试探索未来发展智能代理（intelligent agents）的途径。
　　《人工智能时代语言学》的作者 Marjorie McShane 和 Sergei Nirenburg 发现了一种突破人工智能学习语言瓶颈的新方法，并称为＂语言赋能智能体（Language endowed intelligent agents，LEIA）＂。该方法能在减少训练模型数据量的情况下，进一步提升人工智能理解人类语言的准确性。
　　他们认为，人工智能系统必须超越对词语字面意思理解的范畴。他们在书中用案例显示了，自然语言理解系统能够帮助人工智能理解世界、向人类解释他们的知识并在探索世界的过程中学习。
　　▲ 《人工智能时代语言学》一、AI 学语言的两种方法：被动告知 or 主动学习？
　　例如一个歧义语句的案例：＂开刀的是她父亲＂。这句话有两种理解方式，她的父亲是医生去操作开刀手术，或者她的父亲是被医生开刀的患者。
　　有些语句单独看充满了歧义，但人类能够通过语境来解决这些歧义。我们通过说话者的语气、语境和对话的一般逻辑以及生活基本常识的线索来构建上下文。当我们的直觉和知识未能帮助我们理解句子的时候，我们会提出疑问。对我们（人类）来说，确定上下文的过程是很容易的。但是让计算机用程序思维来理解相同的过程并不简单。
　　科学家提出了两种方式来尝试解决这个问题。
　　第一种方式是科学家在人工智能发展的初期使用的。科学家通过知识库（Knowledge-based）系统来确定句子中的每一个单词的作用，并提取上下文的含义。但知识库系统依赖大量的关于语言、情境和世界的特征（features）。这些信息可能有着各自的来源，并且（在计算机中）需要独立的计算方式。
　　知识库提供了可靠（reliable）和可解释（explainable）的语言分析方法。但后来它们逐渐＂失宠＂了，因为它们需要太多的人力来设计特征、创建词汇结构（lexical structures）和本体（ontologies），以及开发将所有这些部分结合在一起的软件系统。研究人员认为知识工程（knowledge engineering）的瓶颈是手动工作（manual effort，大量的人工操作且不能穷举所有结果），他们尝试寻求其他方法来进行语言处理（language processing）。
　　＂公众认为任何试图克服这种所谓的知识瓶颈的努力都是徒劳的，这深刻影响了人工智能的发展道路，特别是自然语言处理，使该领域远离了理性主义、基于知识的方法，并促成了经验主义的出现。＂McShane 和 Nirenburg 在《人工智能时代的语言学》中写道。
　　近几十年来，机器学习算法（machine learning algorithms）已经成为神经语言程序学（Neuro-Linguistic Programming，NLP）和自然语言理解（Natural Language Understanding，NLU）的核心。
　　部分科学家逐渐开始使用第二种方式，利用知识学习系统（knowledge-lean systems）来训练机器学习模型，使人工智能通过统计关系来处理语境问题。在训练过程中，机器学习模型需要处理大量的文本资料，并根据单词与单词相邻位置的方式来调整其参数。在这些模型中，语境是由单词序列之间的统计关系决定的，而不是单词背后的含义。不过，数据集越大，例子越多样化，这些数字参数就越能捕捉到单词彼此之间的各种出现方式（能够记录单词与单词的排列参数）。
　　知识学习系统之所以得到普及，主要是因为大量的计算资源和大型数据集可以被用来训练机器学习系统。通过维基百科等公共数据库，科学家们已经能够收集庞大的数据集，并针对翻译、文本生成和问答等各种任务，设置机器学习的专项训练。二、机器记录了数据并不意味＂理解＂了数据
　　今天，我们的深度学习模型可以生成文章长度的文本序列，回答科学考试问题，编写软件源代码以及回答基本的客户服务查询。这些领域之所以能取得进展，是因为深度学习架构（LSTMs，Transformers）得到了改进。更重要的是，神经网络研究每年都有新的进展。
　　但是，虽然更大的深度神经网络可以在特定任务上逐步取得进展，但它们并不能解决＂通用自然语言理解（general natural language understanding）＂这一更宽泛的问题。这就是为什么各种实验表明，即使是最复杂的语言模型也无法回答有关世界是如何运作的简单问题。
　　在 McShane 和 Nirenburg 的书中，他们把目前人工智能系统解决的问题描述为＂唾手可得的水果（low-hanging fruit）＂任务。一些科学家认为，继续沿着神经网络的道路前进，最终会解决机器学习正面的语言学问题。但 McShane 和 Nirenburg 认为，还有更根本的问题需要解决。
　　＂当前的系统不像人类，它们不知道自己在做什么以及为什么这样做。它们解决问题的方法也不像人类，而且它们不依赖于世界、语言或机构的互动。＂他们写道，＂相反，它们在很大程度上依赖于将通用机器学习算法应用于越来越大的数据集，并得到现代计算机惊人的速度和存储容量的支持。＂
　　▲ 人工智能三、真正了解学习意义的 AI 才真＂智能＂
　　身为认知科学家和计算语言学家的 McShane 表示，机器学习必须克服几个障碍，其中首先是意义的缺失（真正让计算机了解学习的意义，而不是单纯的背答案）。
　　＂统计/机器学习（The statistical/machine learning，S-ML）方法并不试图计算意义（compute meaning）（目前的计算机学习仅能进行数据处理，并不能真正理解数据的含义）。＂McShane 说。＂从业者（部分研究人员）认为单词（在句子中）足够代表它的含义，但事实并非如此。当涉及到完整的上下文意义时，一个句子中的单词（意思）只是冰山一角。对人工智能来说，混淆词语的含义就像把船开向冰山一样令人担忧（人工智能在不能完全正确理解语言指令含义的时候，会导致后续的一系列错误）。＂
　　在大多数情况下，机器学习系统通过缩小任务范围或扩大数据集来回避处理词义的问题。但是，即使一个大型的神经网络能够＂创作＂一段长文本并保持语义的连贯性，它仍然不能理解它所＂写＂的词句的含义。
　　＂人们可以搭建一个看起来十分＂智能＂的系统，但实际上它们（人工智能）并不知道发生了什么（例如，GPT-3）。＂McShane 说。
　　▲ GPT-3
　　所有基于深度学习的语言模型，只要你问它们一系列琐碎但相关的问题，它们就会开始崩溃，因为它们的参数无法捕捉日常生活中无限的复杂性。在这个问题上投入更多的数据并不能让它们变得更加＂智能＂。四、赋能 AI 突破语言学习的瓶颈
　　在他们的书中，McShane 和 Nirenburg 提出了一种不需要求助于纯机器学习（纯机器学习需要大量数据），而且解决了自然语言理解的＂知识瓶颈＂的方法，它被称为＂语言赋能智能体（LEIA）＂。它有三个关键特征:
　　1.LEIAs 能够理解敏感语境下的语言含义，不至于造成歧义。
　　2.LEIAs 可以向人类解释它们（AI）的思想、行动和决策
　　3.LEIAs 能够在与＂世界＂互动中终身自主学习，减少人类对其扩展知识库的需求。
　　LEIAs 对自然语言进行了六个阶段的处理，从确定单词在句子中的作用，到语义分析，最后到情景推理。这些阶段使得 LEIA 能够解决单词和短语不同含义之间的冲突，并将句子整合到主体工作的更广泛的环境中（将句子的表达方式调整的更像人类的语言）。
　　LEIA 为它们的语言表达设置了信心水平，并知道它们的技能（语言技巧）和知识在哪里达到了它们的极限。在遇到理解力的极限的情况下，它们能与人类 (或其他高等智能) 进行交互以解决语言歧义的问题。这些互动反过来使它们能够学习新事物，扩大它们的知识储备。
　　LEIA 将句子转化为文本意义表述（text-meaning representations，TMR），即句子中每个词的可解释和可操作的定义。根据其（语句）背景和目标，LEIA 决定哪些语言需要跟进处理。例如，如果一个维修机器人与几个人类技术人员处在同一个机器维修的车间，而人类在讨论昨天的体育比赛结果，那么人工智能应该能够区分与它的工作（机器维修）相关的句子和它可以忽略的句子（体育）。
　　LEIAs 主要使用 knowledge-based systems，但它们也在处理语言的过程中使用了机器学习模型，特别是在语言处理句子解析的初始阶段。五、AI 真的需要模拟人类大脑思维吗？
　　LEIA 的主要特点之一是整合了知识库（knowledge bases）、推理模块（reasoning modules）和感觉输入（sensory input）。目前，计算机视觉（computer vision）和自然语言处理等领域的重叠很少。
　　正如 McShane 和 Nirenburg 在他们的书中所指出的，＂语言理解不能脱离整体认知（overall agent cognition），因为语言理解有时也需要其他感知模式（如视觉）的辅助。
　　在现实世界中，人类利用丰富的感官体验来填补语言表达的空白（例如，当有人告诉您＂看那边？＂时，他们假设您可以看到他们的手指指向的位置，并补充信息）。人类对话的思维逻辑能做出假设并省略语言中的细节。我们希望与我们交互的智能代理（intelligent agent）都具有类似的功能。
　　＂我们完全理解为什么单独处理的方式（silo approaches）是现在的常态，毕竟解决每一个问题都很困难，而且每个问题都需要单独进行研究，＂McShane 说。＂然而，如果不进行整合，问题是无法从根源解决的（人工智能语言学习的发展应该整合多个模式）。＂
　　同时，实现类似人类的思考逻辑并不要求 LEIA 完全复制人类大脑。McShane 说：＂至少在这个发展阶段，神经科学（neuroscience）不能为我们的认知建模（cognitive modeling）提供任何语法上和内容上的帮助。＂McShane 和 Nirenburg 认为，复制大脑并不能为人工智能解释目标（语句）所服务。
　　▲ 人工智能 2结语：让 AI 像人一样使用语言仍需时间
　　McShane 和 Nirenburg 提出了 LEIA 作为新的人工智能学习方法，这不仅减少了训练所需的数据量，而且解决了自然语言理解存在的＂知识瓶颈＂问题。
　　同时，他们也承认开发 LEIA 是一个持续的、长期的、范围广泛的工作计划，有很多工作需要做。而最终的目标就是＂使机器能够像人类一样熟练地使用语言＂。

聊天机器人有了长期记忆，遇到不懂的还能上网搜索聊天机器人一直是人工智障的代表。尽管从GPT3开始，AI生成的文本已经能做到以假乱真，但这仅限于生成一段话。在连续聊天中，AI不会记得自己之前说过的话，就像下面这样AI这种前后矛盾佳明推出星战主题智能手表续航1周，售价400美元IT之家10月7日消息迪士尼为了星球大战天行者崛起的宣传已经推出了很多联名产品，比如联名的地雷形可口可乐联名美联航飞机联名乐高联名雷蛇键鼠联名阿迪达斯X翼战机UltraBoost跑名为机器狗Max，腾讯正式发布首个软硬件全自研的多模态四足机器人IT之家3月2日消息根据腾讯官方的消息，今天，腾讯正式发布首个软硬件全自研的多模态四足机器人机器狗Max。官方表示，机器狗Max采用了足轮融合一体式设计，采用了腾讯Robotics华为官宣WatchGT2保时捷版本，10月22日见IT之家10月15日消息华为官方微博刚刚发布预热视频，WatchGT2保时捷版本10月22日见。金属表带IT之家了解到，9月份爆料者evleaks就曾表示华为将为WatchGT2P亚马逊人工智能Alexa更新主动预感功能无需人工干预即可控制其他设备IT之家1月26日消息早在去年9月，亚马逊宣布Alexa将能够在无人工干预的情况下主动采取行动，并称之为Hunches。当用户授权允许后，Alexa将从用户习惯中学习并通知用户是否魅族立式无线超充40W将于4月29日开售，售价199元IT之家4月27日消息在今年的魅族18系列发布会上，魅族官宣将推出一款40W的立式无线充电器，售价199元。今日，魅族配件官方宣布，魅族立式无线超充40W将于4月29日1000开售AI修复历史珍贵影像，教你如何用彩色高清还原70多年前的场景你对历史这个词的第一印象是什么？很多人的脑海中最先冒出来的，或许是像下面这样粗糙颗粒老旧模糊的黑白影片图源1951年纪录片抗美援朝但现在，在AI修复技术的帮助下，那些模糊的影片也能AI进军摇滚圈，发布了一张金属乐专辑利用人工智能编曲，似乎已经不是一件新鲜事。但是你有听说哪个AI发布专辑吗？这个专辑的作者是一个叫DeepSlayerXL的智能程序，它基于TransformerXL语言模型训练，可米家十字四门冰箱4月24日预售496L容量立体送风，到手价3499元IT之家4月23日消息根据官方消息，米家十字四门冰箱496L版将于4月24日全渠道开启预售，5月1日开售。这款冰箱具有一级能效，零售价3999元，到手价3499元。米家十字四门冰箱三星与珠宝商推出特别版GalaxyWatch3，售价3040元起IT之家5月12日消息根据外媒GSMArena消息，三星近日与珠宝商Tous进行合作，推出了一款特别版的GalaxyWatch3智能手表。该产品重新设计了表盘以及表带，同时搭载专属谷歌WearOS添加Gboard输入法，将支持QWER全键盘输入IT之家5月7日消息根据外媒消息，今日谷歌WearOS正式宣布将自家的Gboard输入法带到智能手表的WearOS系统，支持全键盘输入，兼容多种语言。这款输入法还支持语音输入Emo

<<<<<<－>>>>>>

中国人工智能专利排名超过美国中国企业过去3年在日经人工智能专利50强榜单上异军突起，领先于美国同行，扩大了他们在这个全球最重要高科技领域的触角。在2016至2018年间，该榜单中的上榜中国企业从8家增加到19患病祖父竟是被机器人告知生命垂危，家属怒了本周，加州某医院通过一台机器人向一名78岁的病人传达了其生命垂危的消息，这促使该病人的家人将他们的失望与恼怒公之于众。病人的孙女安纳莉丝雅威廉哈姆向今日美国透露，他的祖父欧内斯特昆一文了解AI芯片市场走向未来GPU收益或滑落第二曾是弃儿的人工智能，如今，已经蓬勃发展了很长一段时间了。现在，人们对提供高性能视觉识别匹配或甚至超越人类技能的产品和技术产生了浓厚的兴趣和投资。同样，语音和音频识别正变得越来越普遍孙正义人工智能将在30年内彻底改变人类生活方式据美国财经网站CNBC报道，软银CEO孙正义（MasayoshiSon）日前表示，人们应该为人工智能（AI）的发展做好准备，因为它将在30年内改变我们的生活方式。孙正义今日在接受C难倒笔迹鉴定专家？这位AI机器人能模仿任何人笔迹人类通常认为十分简单的日常任务，比如写字，对于机器人来说却代表着异常艰巨的挑战。现在，名为笔迹公司（TheHandwritingCompany）的初创企业希望帮助解决这个问题。笔迹太空探索的未来，看看这位不吃不喝不怕辐射的AI机器战士人工智能（AI）正以惊人的速度发展，并正迅速赶上人类智能（HI）。从单一用途的狭义人工智能（ANI）发展到通用人工智能（AGI），能够独立思考行动和做出决策的智能机器人将很快成为现带触控的俄罗斯套娃LG获得家用智能机器人专利美国专利商标局（USPTO）已授予LG电子设计一个家用机器人的专利，外观上像是我们小时候玩过的不倒翁，它的前面还有一个小小的屏幕来显示信息。作为一个现代家庭的智能机器人，LG还没有华为AI音箱新技能升级支持召唤小冰IT之家1月28日消息根据华为官方的消息，华为与微软展开在人工智能语音助手领域的合作，现在小艺可以召唤小冰。通过华为AI音箱，用户可以直接和微软小冰进行交流与互动。据介绍，不仅是华AI还原手冢治虫画风和思想明年或将出虚拟新作IT之家10月5日消息日前，东芝半导体功能公司公布了一项最新的AI技术TEZUKA2020（手冢2020），这项AI技术通过学习已故日本知名漫画家手冢治虫作品，学习其画风和思想，真计算资源持续垄断化，AI前沿研究何去何从？从大型机到个人电脑，从互联网到智能手机，计算机技术的每一个重大进步都为更多的人在数字前沿创造了机会。但越来越多的人担心，科技行业的新前沿人工智能，正在逆转这一趋势。计算机科学家表示618大促买智能音箱？这些天猫精灵们你不能错过618大促期间，天猫精灵官方旗舰店开启了促销活动，包括天猫精灵CC天猫精灵方糖R天猫精灵Queen智能语音美妆镜等等产品都有不同程度的促销降价，其中天猫精灵CC更是最高直降200元