机器学习算法可以窃听动物语言吗? 乌干达的这些黑猩猩可以像 2 岁的孩子一样学习理解人类语言 圈养的黑猩猩懂英语,和 2 岁的孩子一样,并使用人类手语的符号。海豚共同协调他们的动作来打开容器并执行新的技巧。鹦鹉可以可靠地报告物品的数量或颜色。土拨鼠发出警报,一个穿着白色衣服的高个子人正在快速接近! 动物会使用语言吗?如果是这样,我们可以使用人工智能与他们交谈吗?人类语言 人类使用语言进行交流。动物还通过视觉和语言就各种话题进行交流,从哪里可以找到食物,到交配的愿望,或危险的警告。 但人类语言不仅仅是交流。人类语言有效地结合了大多数任意声音单元的离散清单,每个单元都有单独的固定含义,以共同传达信息。语言可以描述立即存在的事物,在时间或空间上遥远,甚至是假设的——复杂的规则支配着我们组合这些单元的方式。单词分为以下几类:名词、动词、介词。某些类别,例如动词,要求其他词填补从属的语义角色:动词"给"需要几个参数:给予者、给予的事物和接受者。如果你说 "小王给了小李",听众肯定会问:" 小王给了小李什么?" AI Talks 涵盖了人类尝试教人工系统使用语言进行交流的尝试。了解人类语言和动物交流系统之间的细微差别和惊人的相似之处可以帮助我们了解人工语言系统究竟需要完成什么。动物交流 乍一看,与人类语言相比,大多数动物交流可能看起来过于简单,但实际上,各种动物几乎都可以满足语言的所有属性! 许多动物都有一系列带有固定含义的离散发声。例如, 低等级的恒河猴在面对社会群体中等级较高的成员时会发出"嘈杂的尖叫声",而等级较高的成员会发出"拱形尖叫声"——一种单独的独特声音。 许多鸣禽都有一个高音纯音的呼叫,警告接近的捕食者和一个单独的更严厉的"围攻"呼叫,将附近的鸟类编组成群捕食者。 动物可以就未立即出现的事件进行交流。蜜蜂跳舞告诉蜂巢的其他成员在远处哪里可以找到食物。草原土拨鼠报警已被证明可以对过去某个时间开枪的人类接近的信息进行编码。圈养的海豚被教导"表演新奇特技"和"与另一只海豚表演特技"这两个命令,当被要求一起表演新奇特技时,他们会以某种方式协调他们要做的动作! 恒河猴、鸣禽(如黄知更鸟)、蜜蜂、土拨鼠和海豚 动物产生的某些信号的物理形式肯定会影响该信号的含义。例如,鸣禽的警告声可能很高且音调纯正,因为很难找到高音的来源。但是动物用来交流的许多信号具有任意含义。草原土拨鼠通过以特定且任意的方式调制其短啾啾警报的频率来编码大量信息。 一些动物,例如斯洛博奇科夫的土拨鼠,似乎能够有效地描述新奇的想法。在一项实验中,一位科学家使用晾衣绳滑轮系统将真人大小的胶合板切口送入土拨鼠群的中间。一个剪裁成郊狼的轮廓,而另一个则是大小大致相同的抽象椭圆形。每个剪影都引起了草原犬鼠的不同叫声。土狼剪纸收到的叫声类似于土拨鼠用于真正土狼的叫声,但为了响应椭圆形,土拨鼠产生了一个全新的叫声。同样,当一只名叫 Washoe 的年轻圈养黑猩猩不知道她的便盆标志时,她有效地结合了一系列她知道的标志:脏和好。 更进一步进入人类语言领域,黑猩猩和海豚已被证明至少能理解有限形式的语义论证结构。一只名叫 Ally 的圈养黑猩猩能够理解诸如"毯子上的牙刷"之类的介词短语,这需要两个参数:一个项目和该项目的位置。在对其理解的正式测试中,Ally 将正确的物品放在正确的目标上的几率高达 60%,尽管黑猩猩的过度活跃的性格经常导致他在完成任务之前失去兴趣。 在另一组实验中,研究人员还使用两种截然不同的命令结构向两只圈养海豚阿克和菲尼克斯传授介词短语。阿克学会了一种基于手势的语言,而菲尼克斯则得到了口头命令。同时,正如不同的人类语言使用不同的词序一样,菲尼克斯的命令形式为"物品 A 在物品 B 上",而阿克 的指令为"物品 A 物品 B 在上"。即使他们的命令形式不同,阿克和菲尼克斯都在规定时间内以 60% 的正确率将物体放置在其他物体上——比随机猜测的 4% 正确率要好得多! 在所有提出的人类语言特性中,唯一没有在动物交流系统中得到最终记录的特性是递归结构。甚至在这里,关于某些鸣禽是否使用递归语法将具有不同含义的呼叫组合在一起,也存在持续的争论。 那么,动物交流系统与人类语言有许多相似之处,是否有资格成为成熟的语言?动物语言? 包括 Slobodchikoff 在内的一些科学家将动物交流称为"动物语言",正是因为就像人类使用语言进行交流一样,动物的语言和手势信号也是动物交流的方式。如果人类语言是从我们远古祖先的交流系统进化而来的,那么动物交流不应该也有资格作为语言吗?如果我们系统地将人类语言与动物交流区分开来,我们就有可能在我们崇高的人类和我们所属的自然世界之间设置障碍。毕竟,动物的交流系统在它们的环境中为它们服务,就像人类语言在我们的环境中为我们服务一样。仅仅因为动物可能不像我们那样交流,就将它们从语言中驱逐出去似乎是非常不公平的。 但动物和人类使用的显然不是相同的交流系统。道路标志使用非任意符号传达信息,这些符号指示着环境的各个方面,但很少可以以任何可理解的方式组合。动物也会在不诉诸语言的情况下标记领土和路径。人类和动物都使用外貌来表示年龄、性别和社会地位。但我们的时尚宣言并不遵循自然语言的语法规则。我们可以和动物说话吗? 抹香鲸拥有所有动物中最大的大脑,它们使用称为尾声的短促点击进行交流 虽然目前没有压倒性的证据表明任何动物交流系统表现出人类语言的所有特征,但这并不能保证我们可能还没有发现一个可以做到的!这就是为什么我们对目前使用人工智能和机器学习技术来分析和破译地球上一些最聪明、大脑最大的非人类物种——鲸鱼的声音的项目如此兴奋的原因。 由伦敦帝国理工学院的 Michael Bronstein 领导的 CETI 项目正在分析抹香鲸用于长距离通信的点击序列,而另一个由野生海豚项目研究主任 Denise Herzing 和佐治亚理工学院的 Thad Stamer 领导的小组正在分析海豚发出的声音。这两个小组使用的技术直接来自现代自然语言处理。具体来说,他们使用深度神经网络来构建动物发声的语言模型。 语言模型是一个计算系统,给定序列的前几项,预测接下来会发生什么。在过去的几年里,预算充足的科技公司已经训练了巨大的神经网络来预测英语(或其他自然语言)句子的下一个单词。而 10 年前,最好的语言模型甚至无法生成一个连贯的句子;现在,像 GPT-3 这样的深度语言模型可以生成大部分连在一起的整个段落。 要将深度语言模型应用于鲸鱼发声,必须克服许多挑战:如何找到鲸鱼对应的单词?如何扩大记录的鲸鱼发声数量?当前成功的深度学习算法所训练的数据比我们目前拥有的抹香鲸记录数量多几个数量级。 但也许最大的挑战是,即使我们能够建立一个基于鲸鱼发声的语言模型,该模型可能会产生这样的输出,虽然对于抹香鲸来说听起来自然和正确,但对我们人类来说只是另一个难以理解的点击序列! Emily Bender 和 Alexander Koller 最近的一篇论文认为,像 GPT-3 这样仅在文本上进行训练的现代语言模型本质上无法将它们产生的单词与现实世界中的对象和实体联系起来。这些模型既不"理解"输入文本,也不"理解"输出文本。它们只是产生人类能够解释的点击序列! 为了解决这个问题,将录音与有关环境的上下文信息联系起来至关重要。例如,在土拨鼠的实验中,Con Slobodchikoff 仔细记录了每只土拨鼠发出警报时正在靠近的捕食者。 相信大家都非常希望能够克服这些挑战。我们发现鲸鱼确实用成熟的语言进行交流。已经清楚地操纵和利用其环境的鲸鱼通过以复杂(甚至递归)方式组合任意符号来传达意义。希望我们不仅能发现对鲸鱼发声的正确反应,还能用人类理解的语言解释这种发声。 期待我们与鲸鱼进行有意义对话的那一天 —— 那将是一个历史性的时刻!