范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

专业学者解释Yanny与Laurel

  上周我们讨论过热门音频"Yanny与Laurel",简单的阐释了一下其中的原理,今天我们来听听专家时怎么分析这个现象的。
  以下文字来源于:知乎——王赟 Maigo
  正如那条蓝黑白金裙子一样,不同的人从中听出了 Yanny 和 Laurel 两个迥异的词,且都无法说服对方。我听这段音频的感觉是:初听的时候感觉毫无疑问是一个小男生在说 Yanny;多听几遍后,感觉 Yanny 背后隐藏着一个特别低沉、甚至有点像猪哼哼的声音,努力把精神集中到这个声音上,听出了 Laurel。你的感觉如何呢?
  这段音频是由 64 岁的 Jay Aubrey Jones 上传到 vocabulary.com 网站上的,目的是示范 Laurel 一词的发音 [1]。所以,「标准答案」毫无疑问是 Laurel 了。但许多人把它听成 Yanny,必然是有原因的。这个原因可以用一句话概括:由于说话人发音低沉,人们容易把第三共振峰错当成第二共振峰。
  本文剩下的部分,就将通过分析这段音频的语谱图(spectrogram),详细解释错觉的成因。由于在网上很难找到深入的语音学资料,有一部分论据我不是很确定,但我觉得至少可以支撑我的结论。如果你对语音学有研究,也欢迎补充。
  一、基础知识:语谱图与共振峰
  语谱图是一种把声音可视化,方便观察和分析的手段。它由声音波形经短时傅里叶变换得来的,其横轴是时间,纵轴是频率,颜色表示能量的强弱。事实上,声音进入人耳后,耳蜗也会对声音进行类似于短时傅里叶变换的处理,所以人们能分辨出的声音,在语谱图上也往往会显示出特定的模式。
  上图就是「Yanny or Laurel」音频的语谱图。它的横轴范围为 0 至 0.835 秒,纵轴范围为 0 至 8000 赫兹,越亮的颜色代表能量越高。图上有两种比较明显的模式:一是细线,比如在 0.3 秒附近的低频段内就能分辨出五条细线;二是粗线,比如在 1 kHz 至 3kHz 频段内,就有一条明显的先下降、后上升的粗线。在语音中,元音(如 [a]、[i]、[u])、半元音(如 [j]、[w]),以及辅音中的鼻音(如 [m]、[n])、近音(如 [l]、[r])都会呈现出这两种模式;辅音中的塞音(如 [b]、[t])和擦音(如 [f]、[s])则会呈现出其它模式。好在本文涉及的 Yanny 和 Laurel 两个词全由第一类音素组成,所以我们可以忽略第二类音素。
  在上面两种模型中,每一条细线代表语音的一个谐波(harmonic),谐波的间距就是语音的基频,即人们感受到的音高 —— 间距越大,则音调越高。每一条粗线则代表一个共振峰(formant),它的位置是由口腔和鼻腔的形状决定的,各种元音、半元音、鼻音、近音都有自己典型的共振峰频率。造成 Yanny 和 Laurel 这一错觉的元凶,就是共振峰。
  一般来讲,从语谱图上能看到大约 4 个共振峰,一般人们只着重研究频率最低的 2 个或 3 个。第 n 个共振峰的频率简记作 Fn。元音的共振峰的决定因素研究得比较充分,结论如下:
  第一共振峰的频率由开口度决定,开口越大,F1 越高;
  第二共振峰的频率由舌位的前后决定,舌位越靠前,F2 越高;
  第三共振峰的频率由圆唇与否决定,圆唇时 F3 更低。
  有的读者可能见过下面这张元音音标图。它的两个轴其实就大致代表了 F1 和 F2。从这个图上可以看出各种元音的 F1、F2 的特点,比如 [a] 的 F1 高,F2 也较高;[i] 的 F1 低,而 F2 很高。
  对于辅音中的鼻音、近音共振峰的研究资料则相对难找一些,但一个特别明显的结论:[r] (英语中那种,不是颤音)会明显降低 F3。
  当然,共振峰的频率还与说话人本身有关。一般而言,女性的共振峰高于男性,儿童的共振峰高于成人。
  二、对「Yanny or Laurel」的分析
  下面我们可以开始分析 Yanny or Laurel 了。
  Yanny 的音标为 ["jæni],其中半元音 [j] 和元音 [i] 差别不大,所以可以看成是 [i]、[æ]、[n]、[i] 四个音素。Laurel 的音标为 ["lɔrəl],中间的 [ə] 可有可无,所以可以看成是 [l]、[ɔ]、[r]、[l] 四个音素。由此我们发现,两个单词都可以分成四个音素,且首末两个音素相同。
  引起错觉的音频也可以分为四段,分别对应四个音素,如下图所示。为了叙述方便,我把频率轴也分成了三段:1.3 kHz 以下称为「低频段」,1.3 ~ 3.3 kHz 称为「中频段」,3.3 ~ 5 kHz 称为「高频段」。5 kHz 以上的能量很低,可以忽略。
  解释错觉的关键,在于第二个音素的低频段。按照标准答案,这里的音素应该是 [ɔ]。从元音图上可以看出,[ɔ] 的 F1 中等偏高,而 F2 很低。事实上,在语谱图上,这两个共振峰常常糊在一起,分辨不出来。「Yanny or Laurel」这段音频的发音人是一位 64 岁的男性,他的声音特别低沉,这让 [ɔ] 的 F1 和 F2 更难分辨。在上图中,从第二个音素到第三个音素的过渡告诉我们,低频段其实是有两个共振峰的;但如果只看第二个音素那一段,确实容易误认为是一个共振峰。既然低频段有两个共振峰,那么中频段的那条粗线,自然就应该是第三共振峰了。第三个音素的这个共振峰显著降低,也符合 Laurel 一词中 [r] 的发音特点。
  这里有一个我解释不了的问题:[l] 音的第二共振峰哪里去了呢?
  那么认为音频内容是 Yanny 的人,是怎么听错的呢?这还是由于发音人声音太低沉的缘故。在 Yanny 派听来,发音人的第三共振峰太低了,以至于落入了第二共振峰应该在的频段。不仅如此,这段音频的高频段还有不小的能量。我不确定这些能量是来自第四共振峰,还是录音时混入的噪声,但这个声音落在了 Yanny 派认为的第三共振峰应该在的频段,于是这更让他们觉得中频段的声音是第二共振峰了。
  如果把中频段的声音当成第二共振峰,那么确实就能从语谱图上看出 Yanny 来。在第一、四个音素处,低频段和中频段的共振峰之间的间隙很大,这恰好符合 [i] 音 F1 低、F2 高的特点。在第二个音素处,低频段的共振峰频率升高,中频段的共振峰频率降低,这也符合从 [i] 到 [æ] F1 升高、F2 降低的变化。不仅如此,[i]、[æ] 两个音的 F3 也都与 F2 比较接近,高频段的噪声也符合这一特点。
  这里有另一个我解释不了的问题:为什么 Yanny 派会把中频段共振峰的下降听成 [n]?
  那么,如何让 Yanny 派听出 Laurel 呢?有两个办法:一是用「变调不变速」升高音频的音调。这一操作会同比例地改变基频和共振峰的频率,所以可以把中频段的共振峰升高到第三共振峰的典型频率。我的经验是,升高 5 个半音之后,就听不出 Yanny 了,而是原来说 Yanny 的那个年轻的男声在说 Laurel。二是用一个带阻滤波器把高频段滤掉。上文说过,Yanny 派听错的一个原因就是把高频段的声音当成了 F3,同时也就只能把中频段的声音当成 F2 了。排除高频段的声音的干扰,就有更大的可能性把中频段正确地当成 F3。

月球闻起来是什么味道的?当尼尔阿姆斯特朗和巴兹奥尔德林离开月球表面,回到登月飞船内时他们带回了一捧月球尘埃,尘埃成分里半数是精细锋利的玻璃物质,能粘附到任何东西上,12位曾踏上月球的宇航员里,几乎每个人都南科吴长锋团队开发高亮聚合物点探针实现三维多色超分辨成像应用近日,南方科技大学生物医学工程系教授吴长锋课题组成功开发了一系列高亮度聚合物点荧光探针,通过荧光探针功能化和扩展成像技术,在普通荧光显微镜上可以观察到精细的亚细胞结构,分辨率高达3月球跟月亮是什么颜色你们知道吗真实的月球颜色我们从地球上看月亮是穿过地球的大气层看到的月亮,它并不是真实的月亮的颜色,而是经过大气散射后看到的月亮颜色。太阳光经过大气后,一部分波长的光被散射掉,而另一部分波长的假如有一天月亮会离开地球假如有一天没有的月亮,人类命运将会怎么样?在过去的31年里,小天地不断撞击月球,在月球上形成了许多撞击坑,月球表面也斑斑驳驳,伤痕累累。最新月球照片据不完全统计,月球上直径大于1公日报国际空间站机械臂被碎片击中特斯拉召回天舟顺利升空2021年5月29日科技资讯新闻整合一国际空间站的机械臂近日被太空垃圾击中,外表的保温层被撕裂,留下一个洞口。这个机械臂名为Canadarm2,长18米,由加拿大制造,是空间站最重火星上的确是有甲烷但这究竟是不是生命的迹象?2012年12月,欧洲的火星快车轨道器拍摄到了这张半亮的火星照片。图片来源ESA我们离破解火星甲烷之谜又近了一步。美国宇航局的好奇号探测器最近确定,火星大气中甲烷的背景值是具有季节夜空中银河以外的星星也属于银河系吗?银河在观测条件较好的夜晚,可以看到一条白色的亮带横跨整个天空,这就是我们所说的银河,那里包含了星星。而在银河之外,天空中还散落着不少的星星,那么,这些星星也是属于银河系的吗?基本上图氢气和小行星碰撞可能会帮助火星孕育生命在对好奇号收集的数据进行综合分析之后,美国宇航局(NASA)表示如果人类想要在火星上生存,必须要增加氢气的含量并发生更多的小行星碰撞。根据好奇号的SampleAnalysisatM就在5月,两场流星雨等您来观测5月将各发生1次日食及月食,惜国内均无法见到。宝瓶座流星雨极大期是在5月6日下午,可于5月7日(周六)凌晨时段,在光害少且视野广的地方观看。近期有一颗引人注目的C2021O3(PaNASA火星直升机拍到毅力号火星车的降落伞和背罩来源海外网海外网04291110当地时间4月27日,美国国家航空航天局(NASA)宣布机智号火星直升机发现了帮助NASA毅力号火星车着陆的设备,包括降落伞及在深空和着陆过程中保护火祝融号如何应对火星上的冬天?总设计师详解国家航天局探月与航天工程中心消息火星即将进入冬季,入冬后,正在火星开展巡视探测任务的火星车祝融号将面临更多挑战。中国首次火星探测任务工程总设计师张荣桥近日向记者透露,工程团队已经对
2900万美元!马斯克卖给丁磊的这处豪宅,究竟有多豪?ALENG自媒体6月21日午间自媒体专稿,2020年5月初,硅谷科技大亨埃隆马斯克(ElonMusk)通过社交媒体Twitter宣布,将把自己所拥有的有形资产全部出售,其中包括4处一觉醒来,贝索斯赚了130亿美元,马斯克赚了21亿美元ALENG自媒体7月22日早间自媒体专稿,每个睡眼朦胧的清晨,当你爬出温暖的被窝,准备开始一天的忙碌工作时,你可能对未来充满了信心,甚至梦想有朝一日可能会成为第二个杰夫贝索斯(Je华为再传好消息二季度手机销量5580万部,超三星终成第一ALENG自媒体7月30日午间自媒体专稿,来自第三方统计机构Canalys的最新统计报告表明,2020年第二季度,全球智能手机市场上,华为出货量首次超过三星,成为二季度全球智能手机特斯拉市值破3000亿,马斯克离世界首富还有多远?ALENG自媒体7月23日晚间自媒体专稿,无论你是否知道,硅谷科技大亨埃隆马斯克(ElonMusk)绝对是2020年全球最大的网红。就在刚刚过去的2020前半年,马斯克先后将两名宇马斯克星舰飞船SN6通过点火试验,将进行150米高空飞行测试ALENG自媒体8月25日晚间自媒体专稿,硅谷大侠埃隆马斯克(ElonMusk)的星际移民梦想越来越接近现实了,北京时间8月24日,马斯克旗下SpaceX公司的星舰飞船原型测试机S距离正式发射还有两个月,马斯克的龙飞船已经抵达了发射场ALENG自媒体马斯克旗下的SpaceX公司正在为美国宇航局的下一次载人发射任务Crew1做准备,该任务定于2020年10月下旬进行,目前瞄准的发射窗口是10月23日。而根据美国宇马斯克为何选择在39A发射台进行首次载人发射?ALENG自媒体5月24日早间自媒体专稿,十年磨一剑,十八年造一船。在经过了长达18年的探索和实验之后,硅谷大侠埃隆马斯克(ElonMusk)旗下的SpaceX公司首次载人航天发射三体为什么与父亲的三句对话坚定了章北海的逃亡?01hr章北海,太空军政治部政委,是在三体黑暗森林中与罗辑并行的一位主线人物。与章北海共事的人都始终看不透他,对于上级交代给他的任务,章北海做的往往是最好的或是最正确的。但是章北海火星南极发现4个湖泊,位于地下1500米处火星正在变得越来越有趣,这一次,仍然是发现了液态水,而且是一次就发现了4个湖泊,位于火星南极永久性冰盖之下1500米深处。据9月28日最新一期自然天文学杂志在线发表的一篇论文,科学马斯克的卫星互联网开始全球公测,中国大陆全部可覆盖硅谷科技大亨埃隆马斯克(ElonMusk)旗下的SpaceX太空探索公司,刚刚完成了一次拖延已久的发射任务星链计划第13批次60颗互联网卫星。发射任务取得圆满成功,根据SpaceX一项研究认为,约3的星链计划卫星已经失效硅谷科技大侠埃隆马斯克(ElonMusk)旗下的SpaceX公司星链计划,致力于为全球偏远地区的民众提供高速低延迟的卫星宽带连接,同时,由于其便捷高效和快速部署的特点,星链计划很可