范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

英雄联盟S11直播延迟30秒,窥见无障碍语音识别和失声者的辛酸

  直播延迟几十秒,网友竟然还说"真香"?!!
  你没听错,这发生在英雄联盟 S11 这种全球赛事上,而且,延迟高达 30 秒。
  要知道 S11 观众量可是千万级别,去年决赛最高同时观看人数就多达 4595 万人;像这种顶尖赛事,保证音、画质的低延迟本就应该是各大平台的"基本操作",哪怕一点额外的延迟都是绝对不能忍的。
  拿前几天 Dota2 直播举例,延迟 15 分钟,网友们那可是群情激愤……
  而这回,S11 直播,一个官方频道延迟高达几十秒 ——
  这似乎是大型直播事故了吧?但万万没想到的是,弹幕画风竟然一片"舒适"、"真香"。
  怎摸回事?
  我们顺藤摸瓜来到了这个频道,发现这是B站专门为听障人士推出的无障碍直播间:
  跟常规直播间不同的是,这个直播间是有 AI 实时字幕的,解说提到的队名"T1"、"poke"等黑话基本都能正确显示。赛后采访还有手语解说,整体会比常规直播间延迟几十秒。
  △已经有听障人士用上了
  其实,像这种直播字幕背后的 AI 实时语音识别技术,已经有不少应用了。包括油管的直播字幕、谷歌移动设备的视频字幕和微软 PPT 演讲字幕等,都属于这类技术。
  不过,像这样专门为直播留出一个无障碍直播间的平台,目前还不多。要真正做好一个无障碍直播间,技术上究竟比普通实时字幕特殊在哪里?
  我们深入了解了一下,发现它比想象中更"难"。无障碍语音识别,特殊在哪里?
  在理解无障碍的特殊性之前,需要先知道直播中的实时字幕是怎么来的。
  从流程上来看,实时字幕处在直播视频编码和解码中间的位置。实时字幕是在视频编解码过程中,对音频进行快速语音识别,再与视频一起输出的效果,整体大概是这么一个过程:
  △简略版流程
  可以看到,视频本身还需要经过编解码等传输流程,实时字幕制作则处在编码和解码中间的位置。
  从技术本身来看,实时字幕用的是语音识别,具体分为人工识别和自动语音识别(ASR)两种。
  此前,由于 ASR 准确率上不去(尤其是中文识别),人工识别又需要好几分钟延迟,大型比赛直播中采用实时 AI 字幕的不多。
  这些年 AI 技术上来了,视频中应用自动语音识别 ASR 制作字幕的也多了起来,具体又分为流式 ASR 和非流式 ASR。
  非流式,指整段输入语音、再输出文字的结果;流式,指像"流水线一样"实时输出转文字结果。
  目前的流式 ASR 可以做到速度极快(毫秒级,肉眼看起来是实时)的输出,经过训练也能达到不错的准确率;但与此同时,它也还有不少优化空间。
  对于不同直播来说,选择语音识别方法时,主要会从准确率和识别速度进行考量,像新闻直播更重视准确率,娱乐赛事直播更侧重识别速度。
  BUT,对于无障碍来说,赛事直播还会出现新的挑战:
  由于听障人士无法快速建立视听之间的联系,错字词需要更多反应时间,字幕的准确性要更高;此外,转录的字句需要有一定视觉流畅性;最后,赛事直播的延迟也不能太高。
  一方面,受限于语音的停顿、音频切分的长度,流式 ASR 目前能做到低延迟和基本的准确率,但往往视觉阅读的流畅性会有所降低,"每个字都会,停顿后就看不懂了":
  △每个字都会,就是看不懂
  另一方面,流式 ASR 模型需要满足一定长度的音频输入,才会处理并输出文字,非常依赖语速和说话流畅度的稳定。
  例如,主持人通常在电竞团战或是进球前夕等情况下,语速变得非常快(例如华少最快能达到 18 秒 215 字),或是因为思考出现频繁断句,就会严重影响流式 ASR 技术的"发挥"。
  在这种情况下,流式 ASR 语音识别的结果如不经过处理、直接输出的话,就会出现字幕空白、频繁停顿,或是大段爆发输出的情况。
  为了让字幕流更加稳定(能输出整段整句)、准确率也更高,B站在采用讯飞听见技术进行流式 ASR 识别(毫秒级延迟)时,选择将无障碍直播间整体进行适当延迟,来确保阅读流畅性,主要做了这些操作:
  其一,B站专门梳理了英雄联盟赛事相关的 500 + 专有词汇,包括战队、选手、赛区、游戏英雄名称、比赛术语、解说相关术语、S 赛名句等等,将这些词汇接入到讯飞听见服务器中,进行转译结果优化处理;
  其二,针对语速不稳定的情况,在文字处理部分,B站将流式 ASR 输出的文字,根据阅读习惯进行自动换行,使之更符合用户的视觉理解;
  其三,针对整体阅读体验,B站专门制作了一款辅助软件,将人工复查操作进一步流程化,进一步为听障人士提升字幕准确率……
  这也解释了B站无障碍直播间略有延迟的原因:提升了字幕阅读体验。不止实时语音识别技术
  事实上,这个无障碍电竞赛事直播间,还不止语音技术服务这么简单。
  比如,手语直播了解一下?
  B站邀请了手语翻译的代表人物韩清泉老师,由其领衔的专业翻译团队来进行手语辅助,他们会在赛果播报及赛后采访环节提供实时手语翻译。
  此外,在每个比赛日,直播间还推出了观赛小助手,即手语教学内容。像网友都很好奇的超神、一血、补刀、中单、辅助、经济等这些热门词汇,此前都已经一一亮相。
  不少人认为,之所以上线手语辅助功能,是因为语音转字幕会出错,而手语能够帮助理解。
  实际上,还有更深层次的原因。
  韩清泉老师解释说,对于会手语的朋友而言,如果只有文字和手语两种交流方式可供选择,他们一定会毫不犹豫选择手语,因为用手语交流会有强烈的代入感。通过这种方式,听障朋友们就能强烈感受到被这么多人关注着。
  至于大家很疑惑的"为什么不是全程的手语直播?"事实上,手语也是有方言的。像英雄联盟这类全球性的游戏赛事,要想全程手语直播,需要建立一套新的专有名词。
  现有的语音实时字幕虽然无法做到 100% 准确,但已经能满足大部分听障人士的理解需求。
  2006 年全国第二次残疾人抽样调查显示,我国残疾性听力障碍人群达到 2780 万;而根据 2017 年北京听力协会预估,中国听障人士的数量已经达到 7200 万,这个数字仍在持续增长。
  如今,B站为了照顾这当中一些赛事爱好者的观赛体验,专门开设无障碍直播间,引得不少网友纷纷点赞:
  格局大了。
  这次的无障碍我真的吹爆!虽然残障人士是少数人,但少数人也有享受一切的资格。
  科技本身应该是无障碍的
  放眼整个游戏行业的发展历程,B站这种对残障人士的关怀思考,其道不孤。
  最知名的莫过于是 2018 年 9 月,微软推出的 Xbox 自适应手柄 ——Xbox Adaptive Controller。
  30 厘米长的手柄上有两个大的可编程按钮和 19 个插孔,可连接到一系列的操纵杆、按钮和开关。
  即便有些玩家对价格表示不满,因为这款手柄要 99 美元(人民币 700 元左右),比普通手柄高出 40 美元,但当时在业内却引起了不少的轰动以及好评。
  △B站知名游戏区 UP 主 @-鸦-karas
  那一年,这件产品还被时代周刊评为 50 大发明之一,并获得意大利电子游戏奖创新奖。
  硬件的突破很吸引眼球,但软件上的支持也同样重要。
  三大游戏厂商中的另两家索尼和任天堂,这几年也在软硬件改进上做了不少努力。
  索尼早在设计 PS4 时,就做了许多针对障碍玩家的硬件优化和辅助功能。
  例如,(手柄等)按钮可以重新编程、文本转语音(TTS)、文本放大器等功能,都是针对肢体障碍、视障等群体的设计。
  在某些需要 QTE(快速反应)的游戏中,玩家可以修改手柄按键功能,将反复点按换成长按不放,也能达到连续按键效果。
  任天堂系列产品,也都包含了相应辅助功能,包括触觉和听觉反馈、灰度显示、运动控制、反转颜色等玩法,为有障碍的玩家拓宽了可玩游戏范围。
  △色盲人士看马里奥是这样的(右)
  去年,游戏届奥斯卡奖 The Game Awards(TGA)还专门设立一项最佳无障碍创新奖,来鼓励游戏厂商们为残障玩家服务。
  不止是产品中辅助功能的更新,现在,更多的科技公司开始关注到无障碍相关的技术研发。
  比如,眼球追踪技术。
  如 Tobii 公司的眼动仪,就允许玩家通过眼球移动来控制数字界面,也已经有更多产品支持这项技术;又如 Tribe Game 的推出的《超点》动作游戏,玩家就能通过眼球追踪技术,完成对整个游戏的操控:
  还有众多企业押注的脑机接口技术。
  无障碍游戏就是脑机接口核心应用场景之一。它能让人们只通过意识就完成机械操控、文字输入等操作。
  不少科技公司对这项技术投入了研究,其中就包括 Steam。G 胖表示,Steam 正在与开源脑机接口平台 OpenBCI 合作,共同开发一项脑机接口软件开源项目。
  可以明显看到,更多科技公司与平台在关注残障人群"无障碍"体验文娱服务这件事。
  而且这个群体,确实不应被忽略。
  以往我们多数人只是在电视新闻中看到有企业机构关注他们的现实生计、刚需,但细想一下,这些听障朋友的精神需求,同样是生活中重要一环。
  所幸,这样的需求正在越来越被广泛关注。
  除了最直接的影响 —— 对残障人士有益之外,科技走向"无障碍"本身还有更多额外价值。
  对于他们来说,技术人员正在成为智能时代的"扫盲僧"。
  如今,数字化智能化服务为大多数人带来便利,但始终存在这样一批被拦截在技术之外的"失语者"和"局外人"。
  他们或是不同程度的残障人士,或是行动不便的老年人、又或是那些因为特殊原因不能享受科技福祉的少数群体。
  但谁来扛起这个"扫盲僧"的责任 —— 将科技惠泽到更多群体呢?
  如前所述,就是那些原本改变这一切的人,所谓的"无障碍"场景,正是技术人员的练兵场。
  如何练兵?该往哪个方向练兵?
  这就离不开扫盲僧的核心秘籍 —— 企业的"以人为本"价值观。
  甚至从某种意义上说,这种价值观是最终实现的关键一环。
  即使输出的产品功能再小、技术也不那么前沿,但只要能物尽其用,它所带来的价值就会更加长远。
  这次B站是聚焦听障群体,下次也许就是视障群体,再下次可能就是老年用户…… 细想一下,一个平台最终不正是这么多小众用户共同组成的么?
  毕竟,科技本身就应该是无障碍的。
  如果哪天,地球上不再存在什么"失语者"、"局外人",技术无障碍的终极意义,也就真正实现了吧。

神经学家探讨新冠与脑雾记忆丧失和痴呆症之间的联系作为一名领先的认知神经学家和神经科学家,William正在带头研究轻度至中度COVID19之后的认知障碍的特征。ldquo我们发现神经炎症是许多脑部疾病的共同主题,但并非所有的神经神舟十二号撤离空间站太空出差三人组要回家了据中国载人航天工程办公室消息,北京时间2021年9月16日8时56分,神舟十二号载人飞船与空间站天和核心舱成功实施分离。截至目前,神舟十二号航天员乘组已在空间站组合体工作生活了90SpaceXInspiration4任务即将发射官方将进行直播据外媒报道,在亿万富翁的太空竞赛中,四名ldquo普通人rdquo将创造太空历史,他们将于当地时间周三坐上SpaceX的ldquo载人龙飞船rdquo太空舱,围绕我们的星球进行为期SpaceX首次商业旅行将启航二手火箭送4名纯游客上天近年来,欧美不少太空公司都开展了商业航天业务,维珍蓝色起源SpaceX三家是较为领先的,其中前两家已经送旅客进入了亚轨道太空。现在SpaceX的首次商业旅行即将在8点左右启航,将运科学家开发更环保的牛仔裤染色工艺不用有毒化学品据外媒报道,虽然人们可能认为蓝色牛仔裤是一种朴素的常见服装,但它们的染色过程绝对不是环保的。然而,由于一种新的染色工艺的开发,这种情况可能很快就不会再出现。通常,在牛仔裤的染色过程保存完好的化石揭示了5亿年前节肢动物祖先的大脑节肢动物是动物分类中最多样化和物种最丰富的类别,包括昆虫甲壳动物蜘蛛和蝎子,以及其他不太熟悉的品种,如千足虫和蜈蚣。现在生活在5亿多年前的生物留下保存完好的化石非常详细地揭示了一种生物学家利用进化原理预防细菌发展出抗生素耐药性了解耐药率和交叉耐药性可以提高顺序抗生素治疗方案的效力。eLife杂志上的一项研究报告说,使用相似但经常互换的抗生素进行序贯治疗是杀死细菌和防止抗药性的有效方法。该结果挑战了一个广研究构成生命基础所需的有机分子的重要储备据外媒报道,研究人员表示,对年轻恒星周围物质发出的光的独特ldquo指纹rdquo的分析揭示了构成生命基础所必需的大型有机分子的ldquo重要储备rdquo。领导这项研究的利兹大学研究肉类生产相关排放占所有食品生产排放的近60据英国卫报报道,一项重要的新研究发现,全球食品生产产生的温室气体排放占人类活动所产生的二氧化碳总排放的三分之一,而使用动物生产肉类造成的污染是生产植物性食品的两倍。根据这项研究,整NASA为Artemis着陆器工作挑选了5家合作公司据外媒报道,NASA的Artemis着陆器概念进程达到了一个节点,眼下,5家公司被授予进一步的数百万美元从而成熟它们各自的可持续人类着陆系统概念。这些资金将在ldquoNextSpNASA科学家正调查火星上史诗般的超级喷发火山据外媒报道,美国宇航局(NASA)的科学家正在调查火星上的ldquo超级喷发rdquo火山。NASA正在描绘过去的火星,那是一个充满熔岩气体和灰烬的ldquo地狱rdquo星球。科
波音宣布与保时捷合作开发电动飞行汽车,可垂直起降IT之家10月11日消息波音本周四宣布正与大众汽车旗下豪华跑车品牌保时捷合作开发一款能在城市环境中运送乘客的概念电动飞行汽车。波音已经在与主要竞争对手空中客车和其他公司竞争,正在研早期人类离开非洲的原因气候变化追随捕猎说法不一1月25日消息,据国外媒体报道,智人发展历程中曾数次迁徙。依据传统的智人向非洲之外迁徙的故事进行解释智人在非洲进化,之后在世界其他地区进行大规模迁徙。但究竟是什么原因引起了这种群体2020年关于人类起源的十大重要发现1月22日消息,新冠疫情在很大程度上改变了这个世界和我们的生活,也包括古人类学家考古学家等需要野外作业的研究人员的工作方式。不过,科学家在2020年仍然做出了许多至关重要令人激动的新研究显示,特定频率的红光照射或可改善视力北京时间7月2日消息,据国外媒体报道,英国科学家也许找到了一种价格低廉技术含量低的方法,可以对抗衰老过程中出现的视力下降。在他们开展的一项小型临床试验中,40岁以上的受试者在每天盯黑暗中玩手机半小时就会瞎?医院专家出面回应IT之家10月8日消息最近一篇名为惊叹!晚上熄灯后千万不要再看手机的文章在家长群流传颇广,文中不但有一张通红双眼的惊悚照片,还称黑暗中对着手机30分钟以上,会造成眼睛黄斑部病变视力做近视眼手术真的有这么可怕吗?在电视电脑和手机出现之后,人们花大量时间在虚拟世界,用眼强度空前增大。近视也困扰着越来越多的人。据世界卫生组织资料显示,中国近视患者超过了6亿,在我国5岁以上人群中,每3个人就有1我国清洁能源开发利用取得新进展成功实现干热岩试验性发电IT之家7月4日消息据央视新闻报道,我国清洁能源开发利用取得新进展,日前在河北唐山马头营干热岩勘查区,成功实现了干热岩试验性发电。干热岩是地球内部热能的一种赋存介质。通俗来讲,干热在轨一个月,我国三名航天员相互做超声检查IT之家7月18日消息我国神舟十二号载人飞船于2021年6月17日发射升空,当日正式与我国空间站进行对接,聂海胜刘伯明汤洪波三名航天顺利进入天和核心舱,如今航天员在轨执行任务已满一神十二返回舱将于东风着陆场着陆搜救分队已准备21年IT之家7月16日消息6月17日9时22分,搭载神舟十二号载人飞船的长征二号F遥十二运载火箭,在酒泉卫星发射中心成功发射,顺利将聂海胜刘伯明汤洪波3名航天员送入太空。据人民日报报道我国空间站用水详解三种来源,采用银离子杀菌剂处理IT之家7月15日消息今日国家航天局发表文章,详细介绍了我国空间站的用水情况,目前,驻留在空间站的三名航天员为聂海胜刘伯明汤洪波,他们于6月18日搭乘神舟十二号载人飞船飞入太空,目82岁老奶奶的飞行人生曾训练喝放射性水,将与贝索斯圆梦太空北京时间7月19日消息,7月20日,当沃利冯克(WallyFunk)与亚马逊创始人杰夫贝索斯(JeffBezos)一起搭乘蓝色起源运载火箭到达太空边缘时,她将成为史上最年长的美国航