范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

揭秘搜狗全球首个手语AI合成主播幕后

  搜狗近日发布了最新一代AI合成主播——全球首个手语AI合成主播“小聪”,从技术上给听障人士获取信息、更好融入社会提供了一种新帮助。
  根据世界卫生组织发布的最新数据显示,全球有约4.66亿人有听力障碍,在我国听障人员有2700万人。由于受教育程度参差不齐,除了文字,手语仍是听障人士的第一语言。
  手语AI合成主播“小聪”是基于搜狗人工智能和AI分身技术打造的“数字人”,以打造聋人真正可懂的通用手语播报为目标。“小聪”集成了3D数字人建模、机器翻译、多模态数字人生成、迁移学习、实时面部动作生成及驱动等多项AI技术。在组织的聋人可懂度测评中,“小聪”的手语播报可懂度可以达到85%以上。
  手语AI主播创意源于一次网友交流
  谈及搜狗打造全球首个手语AI合成主播的初衷,搜狗AI交互技术部总经理陈伟回忆道,2019年的时候看到微博上有一位聋人朋友吐槽自己的搜狗语音没法正常用,无法和朋友交流。在通过私信沟通帮他解决问题后,我们意识到其实听障群体对信息获取这件事情特别有期待。如何更好的用搜狗的技术帮助听障人群获取信息,此后我们开始思考并行动。
  事实上,搜狗在AI合成主播领域已深耕多年。从2018年首次推出AI合成主播到现在,搜狗“数字人”技术已经进行了多次迭代进化。
  但是,和有声语言不同,手语是一种视觉空间语言,以表形表意为主,是通过手势、表情、唇动、姿态等方式来表达的。这也意味着手语拥有自身独特的表达逻辑和特点,比如手语表形度高、词性结构不发达、语序语法结构独立等等。
  详细来说,手语的语序,跟汉语语序表达不一样的地方;在词汇方面,手语里没有虚词,没有量词;手语里特有的非手控的信息,比如说表情、口动、身体的朝向这部分在语音语言里是没有的。
  相比较搜狗此前推出的数字人语音主播,手语主播“小聪”背后又有哪些技术思考和突破呢?
  手语AI主播的“超”能力
  “如何把手语语言体系进行计算机应用转化,这件事此前业内并没有特别明确的做法。”,陈伟分析认为,要做出真正让聋人可懂的手语“数字人”,需要解决三个问题:一是,完成手语语言向计算机语言转化。二是,实现健听人和聋人两种语言之间高效高质量转换。三是,驱动“数字人”做出逼真的自然连贯的手语动作和面部表情。
  在明确了要解决的问题后,搜狗技术产品团队开始有针对性的逐一突破。
  陈伟称,要解决上面三个问题,第一需要把手语词汇转化成文字或技术方式标注出来;第二需要构建健听人语序和聋人之间语序之间的平行语料对,这需要大量的机器翻译库;第三需要通过捕捉的方式,预先捕捉大量的真人动作和表情数据,这些数据用来做模型训练。
  另外,陈伟强调,此前搜狗做3D AI合成主播时一直强调唇形,最多加上表情。手语AI合成主播还需要加入更多新的维度,比如主播的嘴形、表情、姿态、手部动作一定要保证在同一时间完成。如果嘴形或动作有提前或滞后情况,这样给人的感觉就是表达不够准确。所以技术上要做到充分对齐,通过多模态端到端生成模型进行联合建模及预测,生成高准确率的动作、表情、唇动等序列。
  针对手语AI主播项目,搜狗除了内部组建了语言、产品和研发体系外,还专门设置了一个“顾问团”。
  据说,顾问团由三类型人员组成,一部分是国家官方聋协和残联标准部门专家;一部分是手语学校的老师,能够听懂声音,同时也能打好手语,做手语教学的人;第三部分是手语的使用者,也就是聋人。通过把手语语言专家、工程师、研究员、实际用户集中在一起,持续沟通、产品迭代,最终打造出全球首个手语AI合成主播“小聪”。
  现在,在数字人效果方面,“小聪”使用了3D重光照扫描还原、面部肌肉驱动、表情肢体手势捕捉技术,生产出了高度还原真人发肤、形象逼真、动作自然生动的数字人模型,手语播报的真实感与亲切感大幅提升。
  手语表达方面,“小聪”能够实现健听人语言与听障者手语语言的机器翻译能力,基于输入的健听人语言能够低延迟生成高准确率的手语语言表征,快速生成数字人手语播报视频,达成信息有效传递。
  手语展现方面,“小聪”可以完整实现手控信息及非手控信息的表达,手语表征信息,覆盖手部动作、面部表情、口动唇动等多个维度,达到自然、地道、接受度更高的手语表达效果。
  自2018年发布全球首个AI合成主播至今,搜狗的“数字人”已经广泛应用于广电、媒体、金融、证券、保险、司法、教育、气象等诸多领域。陈伟透露,搜狗手语AI合成主播预计今年年底将实现大规模应用。
  【来源:Techweb】【作者:果青】

德电诺基亚和爱立信等成立欧洲绿色数字化联盟德国电信Orange和西班牙电信在内的26家ICT领域企业的高管们组成了一个联盟,旨在推动欧盟实现气候变化目标。沃达丰集团诺基亚和爱立信的领导人也参与其中,共同签署了一份宣言,通过2020年PC显示器市场增速最快戴尔占比19。3市场研究机构IDC昨日发布报告,公布了2020年PC显示器市场的数据以及未来展望。报告显示,2020年全球显示器市场出货量增长率达到了近几年最高水平,同比增长8。3。其中第四季度同苹果CEO库克表示迫不及待让员工回归实体工作岗位苹果CEO蒂姆库克今日撰文称渴望员工在疫情发生后重返办公室,他在接受人物杂志采访时表示,他预计苹果将实施混合环境,以恢复亲身工作的模式。库克说,人们在工作中身体力行很重要,否则无法苹果M1芯片或可与特斯拉HW3。0自动驾驶平台一战苹果公司在2020下半年推出了采用M1芯片的Mac产品线,在自研ARMSoC架构和台积电5nm先进制程工艺的加持下,M1设备的效能和续航体验都给我们留下了深刻印象。与此同时,外媒开性价比更高!曝AirPods3部件已经开始供应据此前消息,苹果将会在今年针对AirPods进行升级,推出全新一代的AirPods3无线耳机。不过,根据供应链传出的最新消息,苹果供应商日月光已经开始生产AirPods3所需的光学谷歌悄然下架ClearURLs扩展可删除URL中追踪字段谷歌悄然从ChromeWebStore下架了热门扩展程序ClearURLs。ClearURLs是一款保护隐私的浏览器插件,它可以自动删除URL中的跟踪元素。据其开发者称,这可以帮助联想SmartDisplays应用上架将双屏管理变得简单联想笔记本电脑经常在企业环境中使用,这些用户经常在桌面上有第二个显示器,在办公桌上时连接到这个显示器,然后在外出时多次插拔。这类用户每天都要面对再次插入显示器时重新排列第二屏幕上的展示披萨盒巧妙折叠方法的视频在TikTok爆红据外媒BGR报道,最近在TikTok上爆红的一段视频演示了一种巧妙的方法,可以将吃剩的披萨储存在冰箱里,而不必为一整盒披萨找到足够的空间。这种披萨盒的折叠方法,在你的冰箱没有什么空上海通信管理局启动对手机清理软件问题调查据上海市通信管理局发布的消息,在央视ldquo3middot15rdquo晚会曝光上海苏帕科技有限公司手机清理软件问题后,上海市通信管理局对此高度重视,局领导立即做出部署,第一时间消息称小电科技计划今年在港上市4月12日消息,据IPO早知道报道,小电科技计划今年在港上市,最快本月正式向港交所递交招股说明书,或将成为第二家完成上市的共享充电宝服务提供商。对此,小电科技方面暂未作出回应。资料100万辆推迟交付,全球汽车缺芯严重或持续半年央视财经报道,消息称,美国政府计划于当地时间4月12日与芯片和汽车企业举行会谈,商讨全球芯片短缺问题,受邀企业包括通用汽车韩国三星电子等。市场研究机构英国埃信华迈公司预测,今年第一
安徽ETC停止微信支付手续费不断上涨安徽交通一卡通控股有限公司在官网发布公告称,鉴于微信支付手续费不断上涨,与腾讯公司积极协商无果,将停止提供微信支付服务。官网公司介绍显示,安徽省高速公路联网运营有限公司(简称ldq英特尔之后SK海力士也有兴趣与其他公司共同投资Arm据国外媒体报道,虽然英伟达400亿美元从软银手中收购Arm的交易,已因为监管方面的挑战而宣布放弃,但仍有多家公司,对参与财团投资或收购Arm的交易有兴趣。外媒最新的报道显示,全球第联想小新一体电脑来了全球首批搭载12代酷睿27英寸全面屏联想小新宣布小新家族新成员来袭,它就是全球首批搭载12代酷睿处理器的一体电脑。新品号称高颜值桌面艺术品,外观简洁,27英寸窄边框全面屏,上左右三边极窄,烤漆工艺支架从右侧引出,虽然路特斯发布Eletre一款有超跑影子的电动SUV英国跑车制造商路特斯正跳上电动汽车的行列,这家公司推出了Eletre。据悉,这是一款插电跨界SUV,其设计语言的灵感来自该汽车制造商的Evija超跑。另外,Eletre还将是路特斯Chrome100正式发布启用全新图标适用于WindowsMaciPhoneiPad和Android等设备,Google今天发布了Chrome100正式版。Chrome100之所以引人注目,是因为它具有自2014年以来三星GalaxyXCoverPro2新机爆料或沿用可拆卸式电池设计过去几年,三星已经为XCover产品线带来多款坚固耐用的企业级智能机。此外以GalaxyXCover44s5为代表的机型,其ldquo可负担性rdquo也相当出众。2020年的时候未安装KB4474419的Windows7设备无法安装Firefox100从Firefox100开始,Windows7SP1用户必须要安装KB4474419更新之后才可安装该浏览器,否则会提示安装失败。这是因为Mozilla对FirefoxforWindEdgeCanary新特性可快速访问微软Office应用微软正在积极测试多种方法,以便在Edge浏览器中让用户快速访问应用程序工具和基于网页的平台等等。Reddit用户uLeopeva642最新爆料称Canary新版本中整合了一个微软O中兴通讯将回购不超过2A股股份中兴通讯表示,回购股份是为保持公司经营发展,保障保护投资者的长远利益,促进股东价值的最大化,同时,进一步健全和完善公司长期激励约束机制,确保公司的经营可持续健康发展。回购股份将用于AdDuplex的报告显示Windows11的使用率增长正在放缓来自AdDuplex的最新3月份数据已经出来了,对于Windows11来说,它可能看起来不是太好。根据最新的报告,Windows11的使用情况正在趋于平稳,在AdDuplex的调查WhatsApp用户每日发送70亿条语音信息WhatsApp本周三宣布,活跃用户每天发送超过70亿条语音信息。语音信息的沟通方式获得了很多WhatsApp用户的欢迎,它们和文本方式一样受到端到端的加密保护。WhatsApp表