范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

机器之心GMIS2017人工智能语音技术的百家争鸣

  图1 机器之心GMIS大会现场
  柯洁与Alphago的人机大战刚刚落下帷幕,计算机围棋顶级专家、阿尔伯塔大学Martin Müller教授出席了机器之心于5月27日-28日主办的2017全球智能机器峰会(GMIS2017)。出席大会的有众多来自美国、欧洲、加拿大及国内的顶级专家学者,兼顾学界与产业、科技巨头与创业公司,以专业化、全球化的视角带来了一场智能盛宴。
  智能语音是GMIS2017全球智能机器峰会的一个重点论题,近些年来在深度学习的推动下,语音识别的准确度在一些评测标准上已经超过了人类水平。国际语音学术领域的顶级学者及业界领军人物悉数出席大会,如LSTM之父Jürgen Schmidhuber、腾讯AI Lab副主任俞栋、Citadel首席人工智能官邓力、加拿大麦吉尔大学语言学副教授&科幻电影《降临》的科学顾问 Jessica Coon、搜狗 CEO 王小川、科大讯飞执行总裁胡郁、思必驰首席科学家俞凯等,从技术研究及产业应用的角度,剖析人工智能语音技术的应用及发展。
  腾讯AI Lab俞栋:语音识别领域的前沿研究
  俞栋是腾讯AI Lab副主任,语音识别和深度学习领域的著名专家,此前任微软研究院首席研究员,兼任浙江大学兼职教授和中科大客座教授,IEEE语音语言处理专业委员会委员。现场,俞栋发表了《语音识别领域的前沿研究》主题演讲,探讨语音识别领域的4个前沿问题。
  图2 腾讯AI Lab副主任俞栋
  第一个前沿问题是如何构建更有效的序列到序列(Sequence-to-Sequence)直接转换的模型,目前最佳的解决方案是把 CTC 与 Attention 结合起来,CTC有持续信息,可根据后面的语音信号生成词,这有助于 Attention生成更好的表达,两者结合比CTC、Attention各自训练效果更好,所以是一个1+1大于2的结果。
  第二个前沿问题是鸡尾酒会问题,指在嘈杂环境中,屏蔽周围说话声或噪音,将注意力集中在某一个人的声音上,听懂要关注的那个人的说话声音,这是较难解决的一个问题,目前利用麦克风阵列、选择更好的分离模型等办法都在尝试解决此问题。
  第三个研究方向是建造一个持续预测与适应的模型;第四个研究前沿则有关远场识别以及如何做前端和后端更好的联合优化问题,通过做一个自动的系统,较好地分配信息的信号处理,使前端可以比较少地丢失信息,从而在后端把这些信息更好地利用起来。
  科大讯飞胡郁:人工智能如何改变世界
  图3 科大讯飞执行总裁、消费者事业群总裁胡郁
  科大讯飞执行总裁、消费者事业群总裁胡郁则从人工智能的技术的应用与价值角度进行了分析,表示,在深度神经网络的进展方面,利用深度神经网络和大数据,特别是涟漪效应,使讯飞在语言识别、自然语言理解取得进展。在人工智能技术的应用价值上,一方面,改变人机交互的方式,从而改变消费者领域产品的形态,从最初的键盘、鼠标,到触摸,再到现在人机交互、语音交互的产品正成为一个新的方式;另一方面,人工智能可以通过从专家这样的稀缺资源学习,构建专家系统。
  胡郁指出,人工智能的发展,随着运算智能、感知智能、运动智能和认知智能的发展,将对人类生活产生巨大改变,但是人工智能不会替代人类的职业,它会改变人类的职业,帮人类节省时间,让人类的时间使用更加有效。
  思必驰俞凯:人机对话系统"智能的感知+认知的进化"
  俞凯是上海交通大学教授、思必驰联合创始人/首席科学家,曾为英国知名语音公司VocallQ(现已被苹果收购)的创始人之一。28日上午,俞凯发表了主题为《迈向智能认知型对话交互》的演讲。
  图4 上海交大教授、思必驰联合创始人/首席科学家俞凯
  俞凯指出,目前,从语音识别精准度、搜索速度等感知角度来看,机器系统已逼近人类水平,例如思必驰上海交大实验室推出的VDCNN抗噪算法模型、PSD新型解码框架等,均在语音识别领域取得了成绩。但目前,仍有很多问题存在,如声源定位及追踪、远场、低功耗、非配合式语音交互、主题或应用领域的演变等等,其中"非配合"几乎是最难解决的问题,这种"非配合"往往体现在语音信号、语言范围等方面。
  目前,除依靠"深度学习+大数据"来解决未来对话交互问题外,俞凯教授还强调以下几点:第一,交互的时机,要研究对话过程中什么时间切入最为自由,什么时间切入最为恰当;第二,强化学习是未来非常重要的发展方向。但目前,无论是研究机构还是工业机构,没有任何一家有全强化学习的系统,而都是混合一点的或者主要以规则为主的系统;第三,解决用户异常的处理;第四,自适应,在对话交互当中,语义理解的自适应要远比语音识别更重要;第五,大数据不能解决所有的问题,要逐步进行非结构化小数据处理,这是大数据之外我们所面临的挑战。俞凯指出,"智能的感知+认知的进化"将是未来人机口语对话系统发展的重要方向。
  搜狗王小川:人工智能技术的应用与思考
  人机大战是GMIS2017的一大看点,28日下午,在搜狗与VIP速记创始人五轮PK过后,搜狗CEO 王小川发表了《人工智能技术与应用思考》的主旨演讲。
  图5 搜狗CEO 王小川
  搜狗用识别、决策、生成这样的表达来谈论深度学习,王小川表示,搜狗最有感觉的突破是在识别和生成领域,并认同未来商业智能就是人工智能决策,语言理解是人工智能的皇冠,搜狗努力的方向就是以文字为核心、以语言为核心,去做语音、图像甚至包括翻译的工作。
  王小川指出,搜狗在做的事情之一就是垂直问答系统,没有数据库、互联网资料作为输入,搜狗汪仔已经在《一站到底》已经战胜人类选手了。汪仔动用了全部搜索的力量,甚至可以与IBM Watson进行对比。但是,目前在那些不在人类现有知识范围内的知识,这台机器无法进行问答,汪仔还不能推理,无法作答。此外,辅助对话和海外搜索也是搜狗目前的两个重要业务,搜狗在翻译领域已经取得了突破,搜狗输入法的自动翻译功能已经可以为很多工作者带来便捷。
  图6 加拿大麦吉尔大学语言学副教授Jessica Coon
  国际领域的专家学者也解读了人工智能语音技术,加拿大麦吉尔大学语言学副教授、科幻电影《降临》科学顾问 Jessica Coon进行了《外星人、田野调查和通用语法》的主旨演讲。俄亥俄州立大学终身教授汪德亮发表了主题为《基于深度学习的语音降噪技术》的演讲,探讨分享了鸡尾酒会问题研究的当前进展、解决方案及其泛化等相关问题。
  放眼国内,智能语音技术已然被推向了风口浪尖,这不仅加速了腾讯、阿里、百度、搜狗、科大讯飞等一线企业的产业布局,也为思必驰、出门问问等专业语音企业带来了极大机遇,资本涌动、新型创业企业不断涌现,使这一领域已成为一片红海。技术创新力是人工智能企业生存的关键,构建技术壁垒成为重中之重,但这一切的出发点,都是满足需求,为人类带来更加智能的未来。

今日热点腾讯整治扫码点餐强制关注公众号北京CBD打造千亿商圈1专家辟谣吃草莓会得出血热近日,吃草莓会导致得出血热的消息传遍了朋友圈。12月18日,西部网陕西头条记者采访相关专家以及长安区农业农村局得知,吃草莓和出血热二者并没有关系。同时,长三星GalaxyS21FE曝光,便宜好物?三星GalaxyS21FE的完整规格信息。该机将采用6。4英寸的AMOLED屏幕,拥有401PPI和120Hz刷新率,屏幕下的指纹识别器,由大猩猩玻璃Victus保护。配置方面,三新发展阶段科技创新的着力点来源北京日报原标题建构局部优势转向中间产品创新加强基础研究(引题)新发展阶段科技创新的着力点(主题)科技创新面临的新形势和新挑战我们经常说当今世界正经历百年未有之大变局,大变局的关联通有什么套餐有无限流量还带宽带?联通有什么套餐有无限流量还带宽带?目前在联通中的套餐要有不限量套餐,还需要带宽带的,这个不禁让我想起一款非常符合这个要求的联通套餐,其实现在的联通套餐的优惠力度是三大运营商里面最大天玑9000哪些厂商首发?有哪些旗舰会用?谢邀了。日前,在MdiaTek天玑旗舰战略暨新平台发布会上,联发科正式发布了新一代天玑90005G移动平台。而后,包括OPPORedmi以及荣耀等品牌便相继表示将搭载这一旗舰芯片。单反和微单的所有差别,在这里一次说清楚教你如何选择数码相机单反和微单,最关键的差别在哪里?各自有什么优劣势?热销机型中哪几款单反或者微单最值得拥有?今天就一次说个清楚。首先我们来看一下单反和微单的主要差别。单反是很直观的一个叫法,也就是单怎么查看已连接wifi密码?有时候,当我们忘记Wifi密码的时候,我们可以通过Win10系统查看Wifi密码,下面小编win10如何查看Wifi密码方法。1。首先在Win10右下角的无线网络图标上点击鼠标右键2022新能源汽车展望近期中汽协会预测,2021年中国汽车总销量为2610万辆,同比增长3。1,其中,乘用车销量为2130万辆,同比增长5。6商用车销量为480万辆,同比下降6。4新能源汽车销量为340项目推荐CPP单元测试打桩不管你是开发的老码农,还是新入职场菜鸟,只要你是项目里负责写代码的,都得多多少少写点单元测试代码。企业对质量也会有些要求,像单元测试的覆盖率达到100这种要求。其实单元测试达到60现在助听器处于什么技术水平?从最早的模拟机到数字机,现在是全数字助听器了。除了运算速度,降噪技术的进一步细化,目前无线技术也在不断的完善。你如果还想了解的更详细些,可以到连锁中心实际试听下新技术的助听器产品,论中国芯片的未来之路韩国当年被美国在芯片技术上封锁,韩国人可是举全国之力去大力发展芯片,这才有了三星现代等芯片巨头的横空出世。反观我国,最近两三年中兴华为等科技公司被美国卡脖子,归根结底是没有自主研发
iPhone13已经跟不上潮流了么?!iPhone14大变样苹果始终坚持自己的原则,四年一更替。苹果开刘海屏之初,安卓紧随其后,安卓变为水滴屏,苹果还是刘海屏,安卓又变为挖孔屏,苹果仍是刘海屏,安卓又来全面屏,苹果依旧是刘海屏。坚持了许久,华为推出新系统,花粉很失望,外媒却大加赞赏华为忠实粉丝非常信任华为手机及其他设备的性能和品质,这也使得华为以此为基础,顺利增加鸿蒙OS操作系统的更新设备数量。随着设备升级数量越来越多,完成多个终端设备完成互相连接后,鸿蒙系电力无线微波传输技术一无线通信技术概述目前主流的无线传输技术可分为高功耗高速率的广域网传输技术(2G3G4G蜂窝通信技术微波调制传输等)低功耗低速率的广域网传输技术(LoraSigfoxNBIoT等)泰坦军团A34QG曲面带鱼屏219超宽视野,游戏办公同样精彩在早几年我就很想拥有一台超长的电子屏幕,那时候带鱼屏在我的生活中并没有出现,也是最近泰坦军团曲面带鱼屏的出现,让我一直以来梦寐以求的屏幕得以实现。早几年前,我在微博之中看到了一张图希荻微以上市为契机,打造国际知名模拟芯片供应商1月21日,伴随着宏亮的喜锣声,广东希荻微电子股份有限公司在上海证券交易所科创板成功上市,公司股票简称为希荻微,股票代码为688173。希荻微本次发行新股4,001万股,募集资金将关于埃隆马斯克的梦想野心以及创新的一切在美国,许多人把埃隆马斯克看成是现实版的钢铁侠一位精于技术发明,并以此保护自己不受阴谋所害,走上拯救地球之路的超级英雄。与苹果创始人史蒂夫乔布斯展现出来的睿智和潇洒不同,马斯克拥有外媒分析台积电业绩为何能连创新高?来源参考消息网参考消息网1月19日报道新加坡联合早报网站1月17日发表一篇文章,分析了台积电业绩为何能连创新高。全文摘编如下新冠疫情重创不少企业,但全球半导体巨擘台积电去年赚得盆满音质震撼,户外必备SanagM12SPro蓝牙音箱前言对于喜欢音乐的人来说,耳机或音箱是随身携带的必备品,一个人可以静静地用耳机聆听歌曲,户外是人生最惬意最悠闲的时刻,在户外的时候使用蓝牙音箱可以感受大自然与音乐的结合,该选择一款SSD铁人三项耐力赛致钛PC005惊喜出圈前阵子在小破站上刷到一个关于固态硬盘耐久度的测试,耗时两个多月,品牌涉及之广,涵盖三星长江存储致态(原致钛)金士顿铠侠西部数据英睿达,而几款产品的共通点都是用的原厂TLC颗粒(金士不到70元!智能垃圾桶有什么用?以为是智商税,体验后发现真好用今天和大家聊一个有趣的产品智能垃圾桶。其实智能垃圾桶早在去年4月份我就接触了,当时有人送了我一台,售价300多块钱,我第一反应一个垃圾桶要300多,这不是智商税吗?这个智能垃圾桶比谷歌新一代AR头显细节曝光虹膜追踪算力外置等黑科技加持最快2024年上市科创板日报(上海,编辑宋子乔)讯,据媒体报道,谷歌正在开发下一代AR头显设备,项目代号为ProjectIris,目前开发工作仍处在早期阶段,产品预计最快会在2024年上市。该项目团