范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

微软小冰的星辰大海会对话,唱歌,比喻,还有人类想象

  IT之家11月24日消息11月21日,微软小冰团队在北京微软大厦举办了Research Workshop活动,科学家团队带来了小冰2019年度最新科研进展及其应用,及对业内技术研发趋势的展望。IT之家被邀请参加,在这个微软大厦中的会议厅中,笔者再一次感受到了小冰产品背后的技术原理和对人工智能独特理解的高追求目标。
  IT之家报道,微软小冰在核心对话引擎方面,经过了经过检索模型、生成模型、共感模型的历次技术迭代,2017年就推出了全双工语音交互感官的上线和产品落地,目前正在发展的面向未来的多模态交互感官,融合了全双工语音交互、实时视觉与核心对话引擎的全新交互感官。小冰也能实现用户与人工智能同时边听边说边看的交互体验。
  点对了科技树,微软小冰变得越来越像一个人了。
  微软小冰首席科学家宋睿华介绍称,第七代微软小冰已成为全球最大的跨领域人工智能系统之一,产品形态涵盖了社交对话机器人、智能语音助理、人工智能内容创作和生产平台等。在全球多个国家,微软小冰单一品牌已覆盖6.6亿在线用户、4.5亿台第三方智能设备和9亿内容观众,在交互场景拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)达到了23轮。
  实际上,微软小冰2019年度研究进展活动更像是小冰的科学家们对外公布的一场学术报告会,向IT之家等介绍了小冰背后的研发情况,包括NLP自然语言处理、听觉语音学研究、计算机视觉和图形学,还有多模态生成技术等等。
  ▲微软小冰首席NLP科学家 武威(左)、微软小冰首席语音科学家 栾剑(中)、微软小冰首席科学家 宋睿华(右)
  微软小冰在创新方面获得了一定成绩,IT之家了解到,小冰团队已经在AAAI、IJCAI、ACL、KDD、ACM MM、WSDM、EMNLP、WSDM等上发表了48篇论文;申请了72项专利,包括全双工、Avatar Framework和多模态方面的领先强大专利;2019年亮点包括发布3篇ACL,1篇IJCAI,4篇EMNLP,1篇InterSpeech,1篇ACM MM长论文,赢得了CLSW 2019杰出论文奖《"Love is as Complex as Math": Metaphor Generation System for Social Chatbot》,意思是"爱就像数学一样复杂":社交聊天机器人的隐喻生成系统。
  微软小冰的对话研究
  微软小冰的基础就是对话,在自然语言处理方面,微软小冰首席NLP科学家武威带来了《Towards a Self-Complete Chatbot》(朝向自我完备的对话机器人)的演讲,其认为一个能够自我完备的对话机器人应该拥有以下能力。也就是说小冰在对话语句上要能够补充所缺乏信息的能力。
  能力一,学习——能够从人类的对话中学习怎样去说话。机器人之间可以互相学习,就像人类之间一样。
  在检索模型方面,从最简单的LSTM模型到最近的预训练的模型,质量得到非常大的飞跃。而背后代表这个模型从单轮做到多轮,从浅层次表示、匹配到深层次、宽度表示和匹配的发展进程。
  在基础架构方面,可以把用户的输入和回复候选都表示成向量,通过计算向量的相似度来度量这个侯选是不是一个合适的回复。将输入和回复侯选在每一个词上都进行交互,然后得到一个充分的交互矩阵,然后再把交互的信息从这个矩阵中通过神经网络抽取出来,变成一个匹配的程度。
  多轮对话交互从单轮对话延伸出来,把一句话表示变成多句话表示,额外把多句的表示糅合成上下文的表示,然后再进行匹配。还可以做细腻度的交互,比如让上下文中的对话与回复候选进行交互,然后再把这些交互信息通过一个神经网络整合起来,变成最后的上下文和回复侯选的匹配程度。
  在生成模型方面,逐步做到引入外部知识,从单一模态的回复到可以兼容各种各样的,包括声音、视觉、语言这种模态的生成。通过小冰提出的外部无监督训练话题模型,产生一些话题语料,然后在生成模型中通过话题注意力机制,去遴选话题语料,最后再在解码的过程中单独做出一个话题的生成概率,让话题能够更容易出现在回复中。多轮对话中可通过一种无监督方式,对对话上下文进行补全,然后进行回复。
  模型之间也可以互相学习,两个检索模型在训练过程中互为师生,互相交流。在每一次迭代的时候,一个模型都把它从数据中学到的知识传达给另外一个模型,同时又从另外一个模型中接触到它的知识,然后这两个模型互相学习,最终希望能够得到共同的进步。
  能力二,自主管理——对话单轮表达。把控整个的对话流程。
  在自主管理中,微软小冰对IT之家表示,一个有趣的应用是第六代小冰发布的共感模型,包含了回复生成模型、策略决定模型。
  共感模型把微软小冰从原来基于上下文直接产生回复的模式,变成了从上下文到决策,然后再根据这个决策来决定我说什么的模式。
  其中的策略就是表达意图,可以是话题,也可以是情感等等,当然也可以是意图、话题、情感组合,通过策略组合,可以产生非常多样的、复杂的对话流程。微软通过引入meta-word的概念,代表了属性组合。然后通过变换属性值就可以生成各种各样的回复。
  能力三,连结——对话机器人连结散落在世界上的多模态知识。
  连结牵扯到多模态交互,输入可以是对话、语音、文本知识、多媒体,输出也可以是对话、语音、多媒体,这其中很重要的问题是机器人如何能够把多模态的知识连结在一起,进行消化、吸收,最终把它有机的组合起来,变成自己的一个输出。
  以上是对话机器人这些年来,甚至可能是未来一段时间整个的研究与发展。而微软小冰再加上横线发展,包括从检索模型(重用人类已有话语),到生成模型(合成回复),再到共感模式(自主把握对话流程)。纵线和横线交错发展成对话机器人发展的绚烂画卷。
  IT之家获知,与其他模型不同的是,微软小冰的共感模型会根据上下文把控对话的流程,不仅要知道上下文是什么,还要根据重要性进行对话的组合,怎样引导对话,来达到有组织有目标的交流,这一般是有很高情商的人类才能做到的。
  微软小冰唱歌的研究
  IT之家网友可能也好奇,小冰为什么要做唱歌呢?微软小冰首席语音科学家栾剑 做出了相关解答。
  从前小冰在2015年提出语音聊天功能,声音非常生动活泼,符合小冰个性,后来逐步增加了儿化音、中英文混杂朗读、讲儿童故事、各种情感表现,发现在语音合成领域的一些大方面内容已解决。微软小冰希望寻找更有挑战的课题来做,唱歌就选做了目标,主要有三个目标:
  第一,唱歌的门槛比说话高。
  第二,情感表达上更加丰富激烈一些。
  第三,它是一个很重要的娱乐形式。
  但唱歌和说话有什么不同呢?唱歌的很多技术是从语音合成沿袭过来的,据分析它有三大要素:
  第一,发音,唱歌吐字发音一定要清晰,和说话一样。
  第二,节拍,是通过一种节奏的变化来表现艺术的形式,像我们普通的说唱,比如"一人我饮酒醉"说唱的形式,可能没有其它的旋律,主要就是靠节拍的组合来表达。
  第三,旋律,每个字的音高会不太一样,如果音高唱错、跑调,这首歌肯定就没法听了。
  所以,这三大要素构成了唱歌最基本的元素,当然还可以叠加很多的技巧,比如颤音、气音之类的。
  而机器学习唱歌有两种方式:一种是通过模仿人声去学习,第二种就是通过曲谱方式,通过简谱或者五线谱,配上歌词。简谱涵盖了三大要素,既有歌词,歌词会有发音元素,也会有节拍和音高。前者是简单且广泛的形式,但机器在判断读音时会有误差,后一种反而是便捷且干净的输入。
  接下来就是唱歌的合成演绎了。可以通过单元拼接的方式,基本思想是建立一个单元库,包括声母和韵母等,通过录制不同字母的发音(不同长度、不同音高)采集,最终加上信号处理方法修改,完美匹配效果,将这些单元串接起来,拼接得到最后的音频。这个方法虽然简单,也可保留采集最佳音质,但单独发音和连续发音区别还是很大,生成歌曲不太自然。
  IT之家获知,在语音行业里大家熟悉使用的是隐马尔可夫模型,把所有录音数据提取出声学参数,里面可能包括能量谱、时长、音高,然后去建一个模型,要合成的时候,就根据想要的发音到模型里面预测,预测出声学参数,然后通过声学参数、声码器把音频的波形重构出来,方法灵活。不过其中最大的关键点是声码器,参数还原声音过程中,就会有音质的损失。
  但微软小冰基于发展需求,一开始就选择了第二种方法,使用模型从乐谱里面采集出三大要素,分别对声谱参数、节奏序列、音高轨迹用三个模型分别建模,采用DNN神经网络,将预测参数通过声码器生成波形。在最新模型里,复杂结构已经用到了卷积神经网络、attentions、其他的残差连接之类技术,使用多个模块,使得三个参数同时建模变成可能,这样生成的波形在自然度和流畅度会得到明显的提升。
  在唱歌清唱方面,是严重缺乏数据,绝大部分的数据是混杂的、伴奏的音轨。微软小冰团队在进一步研究如何在伴奏音频中把人声的音高提取更好的模型,从而丰富小冰演唱的风格。
  微软小冰学会"比喻"
  小冰已经学会了写诗、画画、唱歌等操作,那么小冰是否可以创造比喻呢?对于人类而言,比喻是一种生动表达,用于解释抽象的、难以理解的概念。微软小冰首席科学家宋睿华对IT之家表示,比喻重要的是能不能找到一种适合小冰的通用规则。
  输入是本体,而喻体的输出是解释。本体一般是抽象的,比如说爱情,而喻体是具体的。而这两个概念之间的联系通过用Word Embedding来表达它,将其变成一个向量,经过降维之后,投影在这个二维的空间上。通过自然语言形态的连接词将其结合起来,组成一个比喻。连接词可以在Bing搜索找到句子,并经过NLP分析之后确定关联的相关性。
  微软通过三个方面技术了评价:
  第一,评判比喻句是否通顺。
  第二,评判比喻是否恰当。
  第三,评判比喻是否新颖。
  最终小冰可以生成类似"孤独像是空无一人的车站,幸福像是可爱的毛毛虫"这样的比喻句,看起来符合常理和认知。
  研究发现,小冰的比喻句比陈述句更能吸引人。如果你把它拆成两轮的方式,先卖一个关子,然后再去解释,人们会更喜欢一些。
  微软小冰像人类一样想象
  微软小冰未来能否像人类一样思考和想象呢?IT之家在现场了解到,微软小冰的团队已经开始了相关研究。微软小冰首席科学家宋睿华通过举了一个例子引入了跨模态理解的部分。就是当机器识别到文字和图片后,还能够像人类一样可以启用情绪等感官,让人工智能的反应和回馈更像是人类。
  "北极熊爱吃海豹肉,而且爱吃新鲜的"。当人类看到这句话的时候,一开始你会识别出来一些词汇,比如北极熊、海豹,可能你脑海中也会闪现出类似于北极熊的图片或者是可爱的海豹。这些机器也能做到,但是他不能理解北极熊吃海豹可能会流口水。
  另外人类在解读这段文字的时候,会自然进行思考理解,"北极熊悄然接近猎物,有时候会用爪子接近自己的鼻子,"因为鼻子是黑色的,这样一来它就会变得更不易察觉,很明显北极熊是在掩盖自己的鼻子。这些文字之外的信息对机器理解来说是非常困难的。
  微软团队表示,他们一直想让小冰更像人类,更好的理解对话、更好的理解语言,让小冰能否在语言背后找到一些常识性的内容,即暗含的意思。
  在微软小冰团队的研究中,将这个问题定义成一个故事,它可能由N句话组成,看能不能生成M个图片来对应这N句话,就好像你的脑海中听到了这个故事之后产生的场景一样。然后根据受模拟体验假说,让小冰生成和调用以往的记忆,当新的图像和文字出现后,进行一些模拟场景的匹配或者替换,是的场景更加一致。
  如果一句话的信息很多,通过one to many算法检索和插入更多的图片,通过模型和算法逐步完善,去表达出一个更接近人类的故事。
  "我们其实想让小冰更像人,你会发现除了工作,听音乐是你很大的一个享受。我觉得人跟动物的不同在于有一定的自主性,人工智能创造体现了一种自主性,包括作曲、写诗、画画,我们做算法的人也不知道最后会产生什么样的结果,你在那一瞬间就会有一个错觉,觉得她有意识,这是非常好的一个点。"宋睿华表示。

微软Chromium版Edge浏览器安装程序下载感谢IT之家网友踏遍轮回遇见你的线索投递!IT之家3月24日消息今天早些时候,WindowsCentral发布了一段15分钟的微软Chromium版Edge浏览器上手视频,展示了一微软Chromium版Edge浏览器上手视频感谢IT之家网友yang洋的线索投递!IT之家3月24日消息微软将基于谷歌开源的Chromium项目重建Edge浏览器,可以带来体验更接近于Chrome的Edge浏览器。新版本的E微软Chromium版Edge浏览器上手已支持原生Chrome插件IT之家3月24日消息微软将基于谷歌开源的Chromium项目重建Edge浏览器,这将使后者的使用体验更接近于Chrome浏览器。现在,TheVerge已经上手了这款浏览器的早期I微软新专利揭示下一代SurfacePro重要功能边框无线充电IT之家5月10日消息据Windowslatest报道,2019年微软推出了全新SurfaceProX,其可利用键盘上的槽口为手写笔SurfaceSlimPen39充电。不过微软似库存告急!微软认证翻新i7版SurfacePro5官方商城新低5027元IT之家6月16日消息微软官方商城(点此前往)618大促现已正式开启,6月16日18活动持续3天,微软认证翻新Surface也迎来最新一轮特惠,由于大促折扣新低兼之翻新设备数量有限微软认证翻新Surface官方商城0点6折大促,Laptop新低3971元IT之家6月15日消息微软官方商城(点此前往)618大促6月16日0点即将开启,微软认证翻新Surface也迎来最新一轮特惠,SurfaceLaptopSurfacePro4Sur微软申请更薄铰链专利,未来或用于SurfacePro产品中IT之家6月15日消息据外媒报道,日前,微软提交一项新铰链专利,这一专利能让Surface产品铰链变得更薄更好。据了解,如果未来的Surface产品能够使用这一专利,这就意味着设备4288元,微软SurfacePro(第五代)m3版限时直降1450元IT之家6月1日消息微软官方商城618大促开门红火热进行中,Surface笔记本和Xbox系列产品将迎来不同程度直降优惠,大多数商品还可享6期分期免息服务,点此前往。值得注意的是,微软SurfacePro6Book2新款曝光Inteli5配16GB内存,售价更低微软一年半前推出SurfaceBook2时,首次发布了两款机型13。5英寸和15英寸。SurfaceBook213英寸版可以购买到IntelCorei5无独立GPU版,价格较低。但2478元起,微软官方商城认证翻新SurfaceGo限量底价IT之家5月16日消息微软官方商城(点此前往)毕业季大促火热进行中,教育专区立享9折特惠,微软认证翻新SurfaceGoSurfaceBook2迎来历史低价,翻新价2478元727微软推送Win10KB4567512累积更新解决打印机问题IT之家6月17日消息据Windowslatest报道,有用户在安装Windows10的六月补丁星期二更新后报告称其遇到了打印机失效的问题。今日微软正式为Windows10版本19
微软Win10CoreOSPolaris早期版本泄露兼容ARM32架构,已被Windows10X取代IT之家1月4日消息外媒WindowsCentral报道,早在2018年,就有爆料称,微软正在为PC打造一款全新的现代版Windows10,代号为Polaris。这将是Window微软暗示Win10视觉设计将大升级更年轻化,WindowsisBACKIT之家1月4日消息外媒WindowsLatest报道,根据此前爆料信息,Windows1021H2太阳谷UI更新将是这款操作系统的大事件,而微软现在公布新的文档之后,算是终于得到微软展示Win10应用全新设计理念圆角UI,新开关滑块IT之家1月4日消息外媒WindowsLatest报道,微软正在认真对待Windows10的重新设计,该公司现在也在探索对商店应用的改进。微软正在考虑一些新的设计变化,这些变化将影微软Win1021H1成首个不附带FlashPlayer的系统版本IT之家5月4日消息微软近期悄悄确认,新的Windows10删除FlashPlayer变化将在6月和7月上线。按照更新后的路线图,不再需要单独的更新来删除FlashPlayer。最微软目前不会调整Xbox商店游戏抽成比例IT之家5月3日消息微软近日宣布,自8月份开始,向PC游戏开发商收入的佣金费率将从原先的30降至12,和EpicGames收取的费率相当,成为了游戏圈的一大新闻。在近期EpicGa微软AI语音晓晓演绎诗歌童话恬静纯美,还唱起了歌IT之家4月30日消息还记得电影Her吗,人工智能(AI)萨曼莎以美妙的声音与主人公共同谱写了温暖治愈的恋曲。在真实世界中,随着技术不断进步,AI声音已逐渐媲美人类,不断融入各个领微软计划降低游戏商店分成比例吸引独立开发者北京时间4月30日早间消息,据报道,微软宣布,将从今年8月开始下调通过其网上商店发布PC游戏的独立开发者收取的分成。届时,开发者保留的收入比例将从现在的70增加到80。这样一来,在微软智能云未来将以每年50至100个的速度新建数据中心4月29日消息,据微软中国公布的数据显示,微软智能云业务从在华落地至今已经扩容12倍。2021年3月,微软宣布继续加大对中国市场云服务的投入,新增微软智能云在华数据中心区域,并计划微软你的手机应用支持更多三星手机,可在电脑使用AppIT之家5月30日消息根据外媒mspoweruser消息,微软于2021年1月为你的手机应用推出了新功能,可以允许用户在Windows系统中操控安卓手机,目前仅限三星品牌的手机,包苹果iCloudWin10版发现敏感信息泄露漏洞,需尽快升级4月26日,苹果发布了Windows版iCloud12。3安全更新,修复了其中发现的敏感信息泄露,跨站脚本攻击等重要漏洞。以下是漏洞详情来源httpssupport。apple。c微软Win10已恢复可选补丁更新,另外版本19091903将强制升级2004IT之家1月17日消息早在去年12月假日季开始时,微软就宣布暂停Windows10的可选C和D更新。现在,微软已经确认恢复正常的补丁更新,新的可选更新将在1月份的第三周交付。与近期