童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

语音交互启蒙篇

4月28日 赤雷榭投稿
  随着智能音箱、智能家居等智能硬件的普及,语音交互热度也不断飙升。本文内容主要为语音交互启蒙篇。
  2018年的3月,小米,百度等多个公司发布智能音箱产品,小爱音响mini、小度在家、豹豹龙可见智能音箱产业链这一年来的发展之快。随着智能音箱、智能家居等智能硬件的普及,语音交互热度也不断飙升。
  语音交互设计(VoiceUserInteractionDesign):它是一个以用户心理模型为中心的设计过程,交谈式为核心的交互设计。
  本文内容为语音交互启蒙篇,不含详细设计原则和方法。
  一、语音交互的优势
  如今,我们熟练并习惯用手指进行触控交互,那么为什么要在现有的交互方式上增加语音交互方式呢?
  对于这样的疑问,其实主要是语音交互有一些很重要的优势,包含以下几个方面:
  输入效率高:百度、斯坦福大学和华盛顿大学,曾共同完成了一项与智能手机输入方式对比的相关研究。研究结果表明:智能手机利用语音输入的速度比键盘输入快3倍,且输入准确率更高,语音输入以绝对优势胜出。在日常生活中我也感受颇深,用微信发消息时,我经常用讯飞输入法语音转文字,语音输入速度快,识别的准确率也很高,大大提升了输入效率。
  释放双手和双眼:在一些生活场景下,如在驾驶行车时,驾驶员的状态是目视前方,手握方向盘。若想要完成选歌,或是接听电话等操作这个时候语音交互会比其他交互方式更便捷,也更安全。另外,对于一些残障人士来说语音交互也是友好的交互方式。
  交互方式更自然:每个人都知道如何说话,就算是个新手用户,也会通过直觉性自然地用语言进行回复,语音交互是最为自然地交互方式。
  传递丰富的信息:日常生活中我们会发现纯文字沟通很难理解对方的情绪和语气,但语音中却包含了语气、音量、语调和语速,这些特征可以传达大量的信息。例如:“什么”这个词,文字背后的可能包含惊讶、疑问、气愤、不耐烦的语气,这是通过看文字感受不到的情绪。
  设备特征需求:语音交互也常常成为小屏幕设备和不带屏幕设备的首选,甚至是唯一的交互方式。
  当然也有很多情况不适合使用VUI场景的,如在公共场所的场景、用户不适应对机器说话或更习惯打字等情况,面对这些场景,多模态交互就很有必要了。
  二、语音交互语言对话与技术支持
  1。语言对话
  在人际交往中,我们对话双方似乎在有意无意地遵循着某一原则,来完成有效的社交对话。
  语言学家PaulGrice于1975年提出合作原则,即:
  质的准则(QualityMaxim):所说的话需是自己相信的真实信息;
  量的准则(QuantityMaxim):恰到好处的信息含量,满足并不超出交际所需的信息量;
  相关准则(RelevantMaxim):所说的话需与当前对话有关;
  方式准则(MannerMaxim):说话需简明扼要,直奔主题,避免模糊晦涩表达。
  同样没有遵循这些原则VUI体验也会很差:
  (1)质的准则:宣传自己做不到的事
  如:你对用户说:“有什么可以帮助您的?”,而实际上整个VUI系统只能提供点歌功能。
  (2)量的准则:多余的措辞
  如:“好的主人,我已经收到了,请您注意听主人,我要开始给你讲故事了”(废话好多)
  (3)相关准则:给用户当前用不到的指示
  如:用户还没下单的时候就开始解释退货政策。
  (4)方式准则:使用用户难以理解的专业术语
  如:“您的SSID是什么?”
  人们已经习惯于各种各样的会话和社交行为,VUI虽然不是人类,但遵循基本的社会习俗是有好处的。
  2。相关技术
  如今我们的手机和设备都已经可以用语音处理很多事情了,从听到我们的语音到执行正确的指令为我们解决问题,都离不开语音交互的两个重点核心技术:语音识别(AutomaticSpeechRecognition,ASR)、自然语言处理(NaturalLanguageProcessing,NLP)。
  (1)语音识别的挑战:
  噪音处理:恒定以及突然产生的噪音、周遭说话声;
  多人讲话情况:辨别谁在说话仍将是VUI系统的挑战;
  儿童:声带短,音调高,语音数据少;低龄儿童容易自言自语,口吃、长时间停顿等;
  中英文混合,名字、拼写和字母数字:预设列表和上下文信息,运行时抛弃无效结果,优选可能性高的。
  (2)语义识别的挑战:
  语言的多样性:各种不同国家或地域语言:中英文、方言等;
  语言的多义性:语言存在歧义,比如“我要去拉萨”,是理解为火车票?音乐?景点查询?
  语言的表达错误:错字、多字少字、不连贯(我要看那个恩琅琊榜);
  语言的知识依赖:七天(时间酒店)、大鸭梨(水果餐厅)、别称;
  语言的上下文:对话上下文、因果关系、不同类型用户的表达。
  就目前行业来看,语音识别发展较为成熟,一些数据显示ASR的准确性已经超过90,但那是在理想条件下。目前语义识别是学术界研究的聚焦领域,也是行业巨头布局重点。
  设计师需要在现有技术基础上去做设计,理解语音交互相关的技术。并找到有效的设计方法来最大程度的利用科技进步,尽可能避免行业存在的技术瓶颈。
  语音交互已经出现在我们的视野,作为一名设计师,若不想局限自己,就是要培养自己的“敏感体质”,保持好奇心、拓宽眼界、快速学习。
  因为笔者并非语音交互相关的从业人员,所以本文内容主要是笔者在业余学习过程中的的思考和总结,该篇章为启蒙篇大部分观点来源于《语音用户界面设计对话式体验设计原则》这本书(这本书是关于VUI比较全面的一本书,也是天猫精灵团队的参考书籍之一)分享给大家,希望对大家有所帮助,文章若有疏漏之处,欢迎交流指正。
投诉 评论

机器之魂:论AI在未来工厂中的应用编者按:未来的工厂会是什么样子的呢?在AI作为关键驱动力的作用下,工厂会变得更敏捷更定制化。这方面以及有一些国家(比如美国、中国)和公司开始捷足先登。但是绝大部分国家和公司对此……人类感知和深度学习有何不同?人类与机器相比为什么会产生错觉?人类感知和深度学习系统在识别图像与声音上有什么区别?它们是如何感知的,原理是什么?本文将对上述几个方面的内容给出详细解释。我们如何看待这个……谷歌助手点餐,微软小娜下单:AI横行的未来世界里没有人类什么机器人和机器人之间的交流,摒弃了任何人类的从中参与。而没有人类的参与,也就同时意味着,这当中的任何一个过程都不由人类来创造价值。国内用户基本上已经熟悉了在手机上下单订餐,……会打电话的AI背后:谷歌Duplex技术解析谷歌昨晚在加州召开了2018年度的开发者大会(GoogleIO2018)。在大会介绍的AndroidP、Gmail、Gboard、TPUv3等众多新产品和功能中,尤为……当AI成为“人缘裁判”,我们该在社交软件里何去何从?互联网的兴起催生了网络社交,人们在社交平台的只言片语都成为了数据而被存留。随着大数据时代的来临,粗略的估算逐渐被量化呈现的数据取代,微博上有多少粉丝、朋友圈里有多少大佬,都是个……从历史、入侵、服务、未来4个层面,看机器被赋予“智能”的过程AI就在身边,只可惜它在你面前的状态为“隐身”。智能是人类赋予机器的一个称号,并不代表取代(被掌控)。既然是被赋予的,可以从(由来、入侵、服务、未来)四个层面来看机器被赋……Facebook首席AI科学家图文演讲:如何让AI学习常识,4月26日,GMIC北京2018在北京国际会议中心召开,Facebook首席AI科学家杨立昆(YannLeCun)通过视频连线做了题为《AI的最新技术趋势》的演讲。以下为演讲内……AI与基因科学的对话:高岭之花如何“接地气”AI技术已经渐渐步入了人们的生活,而基因科学却似乎离我们还很远。不过基因科学可能很快就要进入一个爆发期了,未来AI可以与基因科学联合,一起在医疗领域大显身手。有人的地方就……突围红海,腾讯听听音箱的全局设计再推演如果把腾讯听听音箱现状称作PlanA,那在产品设计之初,一定是会有更优的PlanB。一。推演背景听听是一款不错的音箱,但不是必胜的方案。腾讯在4月20日对外发……Face云服务平台产品负责人:AI如何助力行业智能化算法,是否可行?行业,是否认可?决定了,是否可以做?用户场景是什么,决定了是否值得做?能否给现有行业的核心玩家带来相应的价值,且价值可否去复用,这是判断是否有价值并且可持续。边……机器心理学家:可能是未来唯一不会被AI取代的职业AI与心理学看似是相亲结合,其实是指腹为婚。《我,机器人》是美国著名科幻作家艾萨克阿西莫夫一生中最重要的一部中短篇科幻小说集。小说集描绘了机器人的智能水平在经历了一步步发……语音交互启蒙篇随着智能音箱、智能家居等智能硬件的普及,语音交互热度也不断飙升。本文内容主要为语音交互启蒙篇。2018年的3月,小米,百度等多个公司发布智能音箱产品,小爱音响mini、小……
共享经济深度研究报告(二):共享经济的核心机制和出现条件正因为共享经济平台打开前端供给,提供更多非标准化、有创造力的服务。平台搭建了买方和卖方进行双向选择的机制。因此,劳动者是和消费者平等的商品服务提供者。这反过来又促进了劳动者有动……从Airbnb看一个租赁产品该如何冲破租赁平台两大弊端获得成大部分做的风生水起的交易平台都是面向购买形式的。下面的图表列出了部分如今做得最成功的平台,左边是购买形式的,右边是租赁形式的。大部分租赁式的平台存在着两个根本性的问题:……手游生态巨头称霸下迎来创业者破局说到中国的手游格局,不得不提手游产业链的三大环节,研发商、发行商和渠道商,正是这三大环节决定了今天中国手游市场的格局。研发商中,以腾讯、网易、搜狐畅游、完美世界等为主的游……互联网趋势报告:搜索流量下滑社交流量翻番搜索流量与社交流量对比新浪科技讯北京时间12月18日晚间消息,社交分析公司Shareaholic周二发布《搜索流量与社交推荐报告》称,由于搜索引擎已经成熟,流量增长开始缓……眨眼拍照,锁屏功能,访客功能,GoogleGlass又带来了根据GoogleGlass的Google官方页面消息,在圣诞节来临之前,Google为GoogleGlass带来了一系列重要更新。这其中包括:锁屏:由于很多GoogleG……在线旅游的另一块新大陆,户外探险旅游我国旅游市场有多大?早已超过一万亿。整块旅游大蛋糕中,携程艺龙去哪儿网这几款在线旅游公司相继上市,尽管这几家在线旅游巨头们已经成功打开IPO进程,但根据艾瑞咨询2013第二季度……长痘痘了应该怎么办不同部位长痘原因揭秘?这样做可以让痘痘消失摘要:很多人都害怕自己脸上会突然冒出大大小小的痘痘,为了杜绝脸上长痘痘,甚至刻意控制自己的饮食,一点辛辣的都不敢吃。对于无辣不欢的人来说,特别难受。其实,想要不长痘痘没那么难,……【人人晚报】144期:WP用户哭瞎:支付宝之后淘宝也用不了?【导读】继20日WP版支付宝钱包出现“版本不再支持”提示而无法登录账户后,今日淘宝官方客户端在确认订单时也出现了“当前版本过低,请升级”的提示且用户将无法提交订单。这是怎……游击式可用性测试的艺术【译】游击式可用性测试是一项非常有效的技术。设计师马丁贝朗这样描述:“这是一门艺术,好比在一家咖啡馆或公共场所随机搭讪一位落单的人,在他浏览网页时,快速拍摄一段几分钟的视频。”我们现……加油美少女第二季播出时间,导师名单有胜利导师报名方式《加油美少女》第一季完美收官,那么大大家关注这样一档大型女子天团养成类节目会不会也有第二季的出现,而答案毫无疑问的是“是!”。《加油美少女》第二季播出时间:2017年暑假……【人人晚报】143期:BAT才是中国最牛的“接盘侠”【导读】金秋十月。对中国互联网来说,当下同样也是一个“收获”的季节,在10月中,已经发生了多起改变互联网细分行业的事件,甚至是改变整个互联网格局。【正文】1。……【人人早报】第101期:3Q大战是非多早报导语中国互联网迄今为止受关注度最高3Q大战即将尘埃落定,从“业务战”到诉讼战,历时颇久有四年,影响巨大,被认为是中国互联网史上的经典案例。360告腾讯垄断、腾讯诉36……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界