童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

如何提升语音的可发现性,让小白用户也能轻松使用?

11月19日 溷元楼投稿
  为什么要提升语音可发现性呢?因为很多时候,用户不小心说错话语音并不懂得纠正,而且语音的自然感知力度也不如视觉交互。本文为了解决这些问题,进行了一些思考。
  在很早的时候语音就已经深入人们的生活,siri算是比较早的被人们熟知的语音助手,每天早上匆忙要离开家之前都会说:“HeySiri,今天天气”,比起解锁找到天气应用,点击打开,查看天气情况,路径缩短很多。
  我认为这就是语音最大的优点,缩短使用路径,直达用户目标,所以智能化可持续性学习的搜索方式会是它比较重要的一种手段。那么首先让用户逐步熟悉了解语音的使用方法,才会真的将这种方便实用的交互方法融入人们的日常生活。
  为什么想从语音的可发现性角度来思考方案呢?第一点,当前的语音错误后的提示很不友好,用户说错后也不知道要如何纠正;第二点,语音无法通过视觉呈现,自然感知力度不如视觉交互。
  那么我们从哪些方面提升语音的可发现性呢?这就要来捋一捋出行时,语音、载体、用户之间发生的触点在哪里,在什么步骤容易出现问题。
  一、触点:语音的载体
  用户在什么场景下接触到语音,这个语音的载体包含哪些部分,都是非常关键的。
  这里不对用户进行定位,主要是出于这样的考虑:现阶段为语音起步阶段,年龄、性别的区分仅代表着接受新交互方式的难易程度。所以此阶段应当是不断探索语音更为方便的场景,让人们逐步认识到语音的便捷性。
  那么现在普遍使用语音的场景有以下几种:
  家中:音箱、电视盒子、电视遥控器、手机
  车内:中控、后视镜、HUD、手机
  公共场合:服务机器人
  这些场景下的载体有这形式:
  有屏幕
  无屏幕
  公共场合的服务机器人这里我们不讨论,他们的业务性比较强,是强业务主导的交互流程,和人们日常生活中使用语音的场景完全不同。那么就是家中有屏无屏和车内有屏的语音交互讨论。
  二、当前语音技术存在的问题
  不论何种场景,语音的技术都是类似的,实现的原理也都是一样的。这里举例一些语音技术存在的问题:
  1。必须唤醒
  唤醒的花样很多,有唤醒词、快捷唤醒词、oneshot,业界外的人肯定不了解这都是什么东西,更可况我们想要推广的广大用户呢。
  这里解释下,这些唤醒方式之间的区别:
  唤醒词:最为基础的唤醒方式,一般是有固定的24个字作为唤醒词,比方说“你好小度、小爱同学”等,机器收到这样的语音信号,就开启录音,这时候用户可以随意说话,机器将录音文件拿去识别,这就是全部的识别的过程。
  快捷唤醒词:由于每次操作都需要说唤醒词才可以控制,所以快捷唤醒词应运而生,有些又叫他hotwords,实现方式都是一样的。选取会比较常用的几个词汇,比方说“上一首、下一首、增大音量、返回主页”等,同样作为唤醒词,不过和唤醒词不同的是,这里只有唤醒,唤醒后识别到相应操作命令,直接执行,没有后续的识别。
  oneshot:同样,设定几个词作为唤醒词,比方说“导航到、我要听”,机器收到这样的语音信号,就开启录音,这时候用户可以随意说话,不过相比较唤醒词增加一步,机器会对录音进行裁剪,裁剪到唤醒词后那一段就是用户自由说话的命令,再拿着裁剪后的音频文件去识别,就和使用唤醒词操作一样的效果。
  2。录音过程中,杂音、交谈的话语可能会被录入
  唤醒语音后,会进入录音状态,识别是将录音的音频拿去识别到唤醒词后面的那一段音频,录音是无差别录音的,虽然现在有各种降噪技术,但是人们对话的声音机器是无法区别的。
  3。语义不能完全覆盖全场景
  想让机器理解这段话,就需要语义理解。现在的做法还是依靠人工的录入,无法灵活理解。
  4。对话系统不够灵活,很多执行完一个任务之后就退出,还需重新唤醒
  当前语音对话系统虽然有不少多轮对话的场景,比方说在导航选择地点时,用户可以说“下一页、第二个”或者某个地点分词进行选择,但是看其本质,依旧是在导航情境下的单轮对话,选择某地之后就进入导航退出语音。最主要考虑的问题点还是第二个问题无法解决。
  三、家中的场景
  家中的场景是语音交互的最好场景,网络的稳定程度、安静的环境、自由的使用环境,都使得语音在这一场景中具有非常大的吸引力。
  在这一场景中使用语音的载体除了音响其他都有屏幕,电视盒子、遥控器都可以配合电视屏幕使用。手机、电视都带屏幕,但是提示方式不能和车载设备类比,使用场景不同有很大的不一样。
  在家中,人处于一种相对比较舒适、静止的状态,他有精力或者时间去仔细看屏幕上的文字提示,那么这样的有屏载体需要有比较多的比重出现说法提示,或者下一步的引导,用户数据收集的比较齐全的时候,也可以做新老手不同的操作引导。
  智能音箱虽说不带屏幕,但是需要通过手机设置连接家中wifi,这样才可以获取云端资源,这里做交互引导的时候需要注意,用户唤醒是通过智能音箱操作的,那么在手机上可以做按钮点击唤醒音箱语音,但不能给用户一种幻觉:可以通过手机对话。
  四、车内的场景
  车内的载体不论中控、后视镜、HUD还是手机都是有屏幕的,这就意味着可以依靠屏幕传达部分信息给到用户,那么这里就涉及到多模交互。何时看屏幕、何时听语音是比较好的。这全看用户心情,当然我们也要做到良性引导。
  根据后台用户使用语音的数据来看,导航是使用频次最高的一个领域,其次是音乐、电台、天气。所以从导航、音乐入手让用户先了解语音的基本使用方法。
  上篇《语音交互中重要的引导设计》已经展示了几种引导方法,不过还是有不足,比方说在首页的位置放说法引导,其实经过一些用户测试,发现那种方法并不是万能的,很多用户都不会去看有什么说法。
  所以我们应该按照使用语音的先后顺序进行引导:唤醒、识别。那么如果跳过新手引导的用户,至少要先告诉用户如何唤醒使用:
  如果忽略这句TTS,也没关系。在首页的语音卡片上,常驻这样一句话,提示用户如何唤醒语音。
  不过这种方法其实都是比较被动的,等待用户去发现,去探索,如果语音自己开始对话,又会被吐槽智障,或者受到惊吓。所以最初的产品策略应该比较保守一点,毕竟在智能车机上语音只是一个很小的一部分,过多的打扰到用户真的会有困扰。
  这是我列的如何循序渐进的教会用户使用这样的唤醒方式:
  第一步:基本操作:导航去哪里,听什么,给谁打电话
  第二步:唤醒进行音乐操作,提示她“下一首”可以不唤醒使用
  第三步:当用户发现有些可以不需要唤醒使用的,但是不知道在哪种情况下使用,那么就设置一个对话:
  U:你有什么不需要我唤醒就可以说的?
  天:全部唤醒词罗列,同时安利免唤醒的概念
  升级方案:用户肯定记不住,当他有疑问询问
  U:快速导航是免唤醒吗?
  天:不是哦,导航中能免唤醒操作的有这些,您可以到哪里查看
  高级用户:找到自己习惯的操作方式,只记住那几个免唤醒词,有了固定的使用操作模式
  之所以想要对快捷唤醒词作那么多的引导,主要是出于当前技术限制,唤醒是无法避免的,但是高频操作如果不采用快捷唤醒词实现的话,对用户来说更为麻烦,每次必须唤醒,就只说那么一个指令,语音的存在是为了满足用户懒惰的心理,用户但凡觉得有点麻烦的时候就会逐渐减少语音的使用,而这个节点就是我们需要花功夫去细化方案的地方。
  五、一些感想
  关于第二个问题点,开了个脑洞,在车内,如果搭配人脸识别、上下文理解,是不是可以去判断用户何时对机器说话呢?
  首先,人们日常对话时,我要和谁说话基本都会面朝谁,哪怕眼神不会转移,但是面部还是会配合对话者转过去,这里就可以通过人脸识别看用户唤醒后是否将面部转过来。
  第二点,因为在开车时,注意力肯定是高度集中的,有时候可能是不会转动面部,但是人们日常的对话遵随的这几个准则:所说的话是自己相信的真实信息、所说的话满足交际中所需的信息量、所说的话和当前对话相关、说话清晰明了。
  所以我们可以根据录入的人们说话的内容判断上下文联系,进而判断是否在和机器对话。
  如果是不相关的内容其实是对机器说的,那么此时喊下唤醒词也是符合常理的,可以对比两人对话,一人突然说了其他的话题,另外一个人没有意识到是对自己说话的,那么说话者肯定会要喊那人名字。所以一个丰富且符合常理的语音状态反馈非常重要。
  以上是我对于当前如何提升语音可发现性以及未来可用技术解决的问题一些探讨。
  语音其实不能只限制在车载或者是家居场景,因为随着人工智能的发展,想让一个机器智能,肯定会有越来越多感知外界的技术:语音、图像等,但是机器想要陈述或是表达,必须要用到语音,所以语音是将来人工智能的一种输入感知的入口。所以如何更好理解人们说的话是非常值得研究的。
投诉 评论 转载

不可用状态设计:如何合理的使用“置灰”?我最近在梳理产品报错场景的过程中,发现“置灰”状态的使用可以有效的提升报错场景中的用户体验。本篇文章就向大家简单分析一下如何合理的使用“置灰”。置灰“置灰”是相对于……从6个方面分析:如何用游戏化思维指导产品设计?事实证明,我们的大脑渴望解决问题,渴望得到反馈和认可,渴望游戏提供的很多其他的愉快体验。而众多研究显示,游戏可激活大脑中的多巴胺系统“快乐中枢”。一、什么是游戏化思维……10个角度阐述:心理学家眼中的用户体验设计如果把用户体验设计比作一头大象,心理学知识就是这头大象的一部分。心理学家对大脑、视觉系统、记忆和动机进行研究,并据此推断用户体验设计原则。你可能听说过这个关于大象的故事。……译文如何做到为所有人设计?作为设计师,我们有能力和责任确保每个人都能访问我们设计的内容,无论其能力,背景或使用场景如何,做好产品可访问性可以为每个人带来更好的体验。如何做到为所有人设计?数字……理解产品设计流程,让你的工作事半功倍作者通过工作积累和平时翻阅书籍记录和整理,在本文分享了产品设计的流程。如果你在拉钩、直聘or各大平台,搜索互联网产品经理职位,你应该经常会看到这样的JD(招聘要求):……重复与突变在产品设计中的应用重复和突变在产品设计中起了怎样的作用呢?本文通过一些例子,简单地为你介绍重复与突变。设计中的重复是什么?在平面设计中,重复构成是常用的一种构成方法,通过重复可以使画……如何提升语音的可发现性,让小白用户也能轻松使用?为什么要提升语音可发现性呢?因为很多时候,用户不小心说错话语音并不懂得纠正,而且语音的自然感知力度也不如视觉交互。本文为了解决这些问题,进行了一些思考。在很早的时候语音就……垂直频道改版,需要注意什么?本文以行业馆为例子,思考了垂直频道改版需要注意的几个方向。一起来看看整个6月,在“行业馆9600W交易额”和“常规营销活动放在馆内来做”这两个任务背景下,我们把行业馆日常……电视屏推荐系统如何设计?这里有个详细的方案传统广电运营商面临IPTV、OTT的强力竞争,传统广电运营商对于推荐系统的需求非常迫切,推荐系统能让家庭影音更加智能,对视频进行个性化推送,有助于增加用户黏度,拓展市场。……设计还原五步曲视觉篇本文根据作者的几次实战项目经验,来谈谈关于设计还原五步曲中的视觉篇,一起来看看在这个快速发展、迭代、更新的时代,互联网产品的用户体验重视度越来越高,而其中的产品设计还原也……简单聊聊“开关”这个小控件开关虽然只是一个小控件,看起来很简单,但其实它的设计也有着大学问。本文和你一起探讨一下一、开关是什么开关,英文Switch,常被翻译为开关、滑动开关、切换开关,作为……为什么设计师要有商业思维?可能有人会觉得奇怪,设计师怎么能让产品赚钱?设计师不是根据原型图来画画图就可以了吗?其实不是的,一个优秀的设计师的工作范围远远不止这些,其中商业思维尤为重要。一款产品从零……
解读SEO实战密码给予的感悟微信互联网时代,如何做SEO优化才有效果?了解符合搜索引擎算法更新的SEO技术,实时改变优化方向制作一个利于seo的网站,需要从内容和代码细节入手敲黑板SEO:盘点网站日志返回的状态码都代表什么?一个合格SEO不仅需要掌握根底网站建设,还需要了解优化常识为什么不包括网站?不包括的网站怎么办企业网站被降权时,我们应该先考虑优化的方向企业网站优化中如何提高页面加载速度【网站收录】网站未收录内容问题分析【企业网站优化】企业自建网站时如何优化网站?新网站没有被搜索引擎收录,原因是什么?夏季宝宝穿衣有哪些讲究如此想你我的中国梦真人造句用真人造句大全甄嬛传华妃年世兰如果早点明白这4个道理,也许就不会心死男生踹伤猥亵女生男子被刑拘了孩子改变从这里开始中国广电5G将正式商用?官方表示暂未接到通知已启动套餐优惠宣【歌词】不再联系升级版歌手:程响热博聚热点网 冬天真快乐作文300字小房子大智慧让每一平方都物超所值动物乐园教学反思范文

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界