童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

AIoT的语音技术,究竟如何落地?

3月27日 终不悔投稿
  AIoT融合AI技术和IoT技术,除了实现技术的革新,其主要技术的应用和真正落地也是该领域的重点问题。
  是新的技术和生产工艺(例如,早期的汽车)通过被应用和被应用而获得改善,之后在获得进一步的应用和采用,进而创造出正反馈或者收益递增的效用。《技术的本质》,布莱恩阿瑟
  上篇我们讲到了AIoT并非泛泛而谈的口号,他是有自身的用户价值和商业价值逻辑。从这篇开始我们要讲讲在AIoT用到的主要技术,也是我入门(keng)以来的梳理和沉淀,若有问题也欢迎交流。
  我认识在AI领域这样强技术领域,了解其技术原理和技术边界,结合市场需求,才能更高效地输出产品服务。
  本篇文章核心内容有以下几点:
  首先,我们先从AIoT的产业链入手,从宏观维度对整个AIoT产业有个宏观认知;
  其次,这篇文章会先聚焦于语音技术在AIoT领域的技术原理和落地产品服务方法。
  其余几大个技术模块我们会在后续的文章中陆续更新。
  一、AIoT产业链
  AIoT产业链主要包括以下几个部分:
  上游:硬件:芯片厂商、通信模块等;软件:AI技术、IoT技术
  中游:操作系统、App、云端服务
  下游:渠道(线上线下)
  AIoT产业链
  从上图我们可以大致了解整个AIoT产业全貌,是一个软硬通吃,涉及模块最全的行业。所以作为产品经理,在这个领域,有很大的发挥空间。
  二、AIoT产品都做些什么
  不同类型的AIoT产品对技术理解要求不同,如阿里云IoT、腾讯云IoT其业务目标是要做生态,做水电煤,主打PaaS层的输出,直接服务开发者,所以这对产品的技术能力要求就非常高,一般得有几年相关开发经验。
  而做前端交互体验的,跟用户直接接触的体验层产品对技术要求就不那么高了,结合产业链越往下游对产品对技术要求越低。结合上面的产业链结构图可以分为三大块:
  硬件产品:为整个终端硬件体验负责。需要从硬件定义、设计到最后的量产全链路环节都有深入理解,这块在这儿不展开说,后续讲到硬件产品再深入聊;
  软件产品:为整个IoT软件服务体验负责。这个是个大模块,再往细的分有App产品、系统产品、IoT平台产品,如果还有线上渠道,那还有电商产品等;
  AI算法产品:为整个AI体验负责。按照技术链路还可以细分为声学前端产品、ASR产品、NLP产品、TTS产品。关于这块的技术,下面我们具体展开来说。
  AIoT产品职能与产业链关系图
  三、AIoT之语音技术
  对于产品经理来说,了解语音技术主要的技术点,可以:
  快速收敛问题,帮助开发提高定位和修改问题效率;
  输出稳定产品,了解技术原理和边界,才能快速输出稳定的产品服务。这个无论对于C端用户或B端客户来说都是最基本的需求。
  我们这里以用户使用语音中控设备控制灯为例(详情可见以下流程图):
  语音控制智能家居流程图
  用户发出打开灯指令,则会经过以下几个步骤:
  第一步拾音
  根据使用场景也分为近场拾音(一般3m以内)和远场拾音(一般35m)。这一部分在技术上称为声学前端。
  主要原理是通过单mic或mic阵列能准确获取到用户语音信息,为下一步ASR(语音识别)做准备,主要包括以下几个技术点(但不限于,整个链路涉及到很多技术环节,下面主要将跟产品体验比较相关的主要技术点抽离出来):
  VAD(VoiceActivityDetection),语音活性检测。使用音频特征等进行分析,确定声音的开始与结束点。对于产品来说经常会遇到某条指令没有识别全,比如打开灯只识别到了打导致最后没有命中相应技能,无法完成用户意图,这时候可能就是VAD异常截断问题;
  AEC(AcousticEchoCancellation),回声消除。如果当前设备在用mic拾音的同时又在播放音乐等音频内容,那mic会将这设备播放出去的声音再重拾回来,避免再播放出去有回音。对于产品来说这是考核一个有待音频播放功能的智能语音设备必然考核的体验点,比如播放音乐时经常有回音问题,那可能是AEC算法没做好;
  BF(BeamForming),波速成形。用于将单个方向的语音进行增强,削弱无关的声音,使得声音听起来更加干净。对于产品来说这个是在嘈杂环境下提高识别的核心技术点,如果嘈杂环境里你的产品识别差,可以从这个点入手看看。
  第二步ASR(AutomaticSpeechRecognition)
  这一步主要是将前端拾音的语音信息转化成文本信息,将处理的文本信息丢给下一步NLP(自然语言处理)来做处理。主要考核指标识别率和误唤醒等。关于这点hanniman老师有做比较深入的讲解,这里就不多做说明。
  第三步NLP(NaturalLanguageProcessing)
  自然语言处理的目的是主要是将文本信息转化成机器语言,明确用户意图,在为下一步,触发用户预期的意图做准备。在产品运营侧主要会分为下面几个部分:
  Domain,即所属领域,如音乐、智能家居分别都算是一个领域。领域相当于类别,比如我想创景一个电视控制技能,就先创建一个电视的D
  Intent,即意图,用户想要让机器做的事情。如以本章节打开灯这个例子为例,打开灯即为用户的行为意图,但同样一个控制意图可能有不同的说法,比如打开灯可以说把灯打开或灯被打开这时需引入一个东西叫Pattern,他是来解决不同说法或句式的问题,产品运营人员可以配置几个常用的句式或说法,然后通过算法进行枚举和泛化;
  Slot,即词槽,在本例中,打开和灯都是词槽。
  第四步平台转发
  语音厂商IoT平台厂商IoT平台厂商设备。因为智能家居领域较为特殊,从用户维度来看,一个用户可能会有各种不同品牌的智能家居设备;而从市场维度来看,目前智能家居市场品类繁多,碎片化严重。
  以天猫精灵为例,目前已接入了600品牌。单纯用技能方式对接,不利于厂商运营管理和用户端体验。所以大部分语音厂商还会针对智能家居做一个管理平台。
  经过上一步NLP的处理信息传给语音厂商的IoT平台,语音厂商的IoT平台会根据用户已经绑定智能家居品牌和设备能力,在将这些信息传给相应的三方厂商IoT平台,最终将控制信息下达给相应的控制设备,完成整个控制链路。
  第五步TTS(TextToSpeech)
  顾名思义是将文本转成语音,如果你的中控设备带有Speaker,当整个控制链路完成后,可以播报一个结果语音来提升整个产品体验,完成体验闭环。
  四、语音技术AIoT
  以上各项技术以排列组合的方式我们很容易算出可以提供给客户25种不同产品技术方案,而对于C端用户产品服务也不计其数。但对于目前很多公司最大的问题在于:如何在于这汪洋大海中找到自己的一片天(就连空调都集成语音能力了,很多人都无法理解)。
  以下谈谈我对语音技术之于AIoT落地的看法(以下方法对C和B端同样适用):
  首先,效率,万事以高效为先。一切新产品或新技术的应用的第一优先考核指标在于相比原先的服务是否提高效率。什么是高效?高效即做同样的事情谁花的时间最短。以打开电视后我想看湖南卫视这个用户场景为例,以下是三种不同类型的电视操作路径对比:
  传统电视:遥控器的频道键左右键切换34页数(除湖南本省外,其他外省可能把忽然卫视放到3、4页后)上下键选择到湖南卫视点击确定。大概需要操作56步;
  智能电视(不带语音):我的应用电视猫App搜索湖南卫视点击确定。大概要操作4步;
  语音电视:一句话xxx,我要看湖南卫视,甚至可以直接免唤醒词。只要1步。
  其次,成本,要考量在单位时间内所消耗的能量和成本。基于上一点做同样事情谁花的时间短除了这一维度还不够,因为速度快并不代表成本低,所以还要考量在单位时间内所消耗的能量和成本。
  比如,你花了20块需要2小时,而花60块钱只能算短到1。5个小时,明显性价比不高。
  以集成语音能力的智能空调为例。目前市面上此类空调价位在69999999之间,主打高端市场。而一个语音模组的价格在几十块左右,这个成本完全承担得起,而且还提升了其议价空间。
  而比如在小家电领域,客单价普遍比较低的领域,这个成本可能就有很大的成本压力了。所以,目前语音模组更广泛应用于大家电如电视、空调等。所以除了用户场景,成本维度也是重要的考虑因素;
  最后,影响力,要考虑做这件事对外部的影响力。即你的产品与用户客户的交互反馈,主要分为积极影响和消极影响:
  积极影响力,比如,接近真人的TTS体验,自然的人机对话体验;
  消极影响力,比如,前几个月的Amazon的Echo鬼声事件。
  可以从定性(满意度等)和定量(日活、留存等)角度来衡量,但为了方便下面延展,我们可以简单的把积极影响力记为正数,消极影响力记为负数。
  AIoT产品服务公式
  总结:我把评判一个AIoT产品服务的好坏,结合三要素,总结为如图所示公式:
  AIoT产品服务效率成本影响力
  通过这个公式我们可以很容易得出:一款好的AIoT产品服务需要具备高效、低成本以及积极影响力,而且这个服务会随着你的正向影响以乘法叠加的方式增长。
  同理,我们也可以很快得到一个差的AIoT产品服务是由什么因素决定的。
  为了方便大家理解,我们以上面提到的例子,目前空调集成语音能力这个是个好的AIoT产品服务吗?
  首先,语音控制相比空调的物理遥控器确实是更方便,假设切换到制冷模式,物理在初始状态下要按两下模式键,而语音只要一句话就能解决,效率提高50;
  其次,对于厂商来说,假设一个模组成本是50,目前带语音能力的空调普遍售价在69999999之间,以6999的价格和35的毛利率(目前几家空调大厂毛利在这个水平,高端型号肯定毛利更高)来算差不多只占了1的成本,完全cover的住;
  再来,关于影响力,先不说语音控制在某些场景效率比遥控器高,用户买了一个那么贵的空调,还有语音能力(除了控制,还能问问天气等),虽然可能平时基本不咋用,但是至少还有个炫耀的资本。比如,有客人来,可以很装13地说我这空调可以语音控制哦,相比不带语音功能的高端空调,确实有一定的附加值。假设以55来做满意度打分,至少给个3分吧;
  最后,通过公式我们可以算出整个空调集成语音能力的AIoT产品服务分数为150分。从这个维度来看,空调集成语音能力是有积极价值的。
  五、小结
  在《技术的本质》中,作者布莱恩阿瑟(复杂性科学奠基人)认为:
  技术,是新的技术和生产工艺(例如,早期的汽车)通过被应用和被应用而获得改善,之后在获得进一步的应用和采用,进而创造出正反馈或者收益递增的效用。
  目前AIoT行业还在早期阶段,了解语音技术这个新技术可以使我们更加从容。祝各位同仁能用这个新技术创造出更多正反馈或者效益递增的效用。

朴素贝叶斯:帮助AI产品经理“小步快跑,快速迭代”贝叶斯定理相信不少人都接触过,这个看似只属于数学领域的定理,在AI产品经理看来有怎样的魅力呢?我们常常遇到这样的场景。与友人聊天时,一开始可能不知道他要说什么,但是他说了……一文读懂智能客服:发展历程、系统搭建、市场推广在人工智能领域,智能客服是比较容易落地,且技术比较成熟的一项应用实践。本文以智能客服为对象,梳理了它的发展历程、系统搭建、市场推广。enjoy2018IO开发者大会上,谷……脱碳入硅,美国SaaS企业的智能化进程AI技术的发展,似乎为SaaS企业带来了新的方向。笔者观察美国SaaS企业进程,总结经验,希望对中国相关企业带来一些参考。编者按人是一种由规则组成的碳基生命,进食之……AI助力环保遥感监测,强大算力很关键虽然遥感监测为环境保护提供了一个全局性的解决方案,对环境保护有着不可或缺的作用,但是遥感也存在问题:发现问题和着手解决的时间差。毫无疑问,最大程度上缩短这个时间差,是遥感……细思极恐,AI“花式诈骗”的N种方式当科技手段用于诈骗,众多普通人可能都无法辨别。科技从来都有两面性,回归技术本身,也许是防范的最好手段。最近关于AI的负面新闻着实有点多。不是“合成老板声音骗走173万”,……无人驾驶已经上路,未来将驶向何方?由于人工智能的技术发展,很多领域开始了革命式创新,无人驾驶就是其中一个。本篇文章中作者介绍了无人驾驶的概念以及发展过程,并且通过分析无人驾驶的具体设计,预测了其未来发展趋势。……“AI”将比“互联网”落地更容易本文认为人工智能产业化速度和规模肯定远远超过互联网化,而“智能化”更是传统企业弯道超车的机遇。相对于以互联网经济为代表的“信息革命”,已经有人把“人工智能”视为第四次产业……快播王欣的“灵鸽AI”不完全体验记录本文以“灵鸽AI”为主题,与我们分享了笔者的使用体验,并分为四个部分展开。北京灵鸽技术有限公司,注册资本为3000万美元,法定代表人是王欣妻子彭鹏,王欣任董事长,注册所属……监测为王:重构营销智能时代基础设施从麦克卢汉的理论出发,笔者探讨了营销智能时代数据监测方的运用和扮演角色相比信息时代的不同。在互联网诞生的四分之一个世纪以前,麦克卢汉就在《理解媒介》中写道:“下一个……如何从零搭建智能外呼场景本文梳理了搭建智能外呼场景时,具体的5个操作阶段以及4个注意点。一、前言智能AI的快速发展,传统呼叫中心也在进行智能化改造,智能外呼本身可以理解为是传统呼叫中心外接……AIoT的语音技术,究竟如何落地?AIoT融合AI技术和IoT技术,除了实现技术的革新,其主要技术的应用和真正落地也是该领域的重点问题。是新的技术和生产工艺(例如,早期的汽车)通过被应用和被应用而获得改善……语音交互在车载场景中的应用汽车驾驶体验的智能化升级下,车载场景内容的语音交互场景、产品形态都在不断变更、不断升级。而未来它究竟发展地怎么样呢?让我们拭目以待。汽车驾驶体验的智能化升级自动驾驶……
借力短视频:直播用户只是短视频用户的子集?直播平台大量死亡,没死的都在借力短视频,直播用户只是短视频用户的子集?本文作者将来聊聊此问题。直播平台涉黄,又又又被曝光了。4月16日,火山、花椒、麻椒、陌秀等被央……产品经理日报第959期美团点评发布首份基于互联网大数据的餐饮哈喽,你我相约七点半,你来了么产品经理日报继续为您带来今日最新的资讯:美团点评发布《餐饮白皮书》,大众餐饮发展迅速,但店铺每月倒闭10;脸书提全新CNN机器翻译,准确度超谷歌还……快消品B2B模式的成功,需要抓住的四个关键点对于快消品B2B弄模式得到成功发展,本文作者进行了深入剖析,针对快消品行业特点来认识快消品B2B模式,首先是对互联网电子商务发展的深度认识,快消品行业企业、品牌、品类众多,需要……第三方支付战争:苹果如何突围支付战争,在苹果和微信间先行打响。一、支付战争的端倪早在2015年11月份,苹果就已曝出将在其即时通讯软件iMessage中,由Siri带入新的点对点个人转帐功能。……二手车形势一片大好,二手车电商却集体营养不良?当前中国的二手车市场的确存在着巨大的市场空间,但是二手车电商们要走的路还很远。麦肯锡数据显示,在过去5年当中,中国整体考虑购买二手车的人群从18增长到47,整体增长接近3……微信支付与支付宝:不是竞争,而是并驾齐驱从当初的疯狂,到如今的静谧,不到一年半的时间,手机厂商的支付就被迫成了“看客”,是偶然,也是必然。而微信支付、支付宝能够像今天一样春风得意,也是努了力、花了钱、做了事的。……产品经理日报第958期“滴滴豪华车”已在京开放预约,价格比专哈喽,你我相约七点半,你来了么产品经理日报继续为您带来今日最新的资讯:滴滴出行今日确认旗下五星级出行服务“滴滴豪华车”率先在北京提供服务;百度将于6月1日起全面实行实名制,用户……社区电商别盲目乱闯,不如从对手寻找方向对于社区电商零售为何一直都难以做得起来,运营策略是其中的关键,究其根本原因是缺少一个明确的竞争对手。在“互联网”概念提出后,传统行业都在开始思考如何全身心拥抱互联网。社区……广告之争,陌陌与快手的着力点在哪?陌陌与快手这两匹黑马大规模投放广告,各有各的意图,陌陌是在继续完善自身的社交生态,而快手则是在重建品牌形象以及推进内容战略。最近陌陌的“视频社交”的广告铺天盖地的出现在地……直播产品的商业化探索和思考在思考整个商业化直播变现的过程当中,可以看到很多的商业化变现形式,从无到有,从有到特别成熟,是一个非常漫长的过程。作为运营人员,当你看到很多人同时做同一件事的时候,就要把……K12领域的“三巨头”:深度分析新东方、好未来、拓维信息的生不知道是从什么时候开始,全社会陷入一场空前的“中产焦虑”之中,而这在中小学生的家长那里成百上千倍放大,为小孩增设培优比重成为突破阶层固化的寄托,K12(基础教育市场)的引爆直接……案例分析:UML大战需求分析本文会借着一个小的案例分析,来简单的说明下会常用到的几个UML图,主要包括顺序图、用例图、活动图以及状态机图,另外文章的最后部分会将这些UML的图例和我们平日工作里用到的泳道图……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界