童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

如何评测语音助手的智能程度(5):指标权重设计

8月4日 渡缘祠投稿
  这是一份前面四篇评测维度介绍文章的总结,同时也是一份清单使用说明书。
  知己知彼,百战不殆,调研评测其他公司的产品是从业者的日常操作,那么当一个产品放到我们手里的时候,到底看什么呢?看哪些方面呢?专业性不到位的同学怕是无法下手。
  而往往具备专业视角的人则游刃有余,他们知道考虑哪些点,结构清晰,主次分明,用解构的方式去理解一款产品,这才是AI从业者专业化思考的表现。
  如何定义权重
  哪位同学问了,这四大维度,什么是重点呢?答案是:基于需求自定义。
  定义权重高低,两个维度考量,一个是行业需求,一个是硬件载体。
  行业需求(出行、教育、医疗、金融、电商、旅游、餐饮、客服等)
  硬件载体(音箱、耳机、手表、车机、机器人等)
  AI智能助手,往往都会解决某个行业领域的特定业务需求。AI智能助手,往往都存在于一个或多个硬件载体上,与人类进行交互行为。跟买房子、招聘员工所考虑的标准非常多一样,你在意什么,就给对应维度,对应指标以高权重。
  比如:某产品的定位是用来听歌的,【意图理解】各个模块做得非常好,但是由于版权原因,无法播放,这个对用户而言就非常糟糕,因为满足不了听歌的需求。
  再比如:某助手的定位是线下生活服务,比如订外卖或者是电影票,这类往往不具备版权垄断特质,但由于业务流程的复杂,有太多叠加查询条件,自然对【意图理解】有很高的权重要求。
  再比如:某个玩具手办具备语音交互功能,用户非常在意玩具手办的语音交互是否匹配角色气质,故而对这类用户而言,【人格特质】就是高权重。
  大维度自定义权重,同理,每个维度上的指标也基于需求自定义。
  指标的选择和量化
  做清单真的是一件非常麻烦和费脑力的事情,这份清单花了笔者太多的时间,有太多的问题值得讨论。
  为什么是4个维度,而不是5个或者是3个?
  各维度是否穷尽了“智能化”评测的角度?
  每个维度的指标是不是做到了穷举?
  每个维度的指标是不是平行、独立关系?
  每个指标的用词的和定义是否精准无歧义且易于理解?
  基于什么依据设置每个维度的重点和加分项?
  特别是在保留哪些指标,合并哪些指标之间,笔者做了很多权衡。
  哪位同学说了,你遗漏了一个指标:语音识别表现,这个指标,与其说是遗漏,不如说是笔者的选择。
  笔者所知道的,目前最好的ASR识别率是97,且这已经是非常成熟的技术。ASR和TTS在未来属于AI领域水电煤一样的基础服务,就跟选腾讯云还是阿里云一样,花钱选技术买服务就能搞定,差距不会太大,故而不值得纳入评测范畴。
  故而这类语音识别的基础表现,就直接归到【交互流畅】维度“服务稳定性”指标上了。
  ASR这项技术未来差距一定会被抹平,而如果做到了方言(音轨)转普通话(音轨)然后转文本那就是另外一个话题了,方言转普通话和任何一种语言转普通话才是同一逻辑。那笔者可能会归纳到【意图理解】维度上。
  这就是笔者选择指标,以及归类的逻辑。上面的这些问题考虑,笔者已经尽自己所能去做到MECE了。
  笔者力求全面,但并非每一个都需要用到,各位同学也可以基于自己的需求,自由添加、删除和修改分类。
  例如:如果是一个智能耳机或者语义翻译棒,那么“反馈样式丰富性”上,就不必要纳入评测范围了。
  但选择本身就是一个难题,这件事情非常考验认知,我举个例子:苹果手机前面几代产品,玻璃屏幕特别不耐摔,这在诺基亚的评测维度里面,是无法出厂的。后来的故事,我们都知道了,这个故事各位细品。
  指标的量化标准,这对大家也不是一个难题。拿测试集去验证,最终统计各个指标的表现,然后再横向比较竞品就好。
  商业比得是相对位置,而不是绝对指标,即,我不需要考满分,我只要在这个科目上,领先与其他竞品一段距离就好,然后就可以宣称,这是当前市面上“某某指标”表现最好的产品。
  产品的上限和下限
  除去调研和评测其他AI助手,这份清单的还可以用于立项做产品定位,以及当checklist评价产品表现。
  产品在立项的时候,要哪些不要哪些,边界范围有多大,就是一个思考题。一开始,各音箱都是没屏幕的,大家都在抄亚马逊的Echo,后面为什么又出现了有屏幕的音箱呢?这个就是产品的定位和选择。
  从商业逻辑上来看,有明显缺陷的产品无法存活于市场,没有长板的产品也注定平庸。而企业也没法把所有的资源平均分配,那样的东西注定平庸,唯有极致才可以生存。
  上限就是自己的产品卖点,这样才能够从竞争之中脱颖而出。
  典型如一些千元智能手机,大多数资源都分配到CPU和大屏幕上,其他的硬件一律堪堪及格线就好,这2个卖点到位,就能够出现在各种评测上做到前列,继而去影响消费者选择。
  而再烂的智能手机也要搭配一颗摄像头,且摄像头的性能表现不能低于某个标准,如果这个太烂的话,注定无法存活。前面苹果手机的例子,其实也抗震,不是一摔就碎的东西,这种就是下限保障。
  下限要做到什么程度,这个就是及格线,存活于市场的前提。
  在保证了及格线达到平均线标准之后,理所应当把更多的资源堆到某个维度上。大家比的是在资源有限的前提下,基于定位做产品交付。
  每个维度都做好,不现实,也不正确。
  战略的第一步就是放弃,敢放弃什么,拼的是认知。
  总结
  综上所述:
  基于产品定位选择重要的维度和指标,做权重优先级排序。
  基于选择的指标,使其数值可衡量,做量化标准。
  基于公司资源保障产品下限,基于人才禀赋提升上限。
  说明书介绍完毕,可用于立项定位产品,也可以就已有产品做评测,量化优缺点,做迭代改进升级。掌握使用说明书,这份清单的价值也就到位了。
  在遇到问题时,高手和普通人的思维决策过程不一样。
  普通人是逢山开路遇水搭桥,也就是我们常说的见招拆招。高手却总是为自己制定各种决策系统,在遇到问题时直接依据清单做决策。
  人的理性是有限的,见招拆招,总会遇到环境影响,情绪波动的时候,结果往往不可控。而以原则清单行事则更加可控,减少纠结犹豫,提升效率,所以高手有时候就像是一台稳定而又客观的程序,冷静而又客观,更容易做出正确理性的决策。
  笔者在设计评测指标的时候,往往是朝着最理想的人工智能去做比对的,它能帮助我们在各个维度上去逼近超级人工智能,打造令人尖叫的产品。
  谢谢各位看到这里,希望这份业务清单能够帮助到大家。
  相关阅读
  如何评测语音助手的智能程度(1):意图理解
  如何评测语音助手的智能程度(2):服务提供
  如何评测语音助手的智能程度(3):交互流畅
  如何评测语音助手的智能程度(4):人格特质
投诉 评论

如何用数学函数去理解机器学习?本文主要分享了如何基于数学函数原理去理解机器学习的本质,并简要介绍了机器学习的过程。近期也是在做项目的过程中发现,其实AI产品经理不需要深入研究每一种算法,能了解机器学习……产品经理10大基础技能(5):读透神经网络和机器学习本篇先介绍许多热门的行业均在产生AI产品经理岗位的需求,再详细介绍AI产品经理必懂的AI技能,接着撰写什么是神经网络?什么是机器学习?最后用一个案例详细拆解AI产品经理如何用机……从算法到产品:NLP技术的应用演变文章回顾了近几年NLP的发展历程,从项目实施的两个阶段中带我们梳理了NLP技术的应用演变。第一个与大家分享的Case,基于NLP展开。分为3个部分,分别是NLP的发展、项……如何评测语音助手的智能程度(5):指标权重设计这是一份前面四篇评测维度介绍文章的总结,同时也是一份清单使用说明书。知己知彼,百战不殆,调研评测其他公司的产品是从业者的日常操作,那么当一个产品放到我们手里的时候,到底看……关于BI,你想知道的都在这里过去几十年,BI经历了从工具到“决策大脑”的角色转变,而未来一定是向“智能决策大脑”转型,也就是“AIBI”。未来5年,BI不会只停留在对历史数据的多维统计。当很多人还不……机器学习中的判别式模型和生成式模型如今已经进入2020年了,5G的时代已经到来,而机器人应用将更加的广泛,下面就让我们去了解机器人在学习中的两类模型,这文章告诉两种类型的区别,推荐给对机器人感兴趣的朋友们阅读!……如何评测语音助手的智能程度(3):交互流畅本篇文章为大家带来【交互流畅】维度的评测点拆解。这个模块,重点考量智能助手各个性能指标及交互体验层面的表现。希望对从事相关领域工作的各位有所启发。当用户发起需求后,【意图……如何评测语音助手的智能程度(2):服务提供关于如何评测的问题,笔者从四个维度展开了分析,而本文服务提供维度展开评测点的拆解,考量的是场景理解及整合应用CP和SP的能力。很多人觉得AI是一个行业,但AI其实并不是行……如何用AI技术保护隐私安全?在AI技术与相关产品高速发展的时代,大量用户隐私未经同意而被用于AI机器学习中,危害用户隐私安全。而国内外AI巨头也意识到这一点,并积极用AI技术制定出保护隐私安全的……如何评测语音助手的智能程度(1):意图理解本文重点定义和讨论第一大模块【意图理解】,即是否能够理解识别用户表述的意图。笔者以为,这个模块是衡量AI智能与否的核心维度,并将为大家揭晓评测维度与指标。从事AINLP领……2020年中国语音OS市场专题分析伴随5G技术的发展、人工智能技术以及自然语言理解能力的提升,带动了一波产业热潮,国内百度、科大讯飞、喜马拉雅等巨头纷纷在智能语音领域发力,智能语音产业迎来发展黄金期。未来……AI落地到教育领域,需要哪些必备条件?本文以教育机器人为例,来实际探讨如何让教育机器人,逐步成为中小学AI技术课程和综合实践课程的良好载体。信息技术的迭代发展不断推动着教育的变革创新,随着人工智能技术的发展,……
“得到”和“极客时间”功能对比分析:如何做“好好学习”的笔记本文分析了得到和极客时间两款产品的“笔记”功能,并进行了对比,探讨其差异,看看“好好学习”如果做笔记功能。一、调研的目的最近发现用户在学习“好好学习”APP课程内容……抓住未来产业互联网时代的小趋势!凡我赶不上的,我就做好准备,到未来等它。大学时代错过了网购的趋势,工作时错过了移动互联网的趋势,趋势和风口一个接一个,总有种稍纵即逝的感觉;许多人经常会想“要是十年前我知……反常识:为什么好产品平淡无奇,酷产品尽是泡沫?一些风口之上的硬件项目,总是夺人眼球、光怪陆离这些年,科技圈有一个怪现象:怪胎式硬件独角兽屡见不鲜。光鲜夺目的产品,履历豪华的团队;局外人拍手叫好,明眼人笑谈要亡。……产品经理周报第51期京东针对商家上线“以考代罚”功能;“闲鱼早上好呀,各位小伙伴们今天是周五啦短暂的上班之后又是双休啦这段时间温度依旧比较低大家还是要注意保暖呀那现在我们先来了解一下本周发生的事情啦n……如何更好地告别2018告别绝对是件高难度的事情,不亚于做一款好产品。然而,时间在督促着我们走向2019,不管我们想要怎样的一年,也不管我们是否已完成了对未来的准备。时间、目标与过程,是三个最容易让人……“盛世”抖音,危机“四伏”“善良比聪明更重要,AI可以比你更聪明,但你比AI更善良”张小龙。如果没有抖音,今日头条今年恐怕不会过得如此锋芒毕露,以致一向寡言的张小龙,把腾讯年会硬生生地开成了“批头……在线K歌又现新模式,音遇APP能否站稳脚跟?音遇这款差异化的K歌社交APP,未来又可能往什么方向发展?从11月底开始,一款名叫音遇的K歌应用突然冲上AppStore榜单,并且持续保持在社交免费榜的前列。这款应用主打……2008年的硅谷告别波诡云谲的2018,我们该如何面对未知多变的2019?剖析过去,展望未来,不妨一起从尘封的2008年探索答案。伴着比特币价格突破10000美金的创富神话,2018年初……观点背后的假设,你看清了吗?一个是理由之所以成立所需的假设,即描述性假设;另一个是理由证明结论所需的假设,即价值观假设。近期一则世界首例免疫艾滋病的基因编辑婴儿在中国诞生的新闻成为舆论焦点。一……数据分析案例:谁是2018当之无愧的“第一”国产电影?2018年度国产电影佳片不少,如何利用数据分析,来一次“年度国产电影第一名”的评比呢?海选:票房才是话语权酒香也怕巷子深,虽然票房不是衡量影片好坏的唯一标准,但是票……微信7。0的张狂:“好看”的内容电商你未看此花时,此花与汝心同归于寂;你来看此花时,则此花颜色一时明白起来。自从关了“内涵段子”之后,我就成了“看一看”的忠实用户,只是微信7。0之前,许多人并不知道“看一看……谷歌搜索idiot事件并不意外细数你不知道的谷歌那些事儿近日,用谷歌搜索“idiot”一词后显示大量特朗普图片的这一事件引起热烈关注。在使用搜索引擎的时候,你有没有碰到过搜索出来的结果里出现了奇怪的东西的情况?前段时间,这个情……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界