童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

智能问答系统产品设计详解

1月21日 囍孤女投稿
  本文通过基于问答对的问答型机器人作为引入,逐步分解其设计流程,用通俗易懂的语言描述问答型机器人的产品设计思路。
  问答系统的概述
  我想大家肯定看过很多关于自然语言处理(简称:NLP)技术方面的书籍或者论文,但在这里我不会详细叙述NLP技术方面的知识,而是想通过产品化思路结合NLP相关技术来搭建一个基础版的问答系统。本文通过基于问答对的问答型机器人作为引入,逐步分解其设计流程,用通俗易懂的语言描述问答型机器人的产品设计思路。
  好了,现在进入正题,让我先介绍一下问答系统对企业来说它能满足企业哪些业务需求,以及产生的价值有哪些?
  问答系统是基于满足B端企业降低人力成本、提高工作效率的智能化产品,为客服人员赋能。其最大的隐性价值是在实际场景中得到标准化后的数据积累,可以在挖掘客服价值信息中起到降本增效的作用,后续还可以作精准营销和产品升级。一套问答系统最困难的是如何提升客服系统的使用效率。
  就问答系统的使用效率,其根本原因是在于是否能够为企业降低人工服务次数和服务时间占比,甚至是提升公司的营业业绩。
  什么是问答系统
  问答系统是信息检索系统的一种高级形式,它可以通过链接知识库方式检索到用户问题的答案。问答系统与信息检索中的语义搜索有点类似,把用户输入的问题转换为一个有结构的语义表达式,然后从知识库中寻找答案,并直接反馈给用户。
  问答系统的答案可以从结构化知识库获取,用于规章制度、规则条款等问答形式,也可以通过结合一些已有的知识库和数据库资源,利用百度百科、维基百科等非结构化文本信息,用信息抽取的方法提取关键信息,并构建知识图谱作为问答系统的后台支撑,再结合知识推理等方法为用户提供更深层次语义理解的答案。
  在这里主要讲解的是针对特定领域的知识进行一问一答,也称之为单轮对话、问答对或FAQ,即直接根据用户的问题给出精准的答案。
  问答系统的业务场景应用
  适用于特殊环境下所限定的信息需求,在日常生活中,用户会经常碰到很多复杂的规章制度、规则条款。比如:乘坐火车时,能不能带宠物上火车;3岁小朋友是否需要买票等。
  在工作中,也会面对公司多样的政策。比如:商业保险理赔需要什么材料,工作几年可以办理暂住证?这些情况下,经常需要各种查询或者检索才能回复并解决用户的疑问。基于这类常见的业务场景就能更快速的搭建一套智能问答系统。
  问答系统的价值
  现阶段智能问答系统最大价值就是为客服人员赋能,而非独立于让机器自行解决众多目前还有很多错误率和不确定性的问题。
  问答系统的产品策略
  现阶段下的智能问答系统是有局限性的,这也是为什么需要落地到行业中某个垂直业务领域的主要原因。所以需要通过问答系统做出一个符合业务实际需求的产品策略,这样能够最大程度的提升用户体验和增加用户对系统的信心。
  比如系统遇到不知道的问题,可以通过产品的兜底策略及时转换其他服务(如:转人工客服)或给出用户可能想问的问题,为用户提供一个便捷的方式,让用户有继续操作的意愿。这样大大提升了系统的可用性,而不需要完全依赖于算法。这样成本也会低很多,效果也会好很多。这就是用产品策略来弥补算法本身的不足。然而在不同业务场景下所采用的兜底策略也是不同的,最重要的还是如何将兜底策略做的更加智能化。
  上述介绍了一下问答系统的基本概念和产品的价值以及产品策略,后面为读者分享的是如何搭建一套基于结构化知识库的问答型机器人。
  问答型机器人搭建
  问答型机器人(简称FAQ问答系统)目前被大量使用在电商、金融、银行、旅游等行业中。本文就以旅游行业为例,详细介绍如何设计并实现一个基于结构化知识库的问答系统,数据来源:东方航空官网http:www。ceair。com(会员常见问题为例)。
  系统介绍
  用户诉求
  通过最短的对话轮次(一问一答),获得精准、直接的答案以及更好的完成任务,来满足用户的需求。
  实现目标
  系统根据用户输入问题,理解用户的问题后,通过标签分类里的问题中匹配相似问句,并将答案反馈给用户,以此来为用户提供服务。
  系统功能
  在特定的垂直业务领域下,问答系统可以回答用户所提出的一系列问题,其主要功能包括问句预处理、问句理解、问句相识度匹配和标签分类。
  1)问句预处理:将用户问句进行分词和词性标注
  2)问句理解:提取问句中的关键词
  3)问句相似度匹配:将问句与每个标签分类下的问题进行相似度计算后召回
  4)标签分类:为问句添加标签,在标签分类下的问题匹配相似问题,以此来提升机器理解能力和匹配精度,同时也可以对问答对进行分类化管理,可以按业务分类、问题所属业务部门等自己需要的维度来管理问答对,提高问答对的管理效率。标签分类根据实际业务场景需求进行分类,切记标注标签分类的时候需要保持数据的一致性
  产品结构
  用户问题分类:
  首先我们需要对问答系统需要支撑的业务进行分析,然后把用户将会问到的问题进行归类整理,并设计符合实际业务场景需求的分类。
  问答型机器人适用场景:
  适用于回答非用户个性化的问题(即一问一答),返回的是静态知识,无需调用外部数据接口或调用知识图谱返回答案。
  问答型机器人处理流程:
  图1:问答系统处理流程图
  问答系统流程如下:
  1)用户提问:怎么样才能注册东方万里行会员
  2)问句预处理:将问句进行分词和词性标注(词法分析)
  分词:怎么样才能注册东方万里行会员
  词性标注:代词名词动词名词名词
  注:在对问句进行分词处理时,可以加入领域词库进行同义词扩展,如“上海”扩展为“沪”、“申城”;“东方航空”扩展为“东航”,需要结合关键词词库进行识别
  3)问句理解:提取问句中的关键词
  关键词提取:怎么样注册东方万里行会员
  注:关键词可以是名词、动词、助词、代词,是描述某一类特征的词,关键词的颗粒度可以很粗(例如“我要申请”、“帮我申请”、“申请”),也可以有一定限度的泛化能力(例如:如何办理东方万里行会员中的“如何”就可以与“怎样”、“怎么样”)的代词一起作为关键词,并在计算句子相似度方面只考虑这些关键词。
  对于特定句某个名词、代词、动词、形容词或副词不一定是该句中的主语、宾语或谓语成分,但相对于句中所有的词构成的词序列而言,关键词序列却具有一定的句法结构信息表达能力,至少可以了解句子中的哪些词在组成句子框架结构方面是比较重要的。在此基础上进行相似度计算,比一般基于词的方法更准确。
  4)问句相似度计算:将用户问句与每个标签分类下的问题进行相似度计算后召回,同时返回相似度最高的标准问题和所属标签分类。
  注:在这里主要讲解的是产品设计思路,告知读者在设计问答型机器人过程中会用到哪些NLP相关技术,而不会详解技术实现过程。
  问句相似度计算方法1:基于多重信息的方法(关键词加权的语句相似度计算),结合了语法和语义信息的改进句子相似度计算方法。首先计算两个句子的语法相似度(词形、句长),借鉴基于词信息和句法分析的方法,综合考虑词的相似度和句子结构(长度)信息,结合同义词词林进行句子语义的相似度计算。最后,考虑关键词、句长、语义多重信息的一种融合算法,值得注意的一点是该方法需结合词库一起使用,其目的是提升分词、关键词提取、词性权重标注准确率。
  注:在计算语法相似度的时候需要注意的是关键词出现的频次应该采用大规模语料进行统计,而在限定领域问答系统中,可以用简化的方法。根据经验,在实践过程中发现名词和动词在句子中起着非常重要的作用,并且名词比动词承载着更多的信息量,一个句子的中心信息基本上都是围绕着名词和动词来展开的。
  所以在进行计算时也特意加大了名词和动词的重要程度,将句子的重心落在名词和动词上面,经查阅论文资料根据实际经验,将句子相似度计算中权值分别是名词类权重(W)为0。3;动词类权重(W)为0。3;形容词、代词、副词类权重(W)为0。2。
  问句相似度计算方法2:基于向量空间模型的方法。该方法把问句用向量来表示,计算2个句子的相似度就是计算2个向量的距离。
  本文使用word2vec对句子进行向量化表示,以作为LSTM(即长短记忆神经网络)神经网络的输入实现问句相似度计算。而基于神经网络的词向量模型,可以从大规模的文本数据中自动学习数据的本质信息,得到低维实数向量,很好地解决了传统的词向量模型。因为词语独立性假设带来的语义建模困难和维度爆炸问题。
  用户问句:
  Q:怎么样注册东方万里行会员
  FAQ库中的句子:
  R1:如何办理万里行会员(标签分类:会员办理)
  R2:如何获得会员卡(标签分类:领取会员卡)
  R3:东方万里行会员申请电话是多少(标签分类:咨询电话)
  R4:东方万里行会员应该怎样申请(标签分类:会员办理)
  返回结果:(使用word2vec计算得出)
  R1:如何办理万里行会员
  0。8045011574330355
  R2:如何获得会员卡
  0。6247308971541259
  R3:东方万里行会员申请电话是多少
  0。7638216222999513
  R4:东方万里行会员应该怎样申请
  0。9042637469903886
  以上案例从人的主观判断可以看出问句Q实际上和R1,R4是同一个问题,假设阈值设置0。9,而R4的相似度值超过阈值0。9,与人的主观判断完全一致,同时也返回R4的标签分类“会员办理”。
  5)阈值控制:经过问题相似度计算后,通过阈值控制来返回1个、多个问题或者返回其它的信息给用户。
  设计思路:初始化阈值分三个匹配等级0。9为精准匹配,则返回1个问题;0。3为模糊匹配,则返回多个问题;0为没有匹配到(在系统中用户可以根据业务实际情况调整阈值配置)
  返回结果:
  0。9为精准匹配
  R1:如何办理万里行会员(标签分类:会员办理)
  0。3为模糊匹配
  R1:如何办理万里行会员(标签分类:会员办理)
  R2:如何获得会员卡(标签分类:领取会员卡)
  R3:东方万里行会员申请电话是多少(标签分类:咨询电话)
  0为没有匹配到
  A:我现在还不会,正在学习中
  阈值控制流程图:
  图2:阈值控制流程图
  5)答案:假设精准匹配,则将R1问题的答案返回给用户
  整体产品结构图
  以下是问答系统整体产品结构图,主要围绕核心模块有问答管理、模型训练、阈值设置、关键词管理、未知问题管理。则其余模块不会做详细讲解。
  图3:问答系统产品结构图
  问答管理模块
  问答型知识构建是基于问答对中的问题匹配算法来设计的,所以首先需要搭建问答对,而问答对是由标准问题和相似问题以及答案组成,通过新增相似问题来提升问答机器人的准确率。
  而标签分类能有效的对问答对进行分类化管理,可以按业务分类、问题所属业务部门等自己需要的维度来管理问答对,提高问答对的管理效率。标签分类的用途是在特定标签分类里的问题中匹配相似问题,其目的是找到用户问题的所属标签分类。
  图4:问答管理新建标签分类
  问答对是由标准问题、相似问题、答案组成,而标准问题与答案的组合称之为问答对。问答对支持一对一、一对多、多对一和多对多;当问题中包含多个答案时,答案随机呈现。相似问题是标准问题的泛化,其表达的意思与标准问题是一样的,其目的是匹配用户问题最相似的问题,并反馈给用户答案,问题样本越多匹配的准确率也就越高。
  图5:添加问答对产品原型
  模型训练模块
  是将编辑好的问答对或新增相似问题加入到算法中进行训练并生成模型,模型需要生效后才可使用。
  阈值设置模块
  经过标准问题相似度计算后,通过阈值控制来返回1个、多个问题或者返回其它的信息给用户。
  图6:阈值设置产品原型
  关键词管理模块
  关键词在问答管理模块中已经有详细的描述关键词对整个问答管理模块来说其重要性,以及关键词的使用和发挥的作用。
  图7:关键词管理产品原型
  图8:添加词典值产品原型
  未知问题管理模块
  未知问题是用户与机器人在对话过程中未识别的问题,用户可以对未知问题进行标注并添加至问题样本中通过模型进行训练。
  图9:未知问题管理产品原型
  图10:转问题样本产品原型
  结束语
  问答型机器人能否实现智能化,最直接的体现就是能否回答人类自然语言的问题,本文通过详细介绍问答型机器人产品设计思路,以及深入研究问答型机器人处理流程。问答型机器人最核心的就是问句相似度计算,以及用户自定义词库拓展同义词来提高匹配准确率,还有就是未知问题的处理并加入模型进行训练。
  本文还介绍了问句相似度计算的2种方法,一个方法是关键词加权的语句相似度计算;另一个方法是word2vec结合LSTM神经网络的问句相似度计算。试验证明,word2vec来计算问句匹配的准确率明显要好。
  至此,因本人一直从事NLP领域的智能问答系统产品设计工作。所以想把一些经验分享给大家,相互学习和交流,后续还会持续更新基于知识图谱的问答系统和多轮对话的产品设计。
投诉 评论 转载

全面解析:服务蓝图的应用逻辑服务蓝图是服务设计的主要工具,然而设计者们经常误解它与用户旅程图的关系、谁应该参与流程以及如何将其价值展现给团队。于是本文就为大家盘点服务蓝图与用户旅程图之间的关系以及服务蓝图……一名优秀交互设计师要思考的四类问题对于交互设计师来说,除了专注于设计的规划与执行外,我们更应该腾出一部分时间与精力去思考、去探索交互设计中的关键问题与关键环节,从认知层面提升自己。做设计不是接到需求就埋头……7大原则,带你设计出更优秀的图标想要设计一套高质量的图标,就需要一套成熟的技巧、训练有素的眼睛、不断的练习和临摹。而就将通过7大原则和大量的案例来说明优秀图标的特点,使你了解优秀图标的共性,设计出更优秀的图标……中台实战(3):数据中心中台化案例聊了那么久的中台概念,本篇文章我们来看一个中台MVP的实战案例,以底层数据中心为例的实战案例。在前几篇文章《中台实战0、1、2》中我们已经详细描述了中台战略的建设目标与演化方式……棉花信息平台的产品分析功能趋势近些年来,“互联网”始终是线上与线下产业结合并赋能发展的趋势所在。其中,棉花信息平台就利用互联网与线下棉花产业的连接,提供质量查询、棉花商城、采供需求、企业仓库、物流金融等功能……初学者如何快速上手数据可视化设计?本文主要讲述可视化全过程,并对各环节的关键点做了说明,希望通过这篇文章能让大家对可视化设计有一定的认识。什么是数据可视化数据可视化是数据内在价值的最终呈现手段,它利……实例分析:了解上瘾模型四个阶段本文就从上瘾模型来分析,这几款APP都是怎样让用户逐渐“上瘾”的,而作为产品的我们,在设计产品的时候,又应该怎样设计,把拉新留存促活转化的过程做好。每天晚上抱着手机从朋友……通过社区买菜,了解业务流程经过这次战役后,用户会习惯网上买菜,未来应该还会涌现出很多公司进入到社区买菜的领域中。这里就简单梳理下这部分的流程,共同学习探讨!前言最近由于疫情的原因,很多城市的……智能问答系统产品设计详解本文通过基于问答对的问答型机器人作为引入,逐步分解其设计流程,用通俗易懂的语言描述问答型机器人的产品设计思路。问答系统的概述我想大家肯定看过很多关于自然语言处理(简……需求太多?1个思考流程,C端产品轻松规划优先级先抛出几个问题:产品为什么要进行需求管理?需求管理的核心是什么?如何规划优先级?然后带着这些问题,聊聊我是怎么思考C端产品需求规划的。“总是做迫在眉睫的事情,会让人……疫情期间最火的电商模式:社区电商因为当下的特殊形势,各种隔离措施使得社区电商模式成为当下最热门的电商模式之一,本文我们就来分析下社区电商的产品如何进行设计。2020年1月,新冠肺炎疫情突起,在这个特殊时……关于填写核对订单信息的产品思考在线上付款的时候,我们都会仔细核对自己的订单信息,再进行确认付款。那么,在这页面的内容展示上,有哪些点是值得注意和思考的呢?互联网公司通过搭建线上平台的购物支付体系,满足……
3个步骤,完成一次B端产品的需求分析数据产品经理,一切从用户出发!?项目验收,产品上线前的最后一道防线3个方面,做好一款B端产品的竞品分析复盘:100份简历中4人录取,产品经理招聘有何背后逻辑ToB定制类产品:硬件产品需求(上)产品经理遇上迷茫期?这三个公式助你自我提升一个项目带你走进产品经理的世界:叮,您有一个需求请查收!产品经理,你有商业思维吗?从5个会议入手,聊聊Scrum敏捷开发实战以美食作家做菜的方式,聊一聊产品思维产品经理:画原型只是入门,能做架构才是进阶祝各位超龄儿童们节日快乐半夜适合发朋友圈的说说大全现在的春晚,你还会看吗?做个清心静气人爱读书的我我妈(首页)变更合同救生绳品牌药妆有什么特点?所有肌肤都适用给大家推荐三种可行的方式你学会了吗辽宁17岁少年行凶致一死一伤可爱圆脸俏短发精致时尚最靓丽

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界