童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

搜索产品指南:必须知道的几件事

2月26日 满月族投稿
  搜索产品有很多,其中有哪些需要注意的问题?在技术之外,我们还需要知道什么?
  搜索本身是一个比较技术的事情,小白产品想要学习搜索的产品知识,就会发现各大论坛上的搜索相关内容都是技术为主。即使买上几本搜索相关的书籍也大部分讲的是搜索引擎的原理,无从下手去学习,入门就更难了。
  那对于一个搜索小白来说,到底应该怎么样去设计一个搜索引擎呢?
  搜索路径:输入搜索词抓取数据分析用户搜索意图识别意图并召回内容结果集排序。
  一、抓取数据
  搜索引擎:在全网中抓取尽可能全的数据,供搜索引擎查询。
  垂类搜索引擎:这些数据95以上都是平台自建的,所以不需要去其他平台抓取数据。如:淘宝、美团都是平台自己维护的数据,平台需要做的事情就是尽量让数据准确、真实。如果一个卖衣服的商品录入的信息全是卖鞋的,即使引擎再好也无法识别这件“衣服”。
  二、分析用户搜索意图:分词、词语处理、词语识别
  1。分词:单字分词、短语分词
  1)单字分词
  就是用户输入词分成单个字,每个单字匹配上搜索域就可以被搜索,这种分词简单易开发,适合spu和品类较少的平台。但这种分词方式有一个弊病,那就是搜索结果不准。
  就比如我想搜索“小金锁”的面膜,那搜索域中匹配上“小”、“金”、“锁”三个字就可以被召回,真实案例就是搜索结果出现“金色小米手机人脸解锁”的手机,尴尬至极。
  2)短语分词
  这种分词方式需要准备一个基于自己平台的分词词库(如果没有找一个开源词库),分词引擎基于这个分词库来分词并进行搜索。
  比如你想搜索“小金锁”,分词库中包含“金锁”、“小金锁”,那你搜索的词就会被分成“小”、“金锁”、“小金锁”,那搜索域中是“金色小米手机人脸解锁”的sku就不会被搜索出来,因为“金锁”、“小金锁”这两个词并没有匹配上。
  部分垂类需要自建自己平台的分词库,比如电商类的平台,就可以从品类名称、地域名称、品牌名称、店铺名称去搭建一个基础库。提供一个思路大家自己去思考,下一步应该怎么搞?
  2。词语处理类
  用户搜索词千奇百怪,避免不了同一个搜索结果,每个人搜索的词不相同。但为了保证无论用户输入什么搜索词,都可以变成想要的结果,这个时候就需要同义词、近义词、错别字、屏蔽词来干预。
  1)同义词
  因为结果集取并集,所以用户无论搜索同义词中的哪个词,得到的结果都是相同的。
  同义词库搭建的时尽量保证词库的真实、准确,如果匹配分词库时有专业的业务部分,最好和业务部分确认好后再配置。如:剃须刀、刮胡刀,书、图书,上海九院、上海第九人民医院,拖鞋、鞋拖。
  2)近义词
  近义词是两种词的定义接近但又不是同一个东西的时候,一般配置近义词。如:生抽、老抽,猕猴桃、奇异果。
  有的人认为不是一种东西,有的人又非说是一种东西(人的认知边界,此处不接受杠)。所以,近义词可以完美解决这种情况。排序的时候优先展示搜索词的结果集,配置的近义词在搜索词结果展示完后展示;当然也可以穿插展示,具体情况具体设计。
  3)错别字
  错别字需要做的是定义主词和错别字词,错别字在没有进入搜索引擎的前一步就完成的替换。
  错别字情况在搜索引擎中最常见,如:雅诗兰黛、雅思兰黛、雅诗兰戴、雅诗蓝黛。这种情况简单点就走同义词,但对应的搜索词和搜索域的相似度会有一定程度的影响,所以错别字还是最有解决方案。
  4)屏蔽词
  屏蔽掉一些无关或者无意义的词。
  如各种奇奇怪怪的标点符号、各种反d反d的词语等,行业内有很多标准词库。在技术论坛上查找,不过多介绍。
  3。词语识别类
  主要还是标记一些词为特殊词,可以在用户搜索该类词的时候,给出一些特殊样式的惊喜,就比如搜索“雅诗兰黛”,不仅仅展示“雅诗兰黛”商品,也可以展示“雅诗兰黛”店铺、“雅诗兰黛”活动入口等等,给用户的惊喜也是很大的!
  三、识别意图并召回内容
  1。搜索域:搜索域就是搜索词匹配相似度的文本
  初级的搜索产品,可能会觉得所有的信息都放进搜索域中就行了。其实大错特错,这样导致的结果就是非常不准确。这个时候,搜索产品一定要克制,尽量把重要的字段放在搜索域中,就比如:商品标题、品类、标签、sku名称、sku规格等。
  2。相似度:搜索词和搜索域匹配度也叫相似度(偏技术可略过)
  1)分词方式
  如用户搜索:“你说的确实在理”。
  “你说”、“的”、“确实”、“在理”1221324218
  “你说”、“的确”、“实”、“在理”1221314215
  “你说”、“的确”、“实在”、“理”1221324114
  机器无法判定那种分词方式是对,但是数字可以判断大小。所以,搜索词先判定了第一种分词方式(真正的分词比这个还要复杂,用分词数量和分词位置比较好理解,下几篇文字会详细讲下如何分词)。
  2)匹配方式or和and
  or和and无非就是用户搜索词和搜索域匹配的结果集是要部分匹配还是完全匹配,用哪种模式还是比较看行业的。电商、020建议用and较好,社区、视频等内容类建议用or较好。
  3)文本相似度余弦相似度
  余弦相似度,就是通过一个向量空间中两个向量夹角的余弦值作为衡量两个个体之间差异的大小。把1设为相同,0设为不同,那么相似度的值就是在01之间。余弦相似度的特点是余弦值接近1,夹角趋于0,表明两个向量越相似。
  看下图:
  比如:{你说的确实在理}、{你说的在理},对应的向量分别是{1,1,1,1}、{1,1,0,1}套入到的公式中,相似度约等于80。4
  PS:但相似度是不准确的,“你真好看”和“你真难看”相似度75,但其实他们一点也不相似。所以,机器学习、语义识别、神经语言等还是需要逐渐搞起来的(小厂谨慎搞)。
  四、结果集排序
  1。业务因子排序
  基于行业特性,定义一些业务因子来综合打分行程排序。
  基于多维度的分数来定义对应的结果集,一般可以加一些ctr、单uv价值、单pv价值、退款因子、转发互动因子等等。要知道搜索结果不仅要准确,还要足够受欢迎。
  2。人工干预排序
  对于特定的词或者类型,给予一些人工干预,保证搜索结果的准确性。
  3。个性化排序
  基于用户标签,在搜索结果集中加权值。
  比如技术宅搜索”苹果“,大概率是想要iphone手机,那吃货当然更希望是水果喽。
  搜索底层路径基本就这四大节点,底层动作围绕着四个节点有很多标准的行业解决方案,欢迎大家一起聊聊!
投诉 评论 转载

从4种账号体系,看账号的演变历程本文从四个账号体系自定义账号、邮箱账号、第三方账号、手机号账号,分析了不同体系的特点与发展规律。自互联网服务兴起开始,账号作为用户在网络世界的身份证,是用户在使用系统时创……产品设计:商城中的优惠券和促销活动在电商业务中经常可以看到各种优惠促销的手法,常见的有:优惠券、促销活动、秒杀活动、拼团活动、预售活动等等,本文就对常见的营销方式相关的产品功能进行详细的说明,文章分为两篇,上篇……如何用故事设计的方法做需求分析?笔者从写小说、设计故事的思路出发,类比了如何用这一思路做需求分析。故事的起点平时我会写一些超短篇的小小说来练练笔,因此如何通过设计故事情节来突出我想要表达的思想是我……人工智能助手的对话设计指南本文列举了人工智能助手的对话设计的8个设计要点与注意事项。在给别的东西起名的时候,设计师是最富有想象力的人。就在前几天,我发现几乎所有的菜单都是以食物来命名的,比如……对用户来说,交互设计价值观的意义是什么?上一篇,分享了对交互设计价值观的理解,更多是从从业者的视角出发。这一篇,会从用户的视角出发,探讨一下这四个价值观的价值。对用户而言,这四个价值观有什么价值?有个句子……苹果微软特斯拉的产品美学向丑而生?本文盘点了苹果微软特斯拉主要产品的设计审美与一系列变化。作为一个键盘侠最多的国度,曾几何时我们从海南椰树吐糟到乡村爱情、从中华酷联吐糟到华米OV、从papi酱吐糟到李佳琦……教你5招,轻松打造系统图标规范系统图标设计能准确反映出品牌的个性理念,并最有效传达企业品牌形象。作者从自身工作经验出发,分享了打造系统图标的5大步骤。今天我们聊聊如何做系统图标规范,大家知道图标在产品……麦当劳自动点餐系统案例分析笔者由一次不好的麦当劳点餐体验开始了对于该系统的研究和分析,根据点餐过程的问题进行了针对性优化。几个星期前,我和我的家人一起去麦当劳买午餐吃,然后我们发现在麦当劳店门口安……思考总结:谈谈卡片式设计本文作者结合实际项目中的得到了一些思考进行总结并归纳出一些卡片式设计的小知识点,同时希望自己通过本次的总结进行知识沉淀,以及跟大家一起探讨下卡片式的设计。卡片式设计对于我……搜索产品指南:必须知道的几件事搜索产品有很多,其中有哪些需要注意的问题?在技术之外,我们还需要知道什么?搜索本身是一个比较技术的事情,小白产品想要学习搜索的产品知识,就会发现各大论坛上的搜索相关内容都……把握这4点,全链路项目优选轻量化站位文章探讨了创新项目的轻量化站位选择的话题,并对轻量化展位进行了全方位的梳理分析,与大家分享。公司里面喊MVP已经喊了很多年,也有越来越多的PM在践行MVP,我今天想聊聊M……“CTA行为召唤按钮”设计规则简析本文主要介绍了如何才能设计一个具有行为召唤能力的按钮,并从形状、色彩、按钮样式、添加图标、文字字体、位置等方面提出了建议。“按钮”在UI设计中是一种常用的UI控件,一个成……
第三章:产品规划(5)产品规划中的竞品分析第三章:产品规划(4)产品规划的需求决策第三章:产品规划(3)产品规划的设计理念新闻App“山东24小时”评测:社交功能亮了移动设备手持分析!用户到底是怎么使用手机的?关于动效要潜移默化,还是要引人注目?iOS8人机界面指南(二):设计策略Moleskine笔记本:卖产品不如卖洞察。让你的拇指歇歇吧无事来嚼小熊软糖,Haribo深度体验报告关于Booking和携程的酒店预订模块的思考他山之石可攻玉!一个美国高管眼里的中国电商从嘿客看亚马逊实体店:体验与期待
Win7不建立索引的情况下如何快速查找文件别着急,好日子是一天一天过出来的金星婚后10年,有没有正常的生活?丈夫汉斯透露真实情况内分泌失调大表现及调理方法狄更斯双城记读后感三篇落满阳光的回忆命题作文继承的法定顺序热文聚热点网 软萌百变小女孩编发打造灵动甜美小公主教学计划电解铝锭价格今日铝价苏珊米勒2016年星座运势天秤座完整版人大常委会环保局关于环境保护工作报告

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界