童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

产品视角下推荐排序系统的冷启动问题(一)

8月12日 眉梢欢投稿
  对做排序或者推荐功能相关的产品经理来说,机器学习不是什么陌生的概念,大家经常看到的各类产品的推荐内容也在向用户传输机器学习的概念。“看过这件商品的用户也看过”“听过这首歌曲的用户也听过”“您也许认识XX”“您的好友也关注了XX”等等这一类的推荐功能大家已经非常熟悉,排序上面应用这种方式的可能不那么明显,但是稍加留意,你也会发现许多电商平台上展现给你的列表中前面的一些内容和你曾经看过的一些东西好像有些许的关联。如果你恰好是个爱思考的人,那么大概已经猜到了这类功能的实现方式:通过用户和item(歌曲、商品、好友关系)的历史数据,(经过合适的协同过滤或其他算法)来给用户推荐Ta可能感兴趣的内容。
  这种机器学习方式的排序推荐策略效果是非常明显,根据一些公开的数据,亚马逊网站通过推荐带来的销量比例占到了20以上,而在笔者的产品实践中,也证明了根据用户历史行为对排序策略进行调整和作出推荐对提高转化率有明显的正面作用,因此在排序和推荐等产品的策略制定中,根据用户历史行为做调整也是大家经常会关注到的内容。从上面的描述中你可能已经注意到,这类策略有一个基本前提就是用户和Item要有足够的历史数据来进行计算,如果用户或Item已经有了足够的历史数据,那么只要通过推荐算法就能够给特定的用户推荐出合适的内容,但当用户和Item没有历史数据的时候,直接通过推荐算法出来的内容很可能就会成为Badcase集锦。对于这类新用户或新Item在排序推荐系统中处理,我们称之为冷启动,这个问题是数据工程师和策略产品经理经常需要讨论解决的问题。
  什么是冷启动
  冷启动研究的是在没有大量用户和产品数据的情况下,如何给相应的用户做出能够让用户能接受的推荐内容。冷启动主要分为三类:用户冷启动、物品冷启动和系统冷启动。
  用户冷启动主要解决给新用户做(个性化)推荐的问题,因为新用户在系统中还没有任何历史数据,因而很难预测其喜好并做出相应推荐。
  物品冷启动主要解决将新的物品推荐给可能对它感兴趣的用户的问题,因为新产品同样是没有和用户交互的数据,常见的推荐系统往往推荐的是数据较多较好的物品,而直接忽视这些新物品。在需要用到推荐的产品中,产品覆盖的物品众多,马太效应变成不得不考虑的问题,而推荐往往代表着流量入口,是造成马太效应的罪魁之一也是消减马太效应的渠道之一。如果考虑整个系统中销量的平衡、考虑推荐的多样性和覆盖率,我们需要给新商品一些推荐的机会,但是如果将新物品强行纳入到推荐中,产品经理不得不冒转化率降低的风险,而且最可怕的是这种风险是无法预期的。
  系统冷启动处理的问题是用户和物品都没有没有足够的数据时候的推荐,个人认为所研究的内容应该包括在用户冷启动和物品冷启动中,不做细究。
  今天主要给大家介绍常见的几种或已经确认在实践中有效的用户冷启动处理方式,至于物品冷启动,处理起来比用户冷启动更复杂,鉴于暂时还没有相应的实践经验,这部分留到有关于物品冷启动的成功实践案例之后,请大家期待产品视角下推荐排序冷启动的处理(二)。
  利用用户基础信息
  用户基础信息是指用户不在产品中有任何交互,我们就能够获得的信息,这些信息主要分为三类:一是用户注册信息,比如性别、年龄、电话、职业等等一些可以引导用户填写的客观信息;二是让用户做出喜好或分类选择的主观信息,比如在一些音乐、视频和阅读类看重推荐功能的产品上,用户在注册时需要填写一些必要的信息和选择关注喜欢的类型,这些信息很大的一个作用就是用于用户个性化内容推荐;三是可以关联外部平台获取的信息,这一类信息是在社会化登陆兴起之后可以提供给推荐的数据,比如网站通过支持微博登陆可以获取用户在微博上注册的信息和好友关系等。
  在我们确认能够获得用户的这些信息之后,就可以通过直观或数据分析的方式发现不同类型的用户的不同特征,进而进行推荐。有些推荐逻辑的判别是直观就可以做出来的,比如用户注册信息是男,那么就不要给用户推荐裙子这一类的产品。而对于一些其他信息,则可能需要复杂一些数据分析来完成,比如通过手机号分析用户常住地城市,然后分析不同城市的用户在商品选择时的价格、品类、品牌偏好是否存在差异。
  那么如何选择使用哪些信息来细分策略呢?我这里有一条简单的判别方法:不同特征的用户在主要考察数据表现上的差异情况,如果差异大,那就是值得细分深挖,反之就(暂时)没有什么必要。比如,你发现不同性别的用户在转化率体现下没有差异,那就不需要区分性别进行策略计算;而如果发现不同年龄段的用户在转化率体现上有很大差异,那就值得区分年龄做不同的策略。
  热门推荐
  用户存在着从众的心理,而且大部分人的特征是趋于相似的。因而当我们确实没法获取用户偏好的时候,我们可以采用热门推荐的方式进行推荐。新闻视频网站的浏览量、音乐网站的收听量、电商网站的销量、搜索的频次、社交网站的关注度等等都是是否热门的具体体现,热门的物品表示物品在大范围是受欢迎,研究发现,新用户更愿意接受热门的商品而不愿尝试新物品,给新用户推荐热门商品理论上至少不会犯太多错。
  在处理热门的时候,需要注意的是热门的“范围”,即物品在什么维度内是热门的。这个维度包括分类、时间、地域等等,需要根据产品的实际情况进行设置。比如在亚马逊上,在科技图书中的热门,但是可能在所有图书中不是热门的。又如在新闻网站中,1小时内的热门和24小时以内的热门应该是有区别的,选择推荐哪个维度的热门是需要分析试验的。在微博上,热门微博甚至直接是按多长时间内热门分Tab展示的。对于时间跨度上的热门,如果是全局情况下,一般会采用阶梯降权的方式处理,比如1小时、24小时、3天内的阅读量按权重从大到小做推荐得分计算,其他维度的也可以尝试这种阶梯降权的方式做热门处理。
  考虑item质量
  虽然手头拿不出确实的研究数据,但是根据合理的猜想,用户更倾向于选择质量较高的物品,因而当新用户接触到我们的推荐时,Ta更容易接受(至少看起来)质量更高的商品。几乎每个产品系统中的物品,都会有能够体现物品质量的数据,常见的可获取数据是评分,我们可以给用户推荐在评价系统处于前列的内容。
  如果用评分来作为质量的依据,那么我们可能会面临的一个问题就是新用户并不了解这个产品中某个具体评分的意义,比如在一个图书电商网站上,4。8分到底意味着什么?处理这个问题,除了我们要让评分系统尽量靠近用户认知之外(比如,别选个满分为7分的系统),还可以用一些辅助信息的展示来给用户说明,这里有一个大家熟悉的案例:淘宝中每个店铺的页面都会展示分维度的评分,并且在评分后面注明“高于同行XX”。在推荐内容的展示中,我们可以给新用户展示评分的同时给出评价的相对意义,方便用户理解我们给Ta推荐的物品到底是什么样的质量水平。
  除了评价之外,销量、浏览、收藏等等也一定程度上反映除了物品的质量,可以作为辅助参数作为选择热门物品的标准。
  合理利用上下文信息
  除了从用户和物品上挖掘尽量多可用的信息,对于新用户的推荐还可以合理利用上下文信息,有时候,这些上下文信息的重要程度甚至超过了其他信息。上下文信息是指用户在接触到推荐系统时的时间、地点、心情、场景等等,这些信息在用户做出决策中都具有决定性的作用,因而也是推荐系统需要重点考虑的内容。比如,音乐产品中对用户心情信息的把握,你不能在用户分手后给Ta推荐一首《今儿个真高兴》吧,同理给12月份进入购物网站的新用户推荐T恤也是不能理解的。
  在笔者所在的O2O产品中,用户地理信息在排序和推荐中都有着重要位置,在机器学习模型中,其重要性甚至远远超过物品质量、用户偏好所有其他特征,曾经在某个场景中,由于地理信息丢失,转化率和交易额都遭受了严重的损失。因此,一定要关注和产品紧密相关的上下文信息,才能给新用户给出相对合理的推荐内容。
  结语
  在排序推荐策略的设计中,对于那些频度较高的产品,或者任何产品中的活跃用户,机器学习的方式能够根据大量的历史数据给出用户满意的排序方式和推荐内容,但对于新用户或当数据稀疏时,机器学习往往达不到想要的效果。根据实践经验,在这种情况下,考虑了用户基础信息、热门情况、物品质量和上下文的强规则方式反而有更好的效果。但是,强规则的处理方式的前提是对业务、用户、产品有着充分的了解,而且策略本身也应该设计成可试验可对比方便迭代的以随时根据试验情况调整。
  同时,这也暗含着一个策略产品经理应该掌握的基础能力,那就是对特例的识别。在策略相关的产品中,许多复杂的内容都是工程师使用机器学习来完成的,但机器不是万能的,它只会处理我们已经考虑到的内容,而我们需要做的就是思考让机器去处理哪些内容,这也是一个策略产品经理的价值之一。
投诉 评论 转载

视觉层面的思考:6个为新手用户设计的策略之前的文章里探讨过界面的易操作性,提到的主要是视觉层面的思考,今天这篇想总结一下对于新手用户,可以通过哪些设计策略来帮助他们进行操作。引导页引导页的使用在PC端常见……如何用科学方法帮你提升用户粘性?序言如何提升用户粘性?这是产品有一定UV后都会面临的问题。大部分产品都在尝试主动跟用户联系,比如电商类APP定期给用户推送各种打折促销消息,吸引用户回到APP;SNS类A……深入浅出!全方位科普移动端导航的七种设计模式看了很多总结导航的文章,其实都基本雷同,但是都觉得不够细致,也不是从我们常用的产品去分析的,因此用自己的思路重新分析了一遍,某些段落来自引用,比如拇指热区,某些来自我读过的文章……产品视角下推荐排序系统的冷启动问题(一)对做排序或者推荐功能相关的产品经理来说,机器学习不是什么陌生的概念,大家经常看到的各类产品的推荐内容也在向用户传输机器学习的概念。“看过这件商品的用户也看过”“听过这首歌曲的用……最新的UX挑战:个性化设计当使用设备时,用户希望有独特的个人体验。从地理位置工具,到回应某个声音或者叫别人名字的语音激活系统,用户希望拥有一个了解他们喜好的工具。但是面对可能截然不同的每个用户,如何设计……产品设计中的点线面法则上一篇文章主要讲的是如何从零搭建起一个信息系统的方法,但实际上甚少有产品人员会参与到系统搭建的工作,因为系统架构往往是在产品的初期,大部分的情况下都是已经搭建好的系统再去根据不……那些看起来很棒的信息可视化图标是怎么设计的?信息可视化包括了信息图形、知识、科学、数据等的可视化表现形式,以及视觉可视化设计方面的进步与发展。地图、表格、图形,甚至包括文本在内,都是信息的表现形式,无论它是动态的或是静态……基于Gestalt原则的一些设计思考一、Gestalt是什么?词意为“形式”,但与我们说的形式的意义不完全相同,它揭示了人的感知,特别是占主要地位的视知觉,并不是直接的镜像反应,它能对所看到的的“形”(视觉……基于行为科学的产品设计方法四步设计有影响力的产品改变行为是艰难的。我们每天都可以看到:落空的新年计划、从没用过的健身房会员卡、以及精心制定但从未完成的节食或省钱计划。有许多产品和服务帮助我们向目标推进,不论是进行更健康……这3个点,新人在规划产品时要注意作为一个刚刚入门的产品新人,我在负责公司产品规划的过程中,因为自己经验缺乏,头脑中的解决思路与现实情况不匹配,导致了公司产品的开发节奏进行了调整。实践上得来的教训是异常深刻和宝……设计边界:理想的设计与现实的制约每次看到别人作品集里出现的那些知名产品的重设计概念方案时,我都蛮感兴趣的。无论方案本身质量如何,精神可嘉,值得钦佩。毕竟是自发的,不会有任何物质回报,需要投入的时间精力也不少,……微信朋友圈技术之道:三个人的后台团队与每日十亿的发布量概述截止到2015年7月,微信每月活跃用户约5。49亿,朋友圈每天的发表量(包括赞和评论)超过10亿,浏览量超过100亿。得益于4G网络的发展,以上数据仍有很快的增长,而……
设计实战:让美团外卖的拼单功能更好用从0到1,如何设计一款体育类小程序大众点评,为什么不需要用户完成服务就可以评价?后台功能设计之评论资源管理设计会员制,所要关注的用户心理角度【小米有品】加入购物车功能还原以及优化建议积分与兑换系统之项目总结以美容行业为例:本地服务行业如何接入小程序?AI领域中设计师能做些什么?我总结了这些设计机会!1。5万字,全方位讲解如何提升移动端表单的可用性10个技巧,帮你设计完美海报如何从01搭建B2B电商平台
鲨鱼裤是什么面料鲨鱼裤的特点俗语“四十不多欲,五十不多情”,后面5字更经典,却少有人知! 2016冬至里的暖意优秀作文好文:自然日介绍(什么是自然日)热文聚热点网 跨新年作文400字开车不方便看手机怎么办,这款自动朗读微信通知的神器介绍给你烦闷造句用烦闷造句大全学校安全综治工作总结只输入真实姓名找人(手机号查人的真实身份软件)绷带包扎的注意事项童年的趣事致娘娘腔请让男人成为真正的男人

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界