童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

作为产品经理,不懂一点个性化推荐原理,怎么行?

3月27日 终不悔投稿
  在之前的文章《针对大众点评V10改版的一些看法》里面提到要想提高用户对内容的点击率,可以通过算法来实现个性化推荐。具体到实操阶段,虽然主要涉及到算法,但作为一名产品经理还是有必要了解的,为此我最近梳理出个性化推荐相关内容,不足之处,欢迎大家指正和讨论。
  1。为何要做个性化推荐
  个性化推荐,一方面从用户角度,可以基于用户特征过滤掉“无效”物品信息,推荐符合用户口味的物品信息,从而提升用户体验,进一步也增加用户点击率,从而为转化提供更多的可能性;另一方面从系统的角度,也可以让更多长尾的物品信息被曝光,从而最大效率的利用资源。如下图所示,可以看出好的个性化推荐比简单热门排序算法有更好的的有效信息覆盖度(图中斜线面积)。
  2。推荐算法的前提断物识人
  通常我们说物以类聚、人以群分,推荐算法也是基于用户喜好物品信息的相似性和同类用户兴趣相同的原理来推荐,这里就涉及到人一物和人人物的关系,为了可量化人与物以及人与人的关系,我们需要做的就是给提炼出人和物的特征即给人和物打上标签,通过标签抽象出事物更具有表意性、更为显著的特点,然后通过标签进行匹配。
  2。1给物打上标签
  标签不只是简单的给物品信息分类,而是代表着分发给不同的用户群体,比如运动、健身类视频就可以在标签中加上“球迷”“健身达人”等,有关动漫等二次元的内容,也可以加入些类似“宅男”“萝莉”等标签。
  这里补充一下标签和分类的区别,分类是树状的,是自上而下依次划分的。在分类体系里,每个节点都有严格的父子关系,在兄弟节点层都具有可以被完全枚举的属性值,如天猫的商品服务分类(下图)。应用分类时必须考虑分类权威性和信息完备性问题,避免因为子节点覆盖不全或分类错误导致的认知问题。
  标签是网状的,更强调表达属性关系而非继承关系,只有权重大小之分,不强调包含与被包含关系。这就使得相对于分类而言,标签的灵活性更强。在权威性方面,标签是弱化的,每个用户都可参与进来,基于自己的偏好贴标签,从而借助规模效应实现对信息表意完备性的覆盖。因此,在设计系统时,可以先基于产品场景快速覆盖主要标签,再结合标签集合的使用频次、专家建议等因素逐步将部分入口收敛到树状的分类体系中来。
  通过PGC和UGC可以获取物品信息标签。例如人人都是产品经理上文章通过审核后,官方会在文章下面会打上相关标签。有的产品除给物品信息打上标签之外,还会以分值代表这一标签的表征程度,如音乐推荐引擎潘多拉(Pandora)的音乐基因工程中,歌曲体系被抽离出450个标签,细化到如主唱性别、电吉他失真程度、背景和声类型等。每一首歌曲都会经由工作人员耗时二三十分钟,有选择性地标注一些标签,并以05的分值代表这一标签的表征程度。
  而在豆瓣,给电影的标签的是普通网友产出(如下图所示)。群体的力量为豆瓣积累了大量具有语义表意性的标签。当然,由于用户的多样性和编辑的开放性,用户标签系统需要经过特定的清洗和归一处理。
  2。2给用户打上标签
  一个用户行为的数据集一般由一个三元组的集合表示,其中记录{u,i,b}表示用户u给物品i打上了标签b(当然实际中会包含用户属性、物品属性等,更为复杂)。给用户提供标签一般有4种方法:
  给用户推荐一个系统中最热门的标签;
  给用户推荐物品i上最热门的标签;
  给用户推荐他自己经常使用的标签;
  将方法2和方法3融合,通过一个系数将上面的推荐结果线性加权,生成最终的推荐结果。
  实际推荐过程中,为了给用户更精确的推荐,除了用户行为数据外,还会收集用户基本信息、位置信息、搜索等信息建立完整的用户画像。
  3。推荐算法原则物以类聚、人以群分
  3。1物以类聚:基于物的相似性推荐
  基于物的相似性推荐是基础的推荐策略。如果你浏览或购买过某种类型的内容物品,则基于类型或标签给你推荐其他内容物品(如下图)。以内容推荐为例,其用于相似度计算的常见因素有:作者层面的相似性(基于订阅或偏好关系),内容层面的相似性(如关键词、话题、类目、标签等)。
  如果想要进一步细化,那么可以借助TFIDF方式给不同的标签设定权重,其基本思想是一个标签在某内容中出现次数越多,同时在所有内容中出现次数越少,越能够代表该内容,那么这个标签的权重应该较高,反之区分度就没有那么高,权重较低。
  以内容物品属性来推荐:
  (1)优点
  只依赖物品本身的特征而不依赖用户的行为,让新的物品、冷僻的物品都能得到展示的机会。
  (2)缺点
  推荐质量的优劣完全依赖于特征构建的完备性,但特征构建本身是一项系统的工程,存在一定成本;
  基于物品或信息属性推荐没有考虑用户对物品的态度,用户的品位和调性很难得到诠释和表达。比如,市面上关于内容分发的书籍很多,仅从标签词上很难分辨出高下。
  因此,为了在推荐中更好地引入受众反馈因素,提出了基于用户行为的“协同过滤”概念。
  3。2人以群分:基于用户行为的协同过滤
  协同推荐是目前应用最为广泛的推荐机制,其基于用户行为的特点使我们不需要对内容物品进行完整的标签化分析和建模,从而实现了领域无关,可以很好地发现用户的潜在兴趣偏好。考虑到协同过滤的方式依赖历史数据,新的用户和新的物品会存在冷启动的问题,该问题笔者的《个性化推荐中不得不知道的冷启动问题以内容类产品为例》文章中有相关梳理。
  基于用户的协同其基础思路分为两步:
  第一步,找到那些与你在某一方面口味相似的人群;
  第二步,将这一人群喜欢的新东西推荐给你。
  目前主要包括三个子类:基于用户(Userbased)的协同、基于物品(Itembased)的协同、和基于模型(Modelbased)的协同。
  (1)基于用户的CF(UserCF)
  基于用户的CF的基本思想相当简单,通过用户对内容物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。下图给出了一个例子,对于用户A,根据用户的历史偏好,这里只计算得到一个邻居用户C,然后将用户C喜欢的物品D推荐给用户A(如下图):
  发现偏好相同的用户
  通常用Jaccard公式或者余弦相似度计算两个用户之间的相似度。设N(u)为用户u喜欢的物品或信息集合,N(v)为用户v喜欢的物品或信息集合,那么u和v的相似度为:
  假设目前共有4个用户:A、B、C、D;共有5篇物品或信息:a、b、c、d、e。用户与物品信息的关系(用户喜欢物品信息),如下图左边所示,为计算方便,通常首先需要建立“物品用户”的倒排表(如下图中间所示),然后对于每个物品,喜欢他的用户,两两之间相同物品加1。例如喜欢物品a的用户有A和B,那么在矩阵中他们两两加1(如下图右边所示)。
  计算用户两两之间的相似度,上面的矩阵仅仅代表的是公式的分子部分。以余弦相似度为例(如下图),到此,计算用户相似度就大功告成,可以很直观的找到与目标用户兴趣较相似的用户。
  推荐物品
  首先需要从矩阵中找出与目标用户u最相似的K个用户,用集合S(u,K)表示,将S中用户喜欢的物品或信息全部提取出来,并去除u已经喜欢的物品。对于每个候选物品i,用户u对它感兴趣的程度用如下公式计算:
  如上面的4个用户,假设我们要给A推荐物品,选取K3个相似用户,相似用户则是:B、C、D,那么他们喜欢过并且A没有喜欢过的物品有:c、e,那么分别计算p(A,c)和p(A,e),通过公式可计算出用户A对c和e的喜欢程度可能是一样的,在真实的推荐系统中,只要按得分排序,取前几个物品就可以了。
  (2)基于物品的CF(ItemCF)
  基于物品的CF的原理和基于用户的CF类似,只是在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。下图给出了一个例子,对于物品A,根据所有用户的历史偏好,喜欢物品A的用户都喜欢物品C,得出物品A和物品C比较相似,而用户C喜欢物品A,那么可以推断出用户C可能也喜欢物品C。
  ItemCF的算法结构基本与UserCF的算法类似(如下图),只不过由对人的相似度改为了物品之间的相似度,这里不做过多说明了。
  N(i)和N(j)表示喜欢物品i的用户数,ItemCF的算法结构基本与UserCF的算法类似,这里不做过多说明了。
  (3)基于模型的协同
  基于模型的协同过滤推荐就是基于样本的用户喜好信息,训练一个推荐模型,然后根据实时的用户喜好的信息进行预测推荐。
  建立好评分规则
  比如,对于一篇内容而言,可能会有以下行为:
  算出用户对物品或信息的偏好
  基于模型的协同最常见的方法为矩阵分解(Matrixfactorization),其示意图如下图左边。矩阵分解通过把原始的评分矩阵R分解为两个矩阵相乘,只考虑有评分的值,训练时不考虑missing项的值,如下图右边所示。其背后的核心思想,找到两个矩阵,它们相乘之后得到的那个矩阵的值,与评分矩阵R中有值的位置中的值尽可能接近。这样一来,分解出来的两个矩阵相乘就尽可能还原了评分矩阵R,因为有值的地方,值都相差得尽可能地小,那么missing的值通过这样的方式计算得到,比较符合趋势。具体案例可参考知乎上关于网易云音乐的歌单推荐算法的回答。
  4。个性化推荐系统的架构
  个性化推荐引擎架构主要包括三部分,如下图所示:
  模块A部分负责从数据库或缓存中拿到用户行为数据,通过分析不同行为,生成当前用户的特征向量(即标签),如果使用非行为特征,就不需要行为提取和分析模块了,该模块的输出就是用户特征向量。
  模块B部分负责将用户的特征向量通过特征物品或信息相关矩阵转化为初始推荐物品或信息列表。
  模块C部分负责对初始的推荐列表进行过滤、排名等处理,从而生成该引擎的最终推荐结果。
  此外,有的推荐系统会将用户行为拆分为数据和事件,其中,数据的时间敏感度更低,事件的时间敏感度更高。基于时间维度,会在推荐系统中增加一个近线层,比如,我在大众点评上输入了野郊公园后,如果希望及时更新用户的推荐列表,那么这次观看动作就会被视作事件型进入近线层,以更快地更新用户画像数据,因此短期内我会收到公园甚至是该公园相关推荐,但是过了一段时间后,公园的频度就会少很多。
  5。小结
  一说到个性化推荐,大家都会觉得这是技术来主导的事情,但是通过前面对个性化推荐的了解后,作为产品经理,还是有不同的优化空间和迭代导向。
  5。1完善用户画像
  完善用户画像既可以通过尽可能多的外部渠道数据塑造用户来实现,也可以借助产品设计和运营活动引导用户多沉淀行为来实现。以支付宝为例,一次过年的集五福活动,就让它收集了数以亿计的关系链数据。而紧随其后的蚂蚁森林、蚂蚁庄园等轻社交游戏,间接地丰富了用户的线下支付数据、用户的健康数据等。
  5。2完善规则系统,优化用户使用体验
  一方面,规则是最快的上线生效途径,可以用于纠偏、提权等操作。比如最新的网络语举个例子,在《中国有嘻哈》开播之前,大众是不知道红花会是什么的。这时,产品经理就该进行规则干预了,标注红花会是一个嘻哈团体。
  另一方面,需要认识到短期的干预是应该逐步被长期的机制所替换的。我们应该下力气解决系统的滞后性,让它能够更快速地实现搜索意图理解的进化,比如监控全网产出的新物品或信息,分析其中的共现词汇特点。
  5。3根据推荐的结果优化推荐结果
  评测推荐系统的指标有:
  用户满意度;
  预测准确度;
  覆盖率;
  多样性;
  新颖性;
  惊喜度;
  信任度;
  实时性;
  健壮性和商业目标。
  因此,基于不同的场景,在使用推荐系统后,产品需要去亲自体验并收集各方面反馈,将反馈同步给技术,并基于反馈,尝试不同推荐方式共同作用,做到查遗补缺,找到更有的推荐方案。
投诉 评论 转载

产品经理职业成长的加速度变量精进方法论上篇文章《产品设计规范与关乎“秩序和混乱”的人生算法》中有提到一个名词“弯道超越算法”,当时是用这个概念来定义产品职业生涯成长过程中高阶方法论。其实,无论是《产品设计规范与关乎……策略产品经理基础知识:2。4策略PRD案例上周我们分享了,怎么编写策略需求文档,这周我们拿个案例,具体的解释下。为了让举例的内容更加丰富,我会让解决问题的方案多一些,这样可写的内容也会多一些。案例的背景1。……“自我”和“自律”,产品经理工作中该怎么选?自律的人,大多更倾向为他人考虑,更容易妥协;自我的人,大多更倾向为自己考虑,更倾向征服。工作中大多数人都比较自律,提意见也是拐弯抹角的表达,增加了很多沟通成本。其实在工作上应该……一套实践中成长起来的“产品管理体系”今天想给大家分享的是一套实践中成长起来的“产品管理体系”,首先借鉴了IBM的IPD(集成产品开发)管理体系,但绝非是飘在空中的理论,因为其中的每一步都是自身所经历实践的知识化和……小白PM跟我来:如何搞定APP中的“搜索”功能?如何搞定APP中的“搜索”功能?本文主要围绕电商这个类别来给大家分析,一起来看看如果让你独立负责搜索功能,你需要干些什么呢?可能大部分人的第一反应是我加一个搜索框和……To新手产品:如何保证快速上线v1。0,同时避免无限改需求?项目管理是产品经理必须的技能,但也是很多年轻产品经理的短板硬伤。一起来听听前辈的建议,enjoy我有很多年轻的产品同事及朋友,每次和他们聊起来,都会和我抱怨,说自……策略产品经理基础知识:2。3策略需求文档上两篇帖子,我们说明了策略需求挖掘和迭代的方法。这周我们分享怎么编写需求文档。一、策略需求文档策略产品的需求文档和功能产品的需求文档,因为编写的初衷都是为了说明:需……两年产品心得:责任、服务、管理不知不觉已经快到两年了,虽然实际上从事产品这项工作内容的时间肯定不止两年,但是在同一家公司担任两年这个岗位,还是值得作为一个时间点好好总结一下的。一、责任产品人对用……微权力下的产品管理前段时间看了一本书叫做《微权力下的项目管理》,其实大部分产品经理也都是在微权力状态下进行工作的,但又要承担巨大的责任,这种权利和责任不对等的情况困扰过我,相信也困扰过很多03岁……产品技术团队:如何引入OKR工作法本文作者将结合自身经验与大家分享:产品团队如何引进OKR?enjoy经常有团队问我,团队或者部门是否可以应用OKR工作法。我一般回答是否定的。像销售、市场、人事、行政这样……作为产品经理,不懂一点个性化推荐原理,怎么行?在之前的文章《针对大众点评V10改版的一些看法》里面提到要想提高用户对内容的点击率,可以通过算法来实现个性化推荐。具体到实操阶段,虽然主要涉及到算法,但作为一名产品经理还是有必……项目立项时,产品经理该了解和注意的事项目立项时,产品经理该了解和注意的事。还有关于项目开发、开发任务评估、技术选型,技术框架等常识。1。产品经理和包工头小奈:怎么了解开发实现功能的方式和难度?大……
青年创业网第十二届企业项目招商路演资源对接大会青年创业网9月7日举办项目推广路演演讲沙龙课青年创业网8月24日举办创业项目路演沙龙演讲课青年创业网第十一届创业项目路演推广交流会青年创业网第九届创业项目路演资源对接大会青年创业网8月3日举办创业项目路演沙龙演讲课青年创业网第十届创业项目路演资源对接大会青年创业网第八届企业项目招商资源对接大会青年创业网第七届创业项目招商路演资源对接大会青年创业网第六届创业项目招商资源对接大会邀请函青年创业网第五届创业项目资源招商对接大会Lyft启动IPO路演计划融资20亿美元

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界