童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

网易云音乐分析之推荐算法

12月12日 倾城傷投稿
  文章从网易云音乐的推荐功能出发,为我们分享了互联网的常用推荐策略。
  在上一篇文章中我们对网易云音乐的核心功能音乐推荐进行了简单分析,时隔三个月,从appstore等评分中可以看出,部分用户对网易云音乐推荐曲目的准确度存在质疑。本篇文章我们从网易云音乐的推荐功能出发,结合我的实习工作,聊一聊互联网的常用推荐策略。
  网易云音乐推荐
  首先来回顾一下云音乐的推荐功能。音乐推荐是创始人丁磊先生愿景最直接的体现,也是网易云音乐的主推功能和核心竞争力所在,备受用户推崇。
  推荐算法简单说就是在海量的用户数据(行为记录等)中对用户进行划分,对同一群体的用户推荐其他用户喜欢的音乐。这其中需要给音乐分类并建立评分细则、建立用户模型、寻找相似用户。基于用户的行为数据将歌曲分类匹配实现“盲听”。
  网易云将音乐推荐分成三个部分:私人FM、每日歌曲推荐、推荐歌单。
  (1)从准确性、多样性角度分析
  私人FM(准确性低、多样性高):多样性高能为用户带来新鲜感,如果发现了一首从未听过但特别喜欢的歌,会带来惊喜感,调动用户正面情绪。可是由于准确性低,很可能新歌很不被用户喜欢,所以在私人FM在播放界面设置“删除”、“下一首”两个按键便于用户切换歌曲。
  每日歌曲推荐(准确性高、多样性低):准确性高使得每日推荐的20首歌曲比较好的满足用户口味,但是存在音乐类型单一化的问题,因此设置了播放列表以提供用户浏览、操作的权利,弥补曲目单一化带给用户的失望。
  推荐歌单(准确性中、多样性中):推荐歌单有别于其他两个个性化推荐功能,它准确性多样性的阈值不只是由算法决定的,更多的是它功能形式所决定的,首先把功能的面向对象分为两类,一类是用户,一类是UGC歌单,系统分别为歌单和用户加标签以提高准确度,由于UGC歌单是由很多用户创建,所以UGC歌单就具有多样性,两者糅合从而保证了准确度和多样性共存。
  (2)从操作流程上分析
  三个功能从看见功能按键到最终获得推荐曲目的步骤:
  看见私人FM点击私人FM获取音乐
  看见每日歌曲推荐点击每日歌曲推荐看见推荐列表筛选喜欢曲目点击喜欢曲目获取音乐
  看见推荐歌单点击推荐歌单跳转歌单页面发现类型标签筛选类型标签点击类型标签看见标签下的推荐歌单筛选歌单点击歌单浏览歌单列表筛选喜欢歌曲点击喜欢歌曲获取音乐
  可以发现三种方式获取推荐音乐的操作流程由简入繁。
  (3)从用户使用阶段分析
  三个功能对应着三种用户阶段:
  私人FM新用户:私人FM位于首页黄金位置,新用户初次体验的产品功能时大概率点击这个按键,所以要简化用户使用流程,用户在快速感受产品个性化推荐的魅力后才产生继续了解其他功能的欲望。
  每日歌曲推荐普通用户:新用户使用私人FM过后需要不一样的体验来满足个性化需求,每日20首歌曲推荐对用户来说是可预知的,20首上限的设定给用户物以稀为贵的感觉,会珍惜每日的推荐,而每日更新无法回看以往推荐的设定,会让用户觉得一天不看就错过了什么的紧迫感。推荐算法设定了基于不同用户行为的权重,“下载”最高,收藏、搜索、分享其次,此外你也可以点击“不感兴趣”,或许会避开这类歌。
  推荐歌单深度用户:歌单是云音乐连接个性化推荐和社交的重要桥梁,推荐歌单是个性化推荐功能最后一环,在深度体验了推荐歌单之后,用户会得到歌单可被分享和推荐的认识,很可能会产生自建歌单的冲动,而歌单在云音乐中具有社交属性,用户可以互相收藏、评论、分享歌单,而且歌单在个人主页中也反映了个人音乐风格,让用户能够更好地展现自己给他人。
  (4)从参与元素分析
  私人FM:系统
  每日歌曲推荐:系统自己
  推荐歌单:系统自己其他用户
  欧氏距离vs余弦相似度
  在线下导购时代,导购员会通过系统的话术掌握消费者的情况,来推荐商品。类比导购员推销时的思维逻辑,我们可以得到音乐推荐算法需要解决的三个核心问题:
  将用户信息转化为用户类型;
  了解曲目的归属类型;
  将不同类型的用户与不同类型的曲目对应;
  我们怎么量化两个事物之间的相似度呢?常见的方法是利用欧式距离和余弦相似度。以A、B用户间相似度为例:
  利用欧式距离时,我们把A、B用户看做两点,用两点间距离表示二者相似度。
  使用余弦相似度时,则把二者看成同一坐标系下的两个向量。两个向量间夹角大小反应出他们的相似度,夹角越小则相似度越大。二维空间向量表示为r(x1,x2),多维空间向量表示为r(x1,x2,xn)
  比如,假设用户有5个维度
  对流行的喜欢程度(15分),对摇滚的喜欢程度(15分),对民谣的喜欢程度(15分),对说唱的喜欢程度(15分),对爵士的喜欢程度(15分)。
  用户A:对流行的喜欢程度3,对摇滚的喜欢程度1,对民谣的喜欢程度4,对说唱的喜欢程度5,对爵士的喜欢程度0,用户A可以用向量表示为rA(3,1,4,5,0)
  一个用户B:对流行的喜欢程度3,对摇滚的喜欢程度4,对民谣的喜欢程度5,对说唱的喜欢程度0,对爵士的喜欢程度2,用户B可以用向量表示为rB(3,4,5,0,2)
  对于向量A和B而言,他们的在多维空间的夹角可以用向量余弦公式计算:
  余弦相似度取值在0到1之间,0代表完全蒸饺,1代表完全一致。那么用户A和B的相似度计算:
  即代表了两个用户音乐偏好的相似程度。
  余弦相似度是一种很好的数据策略,对计算用户类型是很好的解决方法,我们来对比分析它和欧式距离。
  上图中,我们反方向延长点A,很明显向量A和B之间夹角余弦值不变,但欧式距离发生改变。也就是说,利用欧式距离更能突出数值绝对差异,因此常用于歌曲间相似度的计算。例如,喜欢A歌曲的用户数量是10000,喜欢B歌曲的用户数是20000,因为样本足够大,我们认为用户对歌曲喜爱的程度相同,也就是相同的分数,那么直接通过数量上的差异来计算相似程度即可。
  由此可见,小到一个数学公式,大到一个数据模型甚至是推荐系统,都没有单纯的对错之分,只有是否适合产品需求,能在有限的计算量内结合情景满足预期。先入为主的方法论是数据策略工作中的大忌。
  常见推荐方法
  推荐和搜索本质有相似的地方。搜索满足用户从海量数据中迅速找到自己感兴趣内容的需求,属于用户主动获取。推荐则是系统从海量数据中根据获取到的用户数据,猜测用户感兴趣的内容并推荐给用户,属于系统推荐给用户。本质上都是为了在这个信息过载的时代,帮助用户找到自己感兴趣的东西。这里我们介绍四种常见的推荐方法。
  基于歌曲的推荐
  基于歌曲的协同过滤
  基于用户的协同过滤
  基于标签的推荐
  (1)基于歌曲的推荐
  基于歌曲的推荐是比较基础的推荐方法,根据我们播放收藏或下载的某类型的歌曲,推荐这种类型下的其他歌曲。这种方式很容易被理解,但是比较依赖内部曲库完善的分类体系,且需要用户有一定的数据积累,不适用于冷启动。
  (2)基于歌曲的协同过滤
  协同过滤与传统的基于内容分析直接进行推荐不同,协同过滤会分析系统已有数据,并结合用户表现的数据,对该指定用户对此信息的喜好程度预测。
  基于歌曲的协同过滤,通过用户对不同歌曲的评分(下载收藏评论分享对应不同分数)来评测歌曲之间的相似性,基于歌曲之间的相似性做出推荐;一个典型的例子是著名的“啤酒加尿布”,就是通过分析知道啤酒和尿布经常被美国爸爸们一起购买,于是在尿布边上推荐啤酒,增加了啤酒销量。
  计算用户u对歌曲j的喜爱程度:
  N(u)表示与用户有关联的歌曲歌单等集合,wji表示歌曲歌单j和i的相似度,rui表示用户对i的打分。
  推荐时也要综合考虑其他业务数据,比如两首歌曲越多的被加入两个歌单,则认为两首歌越相似。
  (3)基于用户的协同过滤
  基于用户的协同过滤是通过用户对不同歌曲单的行为,来评测用户之间的相似性,基于用户之间的相似性做出推荐。这部分推荐本质上是给相似的用户推荐其他用户喜欢的歌曲,一句话概括就是:和你类似的人还喜欢下列歌曲。
  计算用户u对歌曲i的喜爱程度:
  N(i)表示对歌曲单i有过行为的用户集合,wuv是用户u和用户v之间的相似度,rvi表示用户v对歌曲单i的打分。
  (4)基于标签的推荐
  歌曲有标签,用户也会基于行为被打上标签,系统通过标签将二者关联。
  根据标签进行推荐需要产品在初期就有标签概念,网易云音乐不同的曲目类型是天然的素材标签,通过对UGC内容的处理和对用户行为的数据分析则可以得到用户标签。
  总结
  在广场舞大妈都在谈论AI的时代,基于机器学习的推荐算法实在算不上风口。但是没有任何一种推荐方法或系统能适用全部的情形,在真正实现过程中一定要对算法有熟悉的掌握,另外和一些前辈的交流让我认识到,一个优秀的pm必备的素养之一就是对每一条业务线深刻的理解。
  在构建一个推荐方法时,我们一般会用到加权、降权、屏蔽。一个方法是否能支持灵活调节权重,后期是否能持续迭代,都是要通过不断的测试验证,最终让数据说话。
  根据一些用户反馈和我自身的使用感受,提一些建议:
  网易云音乐推荐算法把用户最近的行为权重置高,因此系统容易大量推荐相似类型的歌曲,使用户审美疲劳、兴奋度降低。建议在算法中加入用户使用场景的分析,并对同类型歌曲出现的次数、位置加以限制;
  针对长尾冷门歌曲,由于数据量相对较少,更要重视效果反馈;深度挖掘数据,丰富推荐元素,比如根据某位用户喜爱歌手的创作成长背景,推荐影响该歌手的音乐、专辑、歌手;
  网易云的情怀令人欢喜,在商业化的今天弥足珍贵。祝越来越好。
  最后,万望不吝赐教。
投诉 评论 转载

爱奇艺泡泡VS腾讯视频doki:明星粉丝社区功能对比分析文章针对爱奇艺泡泡和腾讯视频doki展开对比分析,希望能够给你带来一些启发思考。分析目的本人在视频行业从业一年,希望通过对当下最热的两款移动视频APP爱奇艺和腾讯视……BAT瓜分城市交通O2O,三足鼎立形成科技的不断发展,使得城市交通不断产生新的商业模式,而这种变化在移动互联网的推动下大有愈演愈烈之势。近年来,城市经济快速发展,也暴露出城市交通问题,出行难在各大中小城市问题……吸猫引导的新兴文化潮流:中国猫次元经济现象研究今天,你吸猫了吗?猫咪亚文化正在引导新一轮文化潮流。《妖猫传》的小黑猫Luna刚刚席卷5亿票房,很快《有猫在》又杀上互联网。2月1日,爱奇艺播出网剧《有猫在》……基金公司高大上,做起App来又如何呢?本文重点不在于基金公司电商化对外如何战略拓展前进,而是回过头来看看各家基金公司自己的APP端。现状是怎么样的,以及笔者对此横向比较的定性分析,以及个人关于基金电商App如何耍起……陌生人社交应用“如故”产品逻辑诊断本文旨在对如故的产品逻辑进行诊断。通过分析用户需求、业务需求,对比竞品成功经验来诊断如故产品逻辑存在的问题,并提供改进建议。如故概况如故是一款专注于人群匹配的,帮助……高德手机地图产品分析:未来搜索将从地图开始未来的搜索从地图开始。今后的所有商务活动都将通过地图展开,使之成为兵家必争之地。要将移动流量变现为真金白银,地图将发挥至关重要的作用。目前整个中国电子地图市场目前处于应用……2018年“互联网文明”观察报告:这些产品越用越“文明”?2018年1月16日,腾讯研究院与深圳市文明办联合发布了首个“互联网文明”年度观察报告。通过考察互联网在促进社会文明建设的各个领域中生发的价值和能量,探讨互联网与文明创建的互动……网易云音乐分析之推荐算法文章从网易云音乐的推荐功能出发,为我们分享了互联网的常用推荐策略。在上一篇文章中我们对网易云音乐的核心功能音乐推荐进行了简单分析,时隔三个月,从appstore等评分中可……网易云音乐产品分析报告本文试以一个产品新人的角度,从市场情况、产品概述、用户分析、核心模块、用户反馈五个维度,对网易云音乐(iOSv4。3。5)进行浅析。1。市场分析1。1行业情况……“随手记”产品分析同期的产品已经下坡,随手记凭什么坚挺三年前开始接触的记账APP,那时候朋友给我安利的不是随手记就是挖财。如今三年过去,随手记活跃用户规模已达1326。3万(易观分析2017年Q3),接近三年前的4倍(370万),……用户体验喜马拉雅APP以喜马拉雅APP为分析产品,在产品体检的实践中不断地学习用户体验,了解用户体验,总结用户体验,希望可以为大家提供一种学习知识的方法,大家如果觉得分析方法和结果有误,欢迎大家留言……深度分析:上线仅500天的抖音,居然PK掉了快手和美拍,这个产品匠心打磨200天,仅推出市场半年用户量突破1亿,日播放视频超10亿,干翻老牌短视频玩家快手和美拍,长期占据摄影与录像榜首,总排行榜第二名,抖音从8人团队起家是如何在短短50……
最佳比例的秘密!教你如何在设计中充分运用黄金比例Inlineediting可以怎么玩新技能Get婚恋产品基于KanseiEngineering的为儿童设计网页产品设计:需求和原型中间隔着一堵墙设计与消费,生活抉择的考量瓦萨号沉船与你的App很配做好发现页面应把握好的3种页面类型微信下拉拍视频被回滚,又一颗“彩蛋”陨落了APP数据图表设计的类型和制作方法全方位总结干货!由浅入深科普最常用的八种HTML5动效制作手法移动端的数据输入与存储那天笑如阳光过了担保期限担保人还承担责任吗?舒适葡萄紫的针织上衣低调不艳,配黑色的西装半裙精致有质量两酒鬼,冷吗灭火器需要所有车辆配备吗是否存在只发作过一两次癫痫再也没有发作过的情况?人体煤气中毒的症状有哪些火出圈的羊了个羊再玩亿遍过了50岁后,女性除了补充钙,这4种营养素也需及时补充家用料理机好还是破壁机好千万别在乱买了安全剃刀的发明当一个人进了监狱,他的下半辈子是不是就完了?

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界