童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

一文读懂无处不在的智能推荐系统

2月26日 枯心人投稿
  推荐系统是人与信息的连接器,用已有的连接去预测未来用户和物品之间会出现的连接。推荐系统本质上处理的是信息,它的主要作用是在信息生产方和信息消费方之间搭建起桥梁,从而获取人的注意力。
  对于智能推荐系统相信大家已经不再陌生了,现在它已经在内容分发平台、电商、广告、音视频等互联网产品中随处可见。
  一、为什么越来越多产品需要做推荐系统?
  主要有以下两方面的原因:
  (1)信息过载
  互联网上每天都在产生海量的信息,用户想要迅速和准确地找到他们感兴趣的内容或商品越来越困难。如果用户的目标明确,他可以使用搜索(其实搜索也是有关键字的推荐、推荐是无关键字的搜索),但很多时候我们的用户是没有明确目标的。这时候如果产品能够高效匹配用户感兴趣的内容或商品,就能提高用户体验和粘性,获取更多的商业利益。
  (2)长尾效应
  绝大多数用户的需求往往是关注主流内容和商品,而忽略相对冷门的大量“长尾”信息,导致很多优秀的内容或商品没有机会被用户发现和关注。如果大量长尾信息无法获取到流量,信息生产者就会离开平台,影响平台生态的健康发展。
  二、认识推荐系统
  推荐系统定义:推荐系统是人与信息的连接器,用已有的连接去预测未来用户和物品之间会出现的连接。
  推荐系统本质上处理的是信息,它的主要作用是在信息生产方和信息消费方之间搭建起桥梁,从而获取人的注意力。
  世界是一个数字化的大网,从人类角度来看里面只有两类节点:人和其他。万事万物有相互连接的大趋势,比如:人和人倾向于有更多社会连接,于是有了各种社交产品;比如:人和商品有越来越多的消费连接,于是有了各种电商产品;比如:人和资讯有越来越多的阅读连接,于是有了信息流产品。
  一个完整的推荐系统通常由以下部分组成:用户端前台展示、后台日志系统、推荐算法引擎。
  个人绘制的推荐系统架构图
  前台展示:就是你在app或网页上看到的推荐、猜你喜欢、你的个性化歌单、经常一起购买的商品等部分展示的内容。
  后台日志系统:用户数据、用户行为数据、内容数据等日志数据采集、存储、清洗和分析,从而建立画像体系,包括用户画像和物品画像。
  推荐算法引擎:各种算法模型、模型训练配置、推荐效果评估体系。
  搭建推荐系统所需投入:
  首先要搭建团队,其中算法工程师是必不可少的,当前也是薪酬较高的;其次还要购置存储和计算资源,如果不是云产品你可能还要自己购置硬件设备;然后还有长时间的数据积累和算法优化。
  推荐系统是一个需要长期持续投入的东西,从投入产出比和时间成本上来说,产品经理不要随便拍大腿就要做一个智能推荐系统。
  如何判断一个产品是否需要推荐系统?
  第一,看看产品的目的。如果一款产品的目的是建立越多连接越好,那么它最终需要一个推荐系统。
  典型的目的不是建立连接的产品就是工具类产品,单纯为提高人类某些工作的效率而存在,比如:AXURE、ERP虽然如今很多产品都从工具切入想做成社区,但至少在工具属性很强时不需要推荐系统。
  第二,看看产品现有的连接。如果你的产品中物品很少,少到用人工就可以应付过来,用户产生的连接不多,这时候不适合搭建推荐系统。应该要有长尾效应才可能让推荐系统发挥效果。
  三、推荐算法协同过滤基本原理
  推荐系统里最经典的算法非协同过滤莫属。协同过滤又称基于领域的算法,核心在于协同,互帮互助。其又可以分为两类:基于用户的协同过滤算法(UserCF)、基于物品的协同过滤算法(ItemCF)。
  (1)基于用户的协同过滤算法(UserCF)
  当一个用户需要个性化推荐时,可以先通过用户的相似度计算找到和他有相似兴趣的其他用户,然后把那些用户喜欢而他没有听说过的物品推荐给他,这种方法称为基于用户的协同过滤算法。
  如用户A曾经看过《增长黑客》、《流量池》和《原则》,用户B曾经看过《增长黑客》和《原则》,当我们给B推荐时,推荐系统计算出A和B的相似度比较高,而A曾经读过的《流量池》用户B没有读过,因此就将《流量池》推荐给B用户,这就是经典的基于用户的协同过滤。
  由上面的描述可知,基于用户的协同过滤算法主要包括两个步骤:
  找到和目标用户兴趣相似的用户集合;
  找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。
  (2)基于物品的协同过滤算法(ItemCF)
  介绍基于物品的协同过滤之前,先来看下基于用户的协同过滤可能带来的问题。
  用户数据量比较大时,需要计算的用户之间的相似度会比较多,计算量大。
  构建用户向量时是使用用户对已消费过的物品的评分行为来构建的,用户的兴趣是会随时间改变的,导致计算相似用户的频率较高。
  数据比较稀疏,用户和用户之间有共同的消费行为实际上是比较少的,而且一般都是一些热门物品,对发现用户兴趣帮助也不大。
  基于物品的协同过滤算法,给用户推荐那些和他们之前喜欢的物品相似的物品。
  用户A、B和C分别喜欢的物品如图所示,则计算物品2与物品1的相似度的公式为:
  物品2与物品1的相似度同时喜欢物品1和物品2的用户数喜欢物品1的用户数23;
  物品3与物品1的相似度0;
  物品4与物品1的相似度1;
  如果对一个喜欢了物品1的用户D进行推荐,则推荐的优先级为423。
  基于物品的协同过滤算法主要包括的步骤:
  计算物品之间的相似度;
  根据物品的相似度和用户的历史行为给用户生成推荐列表。
  以上只是协同过滤算法的基本原理,现实中的算法模型要远比这个复杂,而且很少采用单一模型,基本是组合模型。我也是刚刚才开始做推荐系统,至于更为复杂的矩阵分解、基于机器学习的推荐算法等后续我自己搞明白再单独成文分享给大家。
  四、推荐系统的冷启动
  推荐系统需要已有的连接去预测未来用户和物品之间会出现的连接。
  对于BAT(百度腾讯阿里)、TMD(头条美团滴滴)这样的巨头他们已经积累了大量的用户数据,在某个产品上智能推荐的时候不存在冷启动的问题。
  对于很多没有大量用户数据的产品来说,如何在这种情况下设计推荐系统并且让用户对推荐结果满意,从而愿意使用推荐系统,就是冷启动的问题。
  冷启动问题主要分两大类:
  (1)用户冷启动
  用户冷启动主要解决如何给新用户或者不活跃用户做个性化推荐的问题。当新用户到来时,我们没有他的行为数据,所以也无法根据他的历史行为预测其兴趣,从而无法借此给他做个性化推荐。
  (2)物品冷启动
  物品冷启动主要解决如何将新的物品或展示次数较少的物品推荐给可能对它感兴趣的用户这一问题。
  一般来说,可以参考如下方式来解决冷启动的问题:
  利用用户注册时提供的年龄、性别等数据做粗粒度的个性化推荐;
  利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品;
  要求新注册用户在首次登录时选择一些兴趣标签,根据收集到的用户兴趣信息,给用户推荐同类的物品;
  给新用户或不活跃用户推荐热门排行榜,然后等到用户数据收集到一定的时候,再切换为个性化推荐。
  五、评估推荐系统的效果
  推荐系统推荐质量的高低可以通过如下指标进行评估,作为推荐系统的反馈结果他们也是算法模型迭代优化的依据。这些指标有些可以定量计算,有些只能定性描述。
  (1)预测准确度
  准确度表现在用户对推荐内容的点击率,点击后的各种主动行为(购买、分享等),停留时长等。
  (2)覆盖率
  覆盖率是描述一个推荐系统对物品长尾的发掘能力。最简单的定义是,推荐系统推荐出来的物品占总物品的比例。
  (3)多样性
  良好的推荐系统不仅仅能够准确预测用户的喜好,而且能够扩展用户的视野,帮助用户发现那些他们可能会感兴趣,但不那么容易发现的东西。
  比如:你在某个电商网站买了一双鞋子,然后你每次登录这个网站他都给你推荐鞋子,这种情况你就会对推荐系统很失望,这就是典型的不具备多样性。假如知道了用户的喜好,推荐系统大部分给他推荐感兴趣的,小部分去试探新的兴趣是更优的策略。
  (4)新颖性
  新颖的推荐是指给用户推荐那些他们以前没有听说过的物品。
  (5)惊喜度
  如果推荐结果和用户的历史兴趣不相似,但却让用户觉得满意,那么就可以说推荐结果的惊喜度很高。与新颖性的区别是推荐的新颖性仅仅取决于用户是否听说过这个推荐结果。
  (6)信任度
  如果你有两个朋友,一个人你很信任,一个人经常满嘴跑火车,那么如果你信任的朋友推荐你去某个地方旅游,你很有可能听从他的推荐,但如果是那位满嘴跑火车的朋友推荐你去同样的地方旅游,你很有可能不去。这两个人可以看做两个推荐系统,尽管他们的推荐结果相同,但用户却可能产生不同的反应,这就是因为用户对他们有不同的信任度。
  (7)实时性
  推荐系统的实时性,包括两方面:一是实时更新推荐列表满足用户新的行为变化;二是将新加入系统的物品推荐给用户。
  (8)健壮性
  任何能带来利益的算法系统都会被攻击,最典型的案例就是搜索引擎的作弊与反作弊斗争。健壮性衡量了推荐系统抗击作弊的能力。
  参考资料:
  项亮。《智能推荐实践》;
  邢无刀。《推荐系统三十六计》。
投诉 评论 转载

房产中介产品分享功能的六种形式本文根据房产中介产品销售流程中不同的场景,详细介绍了房产中介系统分享功能的六种形式:图文分享、链接分享、视频分享、微信分享、短信分享、文字分享。分享功能是互联网产品最有效……拨动情绪的内容设计QQ团队短视频的完整设计过程作者将向你展示QQ团队在打磨短视频拍摄能力的思考和经验沉淀,展现一个完整的设计过程。一、文章概述前言短视频产品成为年轻用户社交娱乐的主场景,QQ在短视频社交的……知乎关注页的屏蔽逻辑优化知乎关注页的屏蔽逻辑优化主要在两个方面:一是不再过滤已屏蔽话题的内容动态;二是不再将短时间内,不同知友对同一内容的动态过滤为一条。知乎产品专栏发布了一篇新文章:关注页的屏……电商O2O后台产品的需求对接和产品设计后台产品笼统地概括来说就是各种管理系统,本文作者根据自己的经验总结了需求对接和产品设计两方面完整的工作内容,大家可以参考学习。互联网产品领域,可以笼统地分为前台产品和后台……案例分析:绘制流程图需要注意哪些事项?流程图应用于许多领域,在互联网产品设计中,无论是产品经理、交互设计师,或者开发人员,都经常接触到各种类型的流程图。流程图不应该考验阅读者的理解能力,因此如何绘制清晰简洁的流程图……用HMW方法,分析享物说平台的社交优化方向HMW:Howmightwe,我们可以如何,是借鉴DesignHackathon中的一种方法,主要适用于头脑风暴前去寻找解决问题的方向,扩展我们的思路,而不是局限在具体的解决方……你的设计,用户真的看得懂吗?设计师经常犯的一个错误就是上帝视角,高估了用户的理解能力。一顿操作猛如虎,结果用户可能根本没看懂你的设计。前段时间个人所得税app上线,用户可以在线办理个税专项扣除申报。……交互设计、人机交互、用户体验设计三者有何异同本文将从历史沿革、现有状况、未来发展三个方面,对交互设计,人机交互,用户体验设计进行详细分析。关键词:交互设计,人机交互,用户体验设计。在学习和生活中,我们经常会遇……如何潜移默化地影响用户?那就在设计中提供更好的选项如何更好的在潜移默化中去影响用户呢?试试在设计中提供更好的选项在下面这幅图中,哪一个盘子会让你吃得更少?是用20cm的小盘子,还是直径30cm的大盘子?凭直觉,我们会觉得……一文读懂无处不在的智能推荐系统推荐系统是人与信息的连接器,用已有的连接去预测未来用户和物品之间会出现的连接。推荐系统本质上处理的是信息,它的主要作用是在信息生产方和信息消费方之间搭建起桥梁,从而获取人的注意……子弹短信的交互结构有哪些创新之处?本文作者将通过对子弹短信交互结构的分析,总结其在交互结构上的创新之处,以及在用户体验方面的优点和运营策略。交互设计中,我们经常会遇到一些通用的交互结构,这些交互结构几乎会……解析:自营电商后台系统架构接上一篇文章,有同学提出希望讲一下关于电商后台的业务内容。所以今天就和大家分享一下自采自建仓库第三方发货业务模式的电商后台产品架构。首先让我们先看一张脑图:各系统职……
B端产品的三大价值:降本、增效、有序后台产品方法论:如何搭建数据看板?电子发票在公司平台系统与税控开票系统中交互的产品思考一个优秀的管理型系统是怎样的?平台与自营商品管理系统比较做产品,为什么要画这些图?Apple的设计哲学:声音篇B2C电商系统产品架构:全局分析系统定义与职责3个步骤,带你洞察留存提升的秘诀产品反思:“死”在挑战微信的路上包容性设计的价值以税费为基础的线上风控审批模型概要
商品房预售与商品房现售有什么不同我爱读书作文300字任元受耿时举有和篇谨用韵写寄蔷薇绽放帕尔马!王蔷两盘横扫斯蒂文森,第五次闯进巡回赛决赛冬季滋补养生,最好以食用海参为主消费者惩罚性赔偿司法解释是什么?橄榄油颜色越深越好吗建议书的书信格式是怎么样win7系统怎么调节屏幕亮度经济热观察丨全民热议电影的氛围回来了!春节档海南票房迎开门红同被誉为“台湾第一美女”,你觉得萧蔷年轻时和林志玲相比如何呢 墨梅一十首其七

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界