童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

推荐策略中的“召回”

7月15日 不回头投稿
  当你打开一个资讯APP刷新闻时,有没有想过,系统是如何迅速推送给你你想看的内容?资讯APP背后有一个巨大的内容池,系统是如何判断要不要将某条资讯推送给你的呢?这就是笔者今天想跟大家探讨的问题推荐策略中的召回。
  召回是什么
  推荐系统如何根据已有的用户画像和内容画像去推荐,涉及到两个关键问题:召回和排序。
  “召回(match)”指从全量信息集合中触发尽可能多的正确结果,并将结果返回给“排序”。
  召回的方式有多种:协同过滤、主题模型、内容召回和热点召回等,而“排序(rank)“则是对所有召回的内容进行打分排序,选出得分最高的几个结果推荐给用户。
  图1推荐系统的算法流程
  在搜索系统中,用户会输入明确的搜索词,根据搜索词进行内容的召回和呈现即可,但在推荐系统中,用户没有一个明确的检索词(Query)输入,推荐系统需要做的,就是根据用户画像、内容画像等各种信息为用户推荐他可能感兴趣的内容。
  另外,由于没有明确的检索词,推荐系统就需要从整个信息集合中挑选出尽可能多的相关结果,同时又需要剔除相关性较弱的结果,降低排序阶段的工作量。
  怎样的召回策略是好的
  召回策略的评估主要根据两个评价指标:召回率和准确率。
  召回率(Recall)系统检索到的相关内容系统所有相关的内容总数准确率(Precision)系统检索到的相关内容系统所有检索到的内容总数。
  以搜索为例,当用户搜索“北京大学”时,想看到北大相关的网站、新闻等,系统返回了以下三个网页:
  a。北京大学保安考上研究生;
  b。北京互联网工作招聘;
  c。大学生活是什么样的;
  可以看到,只有a是用户真正想看到的,其他两个和用户搜索词无关,而事实上数据库里还有这种网页:
  d。北大开学季;
  e。未名湖的景色;
  d、e这两个网页没被搜索到,但它们和“北京大学”的相关度其实是超过b、c的,也就是应该被搜索(被召回)到但实际并没有显示在结果里的,所以,这个系统的:
  召回率a(ade)0。33;
  准确率a(abc)0。33。
  这是搜索情境下的召回率和准确率,而“推荐”其实就是没有检索词输入时的搜索,例如,用户并没有输入“北京大学”这样的关键词,但其实他是北京大学的学生,对自己学校相关的新闻很感兴趣,推荐系统的召回就是要根据用户画像、内容画像等各种信息,为用户提供他感兴趣的相关内容,所以也存在召回率和准确率的问题。
  召回率和准确率有时存在相互制衡的情况,好的召回策略应该在保证高准确率的情况下也保证高召回率。
  当然,召回率和准确率也是存在一定关系的,而我们在做实际项目的优化目标通常是希望用户所检索的内容能够在召回率和准确率两方面都表现都好。
  举个例子(或许不够准确,仅供参考)如表1,机器在给用户推荐内容的时候,会出现A(准确并召回)、B(准确不召回)、C(不准确召回)、D(不准确不召回)四种情况。那么,最理想的就是A、C两种情况。
  表1内容召回的4种情况
  推荐系统如何召回
  召回策略主要包含两大类,即基于内容匹配的召回和基于系统过滤的召回。
  1。基于内容匹配的召回
  内容匹配即将用户画像与内容画像进行匹配,又分为基于内容标签的匹配和基于知识的匹配。
  例如,A用户的用户画像中有一条标签是“杨幂的粉丝”,那么在他看了《绣春刀2》这部杨幂主演的电影后,可以为他推荐杨幂主演的其他电影或电视剧,这就是“基于内容标签的匹配”。
  “基于知识的匹配”则更进一步,需要系统存储一条“知识”《绣春刀2》是《绣春刀1》的续集,这样就可以为看过《绣春刀2》的用户推荐《绣春刀1》。基于内容匹配的召回较为简单、刻板,召回率较高,但准确率较低(因为标签匹配并不一定代表真的感兴趣),比较适用于冷启动的语义环境。
  2。基于协同过滤的召回
  如果仅使用上述较简单的召回策略,推荐内容会较为单一,目前业界最常用的基于协同过滤的召回,它又分为基于用户、基于项目和基于模型的协同过滤。
  其中,基于用户(Userbased)的协同推荐是最基础的,它的基础假设是“相似的人会有相同的喜好”,推荐方法是,发现与用户相似的其他用户,用用户的浏览记录做相互推荐。
  例如,通过浏览记录发现用户一与用户二的偏好类似,就将用户一点击的内容推送给用户二。
  图2基于用户的推荐
  基于项目(Itembased)的协同过滤中的“项目”可以视场景定为信息流产品中的“内容”或者电商平台中的“商品”,其基础假设是“喜欢一个物品的用户会喜欢相似的物品”计算项目之间的相似性,再根据用户的历史偏好信息将类似的物品推荐给该用户。
  图3基于项目的推荐
  基于模型的协同过滤推荐(Modelbased)就是基于样本的用户喜好信息,训练一个推荐模型,然后根据实时的用户喜好的信息进行预测推荐。
  总体来说,基于协同过滤的召回即建立用户和内容间的行为矩阵,依据“相似性”进行分发。这种方式准确率较高,但存在一定程度的冷启动问题。
  在实际运用中,采用单一召回策略的推荐结果实际会非常粗糙,通用的解决方法是将规则打散,将上述几种召回方式中提炼到的各种细小特征赋予权重,分别打分,并计算总分值,预测CTR。
  例如,根据内容匹配召回策略,用户A和内容甲的标签匹配度为0。6,同时,根据协同过滤召回策略,应该将内容甲推荐给用户A的可能性为0。7,那么就为0。6和0。7这两个数值分别赋予权重(这个权重可能会根据算法的具体情况来确定),得出总分,用它来预测用户可能点击的概率,从而决定是否返回该结果。
  今日头条的召回策略
  今日头条作为业界推荐系统方面的顶级选手,不免有人会好奇,它的召回策略是怎样的?
  今日头条的算法架构师曾在接受采访时表示,今日头条有一个世界范围内比较大的在线训练推荐模型,包括几百亿特征和几十亿的向量特征。但因为头条目前的内容量非常大,加上小视频内容有千万级别,推荐系统不可能所有内容全部由模型预估。所以需要设计一些召回策略,从庞大内容中筛选一个模型组成内容库。
  召回策略种类有很多,今日头条主要用的是倒排的思路。离线维护一个倒排,这个倒排的key可以是分类,topic,实体,来源等,排序考虑热度、新鲜度、动作等。线上召回可以迅速从倒排中根据用户兴趣标签对内容做截断,高效地从很大的内容库中筛选比较靠谱的一小部分内容。基于召回策略,把一个海量、无法把握的内容库,变成一个相对小、可以把握的内容库,再进入推荐模型。这样有效平衡了计算成本和效果。
  参考文献
  【1】闫泽华,《内容算法》,中信出版集团
  【2】CSDN博客:信息流推荐算法实践深入https:blog。csdn。netdengxing1234articledetails79756265
  【3】IBM官网资料探索推荐引擎内部的秘密,第1部分:推荐引擎初探
  【4】今日头条推荐算法原理首公开,头条首席算法架构师带来详细解读https:www。leiphone。comnews201801XlIxFZ5W3j8MvaEL。html
投诉 评论 转载

SaaSPaaS产品设计,如何满足用户个性化需求在设计ToB产品的时候,因为客户的行业,规模体量,商业模式以及内部管理流程的不同,同样的一个需求在不同的公司可能需要不同的解决方案。所以,在产品的设计上,如何能以灵活的方式在同……B端产品:“易用”与“有用”,两者要兼具本文笔者从五个方面产品规划、架构设计、功能设计、数据设计、上线运维,来分析:B端产品经理,如何更好地做用户体验设计。谈到用户体验设计,传统的说法就是:人机交互设计、界面设……推荐策略中的“召回”当你打开一个资讯APP刷新闻时,有没有想过,系统是如何迅速推送给你你想看的内容?资讯APP背后有一个巨大的内容池,系统是如何判断要不要将某条资讯推送给你的呢?这就是笔者今天想跟……产品体验日记(二)日常储备,发现优秀的设计文章给大家分享一些作者觉得优秀的设计,并分析优秀的点在哪里,一起来看看1。支付宝设计点:对用户的操作进行预判,预判结果大概率满足大部分人即可,体验设计的行为是将产品……用户体验分析互联网平台建设(十九)本文包括体验即一切、什么是用户体验、用户体验的五个层级和一条主线、建立自上而下的用户体验设计标准规范体系四部分。enjoy以下是正文:我们开始分享平台设计的用户体验……中级产品方法论(一):产品满足用户的哪一个核心需求从事产品行业快有2年时间了,最近完成了一款狼人杀产品从0到1的产品设计,活跃用户在一个月时间内突破1w,累计用户达50w。希望记录下自己的产品思考,与大家分享,求同存异。文章结……产品经理规划产品之需求梳理业务需求、用户需求和功能需求这三个概念,对于产品新人来说,经常容易混淆,但了解这些是身为产品经理的一个基本功。问:业务需求对于产品经理来说很重要么?答:业务真的是很……内容、软件、产品,IoT厂商成功三因素物联网(InternetofThings)这几年特别火,引发了一波智能物联网设备的热潮。参与的厂商非常多,有allin的,有卡位的,有跟风的,有瞎扑腾的,不一而足,热闹非凡。那……你应该知道的5种刷新样式刷新是最常用的操作之一,主要作用是刷新页面中的缓存,从服务器获取新的内容。最近在浏览APP的过程中注意到,不同场景中使用的刷新样式完全不同,再此之前虽然每天都在进行刷新操作,却……如何有效地选择列表信息展示?当页面列表中需要摆放大量信息时,该如何做出判断并选择性地展示呢?本文将会从四个思路展开,来对这个问题进行分析。当页面列表中需要摆放大量信息时,该如何判断哪些是重要的信息并……构建贯穿于产品全生命周期的体验设计做为一名交互设计师,日常的主要工作内容就是针对产品开展交互过程研究和设计,输出符合用户需求的产品交互设计方案,向上承接用户诉求,向下驱动视觉研发。笔者将针对这2年的实际工作经历……我在风靡欧美的DTC品牌做产品DTC,DirecttoCostomer,直面消费者,这种商业模式诞生于沃顿商学院,已经进入快速发展期,当前美国有超过400家DTC创业公司,融资已经超过30亿美元。风靡……
为什么很多互联网公司在开曼群岛注册?春天来了?工商总局:今后创业注册公司将零门槛创业公司如何鉴定名字的好坏与否创业难:注册一家网络公司要填40多张表数码港:香港式的互联网创业梦新加坡公司注册的优势、流程、规则简介北京注册公司详细流程解读创业借鉴:10个最酷的适合协作办公的地方解读在上海注册公司的优势与程序创业者如何注册公司?开公司的流程及费用在深圳如何注册公司?需要哪些手续?个人注册公司的流程和费用与君初相识虐心台词句子汇总与君初相识经典台词句子大全AI研究员5重境界PK赛关于温暖的作文社区生活温暖了我玛雅人的12大未解之谜枇杷叶煮水用老叶还是新叶枇杷叶怎么煮水止咳张作霖的保镖宫猴子的结局是什么样的奥尼尔湖人现在只有四位名人堂球员,霍华德不配,他还不够格核桃哪里买(核桃仁一般哪里有卖)生殖器疱疹医院哪个好(梅毒能治好吗)从多个方面去看网站优化思维写植树节的作文(精选3篇)唇釉是什么颜色据说符合所有肤色

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界