推荐系统常用模型总结
9本电子书放文末,自取推荐系统的不同阶段
推荐系统的模型部分由召回层,排序层和重排层组成。而在进入召回阶段之前,通常需要构建索引和特征,且排序阶段还可以划分成粗排和精排,以便更精准,更有效地给用户推荐到合适的商品。推荐系统的五个阶段
显然,从构建特征到得到最终的推荐列表,我们可以得到如下几个阶段。
索引特征:会根据内容特性提前建立若干种类型的索引。
召回阶段:用户请求时会从各种索引种取出千万条item。
粗排阶段:针对这上千万条item,进行第一遍打分,再筛选出几百条或者千条。这个阶段的排序模型一般都比较简单,能够过滤掉一些与用户兴趣明显不相关的。
精排阶段:得到几百条item后,精排阶段会建立相对精细的模型,根据用户的画像,偏好,上下文,结合业务目标进行排序。一般精排后返回50100条给到engine侧。
重排阶段:engine侧拿到精排的50条item。还会做很多的人工干预和产品逻辑,比如item之间的多样性,产品策略逻辑,比如热门,置顶,多种内容之间的位置混合等等。最终会返回510条左右的item,曝光给客户端。根据业务特性,在线流程还有许多比较细的模块,比如去重服务,避免给用户推荐重复的内容。特征预处理,特征抽取等模块。召回阶段和排序阶段的特点
简单总结下召回阶段和排序阶段的特点如下:召回阶段:候选集规模较大、模型和特征相对简单,速度快。排序阶段:候选集规模不大,目标是保证排序的精准,一般会使用复杂的模型和特征。推荐系统召回阶段常用模型召回模型的演化关系
召回模型从传统的召回算法,如基于用户的协同过滤、基于商品的协同过滤、基于矩阵分解的召回算法等,演变到embedding相关的模型,如Item2Vec召回,FM召回,以及基于GraphEmbedding的召回模型,如DeepWalk,Node2Vec等模型,对于一些Item还有包含Word2Vec、FastText、Bert等基于内容语义的召回算法,当然还有如YoutubeDNN、DSSM等基于深度学习的召回算法,将比较常用的召回算法整体成如下图所示的思维导图,方便大家有一个比较系统的认识。
多路召回的必要性
在召回阶段,我们通常要考虑召回率和计算速度,以新闻推荐为例,为了保证用户尽可能地感兴趣,同时还要兼顾热点和时效性数据,常常会使用多路召回。下图显示了多路召回的方法。
推荐系统排序阶段常用模型排序算法的演变关系
排序算法大体经过了初期阶段(2010年前)、中期阶段(2010年2015年)和深度阶段(2016年至今),其中,初期阶段主要是人工特征线性模型;中期阶段主要是自动特征交叉线性模型或树模型;深度阶段主要是基于神经网络的各种模型。
初期阶段,主要是进行各种特征工程,模型主要使用LR模型。
中期阶段,进行二阶、高阶特征交叉,使用FMFFM、GBDTLR、XGBoost等树模型。
深度阶段,开始将特征映射至多维空间中,然后再通过多层网络去学习特征之间的相关性(FNN、PNN、WideDeep、NFM、AFM、DeepFM、xDeepFM等)。
按照不同的阶段,将常用的排序模型整理成如下图所示的思维导图。
当然,上面整理的召回算法和排序算法只是一部分,供大家进行参考,也可以将你自己学习过程中用到的相关算法加以整理,方便学习。
看完本篇如果对你有用请三连,你的支持是我持续输出的动力,感谢,笔芯
以下9本书电子版免费领,直接送,想要哪本私我下说声,我发你
《2022年Q3最新大厂面试题》电子书,部分截图如下:
加息75基点!美股上演大变脸戏码,鲍威尔称暂停加息还为时过早中新经纬11月3日电美股上演大变脸戏码。美股三大指数低开后横盘波动,受美联储宣布加息75个基点影响,三大指数集体拉升翻红,道指一度涨超1。随后,美联储主席鲍威尔发表讲话谈到,仍有必
盘前必读丨美联储连续第四次加息75个基点,中国联通回应与腾讯新设合营企业当地时间周三,美股三大指数集体收跌,纳指跌3。36,标普500指数跌2。5,道指跌1。55。大型科技股表现不佳,苹果Alphabet和微软下跌超过3。亚马逊奈飞和MetaPlatf
2022第十七届南昌国际汽车展暨新能源智能汽车展开展图为2022第十七届南昌国际汽车展现场,几位市民在一家新能源汽车品牌展区观看和体验车辆。刘力鑫摄图为2022第十七届南昌国际汽车展现场,几位市民从一辆参展车辆前走过。刘力鑫摄图为2
高质量的成熟文案1。以珍惜之心不放纵自己,以信任之心不限制他人。2。人都会犯错,所以铅笔的另一头是橡皮。3。人心各有所感,角度不同,又怎么相互理解。4。人总是珍惜未得到的,而遗忘了所拥有的。5。选
众泰摘帽,推出新车后又要大手笔布局新能源有着豪车外形的国民神车回来了!在刚刚发布新车后,ST众泰11月1日晚公告称,公司股票自11月3日开市起撤销其他风险警示,股票简称将变更为众泰汽车,11月2日停牌一天。随着ST众泰成
10月新能源交付榜单,问界和极氪进入前五,小鹏下降超35近日,众多造车新势力开始公布10月交付量,问界系列产品持续火热,再次突破万台,达到12018辆,这是连续三个月破万辆,向好势头不减,同时,问界M5EV已于10月底从重庆发运,陆续抵
坚持高质量发展,新希望六和再次入榜财富中国500强11月3日,以凝聚共识,创未来为主题的2022年财富中国500强峰会在浙江省温州市举办,新希望六和股份有限公司(SZ。000876)荣获2022年财富中国500强第108位。财富中
澳大利亚葡萄酒产区袋鼠岛(KangarooIsland)袋鼠岛(KangarooIsland),又叫坎加鲁岛(英语KangarooIsland)是澳大利亚继塔斯马尼亚和梅尔维尔岛之后的第三大岛屿,面积4405平方公里。1802年,英国探
蟒岭绿道浅秋行(作者谷去皮)魏巍秦岭,群山环抱,州城东北,有山称蟒岭,绵亘起伏,蜿蜒百里,吮丹江之碧水,取天地之精华,呈重峦叠嶂之势,显碧翠清秀之色,郁郁葱葱,苍翠欲滴,白云蓝天,层林尽染,所谓
圆明园秋意盎然深秋时节,北京圆明园内的银杏枫树黄栌等彩叶树种五彩缤纷,构成别具特色的金秋画卷。这是10月26日拍摄的圆明园秋景。新华社发10月26日,游客在圆明园游玩赏秋。新华社发这是10月26
全家自驾老凯越闯珠峰大本营川进青出西藏游行前准备物品清单去年暑假,我们全家自驾一台已经行驶了15万公里的老凯越,为保证旅途顺利,行前认真做了攻略,下面从车辆和人员两方面,把准备的物品和资料清单发出来,给没有去过的朋友作为参考。一车辆方面
春运期间琼州海峡两岸四港将投入49艘船舶运力最高峰期将达到200班次天应对春运,新海港港口停放大量船只。记者汪承贤摄新海南客户端南海网南国都市报1月6日消息(记者王小畅)2023年春运即将拉开大幕,随着全国疫情防控进入新阶段,今年春运工作面临前所未有
视频平台收紧账号管理,个人信息安全问题不可忽视臧婷婷(重庆大学)1月4日,针对优酷账号登录相关问题引发的热议,优酷回应称,会员服务仅可用作个人观看,不得以转让出租借用分享出售等方式提供给他人,考虑到绝大多数用户的使用习惯,优酷
近代大学史的现状与展望文檐前语编辑檐前语大学历史作为一门专业已经存在了很长时间,我们发现在现代早期就已经开始了,自18世纪末以来,随着启蒙运动和历史主义史学的科学化,我们遇到了第一批科学大学历史,例如克
宝宝发烧会烧坏脑袋吗?宝宝发烧,家长最揪心的,经常会问,发烧会烧坏脑袋吗?宝宝已经烧到40度了,会不会烧坏脑袋啊?今天我们来聊聊发烧到底会不会造成脑损伤?如果是不受控制的超高温度,比如超过41。5,确实
你家宝宝最爱粘着谁宝宝的太奶奶已经84岁了,眼不花耳不聋,身体很硬朗,但是毕竟已经84岁了,腿脚也不是那么方便,但是不管她多累多不舒服,每天都会陪宝宝玩一会,让我有足够的时间给宝宝做辅食,洗衣服,收
富含100倍益生菌,飞鹤星飞帆卓睿激发宝宝自护力近日,飞鹤发布鲜萃活性营养,更适合中国宝宝体质新战略,并表示未来将牵头负责十四五国家重点研发计划项目,研制中国新一代婴配粉。发布会上,中国飞鹤首席科学家蒋士龙介绍了飞鹤在活性营养方
和娃娃童读馆12月活动回顾丨用阅读的欢乐声为2022画上句号点击下方公益卡片,送乡村儿童一本好书!(此处已添加公益募捐功能,如有捐赠需求,请到今日头条APP查看)和娃娃童读馆活动由杭州市上城区民政局携手聚力益起共富公益创投项目支持,乐高拼搭
每日一书贝乐兔故事集贝乐兔故事集(共三册)英伊妮德布莱顿著安全勇译将将书坊北京联合出版公司2022年7月适读年龄6这套书共三册,分别是贝乐兔是个混球儿贝乐兔的玩笑真吓人谁也别想糊弄贝乐兔。每一册都包含
章泽天惊艳史!章泽天的争议点?大家能补充嘛?章泽天可谓是网红营销受益最大者没有之一1一张奶茶照长期置顶猫扑天涯等各大论坛,让无数宅男惊呼女神2第二波营销跟上清华已确认奶茶MM保送清华,清纯美女清
怀念过去的春晚,就等赵本山出场文跑读绅赵本山近期,网上有传言,赵本山将重登2023年春晚舞台,还说正在参加春晚节目的彩排,不知是真是假,说明人们没有忘记赵本山,还怀念春晚有赵本山的那个年代。赵本山是家喻户晓的大
杜海涛减肥失败遭反弹!与鹿晗录综艺肉脸明显,穿着臃肿身材圆润1月6日,知名主持人杜海涛登上热搜,而上热搜的话题就是他减肥失败,身材反弹,具体原因是因为有八卦媒体在社交平台上晒出一组杜海涛参加综艺五哈的录制路透照,曝光了他的近况,一时间引来无