童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

分析:基于机器学习的个性化推荐系统

8月16日 程染筱投稿
  本文主要跟讲解的是基于机器学习的个性化推荐系统,一起来看看
  需求场景:
  在获知用户潜在的若干个兴趣点的情况下,如何快速的捕获用户的兴趣点,并给予持续的满足,并形成消费转化。
  让用户能够快速的找到有价值的内容。
  需求分类:
  明确:延续性周期性行为;
  利用:围绕用户兴趣点进行推荐;
  探索:拓展用户新兴趣点进行推荐。
  应用场景
  电子商务的个性化推荐,个性化广告、个性化推荐的APP。
  业务目标
  用户消费行为的最大化。
  衡量标准
  整体衡量指标:整个产品的的留存时长;
  局部衡量指标:推荐模块人均的展现量、点击量、消费时长、频道留存率;
  细节衡量指标:推荐内容的点击率(CTR)、消费完成度、消费时长。
  主要步骤召回排序策略干预
  在召回环节,通过召回策略,初选出用户可能感兴趣的内容候,形成一个召回的一个候选集。在排序环节,结合用户特征,产品环境信息推荐内容特征,使用机器学习的模型算法,对召回后的内容进行经排序,以满足核心的业务目标。
  在策略干预环节,对机器学习形成的排序进行策略干预。例如需要去做多元打散来,以及兼顾其他特定的业务目标等等。
  1。召回环节
  推荐模型计算开销较大,完全依赖模型推荐成本过高,因此需要设计召回策略,从海量的数据中筛选出用于推荐的内容候选集。
  简单召回;
  用户历史消费内容相似的内容。
  历史:用户的兴趣有长线的还有即时的兴趣,长线兴趣即用户在平台上过去的一周或者过去的一月一年在平台上说表现的兴趣,即时兴趣用户在今天突然对某个的内容产生了兴趣。
  相似:在我上一篇的文章中,我们可以通过基于内容的相似,或者基于协同过滤,从这两面都出发,构成内容候选集。
  基于以上的两个维度,我们可以找到一个用户历史内容相似的内容的一个候选集。
  (1)基于用户画像的匹配
  通过用户画像对用户进行细分,去收集每一个细分领域内的关注的热点是什么,比如:IT行业、24岁、男性、本科、产品汪,你可以收集产品汪喜欢看的内容,也可以售后机24岁、男性这个画像喜欢看的内容,
  基于用户画像的推荐,有两个实体:内容和用户。需要有一个联系这两者的东西,即为标签。内容转换为标签即为内容特征化,用户则称为用户特征化。
  (2)排序召回
  最新、最热、最近、最新光顾、人工精选。
  (3)规则召回
  天气、近期搜索浏览、朋友的购买、同期过往习惯等业务性策略。
  2。排序环节
  (1)模型简介
  机器学习本质上来说就是通过已有的数据,进行算法的选择,并基于算法和数据构建模型,最终对未来进行预测,简单的来说就是总结过去、预测未来。
  什么是模型呢?
  一般来说给定自变量的值,通过表达式计算就可达到因变量的值,而在机器学习中给定了自变量和因变量的值,通过机器学习,得到这表达式,也就是模型。
  在CV领域,模型可以把一个自变量的输入,也就是一张图片,转化成一个分类。在NLP领域,模型可以把一个自变量的输入,一段语音,转化成文字。
  而模型当中参数会有无数种组合,而我们则需要从中找到一个最优的一组参数。
  (2)模型的构建
  确定输出Y:
  期望模型预估的什么,比如:在推荐领域我们想得到的输出是用户点击这个推荐的内容的概率有多大;在预测肿瘤的性质中,希望得到是良性还是恶性;在NLP特征工程对文本进行处理中,我们期望的输出是一段文本。
  确定输入X(特征):
  哪些业务因素会影响我们的结果,比如:在推荐系统中影响用户最后点击的可能有是否与用户喜爱匹配,内容的整体热度,当前所处的地理位置,等等;在预测肿瘤是结果,可能有肿瘤的面积、形状、方向等等。
  输入输出的关系XY(算法的选择):
  需要根据我们想要的结果确定相应的模型,一般的结果分为两类:一类是离散型变量,一类是连续型变量。
  输出的如果是离散型变量则是分类问题;
  输出的如果是连续性变量则是回归问题。
  比如:预测用户点击推送的内容的概率是多大,则是回归问题,而预测是否点击,则是分类问题。
  线性:逻辑回归(LR)优点解释性比较强,缺点在变量是非线性关系的时候表现很差;
  非线性:随机森林(RF)或梯度提升树(GBM),优点适应性强,有很好的鲁棒性,缺点可解释性差;
  深度学习DNN:非线性,优点技术牛逼,表现优异,缺点解释性更差,对于数据的要求比较高。
  (3)训练模型
  基于已知的X和Y,收集推荐的历史数据,构建训练集和测试集。为了使我们的训练效果更好,我们需要根据内容消费行为的完成度进行有效的过滤,抛弃低完成度行为。
  在训练数据集上运行模型(算法)并在测试数据集中测试效果,迭代进行数据模型的修改,进而找到最优参数。
  (4)模型的评估
  分类算法的评估方式有:精确度、召回率、F1指标、混淆矩阵、ROC曲线、ROC曲线下面的面积。
  回归算法的评估方式有:一般使用的方法有平均方差、绝对误差、R平方值,而一般产生的结果可能有过拟合、欠拟合。
  过拟合:算法太符合样本数据的特征,对于实际产生中的数据特征无法拟合
  欠拟合:算法不太符合样本的数据特征
  3。策略干预
  平台出于内容生态和社会责任的考量,像低俗内容的打压,标题党、低质内容打压,重要新闻的置顶、加权、强插,低级别账号内容降权都是算法本身无法完成,需要进一步对内容进行干预。
  强插:对于重度投入的头部内容,不管从运营的角度还是产品的角度都是有实际需求。
  分类打散:保证多样性,解决某种情况下,一个分类下的内容都被排在前面的问题。通过给每一个分类以一个合适的配比,进行展现。
  内容配比:保证新内容在推荐结果很注重又一个占比,避免因马太效应导致没有用户数据的内容,无法进行推荐。
投诉 评论

谷歌全球医疗广告调查:AI推送,移动端投放和尺度加大谷歌不是不做广告,而是在“聪明地”做广告。谷歌,这家全球最大搜索巨头,越来越表现出它真实的样子。尤其是商业变现上,广告业务一直都是谷歌重要的“现金流”。而2015年……榨菜方便面业绩向好,传递了什么信号?畅销的榨菜,早已不是记忆中的榨菜,走俏的泡面,也不是当初那个泡面了“榨菜泡面二锅头,骑上摩拜遛一遛”。这是时下很多年轻人的日常消费生活缩影。近日,各大上市公司半年报……沉迷产品IoT行业鸿沟IoT行业目前整体处于早期市场,用户群体主要为科技爱好者(创新者和早期使用者),他们关心最新的事物;而智能家居是IoT行业里面离用户最近的细分市场。很长一段时间,互联网在……分析:基于机器学习的个性化推荐系统本文主要跟讲解的是基于机器学习的个性化推荐系统,一起来看看需求场景:在获知用户潜在的若干个兴趣点的情况下,如何快速的捕获用户的兴趣点,并给予持续的满足,并形成消费转……车企喊话BAT:业内共生,业外多赢从长远来看,BAT的全面布局会加速国内车联网未来格局,但标准化缺失下的安全问题会阻碍车联网进一步发展,所以在标准需要统一的现实下,产业链上的诸位是选择继续“各自为政”还是“创新……隐私成“皇帝的新衣”,大数据时代谁能成用户隐私的保护伞?随着大数据时代的到来,隐私泄露的问题也逐渐显露出来。特别是今年隐私泄露案件更是层出不穷,从3月闹得沸沸扬扬的Facebook用户隐私泄露案再到6月A站疑被黑客盗取用户数据,似乎……再向“乡镇青年”下沉,“资讯界拼多多”趣头条也难成为另一个拼一度被媒体称为“资讯界拼多多”的趣头条也一直受困于版权问题,那些从网络抓取,噱头十足、低端媚俗的内容正逐渐被贴成趣头条的标签。那这样的趣头条究竟会不会成为下一个拼多多?趣……二手车市场有没有可能崩塌?长租公寓最近一直热点不断,行业洗牌也在同时进行,从“房租抬升”风波到杭州“鼎家”、“暴雷”,再到自如的“甲醛门”,长租公寓从众星捧月,一夜之间变成了妖魔鬼怪,盈利难题、资本推高……网红崩溃:月入50万美金也无法释放的压力和焦虑他们是互联网内容创业时代的缩影,用最蓬勃的生命力与创造力支撑着草根成名的梦想,光鲜背后,是最彻底的焦虑与孤独。从5月开始,陆续有外媒报道,不少YouTube博主接连崩溃,……循序渐进的增长黑客指南:找到产品和市场的最佳契合点PMF增长黑客的首要前提是你的产品能够给用户提供真正的价值,所以我们要做PMF(ProductMarketFit)分析,找到产品和市场的最佳契合点。PMF是创业早期唯一重要的事……互联网教育,如何实现同质化竞争的突破?在重度决策下,互联网教育如何实现业绩增长?本文列举了2条战略增长路径,一起来看看中国互联网教育具有以下三个特点:用户决策偏重度决策,注重学习效果。线上学习是反……当机器人的尴尬场面,已成了家常便饭。。中国已然成为机器人的城市试验场不管人们是否做好准备,机器人将离开实验室这一阶段,进入现实世界中的测试环节。随着越来越多的人居住在城市,这些技术提供了应对人口老龄化和基础设……
顶配2799元RedmiK60E正式发布RedmiK60E作为K60宇宙的新杯,其搭载天玑8200,搭载一块2KOLED直屏,搭载支持67W快充5500mAh电池,相机内置OIS光学防抖,RedmiK60E采用玻璃后……2499元起!小米RedmiK60发布:骁龙8加持今晚,小米Redmi2023新年发布会如期而至,发布会上RedmiK60旗舰手机正式发布,8GB128GB:2499元;8GB256GB:2699元;12GB256GB:299……RedmiK60Pro发布:第二代骁龙8配2K国产屏售329凤凰网科技讯(作者董盈辰)12月27日消息,红米于今日举行发布会,发布RedmiK60系列手机,其中RedmiK60Pro搭载第二代骁龙8移动平台,采用国产2K柔性直屏,售价3……一图看懂Redmi8款新品:有一款低调到直接消失12月27日晚,Redmi召开新品发布会,一口气发布了包括手机、手表、手环、耳机在内的款新品,其中手机就有五款。其中,K60系列三款预热已久,规格没什么意外,价格着实能打……RedmiNote12Pro极速版意外发布:经典骁龙778G除了RedmiK60系列,Redmi今天还意外带来了一款新机RedmiNote12Pro极速版”。相比于已有的RedmiNote12Pro,这款极速版将处理器从联发科天玑……豪华超跑质感!RedmiK60冠军版发布4599元今晚,RedmiK60旗舰系列正式登场,除了K60E、K60和K60Pro三款,官方还带来了RedmiK60冠军版,16GB512GB组合,售价4599元。据介绍,新机是……差价800元RedmiK60与K60Pro如何选?这三点不同今晚的发布会上,RedmiK60系列手机正式发布,大家关注的主要是K60标准版与K60Pro两款手机,售价分别是2499、3299元起。两款手机差价800元,也就是13的……RedmiK60E发布:唯一配备2K屏的天玑8200手机21今日晚间,RedmiK60E正式发布。售价方面,8GB128GB售价2199元,8GB256GB售价2399元,12GB256GB售价2599元,12GB512GB售价2……比友商便宜500元一图看懂3299元的RedmiK60Pro今晚Redmi红米率先发布了K60家族中第一款产品K60Pro,用上了二代骁龙8平台及2K柔性屏,售价3299元起。作为一款狠快狠强狠旗舰的产品,K60Pro到底升级了多……骁龙82K中国屏!RedmiK60标准版发布:2499元标配12月27日晚,RedmiK60正式发布。作为K60宇宙中的标准款,K60搭载一代口碑旗舰神U第一代骁龙8,配备K60Pro同款6。67英寸顶级2K中国屏,12bit色深……RedmiK60Pro搭载索尼IMX800:弱光连拍得片率1今晚,RedmiK60系列正式登场,除了全系配备2K直屏,新机在影像上也十分能打。据介绍,RedmiK60Pro搭载了索尼IMX800大底传感器,5000万超高像素,拥有……499元!RedmiWatch3发布:升级1。75英寸AMO12月27日,RedmiWatch3正式发布,顺应可穿戴大屏化潮流,升级1。75英寸高清AMOLED大屏,支持121种运动模式,售价499元。RedmiWatch3采用轻……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界