童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

如何避免内容重复推荐?聊聊去重服务

11月15日 眉梢欢投稿
  “请不要再给我推一样的内容了,拜托。”在面对平台一直跟你推荐同样的内容时,你是否是一样的想法。这样情况是否有改善的方法?本文作者从这一问题出发,对去重服务进行了分析探讨。
  如果一个APP一直给你推荐同样的东西,就像一个人在你面前絮絮叨叨同一件事情,你的心情想必非常糟糕。
  去重服务在资讯APP中是一项基础服务,PUSH、图文、视频、直播等内容业务,甚至是作者编辑后台都会需要使用。去重服务细拆开其实是很复杂的,也容易出现“众口难调”的问题,因为重复的类型可能有:不同信息载体的重复(文章和文章、视频和文章等)、不同场景的重复(feed流、正文页等)、信息有无增量的重复(高度重复和一般相似等)
  无信息增量:包含的内容是同样的,用户从该内容中无法获得差异化的信息和体验。
  有信息增量:包含的内容有部分相同或相似,即使之前已有相关的阅读,但用户从该内容中仍可以获得差异化的信息和体验。
  对于第一种情况,是绝对去重,即将高度一致的内容过滤掉,“多选一”。关键点是“如何挑出原创或质量更高的内容”,文章质量、源质量、发布时间、原创度可以帮上忙。所谓“道高一丈魔高一尺”,上网搜关键词“躲避消重教学”,你会发现你要做的工作还有很多。
  (图片来自网络)
  另外直播形式下的专题或机器批量生产的标题,不同内容的标题可能一模一样,为了避免误伤太多内容,需要细化去研究内容的特性。
  对于去重服务,定义标准很重要,拿图片重复来说:
  (1)背景、人物动作完全相同的图片
  (2)同一现场背景,同一机位截图,人物相同(人物动作可能不同)
  (3)某图片的局部截图(至少半图及半图以上)
  以上三组图片,在我们的认知里一般属于重复,基于以上的定义,我们再看几组图片:
  (娱乐类)同一综艺节目,同一机位截图,但人物不同:
  (游戏类)同一款游戏,不同背景截图:
  (游戏类)同一游戏背景截图,游戏人物不同:
  (母婴类)新生宝宝图:
  如果按先前三组的定义,以上图片属于重复,但从我们的日常体验能知道,它们是不一样的内容(只是同个系列),所以,区分分类(category)做细化的定义很有必要,只有这样机器才能按照人的期望学习并输出可用的结果。
  除了内容,图片重复的形式也要定义,如在feed流里:
  对于有信息增量的情况,处理方式要精细得多,面对的是“怎么推”的问题。可以考虑“分层定义分场景限制”的推荐策略。定义文章相似,能用来辅助判断的元素有:
  标题
  摘要
  图片
  正文
  类别
  视频还有物理时长、音频、字幕等。
  我们先来看看标题相似(内容相似或体感相似)的case:标题主体或关键词不同或模糊不清,强调的主旨相同,用词或长或短;同一事件不同角度:
  其中,容易被机器识别为相似从而产生badcase(会降低内容的分发效率),产品汪需要留意一下:
  不同主体同一方面
  同一主体的不同方面
  强本地属性的类似事件
  同一领域中关联度较高的事件
  同一领域(如星座、育儿)实体或关键词相似,但事件面不同
  同属一赛事(如世界杯),不同赛事
  体育球星、会议与政策之间等不同面
  当NLP能较准确识别相似内容时,分场景限制的策略可以从哪些维度入手?
  时间间隔去重:如操作时间在12小时之内,做严格的相似过滤逻辑
  刷数去重:如邻近50刷,做严格的相似过滤逻辑
  事件去重:如同一事件内容不得黏连
  POI(兴趣点)Keyword(关键词)去重:如同一刷同一个POI不得超过3个,重排打散
  源去重:如同一刷同一个源的文章不得超过1篇
  还可以对不同用户(如投诉过重复老旧的用户、新老用户)做不同程度的控制;也可以根据相似度将相似分层,做不同程度的控制;也可根据事件的热度,做不同程度的控制;也可以根据用户的兴趣的浓度做不同程度的控制。
  去重力度需要产品汪把控,而且去重工作中还有很多内容需要确认:比较的对象、信息载体、时间长短、数据来源等等。没有最佳方案,本文旨在引发思考且补全思路,只有不断测试,才能找到适合自己产品的组合方案。
投诉 评论 转载

以产品经理为中心,设计伟大的产品“以用户为中心”是一种偷懒,也是一种市场宣传需要。真正伟大的产品,往往具有深刻的价值观,而这些价值观都是由产品团队确立的。因此,更高层次,让我们追求“以产品经理为中心”。……ABtest平台架构设计本文以一次性设计好ABtest功能架构为目的,对ABtest的使用场景与功能模块进行了分析。最近在考虑一个产品的小功能改进,目前我们的产品列表按照产品带来的收益排序,如果……开票系统与流程设计作者从工作实践出发,简单讲述了传统开票方式与电子发票的区别,希望通过此文能够加深你对开票系统的认识。写在前面的话,上期发了个下集预告,在写的时候发现两个问题无法融到一篇文……产品游戏化三部曲:核心模型、辅助模型和成长模型游戏化设计只不过是一个方向,溯源的初心就是:用户使用的动力是什么?除非有更好的选择,否则就遵从标准。阿兰库John之前在《用户增长策略三步法:产品策略、内容载体和产……B端模块化思考:体验原则篇先设计、后规范,还是先规范、后设计?这真的是一个问题。体验原则是项目进入交互设计之前确定,还是边设计边制定,亦或是设计完成之后根据设计稿来定?这让我想到一个哲学问题……会员体系积分体系,关于两个体系的一些思考文章围绕会员和积分两个体系概念展开,对两者不同的适应玩法进行了比较分析,与大家分享。前段时间写过一篇关于联合会员的文章《超级会员成为趋势,各家开启联合会员大战!》,有朋友……如何避免内容重复推荐?聊聊去重服务“请不要再给我推一样的内容了,拜托。”在面对平台一直跟你推荐同样的内容时,你是否是一样的想法。这样情况是否有改善的方法?本文作者从这一问题出发,对去重服务进行了分析探讨。……阿里云双11背后的故事之主视觉设计如何通过设计去建立新的用户心智和认知,如何从云计算营销设计出发去探索出一条前人未走过的路,如何通过设计解业务的痛点,同时更好地讲“阿里巴巴的云”这个新的故事?对于阿里云官……微信消息推送困扰用户的10点反思优化建议本文总结分析了微信消息推送对用户体验的十点干扰,以及做出了相应的优化建议。极致体验设计围绕的核心是用户,而不是产品本身,极致体验设计应该为用户提供更高效的解决方案,降低对……电商后台:商品库存管理之批次管理本文主要对电商平台的库存系统中的批次管理进行了详细的阐述,一起来看看一、批次管理库存,是电商企业不能回避的问题,如何让仓库商品能够有序的流转,是电商供应链管理后台的……到店管理后台优化心得:如何更好推动赋能本文作者复盘了一次后台体验优化项目,还原其中七个阶段,分享由这次项目而来的经验与心得,供大家参考和学习。后台产品的用户场景、任务往往复杂而琐碎。在进行产品交互设计时,是否……10个维度,聊聊电商个性化推荐系统本文作者从日常生活实践出发,对什么是个性推荐、个性推荐的价值、个性化推荐策略如何制定以及评估等进行了梳理分析,并从10个维度进行了探究,与大家分享。“嘀嘀嘀嘀嘀嘀嘀嘀嘀”……
从评估到验证,看产品经理如何征服需求,告别撕逼?个想法个建议:偏向于行业运营的产品策划经验产品经理,你真的懂产品数据吗?如何进行流失用户研究(下):方案实施和结果分析产品经理的专业度如何体现?当品牌被赋予个性后,能否与消费者“深交”?做好一个女产品经理,前提是要先变成一个汉子吗?产品经理工作的边界在哪里?产品经理常犯的错误:总想要大而全的版本独立思考:为什么对产品经理尤其重要?尽信工具,还不如没有工具感悟年龄对产品经理的三个影响

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界