保健励志美文体育育儿作文
投稿投诉
作文动态
热点娱乐
育儿情感
教程科技
体育养生
教案探索
美文旅游
财经日志
励志范文
论文时尚
保健游戏
护肤业界

用上GAN推荐算法成精,看完视频马上刷出相关文章,微信已用上

  这年头,推荐算法真是越来越智能了。
  举个栗子,当你热衷于东京奥运会并且刷了不少剪辑视频,App就会根据你的品味为你推荐文章、游戏或是同款周边。
  没错,推荐算法早已不局限于一个场景,而是在视频、文章、小程序等各种场景中打通任督二脉,也就是多领域推荐算法。
  但事实上,这类算法并不如想象中容易驾驭,关键在于如何抓住不同领域中,关于目标领域的有效特征。
  为了让推荐算法更了解你,腾讯微信的看一看团队,针对多领域推荐任务提出了一个全新的模型,融合了生成对抗网络GAN、ELECTRA、知识表示学习等思路,学习不同领域之间的特征转移,极大地提升了多领域推荐算法的效果,论文已被KDD2021收录。
  8月18日,数据挖掘领域国际最高级别会议KDD2021会议在线上举行,微信看一看团队的XiaoboHao,针对这篇名为AdversarialFeatureTranslationforMultidomainRecommendation的论文,进行了详细解析和分享。
  我们对论文解析进行了相关总结,一起来看看。多领域推荐难在哪
  推荐系统已经融入生活的方方面面,为我们提供个性化的信息获取及娱乐。
  在马太效应的影响下,Google、WeChat、Twitter等平台应运而生。它们往往拥有各种(推荐)服务,能够为用户推荐多样化的物品(如文章、视频、小程序等),满足用户需求。
  用户在不同推荐服务上的行为(在用户允许下),会通过用户的共享账号产生关联。
  这些行为,能在目标领域行为之外提供更多信息,帮助推荐系统更加全面地了解用户,辅助提升各领域推荐效果。
  多领域推荐(Multidomainrecommendation,MDR)任务就是基于用户在多个领域的行为和特征,来同时优化多个领域的推荐效果,关键在于如何抓住不同领域中的目标领域特化的特征。
  一个直观的方法,是将用户的多领域行为当作额外的输入特征,直接输入给ranking模型,但这种方法没有针对领域间的特征交互进行优化建模。
  另一个方法,是近期基于多任务学习(Multitasklearning,MTL)的一些思路,将一个领域的推荐当作一个任务进行处理,取得了不错的效果。
  然而,多领域推荐效果仍然严重地受限于其固有的稀疏性问题,具体体现在两个方面:其一,useritem点击行为的稀疏性(这个是推荐系统本身拥有的稀疏性问题);其二,跨领域特征交互的稀疏性(这是多领域推荐特有的稀疏性问题)。AFT模型要解决什么?
  为了解决这两个问题,使模型能够同时提升多领域推荐效果,论文提出了一个名为AdversarialFeatureTranslation(AFT)的模型,基于生成对抗网络(GAN)学习不同领域之间的特征转移(featuretranslation)。
  首先,在multidomaingenerator中,论文先提出了一个domainspecificmaskedencoder,用以强调跨领域的特征交互建模,再基于transformer层以及domainspecificattention层聚合这些跨领域交互后的特征,学习用户在目标领域下的表示,以生成虚假的物品候选(fakeclickeditems)输入到判别器中。
  在multidomaindiscriminator中,受到知识表示学习(KRL)中的基于三元组的建模方法(如TransE)的启发,论文构建了一个两阶段特征转移(twostepfeaturetranslation)模型,对领域、物品和用户不同粒度不同领域的偏好进行可解释的建模。
  团队在Netflix和微信多领域推荐数据集上进行了测试后,发现模型在离线和在线实验的多个结果上都获得了显著的提升,论文也进行了充分的消融实验和模型分析,以验证模型各个模块的有效性。
  图1:多领域推荐及AFT模型框架图
  具体来说,如上图1,AFT包括domainspecificmaskedencoder以及twostepfeaturetranslation,着重关注跨领域、多粒度的特征交互建模。
  在生成器(generator)部分,论文先设计了一个domainspecificmaskedencoder,通过mask掉目标领域的历史行为特征(historicalbehaviors),来加强其它领域历史行为特征和目标领域点击行为之间的交互特征权重,以驱使AFT模型学习基于其它领域特征进行的目标领域推荐;
  再用Transformer层和Domainspecificaggregation来抽取目标领域相关的用户特征,以生成topk虚假点击的物品(fakeclickeditems)。这些虚假点击的物品将被输入判别器,迷惑判别器的判断,在对抗中相互提升所有领域的推荐能力。
  在判别器(discriminator)部分,论文受知识表示学习模型(KRL)启发,希望显式地对用户、物品和领域进行建模。
  其中,先用Transformer从多领域特征中分别抽取用户的细粒度item和粗粒度domain的偏好特征,分别标记为useritemlevelpreference和userdomainlevelpreference;
  再构造第一个三元组(useritemlevelpreference,userdomainlevelpreference,usergeneralpreference),进行第一次特征转移,学习用户通用领域的偏好特征(usergeneralpreference)。第一个三元组的物理含义是,对于(Hamlet,writer,Shakespeare)三元组关系,有HamletwriterShakespeare(以KRL中的经典模型TransE为例)。
  在多领域推荐中,用户不同粒度的偏好相加(itemlevelpreferencedomainlevelpreference),就约等于用户通用领域的偏好(usergeneralpreference),因此这一步能得到用户通用领域的偏好。
  然后,论文再次构建第二个三元组(usergeneralpreference,targetdomaininformation,userdomainspecificpreference),进行第二次特征转移。第二个三元组的物理含义是,用户的通用领域偏好目标领域的特征用户在目标领域的偏好(userdomainspecificpreference)。
  论文基于成熟的知识表示学习模型ConvE进行两层特征转移(twostepfeaturetranslation)后,得到了用户在目标领域上的表示,并用于推荐。那么,AFT模型到底有什么优势?
  其一,AFT的GAN框架在domainspecificmaskedencoder的帮助下,提供了充足且高质量的多领域推荐负例,缓解了数据稀疏和过拟合的问题;
  其二,生成器中的domainspecificmaskedencoder能加强模型的跨领域特征交互,而这正是多领域推荐的核心要素;
  其三,判别器中的twostepfeaturetranslation提供了一种大胆的、显式化可解释的建模用户、物品和领域的方式,对多领域推荐提供了更深层次的理解。
  团队将AFT模型和多个有竞争力的baseline模型进行了离线和线上对比。结果显示,AFT模型在多个领域上全面显著地超出所有baseline。此外,团队还进行了详尽的消融实验和模型分析实验,用以加深对AFT各个模块和参数的理解。
  目前,AFT模型已经在用了被部署于微信看一看的多领域推荐场景,正服务于千万用户。论文本身的贡献如下:
  针对多领域推荐问题,提出了一个全新的AFT框架,首次在多领域推荐中引入了对抗下的特征转移。
  提出了一种GAN框架下的domainspecificmaskedencoder,能够针对跨领域特征交互进行特化加强。
  设计了一种两阶段特征转移策略,尝试使用结构化知识表示学习的建模方式,学习用户多粒度多领域偏好、物品和领域之间的可解释的转移关系。
  AFT在离线和线上实验中均取得显著的提升效果,并已经被部署于微信看一看系统。AFT模型具体长啥样
  上文提到,AFT模型基于GAN训练框架,主要分为生成器和判别器两个部分。
  如下图2,生成器输入用户多领域行为特征,并基于domainspecificmaskedencoder、Transformer层和Domainspecificattention,抽取目标领域相关的用户特征,用于生成topk虚假点击的物品(fakeclickeditems)。判别器则基于两阶段特征转移,获得用户向量,然后预测真实虚假点击物品的得分。
  图2:AFT具体模型,包括(a)多领域生成器和(b)多领域判别器
  我们具体来看。多领域生成器
  多领域生成器旨在为用户生成每个领域上的fakeclickeditems,其输入是某个用户在所有n个领域上的行为序列X{X1,,Xn},其中Xt是第t个领域上的行为序列特征矩阵。
  不失一般性,论文假设生成器正在生成目标领域dt上用户可能点击的物品,首先使用domainspecificmaskedencoder处理目标领域序列Xt,随机对目标领域dt中的行为进行mask,如下式:
  公式表示序列中post这些位置上的行为被〔mask〕的token替代,使得domainspecificmaskedencoder强制生成器在生成目标领域的候选物品时,会更多地考虑其它领域的用户行为。
  这样虽然会丢失关键的目标领域的历史行为,导致生成器更难生成最合适的fakeclickeditems,但也会加强跨领域历史行为和点击的特征交互,有助于多领域推荐,特别是稀疏行为的领域上的推荐效果,瑕不掩瑜。
  随后,论文使用averagepooling分别聚合各个领域上(mask后)的行为序列,并基于Transformer和domainspecificattention,得到用户在目标领域上的表示ht如下:
  对每个候选物品ei,生成器计算的点击概率p为:
  论文基于生成概率p,选择目标领域上的topk的近邻物品(剔除训练集中的真实正例),作为生成器生成的负例输入判别器。多领域判别器
  在判别器中,论文首先基于Transformer特征抽取器,获取用户在细粒度的具体行为(item)上和在粗粒度的领域(domain)上的特征表示:
  随后,团队基于知识表示学习中三元组的学习范式,设计了一个两阶段的特征转移:先基于用户在多领域的细粒度和粗粒度上的偏好,得到用户整体偏好;然后基于用户整体偏好和目标领域信息,得到用户在目标领域上的偏好。
  传统的知识表示学习方法(如TransE)显式建模三元组关系。上文提到,对于(Hamlet,writer,Shakespeare)这个三元组关系,TransE认为:HamletwriterShakespeare。
  因此,用户细粒度的偏好加上用于粗粒度的偏好,应该等于用户通用领域上的全局偏好(usergeneralpreference)。基于ConvE模型(因为他能够挖掘elementwise的特征交互),对于三元组(eh,r,et)有:
  类似地,在第一次特征转移中,构造了一个三元组(useritemlevelpreference,userdomainlevelpreference,usergeneralpreference),计算用户通用领域上的全局偏好ug如下:
  在得到usergeneralpreference后,又构建了第二个三元组(usergeneralpreference,targetdomaininformation,userdomainspecificpreference),并进行第二次特征转移。这个三元组的物理含义是,用户的通用领域偏好加上目标领域的特征,约等于用户在目标领域的偏好(userdomainspecificpreference),有:
  其中,目标领域特征综合考虑了领域向量和行为向量。与生成器类似,团队基于用户在dt的特征表示ut,计算物品ei的点击概率p如下:
  生成器amp;判别器优化
  模型判别器的优化如下:
  生成器则是基于REINFORCE强化学习进行优化:
  团队还提出一项MMDloss,目的是让生成器产生的物品和真实物品不完全一致(否则会干扰判别器的训练),具体如下:
  MMDloss基于推荐系统的特质设计:在推荐系统中,绝大多数物品其实并未被曝光,团队假设所有未被用户点击的物品均为负例;和点击物品特别相似的fakeclickeditems,也有很大概率同样被用户点击(例如不同自媒体号发表的同一主题的新闻视频等),这也是推荐系统itemCF的本质。
  因此,团队选择加入MMDloss,使得GAN能够生成更加多样化的、相似但又不完全一样的物品作为判别器的负例。
  最后,综合三项loss获得最终AFT的loss,如下:
  AFT模型的判别器被部署于线上,更多模型和线上细节可参考论文第三和第四部分。实验结果
  团队在公开数据集和微信看一看数据集上进行了实验,结果表明,模型在多领域推荐上获得了显著提升:
  图3:AFT离线结果
  此外,论文也在微信看一看多个线上推荐场景进行了AB实验,也同样获得了显著的提升:
  图4:AFT线上实验结果
  消融实验也证明了模型各个模块的有效性:
  图5:AFT消融实验
  最后,论文也进行了详尽的模型参数分析,探索了不同maskratio和fakeclickeditemnumber对模型效果的影响:
  图6:AFT参数实验模型已用到微信里
  整体来说,这篇论文针对多领域推荐任务,提出了一个对抗特征转移的AFT模型。它基于domainspecificmaskedencoder加强了跨领域特征交互,设计了一种twostepfeaturetranslation,能够显式可解释地对多领域下用户不同粒度的偏好、物品和领域进行建模。
  目前,AFT模型已部署于微信看一看多领域推荐模块中,我们日常用微信看一看时,就会用到这个模型。
  对于未来,团队表示十分看好基于对抗和知识表示学习的跨领域特征交互思路,计划展开进一步探索。

谷歌AI伦理专家论文被撤发牢骚,遭公司解雇当地时间周四,谷歌人工智能伦理团队负责人之一蒂姆尼特格布鲁(TimnitGebru)表示,自己被谷歌解雇,而原因是自己发送的一封电子邮件让公司管理层认为其举动与公司对谷歌经理的……高德地图推出道路作业车辆安全预警系统,首批落地沪宁兰海高速IT之家5月13日消息5月12日,在重庆2021互联网城市交通管理创新论坛上,高德地图发布道路作业车辆安全预警系统,针对道路作业生产事故多、信息发布慢、触达范围有限、管理效率低……党员集中学习工作总结随着经济社会的迅猛发展,如何与时俱进加强党员干部培训,提高党员干部队伍素质,这对于进一步加强党的建设,充分发挥党的思想政治优势,推进社会进步有着非常重要的意义。接下来就跟着品学……高德地图正式推出车载货车导航IT之家4月15日消息高德地图今日宣布,继2017年上线货车导航手机版之后,正式推出车载货车导航解决方案。通过前装和后装合作伙伴,把为货运场景量身订制的专属导航装进货车,助力货……阿里云盘即将公测,本月正式上线感谢IT之家网友大戸愛的线索投递!IT之家3月12日消息感谢IT之家网友热心线索投递,Teambition网盘阿里云盘官方表示,现在产品日趋流畅和完善,预计短期内可达到公……军训心得高中作文3篇其实军训也并非是常人心目中的魔鬼训练、灰色的咏叹调。下面是品学网带来的军训心得高中作文,希望可以帮到大家。军训心得高中作文篇一:时间过得真快,转眼间已经小学毕业了,……销售人员的辞职报告5篇销售:是指以出售、租赁或其他任何方式向第三方提供产品或服务的行为,包括为促进该行为进行的有关辅助活动,例如广告、促销、展览、服务等活动。或者说:销售是指实现企业生产成果的活动,……支付宝蚂蚁森林上线山杏结果可以吃,能量最少的大树感谢IT之家网友爱诺基亚塞班的线索投递!IT之家7月9日消息蚂蚁森林宣布,新树今日出道,会开花,能结果,可以吃,能量最少的大树山杏来了。所需能量38570g,种植地区:庆……商业赞助策划书范文3篇招商策划是招商过程的第一步,那么,招商策划程序的第一步又是什么呢?策划程序的第一步是确立目标。只有目标确立了,策划工作才能做到有的放矢。下面是商业赞助策划书范文,欢迎参阅。商业……蚂蚁集团拟在11月6日AH同步挂牌,10月27至30日进行招10月20日消息,蚂蚁初步计划于下周二至周五(27日至30日)招股,拟在11月6日AH股同步挂牌。这个过程将跨越11月3日美国大选。以上仅是初步时间表,最终可能有变。10……蚂蚁集团香港IPO获得中国证监会批准,今日举行上市聆讯10月19日早间消息,IFR援引未具名知情人士报道称,蚂蚁集团香港IPO获得中国证监会批准,今日举行上市聆讯。报道称,蚂蚁集团计划周一寻求香港交易所的批准,中国证监会预计……中概股收盘涨跌不一,阿里涨逾1股价首次站上300美元,迅雷跌中概股周四收盘涨跌不一,阿里巴巴收盘涨逾1,股价首次站上300美元关口,市值超8100亿美元;迅雷跌近8,该公司前CEO陈磊等人涉嫌职务侵占事宜,深圳市公安局已经对涉嫌职务侵占……
消息称雷军卖出3亿股小米股票,王化回应雷军不再控制雷军基金会感谢IT之家网友紫苏时光的线索投递!IT之家9月3日消息据港交所披露文件,8月31日,小米集团创始人雷军处理了逾3亿股小米股票;在小米的多头仓位从10。63降至9。12。……花落北京!小米汽车注册地揭晓北京经济技术开发区IT之家9月2日消息国家企业信用信息公示系统显示,小米汽车有限公司注册地址为北京,登记机关为北京经济技术开发区市场监督管理局,登记住所为北京市北京经济技术开发区科创十街15号院……不止于找钥匙连连看,UWB欲成下一个蓝牙WiFi8月19日消息随着小米MIX4的发布,以及之前的OPPO一键联手机壳套装,国产手机也开始正式拥抱UWB技术,从原来的技术展示,转为真正走向消费市场。实际上,相比于目前UWB技术……手机关了GPS还会被定位,一项新研究能阻止位置隐私泄露你知道吗?即使你的手机关闭GPS定位,你的位置信息也会被追踪到。这是因为你的手机会向你附近的手机信号塔显示个人标识符,这样运营商就知道了你的位置,并且你的位置数据可能会因此被泄……掌阅科技2020年派发现金红利4389万元IT之家5月24日消息昨日,掌阅科技发布了2020年年度权益分派实施公告。本次利润分配以方案实施前的公司总股本438,896,835股为基数,每股派发现金红利0。10元(含税)……2021年医生入党思想汇报范文医生入党思想汇报【一】敬爱的党组织转眼间又到了7,8月份医院里工作最繁忙的季节了,天气炎热,病人又多,护理人员的骤减,工作强度的增大,使我的心异常浮躁疲乏。临近七一……联发科日赚人民币超九千万元Q1利润同比增长80。5,毛利率高IT之家4月27日消息,联发科今日发布了2022年第一季度财报,营收、获利双双创下单季历史新高,每股大赚21。02元;归属母公司净利达新台币332。61亿元(约74。5亿元人民……友达2021年营收达3706。85亿元新台币,年增36。81月10日消息,根据《經濟日報》消息,友达今(10)日公布的财报显示,该面板厂商2021年营收达3706。85亿元新台币(单位下同),年增36。8,创近七年新高点(约合854亿……思想汇报(一)入党动机思想汇报:你,为什么入党敬爱的党组织:这次能够参加华南师范大学xx技术学院分党校举办的第八期入党积极分子学习班的学习,我感到非常的荣幸,也十分珍惜宝贵的学习……马斯克收购Twitter后的CEO七大人选创始人多西不在其中北京时间5月6日晚间消息,据报道,在完成440亿美元收购Twitter交易后,特斯拉CEO埃隆马斯克(ElonMusk)预计将临时担任TwitterCEO数月时间。之后,他可能……有关于出国留学介绍信范本出国留学介绍信xx学校的朋友您好!我是x同学的导师,x同学是我最欣赏的学生之一。她最吸引我的是她的学习天赋与上进心,她是我见过的最聪明的学生,学习成绩卓著,人文科学……老牌风投携手马斯克收购Twitter引发质疑高管有Meta董北京时间5月6日早间消息,据报道,美国知名风投公司安德森霍洛维茨(AndreessenHorowitz)最近决定和马斯克携手,参加对推特的并购,然而这将带来内部人士利益冲突问题……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网