论文精读对比学习在知识感知的推荐方法中的应用
论文题目:KnowledgeGraphContrastiveLearningforRecommendation
前言必读
推荐系统已日益成为向用户推荐感兴趣的项目并减轻许多在线服务中的信息过载的不可或缺的装置,从电子商务平台、视频网站到在线广告。传统的推荐系统存在数据稀疏和冷启动等问题,知识图谱中丰富语义信息和结构信息能够缓解数据稀疏和冷启动等问题,提高推荐的准确度。但前提需要高质量的知识图谱,若知识图谱中三元组的质量参差不齐,可能导致无法学习到高质量的知识表示,导致推荐模型效果较差。
本文认为现有KG感知推荐方法的有效性在很大程度上依赖于高质量的输入知识图谱,并且容易受到噪声扰动。主要面临两大难题:
1。知识图谱有大量噪声数据(项目和实体之间与主题无关的连接),导致用户偏好不准确。
从新闻事件中提取的关键实体ZackWheeler是美国职业棒球大联盟(MLB)组织中费城费城人队的著名棒球投手。但是我们可以发现ZackWheeler与两个项目(Smyrna,GA和UCLReconstruction)语义无关的嘈杂实体相关联。虽然ZackWheeler出生在Smyrna,GA(佐治亚州士麦那),并且他接受过尺侧副韧带(UCL)重建手术,但这两个实体与本新闻的主题不太相关,本新闻侧重体育新闻。
2、知识图谱中实体的长尾分布导致知识图谱增强项目表示的监督信号稀疏等问题。
在Yelp2018、Book、MIND三个数据集中,其知识图谱中实体的长尾分布图
我们将知识图谱质量问题和实体长尾发布问统称为KG噪声问题。这种数据噪声问题将从两个角度损害项目表示的质量:
i)局部来看,项目直接聚合来自低质量的实体信息会干扰项目的关键语义信息。
ii)全局来看,知识图谱上的信息聚合很容易过度平滑,因为大量信息可以通过一些流行的实体(例如位置名称)传播到目标节点。例如,同样出生在乔治亚州士麦那的其他人可以与职业棒球投手ZackWheeler联系起来。因此,有必要赋予知识图增强监督范式有效的连接去噪能力,以便提取目标用户的真实潜在偏好,并具有不受噪声干扰的表示。为了解决上述存在的问题
本文提出了一个通用的知识图对比学习框架(KGCL)进行推荐。
具体来说,为了处理知识图谱中的关系异质性,首先提出了一种关系感知知识聚合机制来捕获用于项目表示的实体和关系相关的上下文信号。然后,开发了一种跨视图对比学习模式,在知识图谱执行对比学习来减小知识图谱的噪声,并将去噪后的KG与用户项目交互建模联系起来,从而可以利用外部项目语义相关性来指导跨视图自监督信号的数据增强。
在KGCL框架中,联合对比学习和基于知识图谱结构一致性来丢弃不相关的三元组和相关项目,以实现稳定的学习用户偏好。KGCL框架
KGCL的框架如图所示,由关系感知的知识聚合,知识图谱增强和知识引导的对比学习三部分组成。
关系感知的知识聚合
本文设计了一个关系感知的知识嵌入层,将项目、相关实体和项目实体之间的关系映射到注意力矩阵中进行特定表示,从而建立了项目、实体、关系之间的信息聚合机制。
由公式1我们可以看出,对于项目i的表示有本身嵌入和项目链接的加权实体e组成,对应加权实体e,其采用注意力机制进行计算(本质就是GAT加入关系(re,j)。知识图谱增强
我们知道对比学习其核心是数据增强,通过最大化增强视图之间的相互信息,达到减少不相关实体干扰。本文对知识图谱上采用随机数据增强方案来生成两个相关的数据视图。然后,输出单个项目的知识图谱结构一致性,以反映项目对知识噪声扰动的不变性。
在对知识图谱结构进行增强后,我们获得了两个视图。为了确保基于增强视图的每个项目的一致性属性,定义项目的知识图谱结构一致性ci与从不同视图编码的表示之间的一致性如下:
()表示估计两视图的项目嵌入之间相似度的余弦函数。如果一个项目的结构一致性得分越高,表示项目受KG噪声的影响越大。知识引导的对比学习
首先,对用户项目图进行数据增强,采用伯努利分布来生成两个掩码向量,其p的概率。计算过程如下所示:
其中()表示用户项目交互图增强函数。根据()生成了两个用户项目图和项目知识结构一致性来分别指导,并采用关系感知的知识聚合和LightGCN框架来获得项目i的高阶信息,其项目i的高阶信息获取过程如下:
最后,对比损失函数采用InfoNCE:
联合训练
将贝叶斯个性化排名(BPR)推荐损失与对比损失相结合进行联合优化
总结
本来采用关系感知的知识聚合来获得项目的嵌入(低阶),通过随机数据增强来获得两个相关数据视图,并对用户项目图采用服从伯努利分布掩码矩阵生成两个腐蚀的用户项目图。对两个用户项目图采用关系感知的知识聚合和lightGCN来进行知识引导增强。
卡塞米罗1800万年薪?英超年薪前五,曼联多人上榜不愧老牌豪门卡塞米罗加盟曼联已经不是什么新闻了,卡塞米罗的到来让曼联的中场压力有一定减小,但是一名球员显然无法让一支球队脱胎换骨,卡塞米罗能够让曼联有怎样的成绩目前还未可知,但是曼联这种恐慌性
诺基亚G400正式发布,搭载骁龙480Plus,拥有超长续航大家对于诺基亚这个品牌比较清楚了吧,诺基亚公司(NokiaCorporation)是一家主营移动通信设备生产和相关服务的跨国公司,总部位于芬兰埃斯波。成立于1865年,以伐木造纸为
仅售2699元,12GB512GB曲面屏68W闪充,扯下友商遮羞布打着高性价比口号卖手机的手机厂商有很多,因为这样做能让自家的手机更好卖,消费者们购买这类高性价比手机的时候,往往都会觉得手机厂商们没赚多少钱,相反是自己赚了,花费成本价就买到了一款
扫地机器人是人工智障?扫地机器人是典型的一分钱一分货的产品,价格越高,使用体验越好导航避障集尘自动清洁如何选?各价位的如何选?看下面扫地机器人选购攻略(1)看吸力吸力越大一般来说清洁效果会更好,但对应的
华为mate40pro现在还值不值得购买,用起来怎么样华为mate系列是华为自家的旗舰产品线,一直保持着优秀的产品输出。九月华为mate系列将再发新机mate50系列,但是应为一些原因导致华为mate系列仍将只能采用4G芯片,所以华为
做最闪耀的你,索尼派对音箱SRSXG300体验为什么会需要一台蓝牙音箱?现在我们的手机平板笔记本电脑等设备的扬声器无论是音质还是音效都有了很大的提升,但是这些提升都是针对使用者个人而言,这些设备的声音传播范围是有限的,再好的声
入门手机安全小能手,紫光展锐T7601300万AI三摄说起入门机,已经有很长一段时间没有见过像模像样的入门机出现,或许是因为这几年国产手机在中高端高端手机上的进行发力,颜值质感影像等各方面需求,都已经满足了消费者的需求,入门机在一定程
关于嫖娼的那些法律问题李易峰嫖娼被处罚的瓜刚刚被北京警方石锤,为此,我整理了相关法律法规以及结合办案实务经验,觉得有必要跟大家通过文字的形式普法总结一下,讲一讲关于嫖娼的那些法律问题。一什么是嫖娼?卖淫
2022年8月汽车完整销量出炉,别克威朗Pro销量大涨超过1。5万辆2022年8月汽车厂商销量排行榜完整版出炉了,各大车企在8月份销量都有所回暖,逐步摆脱了疫情和芯片的影响,下面小编就带大家看一下这份榜单。轿车榜单日产轩逸以43810辆夺得第一名,
中秋吃太多,喝茶消消滞共话中秋每年中秋时节都有很多好吃的,月饼蛋黄酥板栗柿子各种烧烤大鱼大肉饮料等,暴饮暴食,肠胃都吃坏了。秋天属阳明燥金当令,气以下为顺,当肃降之。胃肠属阳明肺为土金之德。阳明多气多血
正视内心,停止内耗弃我去者,昨日之日不可留,乱我心者,今日之日多烦忧。长风万里送秋雁,对此可以酣高楼。也不知道是我如此难捱,还是深圳的夜如此难捱。面对深圳这零零星星的夜空,远处的灯火阑珊,我却想起家