基于标签的个性化信息推荐系统动力学模型与仿真
〔摘要〕基于系统与控制理论,通过分析标签系统中标签、用户、资源的关系,运用系统动力学的方法分析个性化信息推荐的过程及影响因素,在此基础上构建信息推荐的系统动力学模型,并采用vensimPLE软件对模型进行仿真,最后通过对模型的有效性验证分析,揭示了信息推荐的特性及机理,为进一步研究基于标签的个性化信息推荐动态演变提供研究思路。
〔关键词〕标签;个性化;信息推荐;系统动力学;模型;仿真
DOI:10。3969j。issn。10080821。2016。03。002
〔中图分类号〕G203〔文献标识码〕A〔文章编号〕10080821(2016)03001205
〔Abstract〕Basedonthesystemandcontroltheory,thepaperanalyzedtherelationshipbetweentag,user,andresourceinthelabelsystem,usingsystemdynamicsmethodtoanalyzetheprocessofpersonalizedinformationrecommendationandtheinfluencingfactors,andconstructedsystemdynamicssimulationmodelontheinformationrecommendationusingthevensimPLEsoftware,finalythispaperrevealedthecharacteristicsandmechanismofinformationrecommendationforfurtherresearchonthedynamicevolutiononthetagofpersonalizedinformationrecommendation,throughtheverificationofmodelinvalidity。
〔Keywords〕label;personalized;informationrecommendation;systemdynamics;model;simulation
1问题的提出
个性化信息推荐是根据不同用户的信息需求、偏好或行为模式,将用户感兴趣的信息、服务等推荐给用户的个性化信息服务〔1〕。1999年,Smyth,B最早提出通过用户偏好分析和信息过滤技术来生成基于用户个性化浏览偏好的观看电视指南〔2〕。但是较正式明确提出基于标签的个性化信息推荐概念的是2007年JaeschkeRobert将资源以标签的方式标注,以FolkRank为基础,通过比较协作化推荐和基于图的推荐,验证了基于图的推荐的优越性〔3〕。
此后,国内外许多学者对基于标签的个性化信息推荐从复杂网络、概念语义等角度进行了多方面的深度研究〔46〕,但学者们关注较多的是标签系统的静态结构方面,而对基于标签的个性化信息推荐动态演变过程方面探讨的较少,对此,笔者用系统动力学方法对个性化信息推荐的过程进行建模仿真,为推荐策略提供理论依据。
系统动力学〔7〕(systemdynamics,SD)的概念最早由Forrester提出,适用于模拟研究高度非线性、高阶次、多变量、多重反馈、复杂时变的大系统决策问题的处理,它采用定性与定量相结合、系统综合推理的方法,能够在非完备信息状态下分析求解复杂问题,其建模过程是一个学习、调查、研究的过程,系统性和动态性是SD模型区别于传统的静态决策方法的两大主要特点。
基于标签的个性化信息推荐系统动力学建模首先需要建立因果关系图,确定影响信息推荐的各个关键因素,同时构建存量流量图,明确各种状态变量、辅助变量和常量的含义;然后确定个性化信息推荐模型中各变量的方程式,即各种状态变量、辅助变量和常量之间的关系;最后进行模型的有效性测度、灵敏性测度等,具体分析模型的结构和行为。
2个性化信息推荐系统的因果关系分析
基于标签的个性化信息推荐主要研究的内容是信息在用户之间流动的过程,由于它遵循信息扩散和转移的基本规律,并且信息总量具有不断增长的耗散特征,因此,可以用系统动力学来研究它的演变过程〔89〕。
21个性化信息推荐过程
在利用协同过滤算法提出基于标签的个性化信息推荐算法的基础上〔10〕,笔者进一步将个性化信息推荐具体分为4个阶段,其中包括2个反馈回路,具体如图1所示。
第一个阶段是数据挖掘,通过对标签系统中的用户、资源、标签进行两两关系分析,挖掘用户的行为,进一步提取用户的偏好,并进入第二个阶段,即构建用户偏好模型,具体用向量PijTUi、Rj来表示用户的偏好,然后进入第三个阶段,即相似度比较,利用余弦相似度比较用户的偏好,将相同偏好的用户形成一个集合,针对该类用户集,提取用户标注过的资源,形成资源集Pm,再次利用余弦相似度比较每个用户偏好和每个资源集的相似度PijPm,对每个用户的假设推荐资源进行排序,进行优先推荐。其中反馈1的作用是在相似度比较的过程中,如果相似度值低于既定的阀值,那么要对用户的偏好进行检查、过滤、调整。反馈2的作用是个性化信息推荐如果没有达到用户的满意度阀值,那么要对用户的行为进行再次分析、挖掘,重新构建用户偏好模型。
22个性化信息推荐因果关系分析
系统动力学主要利用反馈循环机制研究系统的内部结构,从而研究系统的行为模式与特性,为决策的制定寻找依据。笔者在综合国内外研究人员分析信息推荐的影响因素的基础上〔1114〕,认为影响个性化信息推荐的主要因素有用户标注行为、用户群的粒度、用户群中的资源,具体如图2所示,进一步通过系统动力学模拟,标明个性化信息推荐过程中的重要因素。其中,个人意向、社群影响、系统内置的标注行为选择算法正向影响用户标注行为〔15〕,用户偏好由于时间的因素,会发生漂移现象,所以会负向延长影响用户偏好,因果关系图中主要的反馈回路为:
(1)用户A标注行为用户群的粒度用户群中的资源用户偏好和推荐资源的相似度个性化信息推荐用户A标注行为
(2)用户A标注行为用户A偏好用户偏好和推荐资源的相似度个性化信息推荐用户A标注行为
(3)用户A标注行为用户群的粒度用户A偏好用户A标注行为
(4)用户A偏好用户偏好和推荐资源的相似度个性化信息推荐用户A偏好
(5)用户A标注行为用户A偏好用户A标注行为
(6)用户A标注行为用户群的粒度用户群中的资源用户偏好和推荐资源的相似度个性化信息推荐用户A偏好用户A标注行为
23个性化信息推荐的存量流量图
存量流量图是在因果关系图的基础上进一步区分变量的性质,更加清晰的反映系统要素之间的逻辑关系,明确系统的反馈形式和控制规律。个性化信息推荐模型的基本假设:用户标注行为和用户偏好会不断上升但是不会永无止境的上升,由于偏好的漂移现象,用户的偏好随着时间会发生变化,那么针对新的偏好又会有新型的标注行为,所以用户标注行为和用户偏好会假设有一个阀值限制。
图3中共有2个状态变量(用户A的资源、用户群中的资源)、5个流率变量(用户A资源的增加、用户A资源的减少、资源的增加率、资源的失效、推荐的资源量)、4个辅助变量(用户A标注行为增加、用户的偏好和推荐的资源的相似度、资源缺口、用户采纳情境)、10个常量(个人意向、社群影响、系统内置的标签选择算法、用户A偏好的漂移速率、用户A偏好的稳定率、同类型资源的增加率、同类型资源的失效率、资源复杂度、文化程度、信任程度),下面分别对重要的辅助变量和常量进行介绍。
用户A标注行为影响率:由于不同用户对信息的需求、情境、偏好等的不同,所以文献〔15〕认为用户标注行为会受到三方面的影响,分别是个人意向,即用户会基于过去的标注行为来使用标签;社群影响,即用户的标注行为会受到其他用户的影响;系统内置的标签选择算法。所以用户的标注行为存在很大的不确定性,它的增加率是随机产生且不断发生变化的。
用户偏好和推荐资源的相似度:采用余弦相似度的方法来计算用户的偏好和推荐资源的相似度,分别看作是向量空间中的两个向量,可以通过计算两个向量的夹角的余弦来衡量相互之间的相似度,夹角越小,相似度越高。例如将某用户的用户兴趣转化为向量p,另一用户的用户兴趣转化为向量r,则通过下面的公式进行计算〔10〕:
similarity(d,p)cos(d,p)nk1Rknk1Uknk1R2knk1U2k
(1)
其中d,p分别为即将要推荐给用户的资源向量d和用户偏好向量p,Rk和Uk分别表示用户的资源向量d和用户偏好向量p的第k个特征项的权重,similarity值越大表明二者内容越相近,设定一个阈值,设定为06,当similarity07时,就可以将资源推荐给用户,或者将排名最前的n项资源进行推荐。
资源缺口:根据用户群中用户A已掌握的资源与用户群共有的资源相比较,求出该用户的资源缺口,它作为将向用户推荐的资源的一个参考值。
用户采纳情境:由于受到资源复杂度、文化差距、信任程度等因素的影响,用户对系统推荐的资源采纳情况会不相同,资源越复杂,用户采纳系统推荐的可能性就越大;用户的文化水平越高,分析、推断信息的能力就越强,从而采纳系统推荐的可能性就越低;用户对系统越信任,就越容易采纳系统推荐的信息。
3个性化信息推荐的系统动力学模型设计
个性化信息推荐的存量流量图中各状态变量和辅助变量的动态方程详细情况如下:
用户A的资源INTEG(推荐的资源量用户A资源的增加用户A资源的减少,5)
用户A资源的增加用户A的资源用户A偏好的显著性用户A标注行为影响率
用户A资源的减少用户A的资源用户A偏好的漂移速率
用户群中的资源INTEG(资源的增加资源的失效,15)
资源的增加用户群中的资源同类型资源的增加率
资源的失效用户群中的资源同类型资源的失效率
资源缺口用户群的资源用户A的资源
推荐的资源量DELAY1I(IFTHENELSE(用户偏好和推荐资源的相似度文化差距,信任程度资源复杂度文化差距,0)。为了便于模拟,设定信任程度、资源复杂度与用户采纳情境正相关,文化差距与用户采纳情境负相关。
4个性化信息推荐的系统动力学模型测试
系统动力学认为,系统结构决定系统的行为,而典型的结构产生典型的行为,如内在规律性的行为等。仿真模型在VensimPLE平台上构建并仿真运行。设定仿真时间为60周,时间步长为0125,用户群中的资源初始值设为15,用户A的资源初始值设为5,用户偏好和推荐资源的相似度为08,调节信任程度、资源复杂度、文化差距的值,使用户采纳情境为01,个人意向、社群影响、系统内置的标签选择算法、用户偏好和推荐资源的相似度分别在〔0,1〕之间取值,最后仿真运行的结果如图4所示。
从模拟的结果可以看出:(1)用户群和用户A的资源在模拟时间内都出现了快速增长的趋势,并且用户群的资源增长要比用户A的资源增长快的多。(2)资源的缺口和推荐的资源量的变化趋势相似,由于在用户偏好和推荐资源的相似度一定的情况下,用户采纳情境为01,较低,所以推荐的资源量随着资源的缺口增加而增加。(3)保持当前的参数不变,提高用户采纳情境分别到04和07,命名为方案Current2和Current3,得到模拟结果如图5所示。
从图5可以看出,当用户偏好和推荐资源的相似度为08保持不变时,提高用户采纳情境,在相同的模拟时间内,Current2、Current3与Current1相比,资源缺口和推荐的资源量都与与原图形总体趋势保持一致,都随时间不短上升。其中,当用户采纳情境在区间〔01〕内逐渐变化时,资源缺口会先快速降低,然后缓慢降低;推荐的资源量会先快速增加,然后趋于平稳,最后由于资源缺口的降低,所以推荐的资源量也随之降低。总体上,推荐的资源量会随着资源的缺口变化而变化,但是两者会相互抑制,当推荐的资源量变大时,资源缺口就会降低。
5结束语
在分析个性化信息推荐过程及影响因素的基础上,建立基于标签的个性化信息推荐的系统动力学模型,分析了模型的有效性和主要影响参数的灵敏度,揭示了系统与用户间信息推荐的特性及机理,为研究个性化信息推荐提供了一个有效的方法。由于真实的个性化信息推荐是一个复杂、抽象的演化过程,因此模型存在一定的局限性,如模型中各影响因素的考虑不太全面,变量及方程的设定都采取了简化等,所以,笔者下一步的工作是深入研究更为复杂的个性化信息推荐模型。
参考文献
〔1〕ZhouT,RenJ,MedoM,etal。Bipartitenetworkprojectionandpersonalrecommendation〔EBOL〕。http:pre。aps。orgabstractPREv76i4e046115,20130205。
〔2〕SmythB,CotterP。Surfingthedigitalwave〔EBOL〕。http:link。springer。comchapter10。10072F354048508241?LItruepage2,20130205。
〔3〕JaeschkeRobert,MarinhoLeandro,HothoAndreas。TagrecommendationsinFolksonomies〔EBOL〕。http:www。kde。cs。unikassel。destummepapers2007jaeschke07tagrecommendationsKDML。pdf,20130205。
〔4〕ZhangZiKe,ZhouTao,ZhangYiCheng。Personalizedrecommendationviaintegrateddiffuseiononuseritemtagtripartitegraphs〔J〕。PhysicaA,2010,389(1):179186。
〔5〕ShangMingSheng,ZhangZiKe,Zhou,Tao。Collaborativefilteringwithdiffusionbasedsimilarityontripartitegraphs〔J〕。PhysicaA,2010,389(6):12591264。
〔6〕GodoyD,AmandiA。HybridContentandTagbasedProfilesforRecommendationinCollaborativeTaggingSystems〔EBOL〕。http:dblab。cs。nccu。edu。twpresentation。980525980525。pdf,20120822。
〔7〕FORRESTERJW。Industrialdynamics:amajorbreakthroughfordecisionmakers〔J〕。HarvardBusinessReview,1958,36(4):3766。
〔8〕王其v。系统动力学〔M〕。北京:清华大学出版社,1994。
〔9〕钟永光。系统动力学〔M〕。北京:科学出版社,2009。
〔10〕田莹颖。基于社会化标签系统的个性化信息推荐探讨〔J〕。图书情报工作,2010,54(1):5053。
〔11〕ChuangMC,ChangCC,HsuSH。Perceptualfactorsunderlyinguserpreferencestowardproductformofmobilephones〔J〕。InternationalJournalofIndustrialErgonomics,2001,27(4):247258。
〔12〕FriasMartinezEnrique,ChenSherryY,MacredieRobertD,etal。Theroleofhumanfactorsinstereotypingbehaviorandperceptionofdigitallibraryusers:arobustclusteringapproach〔J〕。UserModelingandUseradaptedInteraCtion,2007,17(3):305337。
〔13〕余力,刘鲁,李雪峰。用户多兴趣下的个性化推荐算法研究〔J〕。计算机集成制造系统,2004,10(12):16101615。
〔14〕邓胜利,鲍唯。社交网站用户交互学习行为影响因素的实证分析〔J〕。情报理论与实践,2012,35(3):5761。
〔15〕ShiladSen。Tagging,Communities,Vocabulary,Evolution〔EBOL〕。http:portal。acm。orgcitation。cfm?doid1180875。1180904,20120228。
信息技术的教学论文信息技术的应用日益普及,信息技术的迅猛发展把人类社会带入到了一个崭新的信息时代,它已对我们的生产方式生活方式学习方式及思维方式产生了深远的影响。信息技术的教学论文当前,信息技术的应
中学信息技术教学论文中学信息技术教学主要是让同学们认知计算机,培养同学们获取信息处理信息的能力。下面是中学信息技术教学论文,欢迎阅读了解。二十一世纪是信息时代,使信息技术成为社会成员必须具备的技术之一
信息技术教学论文第一篇高中信息技术教学实效探究一加大多媒体的有效使用,提高辅助教学的效率我们知道高中信息技术课程中不仅需要对理论知识的深刻理解,更需要学生的实际操作能力的培养。学生的信息技术学习是
信息技术与英语教学论文一提高学生的英语阅读能力传统的初中英语阅读教学,由于阅读材料及内容范围偏窄,教师主要是通过课本及分发纸质阅读材料的形式进行阅读训练,阅读也只是学生做题教师批阅的单一训练,且反馈矫正
高职路基路面工程课程改革的论文1课程介绍路基路面工程课程改革的目的是改变传统的先学后做教学模式,应以学生为主体,老师主导,利用项目和任务教学,精心设计系列任务,覆盖课程,推进学习。由近及远由浅入深由简单到复杂由
市政工程施工中绿色施工技术研究论文1市政工程建设现状市政工程建设直接服务于城市基础设施建设,包括城市道路桥梁燃气供热和绿化等等项目的建设,是城市建设不可缺少的建设力量。然而,随着市政工程建设的不断深化,环境问题日渐
豪享来西餐厅营销策略分析论文创立于1993年的豪享来是中国国内最早专业经营中西餐饮连锁业务的企业之一,近二十年已经迅速成长为具有很高知名度和极强影响力的中国大型餐饮连锁品牌。豪享来以中国牛排专家理念坚持将科学
国际关系毕业论文提纲精选发展新型大国关系是中美两国政府基于国际情势变迁而形成的基本共识。中美新型大国关系的构建不仅对各自的繁荣和稳定有至关重要的影响,而且对整个亚太地区乃至对世界的和平与发展具有举足轻重的
关于企业库存管理论文在企业中,做好库存管理是十分重要的,那么相关的论文内容应该怎么写呢?下面是小编分享给大家的关于企业库存管理论文,欢迎阅读。摘要企业的主要目的就是对利润的追求,而如何有效地降低库存商
浅谈城市测绘在城乡规划建设中的作用研究论文1城乡规划编制无论新城市的兴建和旧城市的改建扩建,都必须首先制定城市规划,没有规划就不可能有条不紊地来进行城市建设,就不可能建成一个功能协调布局合现环境优美生态健全的文明城市。总之
砌体结构裂缝成因及有效控制研究工学论文摘要通过分析砌体结构裂缝的类型和形成机理,从设计选材施工监控加固等几个方面探讨了有效控制裂缝产生和发展的措施。关键词砌体结构,裂缝类型机理控制措施1砌体结构裂缝的类型及成因1。1地
电大的毕业论文范文在电大的毕业生在毕业时需要写好相关的毕业论文,那么应该如何写好论文的内容呢?下面是小编分享给大家的电大的毕业论文范文,希望对大家有帮助。摘要消费主义文化在现代社会中比较盛行,实际生
感受特级教师于永正论文身临其境地感受了于老师的魅力,那种挥之不去的教益给我自身的教学以诸多启示。当脑中不断再现于老师讲授lt全神贯注)的精彩片断时,我决定就我的视角我的体会试着走近于老师,走进他那精彩课
幼儿心理健康教育模式研究论文参考文献在社会的各个领域,大家都跟论文打过交道吧,论文可以推广经验,交流认识。那么问题来了,到底应如何写一篇优秀的论文呢?下面是小编为大家整理的幼儿心理健康教育模式研究论文参考文献,仅供参
幼儿教育论文参考文献在学习工作中,大家对论文都再熟悉不过了吧,论文是指进行各个学术领域的研究和描述学术研究成果的文章。你写论文时总是无从下笔?下面是小编整理的幼儿教育论文参考文献,欢迎大家借鉴与参考,
幼师教育论文范文(精选3篇)在现实的学习工作中,许多人都有过写论文的经历,对论文都不陌生吧,论文写作的过程是人们获得直接经验的过程。为了让您在写论文时更加简单方便,下面是小编整理的幼师教育论文范文,欢迎阅读,
浅议幼儿园传统文化教育论文在日常学习和工作中,许多人都写过论文吧,通过论文写作可以培养我们的科学研究能力。你知道论文怎样才能写的好吗?下面是小编为大家整理的浅议幼儿园传统文化教育论文,希望能够帮助到大家。摘
幼儿儿童家庭教育论文在现实的学习工作中,大家总免不了要接触或使用论文吧,借助论文可以达到探讨问题进行学术研究的目的。为了让您在写论文时更加简单方便,以下是小编收集整理的幼儿儿童家庭教育论文,欢迎阅读,
幼儿诚信教育论文在社会的各个领域,大家都写过论文吧,通过论文写作可以培养我们独立思考和创新的能力。那么,怎么去写论文呢?下面是小编为大家收集的幼儿诚信教育论文,希望对大家有所帮助。摘要诚信是中华民
电子技术专业毕业论文电子信息工程专业是集现代电子技术信息技术通信技术于一体的专业。快来看看电子技术专业毕业论文吧!电子技术专业毕业论文电子信息工程发展探讨摘要伴随科学技术的快速发展,现代化网络技术手段
试探建立每股收益分析指标体系论文每股收益(EPS)是上市公司最重要的财务指标,因此受到人们特别的关注,投资者往往将每股收益的高低作为衡量股票优劣的尺度。企业理财目标是企业价值最大化,其核心就是每股收益,因此经理人
科学教学获奖论文精选科学探究学习是科学课的活力所在。科学探究教学的研究越来越成为广大科学学科教学的重要话题。探究活动作为科学的根本,也是科学学习的核心,最大的特点就是要求课堂教学要向学生提供充分的探究