保健励志美文体育育儿作文
投稿投诉
作文动态
热点娱乐
育儿情感
教程科技
体育养生
教案探索
美文旅游
财经日志
励志范文
论文时尚
保健游戏
护肤业界

基于数据挖掘技术的图书馆个性化信息服务探讨

  关键词:图书馆;个性化信息服务;数据挖掘技术;关联规则
  摘要:文章从数据挖掘技术的相关原理出发,构建了图书馆个性化信息服务系统,并对数据挖掘的实施过程进行了简要论述,并从关联规则的角度介绍了基于数据挖掘技术的图书馆个性化信息服务的实现途径。
  中图分类号:G250。7文献标识码:A文章编号:10031588(2016)02012703
  文献信息的检索与传播是图书馆的基础职能,随着图书馆数字化、智能化、自动化程度的不断提升,很多图书馆引入了中外文全文数据库。一方面满足了读者多样化的文献信息需求,另一方面也增加了读者在短时间内获取有效信息资源的难度〔1〕。个性化信息服务是图书馆以人为本价值理念的直接体现,是一种最大限度满足读者需求的主动性或智能推送性的服务模式,即通过对用户的借阅习惯和个性特点进行分析,进而主动地向用户提供其可能感兴趣的信息。这一服务模式涉及庞大的数据采集、处理、分析和归类,需要强有力的数据集成分析工具来支撑。数据挖掘又称知识发现过程,即利用关联规则从大量的、模糊的、不完全的信息数据库中提取潜在的、对读者而言有价值的信息。数据挖掘技术最先应用于商业领域,近几年已经开始引入图书馆管理与服务之中,其在图书馆个性化信息服务中的应用仍有较大的开发空间。
  1基于数据挖掘的图书馆个性化信息服务系统设计
  1。1整体结构模型
  图书馆个性化信息服务涵盖了用户从网站注册到接受系统提供服务的全过程。这一系统首先对图书馆用户信息进行收集,而后关联技术对用户需求行为进行模型构建,继而用已存在的图书馆资源知识库与用户模型进行对照,提取出用户需求的具体信息服务(见图1)。
  图书馆个性化信息服务系统分为两大基本模块,即在线推荐模块和离线挖掘模块,图中上半部分为在线推荐模块,下半部分为离线挖掘模块。知识资源库又细分为信息采集层、信息存储层、信息加工处理层、信息服务层等部分内容。其中,信息采集层、存储层和加工处理层满足了图书馆个性化信息服务中的强大数据需求,是数据挖掘的必要条件。系统数据采集通过搜集读者使用图书馆的信息而实现,如读者刷卡保留的借阅信息、个人身份信息等。待采集环节完成之后,由资源处理层对采集信息进行分类加工,更新知识数据库信息,确保数据资源的即时性(见图2)。
  从图2可以看出,资源采集层实现信息采集有两种方式,即自动采集和人工采集。所谓自动采集指的是系统根据用户在图书馆中借书、还书、业务办理等刷卡记录自动提取并存储读者信息。人工采集是一种必要的辅助采集手段,某些情形下,因为系统的原因导致用户个人信息无法收录或收录不完全,如系统因功能故障未记录部分用户的身份信息,此时就需要依靠管理人员根据系统提示对用户信息进行完善补充。资源处理层除具备清理和分类信息功能之外,还具有把不规则数据转换为可识别数字信息的作用,最后经数据挖掘工具将其转化为统一识别的知识规则集,以实现个性化信息资源推送服务。
  1。2工作流程
  系统总体工作流程从用户和图书馆后台数据两方同时开展。首先,用户在图书馆个性化界面中注册信息并申请登录账号,实现与后台数据系统的实时交互。其次,用户通过登录认证查阅各类文献信息,同时点击接受图书馆个性化信息服务操作指令。个性化信息系统后台则根据已录入的用户信息,建立用户使用模型。最后,信息系统后台利用数据挖掘技术获取图书馆资源库中的关联资源,并向用户进行推荐(见图3)。
  在线推荐模块为离线挖掘模块运行提供了数据支撑,而离线挖掘模块辅助在线推荐模块实现信息推送服务,两者共同组成了个性化信息服务模块,都不可缺少〔2〕。在线推荐模块在完成用户信息采集后,对信息进行整理归类,而后与系统知识库进行比对,最后根据关联规则生成用户所需要的信息。离线挖掘模块通过对用户进行的聚类细分找出相似用户群体,继而构建用户模型,完成个性化信息推送服务。
  在线推荐模块的原理主要是把生成的用户模型与已有的资源知识库相比对,最终把有用信息推荐给用户。而采用离线挖掘,一方面要求在时间效度上具有科学性,另一方面要求在数据处理上具有即时性。图书馆个性化信息服务系统中存储的用户信息每时每刻都在更新,需耗费大量时间进行数据处理,考虑到在线处理会影响到用户的使用,通常情形下系统工作采用离线处理模式。因为离线数据挖掘基于用户使用信息生成关联规则,而在短时间内用户信息基数变化不大,所以离线处理的结果不会对个性化信息服务运行造成影响(见图4)。
  图4离线数据挖掘生成关联规则流程图
  从图4可以看出,这一关联规则流程主要由三部分模块组成:数据处理模块。其又称数据存储模块,主要功能是依靠系统分析、处理和汇总图书馆资源数据库中的用户信息,而后将其存储在数据挖掘资源库之中。挖掘模块。其又称数据挖掘引擎,主要功能是运用聚类算法对存储信息进行挖掘,生成用户行为规则。规则导入模块。其主要功能是把挖掘算法结果导入到系统知识库之中,寻找与用户行为规则相匹配的文献资源。
  2图书馆个性化信息服务中的数据挖掘实施与结果评价
  在当前信息资源泛化传播的时代,图书馆用户的信息需求不仅仅局限于以往的信息检索、文献书目查询,而是希望获得更有深度的文本信息或更具全面性的查询问题解答。采用数据挖掘技术既有助于保持信息的完整性和功能性,又能深入剖析信息之间的关联,进而满足用户的深层次信息需求。普通数据挖掘的实施过程分成四个阶段,即问题定义阶段、数据挖掘和结果分析阶段、数据评估阶段。与普通数据挖掘所不同的是,图书馆个性化信息服务中的数据挖掘可以为信息服务提供多种可参照的方式〔3〕,如按照某一主题,提供全面的方案知识,辅助图书馆完成个性化决策支持服务;应用户要求,为其提供全本文献资料或关联资源库链接,使文献服务更具针对性(见图5)。
  图5个性化信息服务系统中数据挖掘实施步骤
  2。1提出问题
  图书馆用户依据自身的借阅需求向图书馆个性化信息服务系统提出文献查阅或借阅请求。系统自动记录用户请求,并根据请求的具体内容缩小数据挖掘范围,减少系统数据挖掘压力。
  2。2数据导入与整理
  数据导入和整理是数据挖掘开始的前提,同时也是用户获得优质信息服务的必要条件。数据挖掘质量与挖掘范围、挖掘工作量成正比关系,为了向用户提供全面而深入的文献信息服务,数据挖掘开始之前应全面理解用户设定的问题,尽可能扩大文献数据的挖掘范围与深度。在挖掘工作初步完成之后,应根据用户的需求和索引题目的要求对挖掘数据进行初步审核,并对挖掘出的数据进行分类。通过异常数据清除、重复数据删除、文献资源标准格式化、错误更正等操作,完成对数据的最终整理。
  2。3模型构建与调整
  把已挖掘数据转换成用户信息模型,并最终与系统数据库中的资源指标正确匹配,从而转换成有用的关联规则,这离不开模型构建工具的科学性和挖掘人员丰富的操作经验。一般而言,一种数据挖掘算法对应一种模型构建方式,想要最大化地发挥数据挖掘功能,关键是要选择一种适合分析模型的挖掘算法。用户模型建立完成之后,可根据系统的需求对模型进行适当调试,如:增加信息匹配因素,使之能够挖掘出更多的或更深层次的关联信息。
  2。4结果评定与解释
  结果评定根据用户的文献信息需求状况而设定,其目的在于分析和整理出有用的挖掘模式运行数据,为后续完善系统服务做准备。数据挖掘之后,在资源数据库中寻找出潜在的价值信息,但数据挖掘之后产生的关联规则可能不止一种模式,也并非每种模式都会产生相同的挖掘效果〔4〕。通过对挖掘结果做出评价和解释,选择最优化的挖掘模式,有助于满足大多数用户的信息需求。
  2。5反馈与修订
  系统接收用户的反馈信息,找出数据挖掘中的不足,与用户沟通后制订下一阶段的详细挖掘计划。
  3基于数据挖掘的图书馆个性化信息服务实现
  3。1分类号级层面关联规则
  分类号级层面的关联规则通过分类号级对图书馆资源系统进行数据挖掘实现。这一关联规则既能呈现出学生的潜在阅读行为,又能勾勒出学科之间的隐性关系。一些情况下,对于图书馆两年内的新购图书,管理人员会把其集中在靠近走廊或阅览室入口之处,以便借阅。此时,利用数据挖掘生成分类号级关联规则,将符合规则的图书集中有序摆放,也就实现了潜在的个性化信息服务。而购置时间在两年以上的图书,其摆放原则大多依据《中国图书馆图书分类法》,很难依据关联规则对其进行重新调整。由此可以看出,此种关联规则下的个性化信息服务方式更加适合传统模式下的图书馆。
  3。2图书馆层面的关联规则
  图书馆层面的关联规则通过索书号级对图书馆资源数据库进行挖掘实现。特定的索引书号对应相应的图书标题,这一数据挖掘生成的关联规则除了显示用户借阅了图书甲的信息,还会显示读者可能借阅图书乙的信息。这一关联规则在数字化图书馆中有较大应用空间,不受图书馆文献资源购买时间长短的限制。其基本过程是通过关联规则表查询用户最近的借阅行为,与资源数据库进行匹配,如果有相关联图书,则从资源数据库中把图书信息调出,待用户下次登录图书馆个性化信息服务界面时,系统会在屏幕中主动显示用户可能感兴趣的图书列表。
  4结语
  当今社会中的图书馆服务不再局限于提供简单的文献查找与借阅,而是转向了为用户提供更为深层次和关联性的信息源。本质上来看,传统图书馆的信息服务模式是一种被动式服务,难以向用户提供完整的知识集合或信息集合。而数据挖掘技术的应用,则有效解决了图书馆信息服务中供求不匹配的问题,使读者享受到更具实效性、针对性和个性化的信息服务。但数据挖掘技术涉及诸多数据处理技巧且工作量复杂,因此在我国图书馆个性化信息服务系统构建中普及率还很低,同时这也成为我国图书馆个性化信息服务建设中面临的现实问题。
  参考文献:
  〔1〕刘琼。大数据环境下图书馆面临的影响与挑战〔J〕。理论观察,2013(8):112113。
  〔2〕查继红。高校图书馆个性化信息服务模式探析〔J〕。图书馆学刊,2014(6):7982。
  〔3〕吴淼。数据挖掘在图书馆个性化服务中的研究〔J〕。出国与就业,2011(12):4244。
  〔4〕孙鸿燕。图书馆关联数据的综合管理及实现〔J〕。图书馆学研究,2011(12):101103。

新闻写作中如何借鉴文学手法摘要:随着我国经济的发展,人们的生活水平和思想觉悟也越来越高。电视新闻也逐渐成为了我国居民了解国家大事和时事新闻的有效途径。而新闻写作作为新闻传播的基础,其写作水平更是直接影响……好太太油烟机好不好好太太抽油烟机特点介绍详解厨房必然少不了抽油烟机这一实用的厨电产品,关于抽油烟机的品牌也有很多,相信大家选购的时候一定会进行品牌的比较。好太太这个品牌不知道大家有没有听说过,关于好太太油烟机怎么样大家了……汉语言文学专业教学模式革新摘要:汉语言文学作为幼师学校课程教学的重要内容,主要起到培养学生文学应用能力、表达能力与文化素养的作用。当前我国汉语言文学专业的学生逐渐增多,但幼师学校所开展的汉语言文学教育,……现代文学的农妇叙事摘要:在现代文学史的三十年中,因历史语境的不同,不同时期对农村妇女形象的塑造呈现出了不同的时代特征。从20世纪20年代文学中祥林嫂牺牲式的祭品,到30年代文学中大堰河包容一切的……汉语言文学教育与人文素质教育探析摘要:在社会发展过程中,学生的三观经常受到威胁与影响。而汉语言文学教育则是强化学生人文素质的主要途径。文章主要针对汉语言文学教育与学生人文素质教育进行分析,从多个方面出发深入研……民间文学在语文教学的融入策略内容摘要:在中国即将崛起的新时代,民间文学作为语文教学中传播传统文化,传承民族精神的重要工具,正日益被人们所重视。本文指明了民间文学融入语文教学能够树立学生正确的历史观人生观价……OPPOK3跑分多少?【OPPOK3跑分多少】OPPOK3已经在2019年5月23日正式发布,这款ldquo;硬核少年rdquo;的千元性价比手机在配置上堪称千元机中最华丽的BOY,无刘海全景屏,升……如何清理c盘垃圾我们在使用电脑的时候,时间长了会觉得电脑的反应速度比较慢,主要是由于c盘累积了过多垃圾所造成的,软件以及浏览网页的缓存积累到一定量的时候就会使电脑运行缓慢。但是c盘和其他磁盘不……网络文学生产机制的建立与引导经过十几年的发展,网络文学已经形成自己的生产机制,这种机制以网络技术为基础,既根植于原有的文学生产机制,又突破了传统的模式和限制,形成了以受众、资本、技术和政策等为核心的生产机……文学生活视野中的现代文学经典的大众接受及其问题在关于经典重构的学术讨论中,童庆炳先生曾指出,一般文学经典的建构至少应包括如下要素:(1)文学作品的艺术价值;(2)文学作品的可阐释的空间;(3)特定时期读者的期待视野;(4)……网络语言给汉语言文学发展的影响探究关键词:网络语言;汉语言文学;影响一、网络语言简介strong网络语言是网络发展过程中形成和出现的语言形式,和中国的传统语言有很大不同,网络语言有很强的创造性和传播……高校汉语言文学专业教学模式转变【摘要】新时代的高校汉语言文学教学,教师要确立更高的教学目标,以学生作为教学的主体来进行教学模式的转变,提高教学的高效性,增强学生的学习热情。教师在进行教学转变中,要多与学生进……
奥林巴斯TG850焦距怎么样?光学变焦是多少倍?奥林巴斯TG850焦距怎么样奥林巴斯TG850焦距等效35mm相机为21105mm。奥林巴斯TG850焦距怎么样?值得一提的是,奥林巴斯TG850将电池仓、存储卡仓……三星note3价格怎么样图文如今市场上手机品牌众多,型号也是多种多样,我们生活在现代大都市中,不免会为了追求时尚和标新立异而不断的更换手机,也借此显示自己的生活水平,当然了这其中不乏有很多为了充门面,比较……努比亚Z5SN需要剪卡吗?努比亚Z5SN用MICROSIM卡努比亚Z5SN需要剪卡吗努比亚Z5SN不需要剪卡。努比亚Z5SN需要剪卡吗?努比亚Z5SN配备了一块5英寸显示屏幕,屏幕材质为IPS。分辨率1920x1080像素,……如何禁止word另存为?有时候我们在共享文件时,常常希望用户可以打开共享文件,但禁止复制共享文件内容,同时也禁止将共享文件另存为本地,那么如何实现呢?可以通过以下两种方法:一、通过宏命令禁止Wo……如何用小DC拍出好的微距照片如何用小DC拍出好的微距照片一、DC微距前的准备1、如何衡量相机微距能力首先是对焦距离。现在很多DC的最近对焦距离都达到1cm,有些更甚。实际上这些标榜最近对……空气智能炸锅怎么样空气智能炸锅使用方法介绍详解有谁曾经想过,油炸都可以用空气来炸呢?看似异想天开,空气智能炸锅就是这样一款神奇的产品。曾经我们油炸是很辛苦的,还要提防被油溅到,如今空气智能炸锅出现了,小编就为大家介绍一下空……我国地域文学史编写现状与古代文学教学关系探讨我国地域文学史编写现状与古代文学教学关系探讨刘同般著《商丘文学通史》(中原农民出版社,2005年),司全胜著《河洛古代文学概览》(河南文艺出版社,2007年),聂大受等著……关于制度创新推进我国新农村建设论文关键词:赣州新农村建设制度创新论文摘要:我国区域经济发展不均衡决定了社会主义新农村建设在不同地区应有不同的发展模式,符合本地区区情的制度创新是新农村建设成功的重要关键……打开word时发送错误报告怎么办故障分析:如下图所示一般造成打开word出现关闭word提示发送错误报告的故障其主要原因为word程序其中的某个文件出现了错误或者被损坏的情况,只要将这个文件删除掉即可。那么解……三星GalaxyCameraGC110标配有什么三星GalaxyCameraGC110标配有机身、电池、快速入门指南。三星GalaxyCameraGC110采用4。8英寸92万像素的HDSuperClearLCD屏,分……浅谈城乡统筹背景下我国农村社会保障的制度设计论文关键词:城乡统筹农村社会保障制度设计论文摘要:在城乡一体化进程中,构建城乡统筹的社会保障体系,对于维护社会稳定、实行计划生育国策、促进农村经济社会全面发展具有重要意义……浅论我国农村小额信贷法律制度〔论文关键词〕农村小额信贷制度发展〔论文摘要〕小额信贷在上世纪70年代发端于孟加拉国,它是满足贫困人口信贷需求的一种信贷方式,贷款对象仅限于贫困人口,额度很小,无需抵押通……
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网