范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

Web集成信息检索在数字图书馆中的应用研究论文

  摘要:本文针对数字图书馆领域的特点,提出了一种实现数字图书馆Web集成信息检索及知识库的建立管理机制,以RDF作为信息和知识的表示模型,采用中介器和包装器框架来实现对异构数据源的集成信息检索,并在此基础上建立基于RDF的知识库,实现全局查询,在知识服务方面做了初步的实现。最后,本文介绍了基于该机制实现的一个原型系统,并以此原型系统为例,分析了系统性能。
  关键词:数字图书馆;Web集成信息检索;RDF;说明式查询语言
  0引言
  数字图书馆是海量电子资源的集合,它所提供的功能涵盖并远远超过了传统的数据库、信息检索系统。数字图书馆已经成为世界范围内、日益重要的基于Web的应用框架体系。其基本目的是实现信息的集成共享,给用户提供统一资源查询服务,保障数字资源的最大可用性、系统之间的互操作性和集成性。
  但是,如果数字图书馆像现有的Web一样仅仅提供简单的信息浏览功能,则同样会让用户陷入"信息过载"的困境,不能共享经验知识,无法满足用户对信息、知识的需求。因此,需要针对数字图书馆异构信息源的特点,采取一种适用的集成信息检索框架,同时要求系统能够积累交互运行中的知识,建立知识库,从而给用户提供智能的、主动的、动态的知识服务。
  1RDF查询语言——RQuery
  RDF查询语言RQuery与XML相比,RDF支持语义信息,然后,XML的设计动机是关心文档的结构,目的在于提供多元的文檔表示结构,关注的焦点不是文档中数据所代表的语义信息。通过比较得知,RDF查询语言可以根据实际需要,使用多元的机制,同时可以定制应用领域内资源、语义信息、知识的表达规则。因此,采用RDF查询语言作为信息表示标准,更方便实现数字图书馆领域异构、半结构化数据源IIR的语义相互操作。
  RQuery的作用有两个,实现对RDF数据和RDFS的查询,为了给用户提供超出普通信息查询更多的知识,系统将上述查询方法结合起来。
  设计的RQuery解析器是一个简单的语法分析器,针对RQuery的上下文无关文法的特点,采用了自上而下的语法分析方法。顾名思义,自上而下就是从文法的开始符号出发,向下推导,推出句子。其主旨是:对任何输入串,试图用一切可能的办法,从文法开始符号(根节点)出发,为输入串获取确定的最左推导。
  提出的RDF查询语言RQuery,是一种融合了谓词逻辑的说明式查询语言,它的设计基于数字图书馆IIR需求,与其它RDF查询语言相比,具有如下特点:支持语义映射、可逻辑解析、模式查询和数据查询相融合。
  2数字图书馆集成信息检索框架
  基于中介器,包装器的数字图书馆集成信息检索(DLIIR)系统结构如图1所示。系统采用RDF作为中间信息表示规范:即系统各组件间交换的数据皆为符合RDF规范和RDFS定义的信息。因此组件之间以计算机可理解的语义信息进行通讯,提高了处理信息的效率和准确度,适合海量数据的查询。
  DLIIR系统包含用户接口和中介器2个模块:包装器生成组件(WrapperDispatcher,WD):包装器(Wrapper);知识获取器(KnowledgeAcquireAgent,KAA):知识库搜索器(KBSearchAgent,KBSA)。它们彼此通信,相互协作,共同完成检索功能。同时,在DLIIR系统中增加了RDF知识库。RDF知识库包含一个知识获取(KAA)组件,将来自中介器的RDF文档转换成RDF知识库中的记录。
  3组件间通讯规则
  DLIIR系统包含若干个共同协作、彼此独立的单元模块,这样的目的在于增加系统的可扩展性。为了进一步实现组件之间的通讯和数据交换,提高系统性能、查询准确率以及工作效率。整个系统的.数据流如图2所示。
  采用RDF作为统一的数据格式,完成彼此的数据交换和通信,协同工作,从而实现整个系统的功能,为用户提供查询服务。
  4用户接口Agent
  用户接口Agent的主要功能是协助用户明确、细化查询请求。同时,将MA返回的查询结果以友好、清晰的格式显示给用户。
  UIA的功能包括:①协助用户明确、细化查询请求,将查询请求提交给MA;②接收MA返回的查询结果,以普通HTML页面形式将结果显示给用户;③为用户提供查询RDF知识库的导航服务。UIA主要和MA进行通信,完成和用户交互的功能,这就是主体和其它主体协作共同实现系统功能的过程。从主体的运行周期来看,UIA的状态周期如图3所示。
  DLIIR系统中,主体之间的通信数据均以RDF表示,MA接收到该消息之后,把该查询请求转换成RQuel查询语句。DLIIR提供给用户基于Web的查询界面,当用户提交查询请求时,激活UIA,开始响应用户的请求。DLIIR给用户提供了两种查询方式:基于关键词的查询和基于语义的查询。基于语义的查询仅仅限于对RDF知识库进行查询,由于知识库中存放的是经过处理的、以RDF格式表示的知识,它们之间存在可处理的语义关联,可以根据语义联系查找用户所需要的信息。
  5中介器的实现机制
  中介器依靠包装器完成信息集成。在DLIIR系统中,中介器(MediatorAgent,MA)需要和其它五种组件通信,协调各个组件彼此协作,共同完成查询任务。从MA的内部结果来看,MA就是一个查询映射、结果集成的模块。
  DLIIR系统中,所有组件之间传递的信息均以RDF格式表示,采用提出的RQuery来实现对这些数据的查询。在MA中,对查询请求的转换,其实质就是将RDF格式描述的查询请求,转换成RQuery语句。
  为了更清楚地给用户提供查询结果,往往需要HTML文档具有一定的格式,如不同数据以不同颜色显示,采用表格、链接给用户提供更友好的界面等。此外,考虑到系统的灵活性,便于将来修改结果显示的形式,在设立了一个系统文件——显示模式(DisplaySchema)文档。MA在进行查询结果到转换时,根据提前定义的显示模式,将RDF文档转换成具有一定格式的HTML文档,然后提交给UIA,以供在用户端的Web浏览器上显示。
  6包装器自动构造及知识库框架
  包装器(Wrapper)具体工作流程如下:首先该Wrapper将全局查询请求转换成对该数据源进行检索的命令格式,按照接口协议和数据源通信,获得检索结果。然后该包装器将结果遵循全局RDFSchema构造成RDF文档,返回给MA。完成此次查询任务后,Wrapper进入空闲状态,等待下次检索任务。
  DLIIR中的RDF知识库以关系数据库形式存储的知识记录,采用两个组件实现对关系数据库的操作:知识获取器和知识库搜索器。图4给出了RDF知識库的框架结构。
  以RDF图模型表示的知识按照类和属性的关系,以关系型数据库格式存储在MicrosonSQLServer数据库中。因此,KAA和KBSA组件需要更新、访问关系数据库,实现对知识库的维护和查询。这个过程涉及到RDF的解析与RDF图的恢复。
  7性能评估
  传统的应用程序往往由程序员手工为每个信息源编制包装器代码,采用包装器自动生成机制避免了程序员手工编写代码。传统方式中手工开发包装器代码耗费的开发代价最大,而DLIIR中建立数据源接口描述文档的开发代价远远小于它。
  DLIIR系统在实现对异构数据源检索的基础上,同时从检索结果中获取知识,构造了以RDF进行知识表示的知识库。利用本文提出的RQuery语言对知识库进行检索。因此,衡量DLIIR系统的知识库检索性能(P-RKBIR)也就是衡量RQuery语言的检索性能。采用知识库检索时间作为P_RKBIR的衡量标准。
  在数据量很小时(10万条记录以下),数据量的变化对查询时间的影Ⅱ向无法衡量出来,查询时间相等。在数据量在百万级别以上时,才体现出查询时间随着数据量的增大而增加的趋势。此外,查询时间与记录数是线性关系的。
  基于结果,DLIIR系统符合设计要求,满足了对数字图书馆领域异构数据源集成检索的需要,而系统的RDF知识库通过设计的专用查询语言RQuery进行检索时性能良好。
  8结论
  数字图书馆已经成为国家信息化水平的标志,是社会信息知识共享的框架平台。因此,实现对该领域内异构信息源的互操作,给用户提供智能的、主动的知识服务是数字图书馆的发展方向。本文提出了一种实现异构信息源集成信息检索的互操作框架,并对知识库的建立和检索进行了初步研究。

西医专家治不好的病怎么办?任氏中医有绝招西医专家治不好的病怎么办?任氏中医有绝招专治鼻炎月子病咳嗽糖尿病痔疮脱发阳痿早泄等免费加盟名医绝招在民间。有病去医院,但很多病西医承认确实治不好,而西药的毒副作用却让病人感觉越治越关于人权与国际法若干问题的初步思考(1)论文一国际法与国内法在人权问题上的历史联系可以说,近代国际法理论从一开始就和近代人权思想有过缘分。世人皆知,被称为近代国际法之父的荷兰人格劳秀斯(HugoGrotius),同时也是近代浅论个人是能否为国际法主体(1)论文主要内容二战结束后,国际环境日趋稳定。和平与发展成为当今世界的两大主题。随着各个主权国家的成立与确认,国际间的关于政治经济文化军事等往来越来越频繁。因此国际间的行为规则必然成为当前人道主义干涉在国际法中的地位及其前景(1)论文冷战结束后,随着国际格局的变化,原来在两极格局掩盖下的民族矛盾种族纷争和宗教冲突一再涌现,地区分治主义不断抬头。因此,人道主义干涉(HumanitarianIntervention试论一国两制下之中国国际法主体资格(1)论文一国两制构想因香港澳门的顺利回归而部分地变为现实,海峡两岸的和平统一也必将在一国两制的框架下得以实现。当港澳台在一国两制下实现与祖国的统一,港澳台地区设立特别行政区享有高度的自治权非政府间国际组织的国际法主体资格探讨(1)论文非政府间国际组织是各国的民间团体联盟或个人,为了促进在政治经济科学技术文化宗教人道主义及其他人类活动领域的国际合作而建立的一种非官方的国际联系合体。其数目由本世纪初的一百多个发展到WTO与国际法(1)论文一WTO是个三位一体的概念从国际法上说,WTO本身包含着两种三位一体的因素。首先,和用GATT(关贸总协定)的缩写来表示的意思一样,人们用WTO所表示的内容,从其功能上说,有三个一美国强权与国际法(1)论文前言刚刚结束的伊拉克战争,是美国强权在国际关系中的一个极端体现,美英等联军在没有联合国安理会决议支持的情况下,悍然出兵伊拉克,严重违反了不使用武力和不以武力相威胁的国际法原则,侵犯两国论于国际法无据(1)论文在台湾的李登辉公然冒天下之大不韪抛出两国论后,台湾的某些媒体以及某些追随台独主张的文人政客纷纷出面为两国论粉饰,称两国论是有充分的政治历史及法律依据的,甚至有人撰文称两国论禁得起国WTO法对传统国际法的创造性发展(1)论文中国加入WTO后,法学界关于WTO对中国具体法律制度的影响的研究成为热点,但是对WTO法本身的研究特别是对WTO法的基础理论的研究受到忽视。本文将从WTO法基础理论着手,通过对WT谈尊敬人权成为国际法的基本原则(1)论文论文摘要在联合国的宪章和序言及相关的条款中尊重人权虽有多处提起,但未成为宪章基本原则的范围,同时国际社会对人权的理解存有争议,尊重人权一直未被认可为国际社会公认的基本原则。但随着国
网络广告创意研究论文导语以下是小编为大家整理的一篇关于网络广告创意研究论文,希望能帮到大家!一网络广告创意想法但这里小编想谈的是网络广告的创意,主要是指创意想法。谈到网络广告的创意,首先笔者偏向将创意试论大学体育教学中培养学生终身体育意识的对策分析论文论文关键词大学生体育教学终身体育意识论文摘要本文为此根据当前大学生终身体育意识认知的现状和影响大学体育教学中大学生终身体育意识认知的原因,提出了提高大学体育教学中大学生终身体育意识超市客户管理系统论文随着零售业的不断壮大和我国的开始实行对外开放政策,国外大型连锁超市纷至沓来,和本土连锁超市形成了掎角之势,相应的竞争关系随之产生。下面小编带来的是超市客户管理系统论文,希望对你有所中国古代餐桌礼仪论文引导语论文是一种非常重要的资源,那么有关中国古代餐桌礼仪论文模板哪里有呢?接下来是小编为你带来收集整理的文章,欢迎阅读!摘要餐桌礼仪在中国传统文化中占有一个重要的地位,它也是一种的普通高校公体课教学模式的探讨论文论文关键词全国普通高等学校体育课程指导纲要健康第一体育运动终身体育论文摘要2002年,教育部下发了全国普通高等院校体育课程指导纲要gt,并要求20O3年开始在全国普通高等学校中施行推进创新环境工程专业实验教学体系的配套改革构建论文环境工程是一门新兴的边缘学科,也是一门综合性较强的学科。随着社会对环境保护和污染治理要求的提高,对高校环境工程专业培养人才的目标提出了更高的要求,为培养出适应社会发展的新型人才,应水面船舶机舱通风系统设计论文一国内外现状分析目前船舶动力舱通风采用常规机械通风机械通风结合循环冷却装置通风射流通风三种方式。三种通风方式各有特点,不同的船舶根据需求采用不同的方式。国际上将空气射流通风技术的设学生科学创新小论文科学创新具有一定的计划性,必然性。下面是小编为大家带来的学生科学创新小论文学生科学创新小论文1随着经济的发展,社会的进步,为了跟上时代的步伐,更好地适应快速发展的社会进程,国家加大培养学生良好意志品质,促进学校体育运动发展论文现在独生子女居多,家长的宠爱,学生学习压力增大,娱乐媒体异常发达,学生体育锻炼时间越来越少,学生越来越不能吃苦耐劳从而引起学生休能越来越差。针对这种情况让学生树立从小为终身体育锻炼酒店管理中内部控制策略分析绪论论文第一章绪论1。1研究的背景。近来,我国内地酒店行业竞争愈发激烈,星级酒店普遍处于亏损状态。根据国家旅游局的相关数据,国内酒店行业仍以中小型酒店为主,又因为酒店作为典型的全天候服务类后信息社会时代应用型人才的多样化培养论文一社会生产形式的变革与特征生产力的发展水平决定了社会生产的基本形式与特点,丹尼尔贝尔以技术为中轴,将社会生产的发展进程划分为前工业社会工业社会和后工业社会(或信息社会)三种形态特征