专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

关于知识依赖度约简的论文

  基于知识依赖度约简的知识发现研究
  摘要:粗糙集理论中的属性约简问题属于NP难问题。以教育技术学专业读者2013学年度图书借阅历史数据为原型,采用借阅类目的次数多少作为属性重要度进行启发式选择,利用粗糙集理论中的知识依赖度对类目约简,挖掘出本专业和各年级借阅类目的核心集,并经问卷调查证明其规律的正确性。通过与教育技术学专业学科知识体系结构的比较,能够发现学科知识体系结构建设的不足之处,以促进其更科学完善。
  关键词:粗糙集;知识依赖度;数据挖掘;知识发现
  0引言
  高校图书馆自动化建设经过多年发展,已经积累了大量历史数据,这些数据不但完整,而且质量高,充分反映了读者学习成长的过程。如何对其进行挖掘提炼并从中发现有价值的知识,是了解读者需要、开展知识推送服务的重要信息来源。前人研究主要是根据读者的借阅历史数据,利用关联规则算法发现某类书籍之间的关联规则〔14〕,或利用聚类算法挖掘具有共同阅读兴趣的读者群体〔5〕,以及通过时间流分析得到读者借阅时间的分布规律〔6〕等。
  也可以利用粗糙集进行挖掘。例如,柳炳祥等〔7〕只是介绍有关理论,文章中并没有对粗造集挖掘进行深入阐述。这些挖掘结果往往只是反映读者已往的借阅规律,而不能反映其当前和今后一段时间的真实需要,因为这些读者还需要不断地进行知识更新和深化学习。本文通过对教育技术学专业读者群进行数据挖掘,利用知识依赖度约简方法发现其学科知识体系结构,并通过与相关专业的知识体系结构建设进行比较,以发现建设中的不足之处。如果利用所得的知识库进行推送服务,则能把读者真正需要的知识推送给他们。
  1粗造集有关理论
  粗糙集理论认为知识是一种对对象进行分类的能力,它将分类理解为在特定空间上的等价关系,而等价关系构成了对该空间的划分〔8〕。
  定义1(论域、知识):设U是感兴趣的对象组成的非空有限集合,称为一个论域。论域U上的任一子集XU,称为论域U的一个概念或范畴。论域U中的任何子集簇(概念簇)称为关于U的抽象知识,简称知识〔9〕。在二维表中,知识是由某些列对所有行的划分构成的集合所表示。
  定义2(知识库):给定一个论域U和U上的一簇等价关系S,称二元组K(U,S)是关于论域U的一个知识库或近似空间。因此,论域上的等价关系即代表着划分和知识。这样,知识库就表示了论域上由等价关系导出的各种知识,即划分或分类模式,同时代表了对论域的分类能力,并隐含着知识库中概念之间存在的各种关系〔9〕。
  定义3(不可分辨关系):给定一个论域U和U上的一簇等价关系S,若PS,且P,则P(P中所有等价关系的交集)仍然是论域U上的一个等价关系,称为P上的一个不可分辨关系,记作IND(P)。IND(P)的等价类称为知识P的基本范畴〔9〕。
  2知识发现
  2。1样本数据选取
  2。2数据预处理
  在进行数据挖掘之前,需要对数据进行去噪、补缺和转换等预处理操作。数据预处理步骤如下:根据年级、专业代码和时间段获取读者借阅历史记录,并通过汇总获得借阅图书的人数、未借阅人数和总借阅册数;去除借阅书目的种次号,得到借阅类目,汇总后得到借阅类目数。由于中图法是通过标记符号代表各级类目和固定先后次序的分类体系,标记符号不同,其表示的知识类目也不同,故不能把相近类目合并为一类;按类目进行汇总,求得各类目借阅册数和所有类目的平均借阅册数,并删除低于平均借阅册数的类目,因为其表现的只是某个学生的个人爱好,不是大家共同学习的知识,相当于噪音数据;求出借过大于平均借阅册数类目的所有读者,这些读者即是进行知识约简的对象;生成上述读者对象和其借阅类目的二维表,并对表中数据进行转换处理,如果此读者借过该类目书籍则为1,否则为0。类目列按类目总借阅册数降序添加到表中。
  2。3知识约简
  经过上面的数据预处理后,得到了知识库的关系簇S和论域U,即不小于平均借阅册数的类目和借阅这些类目的读者。然而,即使经过上述预处理后,其约简的类目数还有几十种;如果直接利用知识依赖度(定义5)来约简,其需要计算的次数为MlogM2n(M是读者数,n是类目数),这是指数级时间复杂度,需要消耗大量计算时间。为了得到多项式时间算法,采用以类目借阅的册数多少作为属性重要度的启发式策略,应用知识依赖度来约简二维表,具体算法如下:
  (1)置K{},R{};K表示约简后得到的知识,R表示临时约简知识
  如果单个知识把论域全覆盖则作为约简知识放入K中
  (2)Forr01tocount(类目)do
  取出count(r0)类目I,计算其划分。
  如果I全覆盖论域U,则把I并入K中;否则,退出循环。
  (3)把I并入R中。
  计算剩下的类目依赖关系(4)Forr1r01tocount(类目)do
  取出count(r1)类目Q,根据类目Q求其对论域U的划分。
  根据R中的知识求其对论域U的划分。
  利用知识依赖度公式,求Q对R的知识依赖度;如果小于0。5,则把Q并入R中,否则认为知识Q归属于R而被约简掉。
  (5)KKR,并退出。即K就是所求的约简集合
  2。4结果分析
  因此,通过对相关数据的分析,给出如下建议:给大一、大二学生适当介绍本学科知识体系结构,使其开始就明确学习目标、方向和内容组成;通过与教育学院教师交流发现,学院已开设《学科导论》课程,但效果不够理想。因此,对于开设《学科导论》课的院系,需要扎实推进本导制,发挥其引导作用;深入研究小说等文学类与教育技术学专业之间的内在关系,将其纳入学科体系结构中,完善学科知识体系结构建设;在低年级中适当开设TP393。092网络浏览器课程,做好相关理论基础知识铺垫,使学科知识结构布局更加合理。
  3知识验证
  4结语
  本文利用粗糙集理论中的知识依赖度约简方法对某专业读者群借阅历史数据进行挖掘,获得其学科体系结构知识,并通过比较,发现相应学科体系结构建设中的不足之处,促使学科结构体系建设更加合理、完善。如果利用所得的知识进行推送服务,则能够根据学生知识结构的变化进行预判,做到有的放矢,提高服务质量。当然,本文还有一些问题尚待解决,如表4类目顺序变化的真正原因是什么,蕴含了哪些知识?小说等文学类中哪些知识是教育技术学专业的本质需要,如何合理设计它在学科体系结构的布局等?相关问题有待进行下一步更深入的研究。
  参考文献:
  〔3〕张红燕。关联规则挖掘在高校图书馆借阅流通中的应用〔J〕。数字技术与应用,2012(5):76,78。
  〔4〕薛琴荣,李响。基于数据挖掘技术的图书馆个性化借阅服务研究〔J〕。情报探索,2013(4):110113。
  〔7〕柳炳祥。基于数据挖掘的图书馆个性化服务系统〔J〕。现代情报,2007(3):108109。
  〔9〕苗夺谦,李道国。粗糙集理论、算法与应用〔M〕。北京:清华大学出版社,2008。
  〔14〕中国图书馆分类法编辑委员会。中国图书馆分类法〔M〕。第4版。北京:书目文献出版社,1999。

高职行业英语教学滞后现状原因与应对策略分论文摘要高职院校是我国高等教育的一种重要模式,但是由于高职院校的一些特点决定了高职院校对于英语教学的一些滞后现状,本文就以高职行业英语教学的滞后现状为契机,分析一下其形成的原因与解决策分析河道治理与水环境保护论文论文一般比较麻烦,连格式都得做好,写论文不是那么容易的,不过也不是很难只要你知道了格式,找到了材料,就方便多了。水环境是居民生存环境的重要组成部分,是城乡居民不可或缺的生产和生活资生态化设计在现代室内设计中的应用论文1生态化设计理念分析我国建筑行业面对当前社会能源紧张态势需要将可持续发展作为核心战略目标,生态化设计理念在房屋建筑室内设计过程中十分注重节约各项装修材料用量,并要将一些含有化学成分网上银行策略发展研究论文网上银行策略发展研究论文摘要网上银行做为新经济的一个亮点一直被人们寄予了很大希望。然而在网络神话破灭的日子里,网上银行也相继陷入了困境。人们发现当前运营状况不错的网上银行是那些在传系统思维视角下的高中语文主题单元教学论文范本系统思维视角下的高中语文主题单元教学全文如下摘要根据系统思维的理论,教师应该在进行高中语文课堂教学的过程中采取主题单元教学模式。本文对此进行了分析研究,指出根据教材设置选择教学主题金属锻造节能技术研究的论文1金属锻造能耗及污染现状1。1能源消耗高在金属锻造行业中,能源的使用效率受到从业人员工作经验材料本身热效率设施水平等限制,能源浪费的现象比较严重。锻造的流程主要包括下料装炉加热锻造中央空调节能技术分析论文摘要本次研究以机场作为主题,探讨与其相关的中央空调节能技术及实践问题。首先对中央空调的系统设计优化措施进行了简要说明通过分阶段水温运行节能调整节能技改设备养护,以及增加人力资源管理汽修技术总结论文古典文学常见论文一词,谓交谈辞章或交流思想。当代,论文常用来指进行各个学术领域的研究和描述学术研究成果的文章,简称之为论文。它既是探讨问题进行学术研究的一种手段,又是描述学术研究成离子膜法制烧碱节能技术分析论文1离子膜法制烧碱节电技术分析1。1节约动力电在当下烧碱生产设计过程中,经常会出现动力电消耗现象,尤其是氯碱生产中电解槽装置的电能消耗量,尤其明显,且大部分都是来自于回流电路。因此,数字信息发展下广播电视技术的优化论文摘要我国已经进入数字化信息化的年代,广播电视也得要跟上时代的步伐,而广播电视技术的优化也就越来越重要,所以广播电视技术要在信息化数字化方面提高。这篇文章根据此重点展开分析,希望能够民法对网络隐私权的保护困境及出路论文近年来我国网络隐私权造成的法律纠纷屡见不鲜,而我国民法在这一方面目前还缺少相应的保护措施。本文从网络隐私权的内涵出发,结合当前我国民法在网络隐私权保护上的缺失,探究加强网络隐私权保
环境工程全日制硕士培养效率提升策略摘要全日制专业硕士培养是当前研究生培养效率提升的重点关注内容之一。以环境工程全日制专业硕士培养为例,采用培养效率提升为目标,分析环境工程专业硕士培养过程中规模效率及质量效率等存在问市政道路柔性基层沥青路面结构探讨针对目前半刚性路面在使用过程中逐渐暴露出裂缝严重车辙破坏抗水害能力差使用寿命短等问题。文章作者结合自身多年实践经验,重点对市政道路柔性基层沥青路面的结构特点予以详细分析,并且对提出论半刚性基层沥青路面的病害特点及维修途径针对半刚性基层沥青路面施工和使用中的质量病害,本文结合实际情况,从病害特征入手,对路面病害原因作了详细分析,并在其基础上提出几点相关的解决和维修对策,以供同行参考。关键词半刚性基层城市电网10kV配电系统继电保护的分析探讨摘要文章介绍了城市电网10kV配电系统在电力系统中的重要位置及城市电网10kV配电系统继电保护的基本类型,着重介绍了几种目前国内常用的电流保护反时限过电流保护定时限过电流保护电流速城市大气中PM简介论述了控制城市大气中PM2。5污染的意义在剖析PM2。5组成与来源的基础上,分析了控制PM2。5的途径,并对今后的研究提出了一点看法。1。1PM2。5是导致城市人为能见度下降的分析超滤技术在化工工艺中的应用分析超滤技术在化工工艺中的应用分析超滤技术在化工工艺中的应用分析超滤技术在化工工艺中的应用精品源自中考试题摘要所谓超滤技术,即一门新型的实用科学技术,随着其不断发展和完善,已在诸多攻克区域大计量课题探索计量增效新途径攻克区域大计量课题探索计量增效新途径攻克区域大计量课题探索计量增效新途径化学与化工论文更新2006411阅读攻克区域大计量课题探索计量增效新途径一综述二区域大计量试验项目的前期工作实现封闭计量是降低天然气供销差率的重要手段实现封闭计量是降低天然气供销差率的重要手段实现封闭计量是降低天然气供销差率的重要手段化学与化工论文更新2006411阅读实现封闭计量是降低天然气供销差率的重要手段随着天津市天然气的功夫是磨出来的岳飞,可南省安阳市汤阴县程岗村人,中国历史上著名的军事家,战略家抗金英雄。从1128年到1147压的十余年间,岳飞夔领岳家军同金军进行了大小数百次战斗,所向披靡,成为一位战功赫赫的工业自动化仪表的使用摘要仪表是实现工业生产过程自动化的重要工具,它应用广泛。在自动控制系统中,过程检测仪表将被控变量转换成电信号或气信号,去进行显示记录调节等单元,从而实现生产过程的自动化,使之达到我浅析流量对加油机误差的影响在石油资源日益紧张的新时期,合理有效确保石油利用率已成为业界关注重点。在业界,为了更好的保证加油机加油量的准确度和使用的正确性,我们有必要在工作中对各种能够引起加油机误差的因素进行
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网