专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

决策树算法在高职院校成绩分析中的应用研究的论文

  摘要:高职院校的学生的成绩是一项重要的数据,它不仅是对学生学习情况的评价,也是对教师教学质量的检查。本文研究了使用决策树算法对学生的成绩进行挖掘分析,分析学生的毕业设计成绩与基础类课程、专业类课程以及专项实践类课程之间隐藏的内在联系,指导教师在今后的教学中加强学生实践操作能力的训练,进而提高教学质量。
  关键词:决策树;ID3算法;数据挖掘;学生成绩分析
  1。引言
  高职院校在多年的教学和管理工作中,积累了大量的教学管理数据,这些数据中蕴含了很多有价值的信息。如果利用数据挖掘技术对学院教务管理系统中教师和学生的数据进行挖掘,可以使教师更好的把握学生、把握教学过程,实现教学过程动态化管理,为学校合理设置课程、优化教育资源配置、提高教学质量提供可靠的数据依据,同时对提高学校教学和管理水平也有一定的帮助。〔1〕
  数据挖掘(DataMining),即数据库中的知识发现,就是对庞大的数据集或数据库进行分析,挖掘出隐含的、未知的、用户可能感兴趣的和对决策有潜在价值的知识和规则,可以为用户提供决策的依据〔2〕。决策树算法是数据挖掘的核心算法之一,决策树方法以树型结构表达最终分类结果的,也能生成IfThen形式的规则,便于使用者理解。
  在教务管理系统中,学生的成绩是一项重要的数据,它不仅是对学生学习情况的评价,也是对教师教学质量的检查。本文中研究使用决策树算法对学生的成绩进行挖掘分析,全面地分析学生的毕业设计成绩与实践类课程、专业类及基础类课程中隐藏的内在联系,体现出学生课程之间有一定的相互关联关系,可以及时指导教师在以后的教学工作中采取恰当的方法,加强学生实践操作能力的训练,指导学生进行专业、基础类课程的学习,提高教学质量。
  2。决策树算法
  2。1决策树算法基本概念
  决策树是一种常用的、直观的分类归纳算法。决策树是一种类似流程图的树状结构,根据层次的不同,结点分为根结点、内部结点和叶结点三种类型。〔3〕每个结点对应一个样本集,树的最高层结点就是根结点,对应整个样本集,内部结点对应一个类标志。根结点和内部结点都包含一个对样本属性的测试,根据测试的结果将样本集划分为两个或多个子集,每个子集生成一个分支,分支用测试属性值来标识。叶结点包含一个类标志,表示对应样本集的类别。决策树的中间结点通常用矩形表示;而叶子结点常用椭圆表示。
  决策树的构造包括两个步骤,一是生成决策树,二是进行剪枝。决策树的生成是从一个根结点开始,从下到下的递归过程,通过不断地将训练样本分割成子集来构造决策树,从根结点开始对该样本的属性进行测试,根据测试结果确定下一个结点,直至到达叶结点为止。决策树的剪枝是对树结构进行修剪,删除多余分支的过程,得到一棵最小期望错误率的决策树。
  2。2ID3算法
  ID3算法是决策树学习算法中最有影响力、使用最广泛的一种决策树算法。ID3的基本思想是自顶向下递归地使用搜索训练样本集,是一种典型的贪心算法,在决策树的每个结点处测试每一个属性,用信息增益作为属性的选择标准,选择信息增益最大的属性作为决策树结点,从而构建决策树。〔4〕在算法中,在决策树结点属性的选择上使用信息论中熵(Entropy)的概念来完成。
  2。2。1信息熵
  信息熵是各自信息量的期望,用信息熵可以用来度量整个信息源X整体的不确性。设样本数据集为X,n是信号源所有可能的符号数,ai是可能取到的值,P(ai)是取值为ai的概率。其信息熵如下:
  2。2。3平均信息增益
  信息增益表示两个信息量之间的差值,在进行分类属性的选择时,应该选择最大的信息增益作为分类属性。信息增益如下:
  Gain(XY)H(X)H(XY)
  3。决策树算法在教学质量分析中的应用
  学生的毕业设计通常是学生对三年来所学的各种基础素养类课程、专业类课程、专项实践类课程的综合掌握,是体现一个学生的综合素质的重要依据,也是教师培养学生的教学质量的重要体现。因此,通过对学生的毕业设计和各种基础课、专业课及专业实践课的考试成绩的挖掘,分析出其中的关系,为今后教师调整教学方案提供依据。
  决策树算法对学生成绩进行分析,是将决策树的相关算法应用于学生成绩挖掘,对大量的考试成绩数据进行分析,从而更好的分析和预测成绩数据。〔5〕其主要过程如下:
  3。1数据收集
  数据收集阶段主要工作是从教务管理系统中收集与挖掘相关的学生成绩数据,并进行简单的统计分析,检查这些学生成绩数据是否完整。
  在进行数据挖掘之前,主要收集了我院2008级软件技术专业0801班42名学生不同学期的课程成绩作为原始数据,一共选择了9门课程。学生成绩表的主要内容包括学号及各门课程成绩。进行分类整理后,得到学生成绩数据表。
  学号
  计算机网络基础
  C语言程序设计
  WEB开发技术
  数据库原理与应用
  ASP。NET程序设计
  C程序设计
  数据库设计与开发
  基于C的ASP。NET应用程序设计
  基于C的Windows应用程序设计
  毕业设计
  100080563hr80hr80hr76hr74hr90hr89hr良好
  良好
  良好
  中等
  100080575hr85hr86hr88hr76hr92hr94hr良好
  优秀
  优秀
  优秀
  100080593hr60hr75hr95hr69hr79hr80hr中等
  及格
  及格
  及格
  其中计算机网络基础、C语言程序设计、WEB开发技术三门为基础类课程,数据库原理与应用、ASP。NET程序设计、C程序设计三门为专业类课程,数据库设计与开发、基于C的ASP。NET应用程序设计、基于C的Windows应用程序设计三门为专项实践类课程。
  3。2数据预处理
  数据预处理的主要工作就是检查数据库中不完整的、含噪声的,不一致的的数据,并且进行清理,除去噪音,填补记录中遗漏的数据值、删除无效数据等,提高挖掘算法的精度和有效性。并且要对数据进行转换,生成新的属性或记录,使之适合数据挖掘处理的格式,预处理后的数据可以节省数据处理的时间。
  在学生成绩表中,对学生因缺考、缓考、违纪、休学、退学等情况产生的成绩记录的缺失,可考虑进行清理,删除这些记录,确保表格数据的完整。最后形成有效数据共42条记录。
  3。3数据转换
  将收集到的数据信息转换为一个数据模型,决策树算法中使用的是离散型数据,学生成绩是连续型的,因此,要将其数据属性进行离散化处理。
  学生成绩的成绩评价指标可分为三个等级,A:85100(优秀),B:7084(良好),C:69以下(一般)。离散化后的学生成绩表如下图所示:
  学号
  基础课
  专业课
  专项实践课
  毕业设计
  100080563hrB
  B
  B
  B
  100080575hrA
  A
  A
  A
  100080593hrB
  C
  C
  C
  3。4数据分类挖掘
  根据生成的分析模型,利用决策树算法对数据进行挖掘,具体情况如下。
  学生成绩表中样本类别属性为毕业设计,首先计算出毕业设计的信息熵。毕业设计成绩分为A(优秀)、B(良好)、C(一般)三种类别,其中优秀为3人,良好为28人,一般为11人,根据公式计算其信息熵如下:
  (3)根据专项实践课成绩计算条件熵。
  专项实践课成绩为A人数为7人。其中毕业设计成绩为A的2人,为B的5人,为C的0人。专项实践课成绩为B人数为25人,其中毕业设计成绩为A的1人,为B的16人,为C的8人。专项实践课成绩为C人数为10人。其中毕业设计成绩为A的0人,为B的7人,为C的3人。因此其条件熵为:
  H(X专项实践课)
  1。022
  其信息增益为:
  Gain(专项实践课)1。1681。0220。146
  由上述计算可见,专项实践课成绩属性所获得的信息增益最大,被作为根结点,并依次取专业课成绩、基础课成绩属性做为分支结点。通过构造和剪枝后,形成如图所示的决策树:
  3。5结果分析
  通过对上述决策树的分析,可得出如下结论:
  专项实践、专业课、基础课成绩均优秀的同学,毕业设计成绩优秀。专项实践优秀、专业课成绩一般的同学,无论基础课成绩如何,毕业设计成绩均为一般。由决策树分析可见,专项实践、专业课、基础课在学生的综合素质的培养中起到了不同程度的作用。专项实践课对学生的综合能力的培养有重要的影响,但不是绝对因素,基础课和专业课的教学安排,对学生的实践能力的训练起到了很大的支撑作用。因此,在专业的课程安排和教师的教学组织中,要注重学生的知识的学习与技能的训练的有机结合,提高学生的综合能力。
  4。结束语
  利用决策树分类算法的ID3算法对学生的成绩进行分析,构造出学生成绩分析决策树,可以挖掘出学生的毕业设计成绩与基础课程、专业课程、专项实践课程之间的隐藏关系,同时也挖掘出各类课程的学习对学生综合素质培养的影响。教师可以根据分析结果在今后的教学过程中,注重加强学生的专业能力培养、实践能力训练,培养出合格的高端技能型人才。
  参考文献:
  〔1〕丁智斌,袁方,董贺伟。数据挖掘在高校学生学习成绩分析中的应用〔J〕。计算机工程与设计。2006。2(590592)
  〔2〕邵峰晶,于忠清,王金龙,孙仁诚。数据挖掘原理与算法〔M〕。北京:科学出版社。2009。
  〔3〕陈安,陈宁,周龙骧。数据挖掘技术及应用〔M〕。北京:科学出版社。2006。
  〔4〕廖芹,郝志峰,陈志宏。数据挖掘与数学建模〔M〕。北京:国防工业出版社。2010。
  〔5〕邢晓宇,余建坤,陈磊。决策树算法在学生考试成绩中的应用〔J〕。云南民族大学学报(自然科学版)。2009。1(7780)

城市饮用水水源存在的问题和保护对策关键词城市饮用水存在问题保护对策摘要文章探讨了我国城市饮用水水源存在的问题,提出了饮用水水源的保护对策。城市是人类社会政治经济文化科学教育的中心。经济活动和人口高度密集,面临巨大的我国城市生活垃圾无害化处理现状及对策措施关键字城市生活垃圾无害化处理一现状(一)城市生活垃圾处理设施建设得到较快发展(二)城市生活垃圾集中处理率提高,但无害化处理水平较低无害化处理率低的主要原因一是历史原因,上世纪90年浅析城市空气污染治理的有效措施我国目前城市空气污染问题非常严重,已经给城市居民的生产生活带来很大的负面影响。以我国首都北京市为例,2013年数据统计显示,全年空气达到良好及以上的天数不足80天,PM2。5PM1浅论城镇污水处理中存在的问题及对策城镇化给城市带来便利的同时也带来了发展的阵痛。很多城镇的地下管网并不完善,生活污水随意排放,城镇周边的水体污染严重,虽然经济得到了发展,但是以环境的破坏为代价。为了弥补对环境造成的浅谈城市供水管网水质污染的防治引言随着我国近些年工业农业的快速发展,环境污染水污染问题已非常严重,这也加剧了城市供水管网水质的污染。水对我们生产生活的重要性不言而喻,而城市供水管网水质污染严重影响了人们正常的生人文体育观在高校体育教学中的构建随着社会经济政治文化的发展,我国的教育事业也随之不断发展,教育体制不断改革,在现代教育中越来越强调对学生的素质教育。在这样的教育环境下,传统的教学模式在现代教育体制中已经不再适用。中职学校体育教学与学生个性培养探析在体育教学中发展学生的个性是教育的一种必然趋势,也符合现代社会对人才的需求,需要有创新有个性的人。在教学活动中,以人为本,努力实施素质教育,顺应学生个性的要求,使学生在教师的指导下中国古代市民史研究述评内容提要援引市民社会理论研究中国古代市民阶层的各种尝试明显带有传统现代两分的现代化模式的印痕。中国古代市民史的研究应该建立在将中国的历史经验或现实作为研究的出发点的基础之上。史学界徽州和珠江三角洲宗法制比较研究宗法制度的故乡本在北方的黄河流域。起源于氏族公社,盛行于西周。尔后,虽然几经改变其形式和内容,以适应社会变迁的需要,但前后依然有一脉相承的关系。随着汉族与各少数民族间的相互融合,宗福建长乐显应宫与郑和信仰研究关键词长乐显应宫妈祖民间信仰华侨华人郑和下西洋明代一妈祖信仰的起源与郑和对妈祖的景仰明初郑和被明成祖委以重任,七次往返各大洋之间。在每次下西洋行前,沿途均要祭祀天妃,平安归来后亦需二十世纪初的茶馆与中国城市社会生活以成都为例内容提要茶馆在中国城市社会生活中扮演着十分重要的角色,是非常理想的观察社会经济文化及地方政治变化的场所。20世纪初,成都的茶馆是市民日常生活的重要舞台,它们既是娱乐消闲的场所,亦为
江西省2011年语文高考试卷文学名著题阐析与备考对策江西省2011年语文高考试卷文学名著题阐析与备考对策2011年高考真题下列关于名著的说明不正确的一项是()A。巴格特漂亮的小女儿被人用一个独眼驼背长着罗圈腿的小怪物换走了。她伤心过后殖民文学批评历史化摘要阿里夫德里克从历史的角度考察后殖民文学批评,他在后殖民文学批评中提出了一个重要的观点,即后殖民文学批评历史化。德里克的这个观点为研究后殖民文学批评提供了新的视域,这是值得思考的当代文学学术前沿问题探究摘要在我国社会经济实现不断发展的现阶段,文学领域也随之出现了整体性和结构性的变迁与转型,对于中国当代文学来说,与传统构建和发展相比较而言,其在生产环境流通传播以及阅读接受等方面都出当代文学课程教学改革思考解析摘要中国当代文学课程教学长期以来处于理论教学的传统教学模式之中,其教学观念陈旧与当代大学生的思维和认知方式严重脱节,面对全球化和消费主义思潮引发的文学边缘化,当代文学课程教学应从学胡枝子在水土保持的作用论文关键词胡枝子土壤改良荒山荒地造林拦蓄降水重要建群种论文摘要胡枝子生长的土壤从微碱到微酸性。多数树种具有耐干旱耐贫瘠耐寒冷耐热耐酸耐刈割等优良特性,可用作水土保持和土壤改良,是荒关于影响年宁安农场大豆产量的气象因子分析论文关键词大豆产量气象因子宁安农场2007年论文摘要通过对2007年各种气象因素分析,得出影响宁安农场大豆产量的主要气象因素有春季降水9月中旬寡照夏旱与伏旱严重分枝期6月份严重干旱关于早衰棉田的剖析及防治措施的思考论文关键词早衰棉田原因剖析防治措施论文摘要近年来,随着滴灌技术及中早熟品种的推广应用,早衰现象在我大量出现,很大程度上影响了籽棉的产量和皮棉的质量。结合近几年实践经验作如下剖析,并新课程背景下现代文学作品教学分析新课程改革以来,高中现代文学作品的教学模式出现了一些可喜的变化,但随之也显露了一系列的问题,诸如教学内容模糊教学方法低效教学评价简单等。很多现代文学作品教学低效耗时,整个教学过程丢关于魔芋微球茎栽培试验研究论文关键词魔芋微球茎栽培1材料与方法1。1材料1。2方法1。2。2种植。厢宽1。5m,微球茎间的株行距为15cm20cm,微球茎上部覆土层23cm厚,浇足定根水。1。2。4除草。由社会核心价值观融合进现代文学的研究摘要社会核心价值观主要反映了社会主义实践要求和内涵价值,社会核心价值观是指导社会工作和弘扬传统美德的重要基础条件。现代文学课程融入社会核心价值观是时代发展的要求,更是社会进步的体现汉语言文学专业应用性问题思考分析提要随着社会体制的改革,综合型应用型人才逐渐成为了社会的主要需求对象,而缺乏实际应用性的汉语言文学专业逐渐开始没落,汉语言文学专业学生缺乏市场竞争力,单纯的文化素养无法满足社会的职
友情链接:快好知快生活快百科快传网中准网文好找聚热点快软网