大数据在教育领域如何应用?
7月15日 眸中星投稿 数据(data),一般而言是指通过科学实验、检验、统计等方式所获得的,用于科学研究、技术设计、查证、决策等目的的数值。通过全面、准确、系统地测量、收集、记录、分类、存储这些数据,再经过严格地统计、分析、检验这些数据,就能得出一些很有说服力的结论。大规模、长期地测量、记录、存储、统计、分析这些数据,所获得的海量数据就是大数据(bigdata)。在制作大数据时,需要严格的方案设计、变量控制和统计检验等,不然所获得的大数据就是不全面、不准确、无价值或价值不大的。
在教育特别是在学校教育中,数据成为教学改进最为显著的指标。通常,这些数据主要是指考试成绩。当然,也可以包括入学率、出勤率、辍学率、升学率等。对于具体的课堂教学来说,数据应该是能说明教学效果的,比如学生识字的准确率、作业的正确率、多方面发展的表现率积极参与课堂科学的举手次数,回答问题的次数、时长与正确率,师生互动的频率与时长。进一步具体来说,例如每个学生回答一个问题所用的时间是多长,不同学生在同一问题上所用时长的区别有多大,整体回答的正确率是多少,这些具体的数据经过专门的收集、分类、整理、统计、分析就成为大数据。
分析大数据助力教学改革
近年来,随着大数据成为互联网信息技术行业的流行词汇,教育逐渐被认为是大数据可以大有作为的一个重要应用领域,有人大胆地预测大数据将给教育带来革命性的变化。
大数据技术允许中小学和大学分析从学生的学习行为、考试分数到职业规划等所有重要的信息。许多这样的数据已经被诸如美国国家教育统计中心之类的政府机构储存起来用于统计和分析。
而近年来越来越多的网络在线教育和大规模开放式网络课程横空出世,也使教育领域中的大数据获得了更为广阔的应用空间。专家指出,大数据将掀起新的教育革命,比如革新学生的学习、教师的教学、教育政策制定的方式与方法。
教育领域中的大数据分析最终目的是为了改善学生的学习成绩。成绩优异的学生对学校、对社会、以及对国家来说都是好事。学生的作业和考试中有一系列重要的信息往往被我们常规的研究所忽视。而通过分析大数据,我们就能发现这些重要信息,并利用它们为改善学生的成绩提供个性化的服务。与此同时,它还能改善学生期末考试的成绩、平时的出勤率、辍学率、升学率等。
现在,大数据分析已经被应用到美国的公共教育中,成为教学改革的重要力量。为了顺应并推动这一趋势,美国联邦政府教育部2012年参与了一项耗资2亿美元的公共教育中的大数据计划。这一计划旨在通过运用大数据分析来改善教育。联邦教育部从财政预算中支出2500万美元,用于理解学生在个性化层面是怎样学习的。部分综述了该计划的数据和案例已经在美国教育部教育技术办公室2012年4月10日发布的《通过教育数据挖掘和学习分析增进教与学(公共评论草案)》中披露出来。
美国教育部门对大数据的运用主要是创造了“学习分析系统”一个数据挖掘、模化和案例运用的联合框架。这些“学习分析系统”旨在向教育工作者提供了解学生到底是在“怎样”学习的更多、更好、更精确的信息。举例来说,一个学生成绩不好是由于他因为周围环境而分心了吗?期末考试不及格是否意味着该学生并没有完全掌握这一学期的学习内容,还是因为他请了很多病假的缘故?利用大数据的学习分析能够向教育工作者提供有用的信息,从而帮助其回答这些不太好回答的现实问题。
许多人因此会问,大数据能拯救美国的公立教育吗?全球最大的电脑软件提供商微软公司(Microsoft)的创始人、前首席执行官比尔盖茨(BillGates)今年3月7日在得克萨斯州首府奥斯汀举行的一个教育会议上打赌说,利用数据分析的教育大数据能够提高学生的学习成绩,拯救美国的公立学校系统。他称过去十几年里教育领域的技术发展陷入了停滞,研发投入远远不够。盖茨充满信心地认为,教育技术未来发展的关键在于数据。在这次大会上,5000多名参会者讨论了教育数据应用的前景。
教育大数据市场前景广阔
美国高中生和大学生的糟糕表现高中生退学率高达30(平均每26秒就有一个高中生退学),33的大学生需要重修,46的大学生无法正常毕业在让教育部门忧心忡忡的同时,也让教育科技公司找到了淘金的机会。近些年来,许多教育科技公司纷纷开始抢滩大数据学习分析的市场,竞争极为激烈。
美国的一些企业已经成功地商业化运作教育中的大数据。全球最大的信息技术与业务解决方案公司IBM就与亚拉巴马州的莫白儿县公共学区进行大数据合作。结果显示,大数据对学校的工作具有重要作用。当IBM刚刚开始与这一学区合作时,除了学生成绩不好之外,该县还面临着辍学率已增加到48的严峻情况。根据联邦政府的《不让一个孩子掉队法》(NoChildLiftBehind,NCLB),学生成绩糟糕的地方政府将受到惩罚。为了应对这一巨大的挑战,该县此前已经在学生数据的基础上建立了一个辍学指示工具,并将其用于全县层面的决策。但IBM认为这仍不足以改善莫白儿县窘迫的现状,需要借助IBM的技术支持重新建立大数据,进而利用大数据分析来改善学区内所有学生的整体成绩。
在美国的教育大数据领域,除了处于领先地位的IBM,还有像“希维塔斯学习”(CivitasLearning)这样的新兴企业。“希维塔斯学习”是一家专门聚焦于运用预测性分析、机器学习从而提高学生成绩的年轻公司。该公司在高等教育领域建立起最大的跨校学习数据库。通过这些海量数据,能够看到学生的分数、出勤率、辍学率和保留率的主要趋势。通过使用100多万名学生的相关记录和700万个课程记录,这家公司的软件能够让用户探测性地知道导致辍学和学习成绩表现不良的警告性信号。此外,还允许用户发现那些导致无谓消耗的特定课程,并且看出哪些资源和干预是最成功的。
在加拿大,总部位于安大略省沃特卢的教育科技公司“渴望学习”(Desire2Learn)已经面向高等教育领域的学生,推出了基于他们自己过去的学习成绩数据预测并改善其未来学习成绩的大数据服务项目。这家公司的新产品名为“学生成功系统”(StudentSuccessSystem)。“渴望学习”声称加拿大和美国的1000多万名高校学生正在使用其学习管理系统技术。“渴望学习”的产品通过监控学生阅读电子化的课程材料、提交电子版的作业、通过在线与同学交流、完成考试与测验,就能让其计算程序持续、系统地分析每个学生的教育数据。老师得到的不再是过去那种只展示学生分数与作业的结果,而是像阅读材料的时间长短等这样更为详细的重要信息,这样老师就能及时诊断问题的所在,提出改进的建议,并预测学生的期末考试成绩。
像美国的“梦盒学习”(DreamBoxLearning)公司和“纽顿”(Knewton)公司这类领先性的开发者们,已经成功创造并发布了各自版本的利用大数据的适应性学习(adaptivelearning)系统。在2012年国际消费电子展的高等教育技术峰会上,世界最大的教育出版公司培生集团(Pearson)与适应性学习领域里的先行者纽顿公司共同发布了主要由培生集团开发的适应性学习产品“我的实验室高手掌握”(MyLabMastering)。这款产品在将全球范围内向数百万名学生提供个性化的学习服务,向他们提供真实可信的学习数据,让学校通过这些数据提高学生的学习效果并降低教学成本。首款产品将在美国的数十万名学生中使用,包括数学、英语,以及写作等技能开发课。
纽顿的创办人、首席执行官何塞费雷拉和培生高等教育分公司的总裁格雷格托宾共同出席了“我的实验室高手掌握”的发布会并介绍了合作的细节,讨论了高等教育的未来。托宾说:“个性化学习是未来教育的一个关键点。我们把纽顿的技术整合到‘我的实验室高手掌握’这个产品中,是整个行业进入个性化教育新时代的引领风气之举”。费雷拉说:“从今年秋季起,培生的课程材料将在纽顿技术的支持下,开始适应性地满足每个学生独特的学习需求。学生能够生成大量有价值的数据,纽顿可以分析这些数据,以此确保学生以最有效、最高效的方式学习。这是教育的一个新的前沿领域”。按照已经达成的协议,这两家公司2013年将进一步扩大合作,把大学数学、大学统计学、大学一年级作文、经济学以及科学等领域纳入其产品中去。
此外,由总部设在美国纽约的麦格劳希尔公司(McGrawHill)、总部设在英国伦敦的培生集团和其他出版公司共同开发的“课程精灵”系统(CourseSmart),也允许教授们通过让学生使用电子教科书来跟踪他们的学业进展,并向助教们显示学生的学习参与度和学习成绩等大量的数据信息,只是这一系统尚不具备预测的功能。
大数据让考试变得更科学
教育中的数据挖掘是迈向大数据分析的一项主要工作。教育中最近的趋势是允许研究者积累大量尚未结构化的数据(unstructureddata)。结构化的数据(structureddata)是从教育部门多年的数据特别考试成绩和出勤记录那里收集而来。互动性学习的新方法已经通过智力辅导系统、刺激与激励机制、教育性的游戏产生了越来越多的尚未结构化的数据。这就使得更丰富的数据能给研究者创造出比过去更多的探究学生学习环境的新机会。
教育数据与其他领域中的数据比较起来,有一些独特的特征。总结起来就是教育数据是分层的(hierarchical)。美国教育部教育技术办公室在《通过教育数据挖掘和学习分析增进教与学(公共评论草案)》的第18页中写道:“教育数据是分层的。有键击层(keystrokelevel)、回答层(answerlevel)、学期层(sessionlevel)、学生层(studentlevel)、教室层(classroomlevel)、教师层(teacherlevel)和学校层(schoollevel),数据就寓居在这些不同的层之中。”
当某个学生回答一个问题时,一些变量就需要一起分析了。例如,学生回答正确率低的问题就是好问题吗?此外,时间也是重要的因素。比如,一个学生在考试的第一部分耗时太多,是否意味着其接下来就会飞速、凌乱地答题。一道问题的答题顺序、结果、具体情况,都给研究者提供了许多前所未有的大量数据。运用这些数据,研究者就能揭示学生的学习模式。研究者利用所有这些数据就能获悉到底是什么因素对学生构成了最好的学习环境。理解这些重要的问题有助于教育工作者给学生创造一个个性化的学习模式。
监测学生是“如何”考试的能让研究者有效定型学生的学习行为。大数据要求教育工作者必须超越传统,不能只追求正确的答案,学生是如何朝着正确答案努力的过程也同样重要。在一次考试中,学生个人和整体在每道题上花费了多少时间?最长的是多少?最短的是多少?平均又是多少?哪些此前已经出现过的问题学生答对或答错了?哪些问题的线索让学生获益了?通过监测这些信息,形成数据档案,能够帮助教育工作者理解学生为了掌握学习内容而进行学习的全过程,并有助于向他们提供个性化的学习模式。
监控学生的每一个学习行为是可能的。为了改进学生的学习成绩,我们需要知道他们回答一个问题用了多少时间,回答这个问题使用了哪些资源,哪些问题被跳过了,为了回答这个问题做了哪些研究工作,这个问题与其他已经回答了的问题之间存在什么关系。此外,老师对每个学生提供什么样的建议才是最佳的?学生写作业和答题的信息能立即被自动地监测到,老师还能在第一时间将这些信息反馈给学生。
用这些学生学习的行为档案创造适应性的学习系统能够提高学生的学习效果。利用学生是“如何”学习的这样重要的信息,考试的出题者们就能为学生量身定制出适合学生的个性化问题,并设计出能够促进记忆力的线索。通过分析大数据,研究者发现从教育的效果上来看,当被问到一系列难度逐渐增加且互相关联的问题时,学生的表现要好于围绕一个共同的知识点而随机挑选出的问题。美国标准化的研究生入学考试(GRE)中的这种适应性考试已经显示出朝这一方向努力的趋势。
五大技术利用教育大数据
需要特别注意的是,如何收集数据对于它们未来的使用性非常重要。接收数据汇入背后的挑战是从一开始就要标准化,以便今后对数据进行仔细分析。这样做并不是意味着将未结构化的数据转化为结构化的数据,而是要用直观的方法对接收的数据进行分类。
应该说,获得相关数据并不是一件容易的事。对于大学阶段的学生而言,数据的收集并不是主要问题。然而,对于中小学阶段的学生而言,挑战却很大,因为有些数据的收集存在法律问题,有的则存在伦理道德的问题。
数据收集者的人数和技能也是一个问题。对于公司而言,通常通过网络上的小型文本文件(cookies)来收集用户的相关信息。但是对于美国联邦政府教育部而言,则需要依赖于全国众多学区和研究者的网络来提炼和确认数据。
教育工作者和研究者已经开发出从大数据中提取价值的5种主要的技术。
在线旅游BAT代理人战争全面打响携程最受伤?日前艺龙旅行网对外宣布,其董事会收到了腾讯控股的私有化要约,以收购艺龙发行的除了携程、铂涛和腾讯等艺龙股东外的全部流通股。此消息一出,整个在线旅游市场再次引发了一场地震。……
阿里如何干掉腾讯的社交?互联网界有一个人人皆知的常识:互联网已形成三足鼎立的格局:阿里重运营,腾讯重产品,百度重技术。然而,阿里作为野心勃勃的后起之秀,从未放弃只守着自己的一亩三分地,即使腾讯已……
大数据在教育领域如何应用?数据(data),一般而言是指通过科学实验、检验、统计等方式所获得的,用于科学研究、技术设计、查证、决策等目的的数值。通过全面、准确、系统地测量、收集、记录、分类、存储这些数据……
不仅要清楚如何收集数据,还要清楚如何创造数据导读:企业每天都受到大量信息的冲击。这些信息由邮件、社交媒体、网站和移动应用等等生成,来自于它们业务的各个方面。业界估计数据每年的增长率在30到50之间,对于许多企业来说……
短视频如何在三足鼎立形势下脱颖而出?短视频的兴起离不开整个互联网、移动互联网的发展。包括4g的普及还有整个行业的发展,如最开始的门户站到BBS到SNS到微博到微信到语音类FM电台到短视频的发展。作为一直关注……
苹果发布会基本达成用户期望无指纹识别成遗憾10月23日凌晨消息,苹果在美国旧金山芳草地艺术中心召开新品发布会,正式发布iPad5、iPadmini2已经升级版的MacbookPro。对于期待着配备Retina显示屏的第……
苹果刚刚宣告了付费OS时代的终结编者按:本文作者是RYANTATE,原文发表在《Wired》上,有删减。苹果新品发布会亮点不少,但最让我关注以及感到惊讶的是:苹果最新操作系统OSXMaveri……
【人人早报】第62期:苹果发布会有喜无憾早报导语苹果在今天早上凌晨,又开始了新一轮发布会。中国又是第一批销售国家。本次发售会主要以ipad系列产品为主打。最新的ipad更轻,更薄了。让我们一起来好好的看一看吧。……
Google的失败,是Google为推翻Facebook付出Google从上线起就一直被认为是山寨Facebook,直到现在,其运营状况仍旧不见起色。纵观Google的社交产品史,更是一片狼藉。这样的前提下,Google当初是为何尝试做……
快递、电商、金融:即将到来的物流三国金融、电商、快递之间,一直在寻求机会跨界,涉足对方主营物流是国民经济的基础产业,也是电商和零售行业赖以生存的必要配套,随着社会商品交易规模的扩大和消费金融的发展,物流领域……
聊天界面设计:IM等社交产品与社交场景在过去的很长一段时间里,每当我坐在电脑前,父母的问候语总是“在聊天吗”,一定程度上可见网络聊天之深入人心。科学一点,翻看近几年不同地区互联网用户时间的分配比例数据,聊天时间通常……
从成本到体验:未来零售业的五大趋势几块钱评论:电子商务对传统零售业产生了巨大的冲击,一个来自渠道与成本,多渠道、低成本;另一个来自消费者的消费习惯,从线下逐渐向线上的转移。移动的爆发,线上与线下的融合速度加剧。……
微信改版,“内容服务”成为王道?微信改版,每次必引起恐慌和期待,这次更不例外,比如新媒体运营人员如何通过推出优质内容和服务,防止公号被取关;靠文章位置卖广告位的流量大内容却低质的订阅号的焦虑等等。作为产品经理……
瑞幸咖啡的排队烦恼如何解决?这里有3个思路如果你是瑞幸咖啡的店面经理,面对每天中午在柜台前拿着号码牌焦急等待回去上班的楼上白领,你会有什么好的改进方案吗?现在再提瑞幸咖啡,恐怕会有一种跟风还赶不上趟的错觉。但今天……
佛系马化腾的攻防战一守一攻,将会成为腾讯未来一段时间的关键词。微信订阅号改版,信息流代替列表,自媒体圈炸了。但在一片争议声中,都忽略了一个信息,虽然有点八卦,但是与近半年腾讯的一系列动作,……
腾讯难逃的巨头宿命?放眼望去在世界范围内,很多科技大公司在追逐利益的道路上,总会与梦想渐行渐远,让自己陷入两难。诸如Facebook、Google、Intel、Cisco、Motorola、Ali……
电影行业,什么时候能有属于用户选出的奖项?各类型的电影层出不穷,在电影行业,我们所熟知的奖项都是从专业角度出发的。但是,尚且没有一个标志性的奖项,来落地从用户出发的电影评价,这与互联网在电影行业日渐兴盛的影响力并不匹配……
产品经理周报第24期微信订阅号列表改版;ofo推出新一代信用早Step1:好看大佬言论(1)魅族创始人黄章:这么多年我没管公司就是个错误近日,有网友在魅族论坛上提问魅族总裁白永祥是否还在魅族工作,黄章回……
微信公众号大改版:今后的每一次推送都关乎生死今后,每一次推送都将变成公众号的一次“体检”,各色内容被放到读者的案板上,稍不顺眼就有被“取关离场”的风险。公众号运营者们在屏幕前瑟瑟发抖。昨天(20180620)下午,……
从40年前的日本,看中国式消费升级研究邻国日本40年前的消费趋势,不是照猫画虎或者亦步亦趋,而是为了抽象出底层逻辑消费升级不等于贵;消费升级最大的机会是本土化;“性价比”是可复制的模式,好品牌满足用户的感性诉求……
自恋社会:解读“国民性”的清明上河图导读:本专题横跨两千年的东西方思想史,借鉴文化历史学、心理学、政治哲学、精神分析、人类学、演化论等多种理论,一层一层剥开压在真相之上的文化屏障,尝试揭示后互联网时代下,“自恋社……
公众号变身信息流,微信背后的逻辑和策略说明:本文写于去年11月,原标题为《传公众号将变身信息流,微信背后的逻辑和策略》,发表于《计算机应用文摘》当年12月刊,当时就传言公众号将改版信息流。10月下旬(注:指2……
群起而攻,拼多多动了谁的奶酪?从2015年至今,不到三年的时间里,拼多多得到高速成长,一步迈进了巨头的行列。而在拼多多高歌猛进的时候,因为最近有十几个出售假冒伪劣商品,侵害消费者权益,假冒物流发货订单,失信……
现金危机中的共享单车,还是新四大发明吗?今时今日,陷入现金危机中的共享单车,还能称之为新四大发明吗?4月3日,美团收购摩拜单车。6月1日,有消息称ofo资金链紧张,开始大规模裁员,COO张严琪带领的海外事……