大数据与教育

化学试题 2019-10-16 06:53:27 化学试题

小中大

手机查看

[摘要]大数据与教育篇一:教育大数据研究综述教育大数据不仅仅是大数据在教育领域应用，而且通过教育领域反向驱动大数据技术分化为独立的分支，从而带来了对传统教育技术领域长期研究问题解决的新途径，甚至可以跨越传统个性化学习的精确逻辑推理过程而直接分析全样本学习者特征。这样来促进教育管理科学化变革、促进教学模式改革

【www.shanpow.com--化学试题】

大数据与教育篇一:教育大数据研究综述

教育大数据不仅仅是大数据在教育领域应用，而且通过教育领域反向驱动大数据技术分化为独立的分支，从而带来了对传统教育技术领域长期研究问题解决的新途径，甚至可以跨越传统个性化学习的精确逻辑推理过程而直接分析全样本学习者特征。这样来促进教育管理科学化变革、促进教学模式改革、促进个性化教育变革、促进教育评价体系改革、促进科学研究变革等。这些主要依托于教育大数据的两项关键技术：教育数据挖掘和学习分析。但是我国的教育大数据研究与应用尚处于起步阶段，缺乏前期的规范化和系统化顶层设计，面临许多层次的挑战，如应用挑战、安全与隐私问题、运营挑战等，因此，特别需要从教育大数据整体进行规划和由上至下的系统综合研究。
引言
移动互联网技术相比较PC时代的互联网有着本质的区别，伴随着数据时代带动的非线性大数据增长过程，社会生活和城市建设过程中的教育系统也在高速发展过程中，这完全不同于过去的二十年间的信息技术对教育教学的改变进程。联合国在2012 年发布的大数据白皮书《Big Data for Development：Challenges&Opportunities》中指出大数据的出现将会对社会各个领域产生深刻影响。无论国内外都开始了对大数据的研究，起步略有早晚之分，但从政策到区域再到机构的发展方式是共识。《国民经济和社会发展第十二个五年规划纲要》中提出：“重点研究……海量信息处理及知识挖掘的理论与方法……”。美国教育部于2012年10月发布的《通过教育数据挖掘和学习分析促进教与学》中指出通过对教育大数据的挖掘与分析，促进美国高等院校及K-12学校教学系统的变革。2015年8月31日国务院发布的《促进大数据发展行动纲要》中指出“数据已成为国家基础性战略资源”，并在启动的十大工程之一“公共服务大数据工程”中明确提出要建设教育大数据。目前，教育大数据的重要性已经提升到国家战略层面，教育大数据中心建设和区域数据共建共享应用成为主要的建设模式，对个体学习全过程数据分析和精准数据评测学习成为主要的应用场景，从而通过宏观和微观的两方面建设，带动教育领域的广泛关注和重视。
相关概念
大数据的3V定义基本是从大数据的特征出发，即:规模性(Volume)、多样性(Variety)和高速性(Velocity).目前比较认可是4V定义，如国际数据公司(IDC)认为，大数据是符合4V特征的数据集，即在3V基础上增加价值性(Value)。而IBM认为大数据必然具有真实性(Veracity)。维基百科对大数据的定义是：“巨量资料(Big Data)，或称大数据、海量资料，指的是所涉及的资料量规模巨大到无法透过目前主流软件工具，在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯”。
另一方面，教育大数据的定义最早从产生教育大数据的主体出发，将教育大数据分为广义的和狭义的两类:广义的教育大数据泛指所有来源于日常教育活动中人类的行为数据;狭义的教育大数据是指学习者行为数据。也有研究指出教育大数据指整个教育活动过程中所产生的以及根据教育需要采集到的，一切用于教育发展并可创造巨大潜在价值的数据集合。
基于以上研究，可以认为教育大数据的定义包含三层含义:第一个含义，教育大数据是教育领域的大数据，是面向特定教育主题的多类型、多维度、多形态的数据集合;第二个含义，教育大数据是面向教育全过程的数据，通过数据挖掘和学习分析支持教育决策和个性化学习;第三个含义，教育大数据是一种分布式计算架构方式，通过数据共享的各种支持技术达到共建共享的思想。也就是说，我们把教育大数据定义为：面向教育全过程时空的多种类型的全样本的数据集合。教育大数据不仅仅是建设教育大数据中心，不仅仅是分析全过程学习数据，更多的是一种共享的生态思想。
与用传统方法收集的教育数据相比，教育大数据有更强的实时性、连续性、综合性和自然性，并使用不同的应用程序来分析和处理不同复杂度和深度的数据。传统教育数据收集的大多是阶段性的数据，而且大多在用户知情的情况下收集，使用的分析方法也通常是简单的统计分析方法。教育大数据收集的是整个教育教学过程中静态和动态的所有数据，可以在不影响教师和学生活动的情况下，连续记录整个教学活动的所有数据，如教学资料、互动反映和学生在每个知识点上停留的时间等。
教育大数据的业务分析
教育大数据是一种新的架构和思维基础，可以弱化分析模型直接进入研究目标进行分析，还可以通过数据聚集对“小现象”进行规律研究，还可以对个体进行多维度数据融合研究，再可以对目标对象进行时间序列和空间维度动态分析。面对具体教育业务，教育大数据技术对教育的管理、教学、学习、科研和评价等都产生了很大的影响。教育大数据的业务分析如图1所示。
图1 教育大数据的业务分析
1.教育大数据对教育管理的支持
传统的教育决策制定形式常被形象的称为“拍脑袋”决策，是指决策者常常不顾实际情况，以自己有限的理解、假想、推测依据直觉、冲动或趋势来制定政策。这种来自决策者“头脑发热”决策，经常处于朝令夕改的尴尬境地，教育大数据正可以帮助解决这种不足。
大数据时代，教育者将更加依赖于数据和分析，而不是直觉和经验;同样，教育大数据还将改变领导力和管理的本质。服务管理、数据科学管理将取代传统的行政管理、经验管理。技术不断发展，教育数据挖掘与分析不断深入，不仅要着眼于已有的确定关系，更要探寻隐藏的因果关系。利用大数据技术可以深度挖掘教育数据中的隐藏信息，可以暴露教育过程中存在的问题，提供决策来优化教育管理。大数据不仅可以运行和维护各教育机构的人事信息、教育经费、办学条件和服务管理的数据，而且可以长期积累所有类型教育机构的数据，利用统计分析、应用模型等技术将数据转换为知识，最终为教育者和学习者提供科学的决策。
2.教育大数据对教学模式的支持
教育大数据推进实现智慧学习。教师在智慧教学环境下，利用大数据技术可以更深入的了解每一个学习者的学习状况，并且与学习者的沟通更加通畅，教师的整个教学过程和学习者的学习过程更加精准化和智能化。教师对教学过程的掌握从依靠经验转向以教育数据分析为支撑，学生对于自己学习状况的了解从模糊发展到心中有数，可以更好的认识自我、发展自我、规划自我。大数据技术可以帮助教师及时调整教学计划和教学方法，有利于教师自身能力提高和职业发展。
3.教育大数据对个性化学习的支持
除了学生学习的行为可以被记录下来外，学生在学习资源上的数据也可以被精确记录下来，如点击资源的时间、停留多久、问题回答正确率、重复次数、参考阅读、回访率和其他资源信息，通过大数据可以定制个人学习报告，分析学习过程潜在的学习规律，还可以找到学生的学习特点、兴趣爱好和行为倾向，并一目了然教育状态信息。大数据技术使教育围绕学习者展开，使传统的集体教育方式转向为个性学习方式。同时还伴随着教育者和学习者思维方式的改变，进一步朝着个性化学习的方向迈出重要的一大步，使得精准的个性化学习成为可能。
4.教育大数据对教育评价的支持
教育评价正在从“经验主义”走向“数据主义”，从“宏观群体”评价走向“微观个体”评价，从“单一评价”走向“综合评价”。教育大数据下教育评价的变化，不仅表现在评价思想，还包括评价方法，不仅包括对学生的评价，还包括对教学管理、评估质量等具体水平的评价。教学评估不再仅仅是由考试成绩和纪律帮助教师评价的主观传统意义上的感受，而由大量的数据感知得到，为实现教学评价的公正提供了依据，优化了教学方向。教育评价可以是多元化的，而不是仅停留在知识掌握程度这一单一维度。
5.教育大数据对科学研究的支持
教育大数据使得从追求单向因果性转向追求复杂的多元相关性，并用直观的图形等表达方式体、系统、清晰、简洁地展现。这种新理念、新思维的创生，是实现教育创新和发展不可缺少的手段、工具和方法论。教育大数据时代，科学研究将从随机抽样、探讨因果关系走向全部数据、寻找相关关系。大数据技术减少了研究资金的浪费，在某些问题上，数据分析为研究人员提供了个性化的服务，可以提高了研究的效率和成果的可靠性。大数据依赖于自动、连续的记录和搜集的数据比传统调查数据更加客观和中立。大数据还将改变传统学术研究的过程，信息系统依赖于自动同步，连续获得持续的行为数据，这意味着学术研究和信息技术、课题研究与实践联系在一起。
教育大数据转换层次模型
教育大数据具有转换层次的四个过程特征：数据、信息、知识、智慧。教育大数据技术采集的海量教育元数据，经过抽取、转换、加载，联机分析处理和统计分析等过程，转换为教育信息，又经过数据可视化将教育数据呈现出来，最后形成教育决策来指导教育者和学习的教学，这个过程数据完成了从数据到信息、知识和智慧的演变。教育大数据转换层次模型如图2所示。
图2 教育大数据转换层次模型
目前在教育大数据领域中有很多研究领域，比较主要的是数据挖掘和学习分析。两者既有相同之处，又存在一定差异。
1.教育大数据和数据挖掘
数据挖掘就是从大量的、有噪声的、不完全的、模糊的、随机的实际应用数据中提取有效的、新颖的、潜在有用的知识的非平凡过程。目前认可度较高的一种处理模型是Fayyad等人设计的多处理阶段模型，在此不再赘述。在大数据时代处理数据理念上有三大转变：抽样到全体、绝对精确到效率、因果到相关[10]。大数据时代的数据挖掘继承于传统数据挖掘又不同于传统数据挖掘。首先是分析对象不同，传统数据分析的对象是在已知的数据范围中易处理的数据，而基于大数据的数据挖掘对象时包括非结构化数据的全部数据，不能保证原始数据是完整的、清洗过和没有错误的。其次是分析基础，传统分析是建立在关系数据模型之上的，是在系统内就创立的主题之间的关系基础上进行的，而在大数据分析中，绝大部分分析基于纵裂数据库之外。再其次是分析效率，传统数据处理过程中需要等待抽取、转换、加载等工作完成。而大数据分析是对数据进行实时分析。最后是硬件差别，在传统数据处理中所使用硬件比较昂贵。而大数据处理过程加入了对分析软件的使用，所以硬件成本较低。
近几年出现了许多有关教育数据挖掘(EDM)的文献。研究者对EDM研究的主题范围集中在使用数据挖掘提高机构效率和促进学生的学习过程。但是教育数据挖掘领域内还存在更广泛的话题，例如，在课程管理系统内(CMS)学生的退出和保留、个性化推荐系统、以及学生学习评价。
教育数据挖掘可以向教育者、学习者、教育管理者、家长及教育研究者提供决策帮助，最终提高学习者的学习水平。基于教育大数据的数据挖掘过程即将学习结果、学习内容、学习资源与教学行为等教育原始数据使用多种技术，如聚类、关系挖掘和模型构建等，最终达到预测学习者发展趋势、促进有效学习的目标。具体过程如图3所示。
图3 基于教育大数据的数据挖掘过程
教育大数据公认的特征之一是规模性，面对海量数据，可以采取分布式文件的系统进行并行运算。对于半结构化或非结构化的数据，可以采用自然语言理解和信息抽取等方式将其转化为结构化数据。对于杂质较多的数据，可以在数据挖掘时进行数据清洗。对于实时产生的数据可以使用自动获取效率优先的方式来采集数据。
2.教育大数据和学习分析
新媒体联盟(New Media Consortium)将学习分析定义为：利用松散耦合的数据收集工具和分析技术，研究分析学习者学习参与、学习表现和学习过程的相关数据，进而对课程、教学和评价进行实时修正。总之，学习分析运用多种方法采集、存储和分析学习者数据，如移动终端的数据和现场智能数据等，再使用多种技术来分析处理这些数据，最终应用于教育者和学习者，产生评估、预测和干预。基于教育大数据的学习分析过程如图4所示。
图4 基于教育大数据的学习分析过程
教育大数据学习的具体应用体现在评估、预测和干预。评估是指基本统计分析及其可视化、发现问题学生、学生社交网络分析与应用，预测是指学生分类、学生模型的构建、预测学生成绩，干预是指对教师的教学方法提供改进意见。教育大数据在学习分析中还有其他应用，如表1所示。除此之外，大数据在学习分析中的应用还包括学生分组与协作、社交网络分析、开发概念图、课件制作、规划和调度等。
教育大数据的进一步挑战
1.教育大数据的技术挑战
教育大数据在实际应用存在很多技术瓶颈，如：在数据的采集时数据挖掘和学习分析的重要环节，在这一环节有很多技术挑战;面对海量教育数据，数据的存储、处理和分析都存在技术考验;另外由于目前没有统一的数据规范，不同系统之间的兼容也是一大问题。从全局考虑，我国的教育大数据系统应遵循顶层设计原则，由教育部对数据格式、数据存储等问题制定统一规范，下级企业、学校按照统一规范去设计自己的系统，这带来了新的技术挑战。
2.教育大数据的安全与隐私挑战
在伦理道德方面，教育大数据面临着数据安全与保护隐私的挑战。教育大数据不仅是一种宝贵的教育收益，而且有关学习者和教育工作者的隐私权，其潜在的安全和隐私甚至是无法用常用办法评估出来，甚至无法通过独立的方法进行评估。如果教育大数据处理不当将导致严重的安全漏洞，甚至是影响区域教育政策的制定。教育数据所有权究竟属于学习者还是运行平台或是双方共享，这是互联网教育和教育大数据发展所面临的必然问题。如何保证所有权归属、如何判定所有权归属，这些仍是需要深虑的问题。
3.教育大数据的价值挑战
教育大数据技术挖掘出教育数据的巨大价值，但是数据的权属问题不是传统的财产、知识产权等可以涵盖的，数据成为国家间争夺的资源，人口红利、地大物博、经济实力、文化优势等都体现为数据资源储备和数据服务影响力。教育大数据是一种无形资产，国家应当保障教育大数据不外泄并不被恶意使用，而且还要兼顾部分数据向公众开放，发挥其应用的社会价值，做到适当的综合评估来进行价值平衡，这也是前所未有的一种挑战。(作者：杜婧敏、方海光等，首都师范大学)

大数据与教育篇二:教育虚拟社区：教育大数据的必然回归

本文由《开放教育研究》杂志授权发布
作者：张洪孟、胡凡刚

摘要
当前，基于教育大数据的实时决策、数据可视化和个性化学习服务受到人们的热捧，但很少有人从伦理规范和质量保证等视角对基于教育大数据的研究和应用进行反思。本文首先厘定了教育大数据的内涵、特征，然后分析了教育大数据与教育虚拟社区的契合以及教育大数据当前研究和应用中在技术器物、运维机制、使用主体三个层面所凸显出的问题，认为以学习者为中心、具有生态交往文化特性和一定伦理规范的教育虚拟社区可以规避教育大数据当前所面临的问题。基于上述论述，文章提出教育大数据回归教育虚拟社区将是必然，并阐述了实现教育大数据向教育虚拟社区回归的思路或方法。
关键词：教育大数据；教育虚拟社区；联通主义；自组织；超循环
近两年来，教育大数据的研究和应用得到人们的广泛关注。在线教育机构纷纷以教育大数据标榜自己，动辄以“教育大数据可视化”“个性化学习服务”宣传自己。教育大数据的作用被绝对化，教育大数据的宣传、研究和应用在一定程度上被异化和神化，一些机构疯狂涌入教育大数据领域。然而，很少有人对其深层问题进行探讨。比如，教育大数据生成的原动力是什么？其发展有无规律可循？研究和应用中伴有什么样的伦理问题？教育大数据的终极目的是什么？本文在对教育大数据内涵进行深刻解读的基础上，剖析了当前教育大数据在发展和应用中存在的问题，阐述了教育大数据回归教育虚拟社区的必然，以及如何实现教育大数据向教育虚拟社区的回归。

一、何为教育大数据

摇摇学生学习过程中会产生大量的学习数据，尤其是云计算、移动互联网等技术和泛在学习、移动学习等普及后，教育大数据自然而然成为教育领域的新生事物。教育事业发展的内在逻辑性，教育现象、内容和规律之间的级联性、高相关性被要求运用大数据的思想和方法进行深度的分析和挖掘。

（一）对大数据的认知

已有大数据的定义大多从其特征出发进行描述性定义（Laney，2012；Barwick，2011；IBM；Department of Education Office of Educational Technology，2010）。大数据产生于网络生产过程中，伴随物联网、社交网络、云计算等网络服务的发展，传统的数据分析方法和分析工具很难再应对网络生产过程中的海量数据。大数据的产生主要来源于两点——在线和交互。“大数据”在内涵和外延上已超越传统意义上的“数据”概念。其实，“大数据”一词并不能准确概括当今大数据研究领域的全部。大数据的重点并不在于“大”，而在于其蕴涵的多元、有序、共享、生成等思想，在于人们在技术哲学指导下应对大数据挑战过程中所生成的技术、方法和思维。基于大数据的思维和技术在实际应用中应是稳定、可重复、可解释、可实施的。

（二）教育大数据的涵义

国内关于教育大数据的定义最早见于徐鹏的《大数据视角分析学习变革》一文。他从产生教育大数据的主体出发，将教育大数据区分为广狭二义：广义的教育大数据泛指来源于日常教育活动中人类的行为数据；狭义的教育大数据指的是学习者的行为数据（徐鹏等，2013）。章怡等从教育大数据如何产生的角度将其界定为：信息技术支持下教与学各个环节所产生的符合教育大数据特征的数据集，是信息技术环境下教与学行为轨迹的产物（章怡等，2014）。2013 年10 月，美国哥伦比亚大学瑞恩·贝克（Ryan Baker）在Coursera 平台开设“教育中的大数据冶（ Big Data in Education）课程（ Coursera，2013），向学习者介绍常用的数据挖掘方法，以及如何将这些方法应用到教育数据挖掘和学习分析中。美国Knewton 教育公司将教育大数据分为两类：一类是有关学生基本信息的数据（例如，身份识别数据）；另一类是基于学生学习活动用以提升学习效果的数据，包括学习交互数据、推断的内容数据、系统范围数据、推断的学生数据（Ferreira，2013）。根据已有研究并结合教育虚拟社区实践，本文将教育大数据界定为：学习者以学习为目的，在互联网学习环境中借助一定媒介，与外界交互过程中所产生的数据，主要包含学习行为数据、学习内容数据、虚拟社会网络关系数据以及学习管理数据。

——学习行为数据即记录学习者网上学习行为的数据。例如，学习者访问网站的分布数据，包括访问网站的时间分布数据、停留时间、回访次数、回访相隔天数等。对学习者在线学习行为数据的分析和研究有助于了解学习者的学习类型、学习风格以及所需学习服务类型等。

——学习内容数据指学习者在网络学习过程中形成的关于某一问题的观点、意见，这种数据多以文本、图像、声音和视频等形式沉淀下来。对学习内容数据的挖掘和分析，有助于描绘学习者的知识图谱，明确学习者的知识掌握情况。

——虚拟社会网络关系数据主要记录学习者在各虚拟学习社群中的交往属性和交往动态，以及在社群中的位置和作用。掌握学习者的虚拟社会网络关系数据有助于了解知识在虚拟社区中如何传递，进而更好地促进知识在虚拟社区中的传播。

——学习管理数据即对学生学习进行管理和评价中所记录、生成的数据。学习管理数据的管理和应用水平体现了一个组织或机构学习管理的能力。教育大数据与其他行业领域（医疗、交通、气象、金融等）大数据相比，其特点为教育性、交互性、生成性。教育大数据是以“教学”和“学习”为中心所产生的数据，主要生成于以“学习”为中心的在线交互过程中，且在形成和发展过程中呈现一定的自组织性。教育大数据的重点并不在于其存储、生成和计算上的“大”，更重要的是，它体现了一种方法论和技术论上的变革，一种对于教育和学习问题研究的新思路。

二、教育大数据回归教育虚拟社区的必然

当前，教育大数据的研究和发展面临一系列难题。世界银行前资深教育专家埃米利奥·门（Emilio Porta）认为，当前真正有用的教育大数据仅来自于数据网络中的关键节点，且这些教育大数据在制定国家层面教育政策时没有发挥很大的作用（Porta，2013）。教育大数据在技术器物、运维机制和应用主体方面存在的问题，使教育大数据在学习分析和个性化学习建构方面还未真正发挥作用。通过对比分析我们发现，教育大数据与教育虚拟社区在文化内涵、人本主义追求、联通虚拟教育与现实教育等方面存在一定的契合。而且，教育虚拟社区在教育、人文和社会价值上的功能和追求，很好地规避教育大数据的缺点。结合当前的教育实践，我们认为，教育大数据与教育虚拟社区相结合，即教育大数据发展和应用的社区化将成为必然。

（一）教育大数据和教育虚拟社区的契合

教育虚拟社区基于跨时空、开放、自由的网络虚拟环境，社区成员之间进行专题研修、交互协作、资源共享，从而相互影响、相互促进，最终形成具有共同社区文化心理、生态式的社会关系共同体（胡凡刚，2005）。开放、自由、平等、共享等是教育虚拟社区的显著特征。《美国2010 国家教育技术计划》强调虚拟社区和教育大数据在“技术支撑的学习模型”和“基于联结的教学来提升教师教学能力和专业知识模型”中的重要作用（The Enterprise Strategy Group，2010）。徐鹏在探讨美国教育大数据对我国教育大数据研究和应用的启示时指出，教育大数据为教育虚拟社区的建设和运维提供了机遇和挑战。教育大数据和教育虚拟社区都是在网络技术背景下，促进在线教育发展过程中涌现的。因此，目标的一致性和教育文化的相似性为两者的契合奠定了基础。

1. 教育大数据和教育虚拟社区蕴含相同的文化内涵。教育虚拟社区和教育大数据本质上皆呈现开放、自由、平等、多元、自主生成的文化特性。教育虚拟社区是学习者在平等、自由、自主的文化氛围下自发聚集而成的。教育虚拟社区生态交往的文化特性是从线性走向网络，从依附走向平等，从他塑走向自塑（胡凡刚，2011）。在教育虚拟社区交往过程中，学生不用顾忌课堂教学中的等级、优劣、专家和教授的权威。来自优等生的优越感在教育虚拟社区完全被颠覆。学习者相互间平等交流和表达观点，不存在学习上的歧视和不平等现象。教育虚拟社区开放、自由、平等、多元、自主生成的特性能激发学习者表达自身学习需求、开展社区交往的愿望。

教育大数据突破了传统数据绝对集权的观点。每位学习者都可借助互联网和媒体设备生成学习数据，都是教育数据的中心。数据在网络世界没有高低贵贱之分，都借助数字信号在网络中传输。每位学习者都可表达自己真实的想法，各人在学习过程中生成的数据也各不同。同时，随着学习的不断深入，新数据又会在已有数据上不断生成。这些数据的不断积累，最终实现对学习者的准确“画像”。

2. 教育大数据和教育虚拟社区具有共同的人本主义追求。以往对学习者学习数据的处理多为记录和储存，且数据多是静态、孤立的结构化数据。各教育部门、教育机构、网络学习社区之间的数据相互割裂，得不到有效联结，在数据库建设、应用上存在重复性。基于云计算的教育大数据，实现了以学习者为中心的学习数据的共建、共享，实现了不同系统间的耦合，即多种学习情境中产生的数据可有效联结。例如，由海峡两岸五所交通大学2013 年8 月发起并建立的ewant 育网开放教育平台，创新性地实施微学程学习模式。微学程是一组精心设计、有系统关系的课程，每个微学程包含三门以上的课程，课程间有连贯性、逻辑性，每门微学程课程会在1-2 年间陆续开设（ewant，2013）。这种基于教育大数据、跨地域的微学程模式使学习者对某一领域知识的学习历程更加系统、完整，充分体现了以人为本的服务理念。

教育虚拟社区的形成建立在交互的基础上，这种交互存在于学生与教师、学生与学生、学生与内容、内容与内容之间，学习者在其中共同协作、相互学习、完成知识建构，并体验学习的归属感、成就感和存在感。在交往日益文明的教育虚拟社区中，学习者自我价值的实现将会成为最大、最现实的需求。在这种自我需求的驱动力下，学习者会积极发出自己的声音、共享自己的观点，进而增强其促进社区智慧和个体智慧的发展。

3. 教育大数据和教育虚拟社区——虚拟教育与现实教育有效联通的路径。联通主义学习观强调知识分布在网络中，这一网络有三层含义：个体的知识网络、小规模的学习社群网络（包括现实和虚拟两种形态）、通过社交媒体和网络等将各种学习社群连接起来形成的跨社群虚拟学习网络。联通主义学习观认为知识蕴含在这些网络的节点以及节点之间的联结中，并通过节点间的不断交互，在网络中不断生成新的知识，促进各个层次的网络在组织、内容和结构上更加有序、自组织。学习的关键是形成网络内外的有效联结，在不同层次的有效联结中丰富和完善个体知识结构（George，2005）。这种联结和交互通过不同层次的网络间和网络内的数据和信息的流动而实现。

学习者在虚拟教育和现实教育中的学习行为，展现的是学习者在不同空间的不同学习需求，都是学习者心理活动外化的表现。基于教育大数据的教育虚拟社区跨越时空阻隔将虚拟教育与现实教育有效联通，消除了二者的界限。这种联通的根本驱动力是学习者学习和交往的需求，联通的形式就是教育虚拟社区中数据和信息的流动。

（二）教育大数据存在的问题

海德格尔在评价技术的消极影响时指出，单纯的技术并不可怕，可怕的是受技术影响而产生的技术思维（许良，2005a）。当前，对教育大数据的研究和应用多停留在希冀的美好愿景上——如果教育大数据按照如何如何的顶层设计，那么将会产生如何如何的效果。这就暴露出人们对教育大数据的认识、研究和应用还存在一定问题。虽然教育大数据能够记录学习者的学习过程，但它不能解释这一过程为什么是这样的，而且学习过程还存在数据无法表征的因素，例如学习动机和情感因素等（祝智庭等，2013）问题。基于大数据的机器学习还无法构建类似人脑这样的智慧系统，主要技术瓶颈在于机器无法像人一样去感知周围事物（Jordan，2014；赵勇，2014）。此外，教育大数据还存在如何在价值观、性格塑造和公民参与等方面发挥作用（Tan，2013），如何保卫学习者的自由意志、道德意志，如何保卫学习者的自主选择权、学习的能动性（Cukier，2014）等问题。

德国哲学家E·卡西尔（Emst Cassirer）等人主张把技术看作是文化的组成部分，技术和文化在交互过程中相互影响，形成技术文化。对技术文化分析研究可从三个层面进行，从外到内依次是：技术器物层、技术制度或技术体制层、技术意识形态层（许良，2005b）。依据教育大数据的特性、当前研究和应用现状，借鉴卡西尔等人的思想，教育大数据凸显的问题可以划归为三个层面：技术器物层面、运维机制层面、使用主体层面。

1. 技术器物层面

1）教育大数据对学习者的数据化解构与重构。教育大数据的技术思维取向认为，教育大数据产生的过程即对学习者数据化解构与重构的过程，每位学习者都是一个数据源，都可以逐步加以解构，直到每一部分、每一属性都以数据化形式表示，并可以一定的编码进行映像存储。然而，这种映像与学习者之间不能划等号，这种数据化解构与重构，忽视了学习者的自我意识、自我能动性、信仰和道德情感。学习者不再被视为有思维和能动意识的人，而被替代为一串串的符号记录。学习者之间的关系变成了干巴巴的数据关系，失去了之所以为学习者的根本属性。此外，学习者不仅有知识的需求，还有社会交往、情感和价值观方面的需求。学习者这些需求的程度，以及这些需求在学习过程中的作用机制也无法通过数据衡量。互联网进化论的提出者刘锋认为，互联网的发展和应用最终将以人为本，而不是以数据互联为中心（刘锋，2009）。学习的思维过程是不可还原、不可重复的，每位学习者思维加工的经验和知识基础各有不同，不能机械地将已有学习者的成功经验移植到其他学习者身上。

2）教育大数据研究和应用过程中的单向性。教育大数据的真正力量在于将基于数据的形成性反馈准确地指向学习者（Clark，2013）。当前，教育大数据的存储和聚集比较常见，且容易实现。然而，真正基于教育大数据的教育决策和个性化学习建构却很少。教育数据只是单向地流向数据中心，很少形成基于教育大数据的意义反馈，学习者与教育大数据之间缺乏深层交互。数据被无意义地收集和存储，潜在意义得不到有效的开发和利用。即使存在反馈，那也是低层次的，很少涉及智慧层面。

3）教育大数据的产生多以网络终端设备为中心，并非以问题为中心。在处理学习者的某一问题时，研究者需要跨越多设备聚合数据，然后再对数据进行分析和处理。因此，数据准备阶段耗费时间和资源较多。

2. 运维机制层面

1）在线教育产业链上企业或机构间的利益博弈阻碍了教育大数据的联通。学校、教育培训机构等拥有教育大数据却没有处理数据的能力，企业拥有处理、分析教育大数据的能力，却得不到教育大数据。在线教育机构关于教育大数据的研究和应用未能实现良好的沟通和共享，多为竞争关系。目前，国内各大网络公司纷纷依托自身优势打造垂直在线教育，最令人关注的是BAT（百度、阿里巴巴、腾讯）的动向（见表一）。三家互联网产业公司，分别依托自身数据、流量和产业优势，发展在线教育，相互间缺乏数据的沟通和交互。这种博弈导致数据断联并形成一个个“数据孤岛冶，阻碍了他们通过相互合作达到整体的最大利益。近期，“学堂在线”正与阿里巴巴磋商，合作一旦成功，天猫盒子用户即可通过电视学习“学堂在线”提供的高清MOOC课程。这种将传统教育电视与新型MOOC在线教育相结合的创新模式能实现将互联网运营商、教育大数据、教育电视和MOOC等多种技术手段和优势资源的结合（辛巴，2014）。

2）教育大数据算法限窄学习者信息来源。维克多·迈耶（Viktor Mayer-Schonberger）和肯尼斯·库克耶（Kenneth Cukier）反思教育大数据负面影响时指出，基于教育大数据的课程推荐一定程度限窄了学生的选课范围，挫伤了学生向困难挑战的积极性，使学生转而选学容易通过的课程（ Mayer –Schonberger et al. ，2014）。埃里帕泽（Eli Pariser）研究发现，基于大数据的媒体和网络过滤机制一定程度上阻碍了学习者信息视野的拓展（Pariser，2011）。在教育虚拟社区中，相同或相反观点的学习者自发地聚集网络，形成强连接。然而，真正给社群带来新观点、新知识的，往往是弱连接上的某些节点。刘锋认为忽略互联网上人脑的参与，是当前互联网发展面临的主要困境。基于教育大数据的算法和人工智能能否知道学习者的真实想法，提供的学习服务能否真正满足学习者的需求，有待进一步商榷。

3. 使用主体层面

1）教育大数据应用过程中的伦理失范。首先，教育大数据研究和应用中的隐私问题。受家长、数据隐私保护者和教育工作者对学术数据隐私的质疑，2014 年4 月美国知名教育大数据新兴公司inBloom 宣布停止运营。inBloom 公司的宗旨是将经过存储、清洗和聚合分析后的教育大数据提供给政府批准的第三方机构开发教育产品，以更好地促进课堂教学。虽然inBloom 公司的初衷值得称赞，但其在具体操作中将学生的敏感数据提供给利益集团用作数据挖掘，没有充分保障学生的隐私权（Herold，2014）。其次，教育大数据所有权应当归谁？是学生、教师，还是教育机构？最后，教育大数据研究和应用到底是公益还是商业？教育大数据的应用和研究迄今还未形成一套切实可行的伦理规范。教育大数据的伦理失范主要表现在对学生和教育相关从业人员的隐私侵犯，在实际研究和应用中目的与手段的不统一、研究方法的不规范等。

2）教育大数据的研究和应用缺乏一定的质量保证体系。随着大数据的“蹿红”，一些利益组织或个人在不具备条件的情况下疯狂涌入教育大数据领域，各大教育公司或组织摇身一变成为基于教育大数据的教育产业公司。然而，在线教育盈利周期较长，许多教育机构受时间制约和利益诱惑，急于从数据的浅层分析和表象中得出结论，并将其应用于教育服务。这种现象折射出的是教育大数据研究和应用质量标准鉴定体系的不完善，由此建议应建立一套相对成熟的教育大数据应用、评价体系，对各行业、领域的教育大数据研究和应用的质量进行评定，以此提高涉足教育大数据的门槛。

3）专业教育大数据分析师的缺乏。当前制约教育大数据研究和应用发展的关键因素并非技术，而是人才——教育大数据分析师。教育大数据分析师应是兼具教育学、心理学、社会学等多学科知识，同时具备大数据思维，能从学生角度发现问题、思考问题和解决问题的复合型人才。美国求职网站Career Cast 发布的2014 年全美十大最佳职业中，与大数据相关的职业分别排第一、三和八位（Perman，2014）。如今，电子商务、天文研究、社交网络分析、医疗健康、气象研究等领域已开始招聘大数据分析研究人员。微软全国广播公司2010 年就开始招聘精通大数据相关知识的记者。BBC 新闻在线在早期项目研究中就已在由多领域专家合作的项目中培养具备多领域知识、精通大数据的记者。不可否认，教育大数据的应用会对教育的发展产生重大影响，但我们不希望把一堆有关学习的数据扔给机器，认为有关学习的问题都可借此得以解决。这种思考问题的方式似乎改变了问题的本质。教育是关于人的复杂性系统，教育大数据仅仅是整个系统的一环。

三、教育大数据回归教育虚拟社区理路

以学习者为中心、具有一定生态交往文化特性和价值诉求的教育虚拟社区规避了教育大数据的缺点，为教育大数据的研究和应用提供了指导。结合当前教育实践，我们认为，教育大数据的发展和应用与教育虚拟社区相结合，即教育大数据的社区化将成为发展的必然。

（一）自组织教育虚拟社区避免了教育大数据的无意义增长

戴维·阿斯平（Aspin，D. N. ）从教育哲学的高度指出，由于人是具有自主性的个体，人类作为一个共同体具有相同的福祉和道德追求，因此在教育现象中必然会呈现自治性和群体性（戴维·阿斯平等，2013）。基于自组织的教育虚拟社区以超循环理论为指导，无论是学习个体，还是整个社群都具有认知意识。基于自组织的教育虚拟社区的发展能够避免教育大数据自发、无意义的聚集，引导教育大数据向合理、有序的方向生成。从整体生成论的角度看基于自组织的教育虚拟社区主要经过自选择、自组织、自稳定三个阶段（见图1）。个体水平的循环过程中，学习者借助已有认知结构参与学习交往，伴随以同化和顺应，促进学习者个体认知结构的不断完善。符合社区认知规律、发展需求和具有共同情感追求的学习者的社区交往过程被保存下来，成为社区发展的关键节点，同时这些关键节点在社区内交往过程中改变着社区的结构和功能，不断促进社区水平的认知循环。新认知水平上的教育虚拟社区作为一个单元进入更高层次（相关社区耦合为更大的教育虚拟社区）的进化循环，形成社区间的影响。这样，底层循环催化、耦合为高层循环，同时高层循环对底层循环有负反馈作用，通过自选择和自组织使整个生成系统趋于稳定，形成超循环形态的教育虚拟社区。

在这种超循环机制中，不同层次间能够耦合的基础有两点：一是学习者学习交往的本性；二是学习者追求自我归属感、自我发展的内驱力。耦合的具体表现是数据承载的信息在不同层次间交换和传递。自组织教育虚拟社区将教育大数据和学习者统筹考虑，同一问题的关联数据自发聚集并被收集，增强了数据之间的互通性、关联性，避免了教育大数据的无意义增长和教育大数据研究和应用中的单向性。学习者之间的关系不再是干巴巴的数据关联，而充满了人情味。

（二）构建基于教育大数据的教育虚拟社区学习者个性化学习服务

教育大数据的真正力量在于将基于数据的形成性反馈准确地指向学习者。共享内容对象参考模型SCORM（Share Content Object Reference Model）注重教育资源的可重用性、可获得性、耐久性、互通性。然而，其思考问题的出发点是如何更好地促进教师的“教”。学习管理系统强调的是对学生学习事务的在线管理和处理、信息拥有者对信息的综合处理和应用，但其信息处理的对象多为某个学习群体或个体，很少研究同一学习者的跨群体表现。在教育大数据时代，在线学习正在从以内容为基础的弱互动向以关系为基础的强互动转变。基于教育大数据的教育虚拟社区学习者个性化学习服务将与学习者的多种教育云相整合，通过对教育云中教育大数据的分析，识别学习者，进而为学习者提供个性化学习服务（见图2）。

基于教育大数据的教育虚拟社区学习者个性化学习服务构建大体分为以下三阶段：识别学习者、确立最优个性化学习服务、学习服务推送。首先，通过对学习行为数据、学习内容数据和虚拟网络社区关系数据的分析，结合学习者已有的管理评价数据，识别学习者，实现学习者基本属性和学习需求的准确定位；其次，学习服务提供方依据学习需求制定学习服务，第三方评价机构依据学习服务标准在相互“竞价”的学习服务中选择最优学习服务；最后，教育虚拟社区选择合理、有效、人性化的方式向学习者推送学习服务。

基于教育大数据的教育虚拟社区学习者个性化学习服务的构建中，生成的每一步数据都是对上一步的反馈，同时这些数据也会以多种形式加以管理和评价，并存储于数据库中。基于教育大数据的教育虚拟社区学习者个性化学习服务，是一种遵从学习者学习需求，跨媒体、跨社群、跨终端、多情境、最大限度地整合与学习者相关教育大数据的学习服务，能实现教育大数据产业链上合作博弈的最优。

（三）以教育虚拟社区伦理建设规范教育大数据应用

康德说“你的行为要始终把人的本质作为目的，而绝不要仅仅作为手段对待，无论这本质是你自己，还是他人”（Kant，1964）。也就是说，人不是通往任何目标的工具，而是目标本身。在线教育组织或机构将学习者作为教育大数据采集和实验的对象，并将获取的数据用以商业目的，在某种意义上，这种做法会导致意外的“目的的善”，但学习者在这个过程中对自己的数据和信息被利用是否知情，是否允许，又是否自愿？教育大数据的社区化有助于规范教育大数据的研究和应用，通过教育虚拟社区伦理的带动和示范，形成教育大数据研究和应用的伦理规范。

首先，保障教育虚拟社区学习者的信息知情权。在广播媒体时代，信息源（例如，媒体和报纸刊物的编辑等）根据一定的职业伦理和价值判断有甄别地向用户传递信息。但在自媒体时代，人人都是信息源，信息甄别被计算机算法所取代，然而这种机器算法是否考虑了人类思维的伦理道德、价值判断和情感因素？因此，教育虚拟社区应赋予学习者一定的信息甄别权、知情权和自主权，也就是学习者应知道教育虚拟社区通过什么样的机制使用户获取了哪些信息、丢失了哪些信息，学习者可以凭借自身需求定制、取消各类信息服务。

其次，保障教育虚拟社区中学习者的个人隐私。教育大数据应用过程中，学习者最为关注的是个人隐私。教育大数据的隐私和安全问题，不仅要诉诸法律、制度和技术，最根本的应加强人们在个人隐私和数据使用上的伦理规范教育。美国“大数据、伦理与社会理事会”（the Council for Big data， Ethicsand Society）定期召集各领域的专家研究大数据的安全、隐私、平等和使用问题，并通过发布评论、白皮书，开发大数据标准等使大数据研究人员和公众及时了解与大数据相关的社会、伦理、法律和政策问题（Boyd et al. 2014）。

最后，建立健全教育大数据应用的相关法律法规，制定教育大数据研究和应用的相关行业标准。

某组织获取学习者的数据后，为何其他组织使用这些数据需要向其付费，即使这种付费是合理的，付费标准又如何制定？这些基于教育大数据的交易原则的合理性、可行性以及交易中的具体问题，应通过相关法律和行业标准规范教育大数据的操作流程，提高教育大数据服务领域的准入机制。

四、结语

教育大数据回归教育虚拟社区的过程应符合伦理规范，具有一定质量保证体系，以提升学习服务为目的。教育大数据回归教育虚拟社区不是把教育大数据的特性加以刨除，更不是两种技术或思想的简单叠加，而是以教育虚拟社区的特性规避教育大数据在思想、方法和实际应用中的弊端，回归意味着教育大数据在教育虚拟社区中是一种内在的存在和超越。教育大数据向教育虚拟社区的回归，是一种价值引领，其实质是一定意义上向学习者的回归，是对学习者的自我意识、自我价值和自我追求的肯定和彰显，目的是把学习者应有的权利归还学习者。

未来研究中，我们将会继续研究如何实现教育大数据在符合伦理规范要求下向教育虚拟社区的回归，如何使教育大数据的研究和应用更加符合教育虚拟社区生态交往的运行机制，从而变革现有教育虚拟社区的学习和交往模式。

基金项目：国家社会科学基金教育学一般项目“教育虚拟社区伦理的作用机制及评价研究”（BEAI30026）。
作者简介：张洪孟，硕士研究生，曲阜师范大学传媒学院，研究方向：网络教育应用；胡凡刚，博士后，教授，硕士生导师，曲阜师范大学传媒学院（通讯作者），研究方向：教育虚拟社区理论与实践、网络教育应用、影视文化传播（hufangang5@163. com）。

转载自：《开放教育研究》 2015年2月第21卷第1期
排版、插图来自公众号：MOOC（微信号：openonline）

大数据与教育篇三:大数据在教育领域的应用

大数据在教育领域的应用2013-10-28 光明日报

    数据（data），一般而言是指通过科学实验、检验、统计等方式所获得的，用于科学研究、技术设计、查证、决策等目的的数值。通过全面、准确、系统地测量、收集、记录、分类、存储这些数据，再经过严格地统计、分析、检验这些数据，就能得出一些很有说服力的结论。大规模、长期地测量、记录、存储、统计、分析这些数据，所获得的海量数据就是大数据（big data）。在制作大数据时，需要严格的方案设计、变量控制和统计检验等，不然所获得的大数据就是不全面、不准确、无价值或价值不大的。
    在教育特别是在学校教育中，数据成为教学改进最为显著的指标。通常，这些数据主要是指考试成绩。当然，也可以包括入学率、出勤率、辍学率、升学率等。对于具体的课堂教学来说，数据应该是能说明教学效果的，比如学生识字的准确率、作业的正确率、多方面发展的表现率——积极参与课堂科学的举手次数，回答问题的次数、时长与正确率，师生互动的频率与时长。进一步具体来说，例如每个学生回答一个问题所用的时间是多长，不同学生在同一问题上所用时长的区别有多大，整体回答的正确率是多少，这些具体的数据经过专门的收集、分类、整理、统计、分析就成为大数据。
    分析大数据助力教学改革    近年来，随着大数据成为互联网信息技术行业的流行词汇，教育逐渐被认为是大数据可以大有作为的一个重要应用领域，有人大胆地预测大数据将给教育带来革命性的变化。
    大数据技术允许中小学和大学分析从学生的学习行为、考试分数到职业规划等所有重要的信息。许多这样的数据已经被诸如美国国家教育统计中心之类的政府机构储存起来用于统计和分析。
    而近年来越来越多的网络在线教育和大规模开放式网络课程横空出世，也使教育领域中的大数据获得了更为广阔的应用空间。专家指出，大数据将掀起新的教育革命，比如革新学生的学习、教师的教学、教育政策制定的方式与方法。
    教育领域中的大数据分析最终目的是为了改善学生的学习成绩。成绩优异的学生对学校、对社会、以及对国家来说都是好事。学生的作业和考试中有一系列重要的信息往往被我们常规的研究所忽视。而通过分析大数据，我们就能发现这些重要信息，并利用它们为改善学生的成绩提供个性化的服务。与此同时，它还能改善学生期末考试的成绩、平时的出勤率、辍学率、升学率等。
    现在，大数据分析已经被应用到美国的公共教育中，成为教学改革的重要力量。为了顺应并推动这一趋势，美国联邦政府教育部2012年参与了一项耗资2亿美元的公共教育中的大数据计划。这一计划旨在通过运用大数据分析来改善教育。联邦教育部从财政预算中支出2500万美元，用于理解学生在个性化层面是怎样学习的。部分综述了该计划的数据和案例已经在美国教育部教育技术办公室2012年4月10日发布的《通过教育数据挖掘和学习分析增进教与学（公共评论草案）》中披露出来。
    美国教育部门对大数据的运用主要是创造了“学习分析系统”——一个数据挖掘、模化和案例运用的联合框架。这些“学习分析系统”旨在向教育工作者提供了解学生到底是在“怎样”学习的更多、更好、更精确的信息。举例来说，一个学生成绩不好是由于他因为周围环境而分心了吗？期末考试不及格是否意味着该学生并没有完全掌握这一学期的学习内容，还是因为他请了很多病假的缘故？利用大数据的学习分析能够向教育工作者提供有用的信息，从而帮助其回答这些不太好回答的现实问题。
    许多人因此会问，大数据能拯救美国的公立教育吗？全球最大的电脑软件提供商微软公司（Microsoft）的创始人、前首席执行官比尔·盖茨（Bill Gates）今年3月7日在得克萨斯州首府奥斯汀举行的一个教育会议上打赌说，利用数据分析的教育大数据能够提高学生的学习成绩，拯救美国的公立学校系统。他称过去十几年里教育领域的技术发展陷入了停滞，研发投入远远不够。盖茨充满信心地认为，教育技术未来发展的关键在于数据。在这次大会上，5000多名参会者讨论了教育数据应用的前景。
    教育大数据市场前景广阔    美国高中生和大学生的糟糕表现——高中生退学率高达30%（平均每26秒就有一个高中生退学），33%的大学生需要重修，46%的大学生无法正常毕业—— 在让教育部门忧心忡忡的同时，也让教育科技公司找到了淘金的机会。近些年来，许多教育科技公司纷纷开始抢滩大数据学习分析的市场，竞争极为激烈。
    美国的一些企业已经成功地商业化运作教育中的大数据。全球最大的信息技术与业务解决方案公司IBM就与亚拉巴马州的莫白儿县公共学区进行大数据合作。结果显示，大数据对学校的工作具有重要作用。当IBM刚刚开始与这一学区合作时，除了学生成绩不好之外，该县还面临着辍学率已增加到48%的严峻情况。根据联邦政府的《不让一个孩子掉队法》（No Child Lift Behind，NCLB），学生成绩糟糕的地方政府将受到惩罚。为了应对这一巨大的挑战，该县此前已经在学生数据的基础上建立了一个辍学指示工具，并将其用于全县层面的决策。但IBM认为这仍不足以改善莫白儿县窘迫的现状，需要借助IBM的技术支持重新建立大数据，进而利用大数据分析来改善学区内所有学生的整体成绩。
    在美国的教育大数据领域，除了处于领先地位的IBM，还有像“希维塔斯学习”（Civitas Learning）这样的新兴企业。“希维塔斯学习”是一家专门聚焦于运用预测性分析、机器学习从而提高学生成绩的年轻公司。该公司在高等教育领域建立起最大的跨校学习数据库。通过这些海量数据，能够看到学生的分数、出勤率、辍学率和保留率的主要趋势。通过使用100多万名学生的相关记录和700万个课程记录，这家公司的软件能够让用户探测性地知道导致辍学和学习成绩表现不良的警告性信号。此外，还允许用户发现那些导致无谓消耗的特定课程，并且看出哪些资源和干预是最成功的。
    在加拿大，总部位于安大略省沃特卢的教育科技公司“渴望学习”（Desire 2 Learn）已经面向高等教育领域的学生，推出了基于他们自己过去的学习成绩数据预测并改善其未来学习成绩的大数据服务项目。这家公司的新产品名为“学生成功系统”（Student Success System）。“渴望学习”声称加拿大和美国的1000多万名高校学生正在使用其学习管理系统技术。“渴望学习”的产品通过监控学生阅读电子化的课程材料、提交电子版的作业、通过在线与同学交流、完成考试与测验，就能让其计算程序持续、系统地分析每个学生的教育数据。老师得到的不再是过去那种只展示学生分数与作业的结果，而是像阅读材料的时间长短等这样更为详细的重要信息，这样老师就能及时诊断问题的所在，提出改进的建议，并预测学生的期末考试成绩。
    像美国的“梦盒学习”（Dream Box Learning）公司和“纽顿”（Knewton）公司这类领先性的开发者们，已经成功创造并发布了各自版本的利用大数据的适应性学习（adaptive learning）系统。在2012年国际消费电子展的高等教育技术峰会上，世界最大的教育出版公司培生集团（Pearson）与适应性学习领域里的先行者纽顿公司共同发布了主要由培生集团开发的适应性学习产品——“我的实验室/高手掌握”（MyLab/Mastering）。这款产品在将全球范围内向数百万名学生提供个性化的学习服务，向他们提供真实可信的学习数据，让学校通过这些数据提高学生的学习效果并降低教学成本。首款产品将在美国的数十万名学生中使用，包括数学、英语，以及写作等技能开发课。
    纽顿的创办人、首席执行官何塞·费雷拉和培生高等教育分公司的总裁格雷格·托宾共同出席了“我的实验室/高手掌握”的发布会并介绍了合作的细节，讨论了高等教育的未来。托宾说：“个性化学习是未来教育的一个关键点。我们把纽顿的技术整合到‘我的实验室/高手掌握’这个产品中，是整个行业进入个性化教育新时代的引领风气之举”。费雷拉说：“从今年秋季起，培生的课程材料将在纽顿技术的支持下，开始适应性地满足每个学生独特的学习需求。学生能够生成大量有价值的数据，纽顿可以分析这些数据，以此确保学生以最有效、最高效的方式学习。这是教育的一个新的前沿领域”。按照已经达成的协议，这两家公司2013年将进一步扩大合作，把大学数学、大学统计学、大学一年级作文、经济学以及科学等领域纳入其产品中去。
    此外，由总部设在美国纽约的麦格劳·希尔公司（McGraw-Hill）、总部设在英国伦敦的培生集团和其他出版公司共同开发的“课程精灵”系统（CourseSmart），也允许教授们通过让学生使用电子教科书来跟踪他们的学业进展，并向助教们显示学生的学习参与度和学习成绩等大量的数据信息，只是这一系统尚不具备预测的功能。
    大数据让考试变得更科学    教育中的数据挖掘是迈向大数据分析的一项主要工作。教育中最近的趋势是允许研究者积累大量尚未结构化的数据（unstructured data）。结构化的数据（structured data）是从教育部门多年的数据——特别考试成绩和出勤记录——那里收集而来。互动性学习的新方法已经通过智力辅导系统、刺激与激励机制、教育性的游戏产生了越来越多的尚未结构化的数据。这就使得更丰富的数据能给研究者创造出比过去更多的探究学生学习环境的新机会。
    教育数据与其他领域中的数据比较起来，有一些独特的特征。总结起来就是教育数据是分层的（hierarchical）。美国教育部教育技术办公室在《通过教育数据挖掘和学习分析增进教与学（公共评论草案）》的第18页中写道：“教育数据是……分层的。有键击层（keystroke level）、回答层（answer level）、学期层（session level）、学生层（student level）、教室层（classroom level）、教师层（teacher level）和学校层（school level），数据就寓居在这些不同的层之中。”
当某个学生回答一个问题时，一些变量就需要一起分析了。例如，学生回答正确率低的问题就是好问题吗？此外，时间也是重要的因素。比如，一个学生在考试的第一部分耗时太多，是否意味着其接下来就会飞速、凌乱地答题。一道问题的答题顺序、结果、具体情况，都给研究者提供了许多前所未有的大量数据。运用这些数据，研究者就能揭示学生的学习模式。研究者利用所有这些数据就能获悉到底是什么因素对学生构成了最好的学习环境。理解这些重要的问题有助于教育工作者给学生创造一个个性化的学习模式。
    监测学生是“如何”考试的能让研究者有效定型学生的学习行为。大数据要求教育工作者必须超越传统，不能只追求正确的答案，学生是如何朝着正确答案努力的过程也同样重要。在一次考试中，学生个人和整体在每道题上花费了多少时间？最长的是多少？最短的是多少？平均又是多少？哪些此前已经出现过的问题学生答对或答错了？哪些问题的线索让学生获益了？通过监测这些信息，形成数据档案，能够帮助教育工作者理解学生为了掌握学习内容而进行学习的全过程，并有助于向他们提供个性化的学习模式。
    监控学生的每一个学习行为是可能的。为了改进学生的学习成绩，我们需要知道他们回答一个问题用了多少时间，回答这个问题使用了哪些资源，哪些问题被跳过了，为了回答这个问题做了哪些研究工作，这个问题与其他已经回答了的问题之间存在什么关系。此外，老师对每个学生提供什么样的建议才是最佳的？学生写作业和答题的信息能立即被自动地监测到，老师还能在第一时间将这些信息反馈给学生。
    用这些学生学习的行为档案创造适应性的学习系统能够提高学生的学习效果。利用学生是“如何”学习的这样重要的信息，考试的出题者们就能为学生量身定制出适合学生的个性化问题，并设计出能够促进记忆力的线索。通过分析大数据，研究者发现从教育的效果上来看，当被问到一系列难度逐渐增加且互相关联的问题时，学生的表现要好于围绕一个共同的知识点而随机挑选出的问题。美国标准化的研究生入学考试（GRE）中的这种适应性考试已经显示出朝这一方向努力的趋势。
    五大技术利用教育大数据    需要特别注意的是，如何收集数据对于它们未来的使用性非常重要。接收数据汇入背后的挑战是从一开始就要标准化，以便今后对数据进行仔细分析。这样做并不是意味着将未结构化的数据转化为结构化的数据，而是要用直观的方法对接收的数据进行分类。
    应该说，获得相关数据并不是一件容易的事。对于大学阶段的学生而言，数据的收集并不是主要问题。然而，对于中小学阶段的学生而言，挑战却很大，因为有些数据的收集存在法律问题，有的则存在伦理道德的问题。
    数据收集者的人数和技能也是一个问题。对于公司而言，通常通过网络上的小型文本文件（cookies）来收集用户的相关信息。但是对于美国联邦政府教育部而言，则需要依赖于全国众多学区和研究者的网络来提炼和确认数据。
    教育工作者和研究者已经开发出从大数据中提取价值的5种主要的技术。
    1.预测（Prediction）——觉知预料中的事实的可能性。例如，要具备知道一个学生在什么情况下尽管事实上有能力但却有意回答错误的能力。    2.聚类（Clustering）——发现自然集中起来的数据点。这对于把有相同学习兴趣的学生分在一组很有用。    3.相关性挖掘（Relationship Mining）——发现各种变量之间的关系，并对其进行解码以便今后使用它们。这对探知学生在寻求帮助后是否能够正确回答问题的可靠性很有帮助。    4.升华人的判断（Distillation for human judgment）——建立可视的机器学习的模式。    5.用模式进行发现（Discovery with models）——使用通过大数据分析开发出的模式进行“元学习”（meta-study）。
    实施这些技术就能够通过大数据来创建为提高学生成绩提供支持的学习分析系统。研究者们相信这些技术将帮助教育工作者更加有效地指导学生朝着更加个性化的学习进程迈进。
    总而言之，通过大数据进行学习分析能够为每一位学生都创设一个量身定做的学习环境和个性化的课程，还能创建一个早期预警系统以便发现开除和辍学等潜在的风险，为学生的多年学习提供一个富有挑战性而非逐渐厌倦的学习计划。因此，有识之士经预言未来的学习将是大数据驱动的新时代。我们应该积极迎接这个新时代，通过大数据来分析学习，进一步改善教学的方式与方法，进一步促进学生学习成绩的提高

本文来源：https://www.shanpow.com/xx/492964/

《大数据与教育.doc》

将本文的Word文档下载到电脑，方便收藏和打印

推荐度：

点击下载文档

文档为doc格式