教育大数据引发聚焦关注,一文了解教育大数据

文 | 商业智能BI相关文章 阅读次数:1,236 次浏览
2023-08-29 15:34:02

现代信息技术的发展为大数据的收集和分析提供了无限的可能,大数据时代的这一趋势也对教育产生了巨大的影响:一方面,在科技理性的指导下,通过多维度收集学生行为的数据并进行模型建构,可以对学生的学习行为模型进行预测;另一方面,大数据时代的人文主义转向使人们更关注教学活动的适应性,教育大数据的挖掘和利用可以更好地实现适应个人需求的定制化教学。

国际数据公司(IDC)认为大数据时代数据有4大特点——数据的规模大、价值大、数据流转速度快以及数据类型多。大数据的挖掘和利用对教育——特别是课堂教学——产生着深远的影响。学习科学家索耶认为:越来越多的学习将经过计算机中介发生, 并产生越来越多的数据,我们有必要运用这些数据分析什麼时候有效的学习正在发生。所以数据挖掘可以用于探究行为与学习之间的关系,如学习者的个体差异与学习行为之间有何关系,不同行为又会导致何种不同的学习结果等。2012年美国发布《通过教育数据挖掘和学习分析促进教与学》(Enhancing Teaching and Learning through Educational Data Miningand Learning Analytics)提出大数据时代教育数据的特点:具有层级性、时序性和情境性,其中数据的层级性指,既收集教师层面的数据也收集学生层面的数据,既收集课堂数据也收集活动数据,为后期模型的建立提供了多维度的资源;数据的时序性是指,数据是实时的、连续的,为材料的前沿性提供了保障;而数据的情境性是指,数据是基于真实情境脉的,保证了模型的信度。

大数据技术能够促进以学生为本的学习,数据不仅仅是科技理性指导下收集数据和拟合成模型,并针对学生的群体行为做出建模预测判断,还可能在固有模型的基础上,通过诊断学生在课堂中的行为表现,对固有模型进行修改,使课程内容更加适合学生的长尾需求,实现个性化教学。大数据的利用可以支持对教育活动行为的建模预测,还可能支持教育实践中的适应性教学。前者是后者的基础,后者是前者的深化。

大数据时代数据促进教育变革的方法之一是收集和分析处理数据,并进行预测。现如今,由于数据记录、存储与运算的便捷性,海量的、多层次的数据可以便捷地加以收集,由随机抽样带来的误差因此减小,建模预测可以基于全数据和真实数据,因而就更为精确。近几年,教育研究的对象逐渐关注学生的学习行为模型,其背后是一种学习观的转变,学习被视为一种识知的过程(knowing about),识知是一个活动,而不是将知识作为一个物品加以传递。识知总是境脉化的,而不是抽象的和脱离于具体情境的。识知是在个体与环境的互动中交互建构的,而不是客观准确的,也不是主观创造的。所以,学生的行为活动数据被认为是可以反映学生在学习过程这一情境化的动态变化进程中的情况。海量、多层次、连续的行为数据在收集后被拟合成模型,实现预测,如学习管理系统(LMS)的运用。然而,由于建模预测依赖的基本原理为数理统计,其预判对象主要是学生的群体行为。

1.案例分析

学习管理系统(Learning Manage System)简称LMS,是基于网络的管理系统平台,用于监控学生学习活动行为,识别和预测学困生(student at-risk),并为其提供相应的帮助。大多数LMS包括5个部分:有和课程相关的学习资料、用于确保学生提交作业与完成测试的评价工具、用于沟通的交流工具(如邮件、聊天室等)、用于确保教师记录和存储学生的学习活动并发布活动截止日期的课程管理工具、用于帮助学生学习回顾和跟踪学习进程的学习管理工具。在高校大量使用的BB(Blackboard)平台就是一个常见的学习管理系统。系统记录了学生参与选修的网上课程的种类、在线时长、阅读和浏览的文章数量,反映学习者的学习行为模型。2008年,Leah P.Macfadyen和Shane Dawson教授在加拿大不列颠哥伦比亚大学通过分析5个本科班级使用BB平台选修生物课的数据,建立了预测模型。平台记录了学生课程材料的使用情况、参与学业交流情况和完成作业提交和考试情况。大数据时代教育数据记录的层级性在这裏充分显现,课程材料的使用包括记录在线时长、邮件的阅读时间、邮件的发送时间、讨论信息的阅读时间等。参与学业交流记录了发布新讨论的时间、回复讨论的时间、使用搜索工具所花的时间、访问个人信息的时间、文件的浏览时间、浏览谁同时在线的时间、浏览网页连结的时间等等。评价模块记录了评价的阅读时长和提交评价的时间等。通过应用统计工具描述散点图,发现了在LMS记录下学生在线时长和学业表现呈相关关系。在进行多元回归时,研究者发现,学业成就处在后四分之一的学生在线时间略长于平均时间,而学业成就处于前四分之一的学生的在线学习时间低于平均水平。紧接着,研究人员为了作出预测,利用逻辑斯特回归生成了一个预测模型,通过收集学生的新的行为数据,预测学生是否处于真正参与了学习活动,并得出如下结论:讨论举行的次数、邮件信息发送量和测评的完成情况这三个维度构成的模型可以预测学生的学业水平情况。

大数据时代,通过探求学生行为与学业水平之间的相关关系,建立模型,实现预测,能够对课堂教学产生重要影响。然而,数据建模过程中,为了保证模型的效度与信度,极端个别数据被处理,使模型只能实现群体行为的预测,不能针对学习者个体实现定制化和个性化。

2.建模与预测的不足

数据建模与预测的背后充分体现了实证主义的思想和方法。19世纪上半叶,以孔德为代表的社会学家提出了实证主义的基本信条:利用观察、分类,探求彼此的关系,得到科学定律。实证主义的哲学思潮到20世纪60年代,演变成一种科技理性,实践知识逐渐染上了工具性的色彩,专业活动存在于工具性的解决问题之中,所有的专业活动都被视为厘定目标、套用已知的方法解决问题的过程。这一期间,大量的学科被系统地整合发展,甚至包括教育学和社会学这样的「软科学」。用证据解决未知的问题,用数据预测未来一时成为潮流。

学生活动行为数据的建模尤其侧重体验实证主义的思想,模型注重成功教学行为的共性,忽视教师与学生群体的独特性需求时,科技理性的主导有可能使课堂教学被视为独立于真实境脉的模块,只要教学行为取得成功,就会被数据抽象化,形成模型,对学生群体行为产生预测。科技理性有赖于人们认同的共有目标,教学实践目标的厘定极其复杂,包含巨大的不确定性和独特性,甚至,由于社会角色的不同,还会带来价值冲突。一个稳定的、为所有人所认同的目标不复存在,依据科技理性精神和方法推理预测的行为模式并不可能满足每一个人的需求,教育变革在大数据时代下出现新的取向。

教育工作者和研究者已经开发出从大数据中提取价值的5种主要的技术。

  1. 预测(Prediction)——觉知预料中的事实的可能性。例如,要具备知道一个学生在什么情况下尽管事实上有能力但却有意回答错误的能力。
  2. 聚类(Clustering)——发现自然集中起来的数据点。这对于把有相同学习兴趣的学生分在一组很有用。
  3. 相关性挖掘(Relationship Mining)——发现各种变量之间的关系,并对其进行解码以便今后使用它们。这对探知学生在寻求帮助后是否能够正确回答问题的可靠性很有帮助。
  4. 升华人的判断(Distillation for human judgment)——建立可视的机器学习的模式。
  5. 用模式进行发现(Discovery with models)——使用通过大数据分析开发出的模式进行“元学习”(meta-study)。

实施这些技术就能够通过大数据来创建为提高学生成绩提供支持的学习分析系统。研究者们相信这些技术将帮助教育工作者更加有效地指导学生朝着更加个性化的学习进程迈进。

总而言之,通过大数据进行学习分析能够为每一位学生都创设一个量身定做的学习环境和个性化的课程,还能创建一个早期预警系统以便发现开除和辍学等潜在的风险,为学生的多年学习提供一个富有挑战性而非逐渐厌倦的学习计划。因此,有识之士经预言未来的学习将是大数据驱动的新时代。我们应该积极迎接这个新时代,通过大数据来分析学习,进一步改善教学的方式与方法,进一步促进学生学习成绩的提高。

然而,除了设备的制造商们,还有谁更在乎设备本身?关注数据本身才是王道。是时候通过系统的增加智能服务来调整日常硬件设备了,这样我们可以更加专注于如何从数据中发掘出更多的价值。数据效率的意思正如其名那样,让我们所需要的数据更加方便的访问、使用和管理。这样可以让我们更加能够从中挖掘出数据的信息,这当然也是IT生产的本质。

比如,目前主流的软件——finereport,它小到填报、查询、部署、集成,大到可视化大屏、dashboard驾驶舱,应有尽有,功能很强大。最重要的是,因为这个工具,整个公司的数据架构都可以变得规范,下一步就是构建企业的大数据平台了。而且它是java编写的,支持二次开发,类Excel的设计器,无论是IT还是业务,上手都很简单:编辑sql优化、数据集复用简直都是小case,大大降低了报表开发的门槛。在企业中被关注最多的数据安全方面,FineReport支持多人同时开发同一套报表,并通过模板加锁功能防止编辑冲突;通过数据分析权限控制,保障数据安全。

教育大数据,建模预测,学习行为模型

产品体验

相关内容

目录
立即咨询 立即咨询

商务咨询

在线咨询
专业顾问帮您解答问题

电话咨询

技术问题

投诉入口

微信咨询

返回顶部