
本文目录导航:
教育大数据是什么?
一、教育大数据的起源 教育是一个超复杂的系统,触及 教学、治理、教研、服务 等诸多业务。
与金融系统具备明晰、规范、分歧化的业务流程所不同的是,不同地域、不同窗校的教育业务只管具备肯定的特性,但差同性也很突出,而业务的差同性间接造成教育数据起源愈加多元、数据采集愈加复杂。
教育大数据发生于 各种教育通常优惠 ,既包含校园环境下的教学优惠、治理优惠、科研优惠以及校园生活,也包含家庭、社区、博物馆、图书馆等非正式环境下的学习优惠;既包含线上的教育教学优惠,也包含线下的教育教学优惠。
教育大数据的外围数据源头是“人”和“物”——“人”包含在校生、老师、治理者和家长,“物”包含消息系统校园网站、主机、多媒体设施等各种教育装备。
依据起源和范围的不同,可以将教育大数据分为集体教育大数据、课程教育大数据、班级教育大数据、学校教育大数据、区域教育大数据、国度教育大数据等六种 。
二、教育大数据的分类 教育数据有多重分类方式。
从数据发生的业务起源来看,包含 教学类数据、治理类数据、科研类数据 以及服务类数据。
从数据发生的技术场景来看,包含感知数据、业务数据和互联网数据等类型。
从数据结构化水平来看,包含 结构化数据、半结构化数据和非结构化数据 。
结构化数据适宜用二维表存储。
从数据发生的环节来看,包含 环节性数据和结果性数据 。
环节性数据是优惠环节中采集到的、难以量化的数据(如课堂互动、在线作业、网络搜查等);结果性数据则常体现为某种可量化的结果(如效果、等级、数量等)。
国度采集的数据关键以治理类、结构化和结果性的数据为主,重点关注微观层面教育开展全体状况。
到大数据时代,教育数据的片面采集和深度开掘剖析变得越来越关键。
教育数据采集的重心将向非结构化、环节性的数据转变。
三、教育数据的结构模型 全体来说,教育大数据可以分为四层,由内到外区分是基础层、形态层、资源层和行为层。
基础层:也就是咱们国度最最基础的数据,是高度隐秘的数据; 包含教育部2012年颁布的七个教育治理消息系列规范中提到的一切数据,如学校治理消息、行政治理消息和教育统计消息等;形态层,各种装备、环境与业务的运转形态的数据; 肯定设施的耗能、缺点、运转期间、校园空气品质、教室光照和教学进度等;资源层,最下层是对于教育畛域的用户行为数据。
比如PPT课件、微课、教学视频、图片、游戏、教学软件、帖子、疑问和试题试卷等; 行为层:存储扩展教育相关用户(老师、在校生、教研员和教育治理者等)的行为数据, 比如在校生的学习行为数据、老师的教学行为数据、教研员的教学指点行为数据以及治理员的系统保养行为数据等。
不同档次的数据应该有不同的采集方式和教育数据运行的场景。
对于教育大数据的冰山模型,目前咱们更多的是采集一些显性化的、结构性的数据,而存在冰山之下的是更多的非结构化的,而且真正为教育发生最大价值的数据是在冰山之下的。
参考文献: 教育大数据的起源与采集技术 邢蓓蓓
2019年教育大数据蓝皮书指出 数据将成学校外围资产
4月17日上午,《中国基础教育大数据开展蓝皮书(2015)》颁布会暨教育大数据高峰论坛在 北京师范大学 举办。
国际首份基础教育大数据开展蓝皮书正式颁布。
据悉,《中国基础教育大数据开展蓝皮书(2015)》由 北京师范大学 “移动学习”教育部-中移动联结试验室、中国教育技术协会、江苏省教育消息化工程技术钻研中心联结颁布,由北京拓思德科技有限公司独家允许。
北京师范大学 “移动学习”教育部-中移动联结试验室主任余胜泉指出,数据将逐渐取代土地、劳力、资金等稀缺资产,成为社会和企业最关键的外围资产。
同时,数据也将扭转人类的认知方式和文明生态,“人机结合的思想形式将成为现代人认知环球的基本方式,借助默认设施而生活的时代曾经来到”。
未来,大数据将演化成为一种“人人消费数据、人人共享数据、人人治理数据”的社会文明。
余胜泉示意,作为教育界和学校最关键的资产,未来教育数据采集的重心将向非结构化、环节性的数据转变,“教育大数据的采集应该是全样本的、即时的数据”。
教育界还应增强教育大数据与其余畛域大数据(医疗、交通、经济、社保等)的融通和关联剖析,进一步增强教育决策的迷信性”。
蓝皮书担任人之一、 江苏师范大学 副传授杨现民示意,教育大数据并非单纯指其数量大,更关键的是其“价值”很大,教育大数据的外围价值是剖析和预测。
他示意,与其余畛域的大数据相比,教育大数据具备高度的复杂性,其运行也须要高度的发明性。
他以为,教育属于超复杂的系统,教育畛域的大数据不存在明晰的、固定的剖析流程和剖析方法。
教育大数据的剖析既要综合运用传统的数据剖析方法与工具,也要正当驳回专门针对大数据处置的新方法和新工具,“严厉来说,教育大数据的剖析模型不是被设计进去的,而是被发现的”。
此次蓝皮书梳理了环球教育大数据相关政策停顿,解读了教育大数据的外延、共同性,剖析了教育大数据的起源与结构,对罕用的四大类13种教育数据采集技术启动了引见,并提出7种典型教育数据剖析模型。
经过收集整顿49个典型运行案例,提炼出基础教育大数据的五大运行形式,讨论了国度、区域以及学校三个层面教育数据网络的构建思绪,以及教育大数据治理存在的难题及基本处置思绪。
在随后的教育大数据高峰论坛中,与会专家针对教育与大数据的深度融合开展了讨论。
专家们指出,是中国的教育大数据元年,政府、企业、学校、钻研者、社会群众等开局关注教育大数据。
与此同时,我国教育大数据钻研与通常全体还处于起步探求阶段,国外也没有成熟的阅历和形式可以自创。
宿愿经过“政、产、学、研、用”五方联结,共同助力我国基础教育大数据开展,为成功中国教育引领环球而一同致力。
余胜泉、顾小清、方海光、魏顺对等4位专家,区分就《大数据时代的教育改革》、《以学习剖析改良教学通常》、《面向基础教育的移动学习与教育大数据钻研》、《数据驱动的大规模在线教育实施评价模型构建与运行》等主题宣布了演讲
大数据剖析畛域有哪些剖析模型
数据开掘和剖析畛域触及多种模型,旨在从少量数据中提取有价值的消息。
以下是几种常常出现的剖析模型:1. 降维模型在处置大数据集时,高维度数据或者造成计算复杂度和存储需求参与。
降维模型如主成分剖析(PCA)和t-SNE,旨在缩小数据集的维度,同时保管最关键的消息。
2. 回归模型回归模型用于剖析自变量与因变量之间的相关。
线性回归是最基础的方式,它假定相关是线性的。
经过建设数学方程,回归模型可以预测因变量的值。
3. 聚类模型聚类模型如K-means和档次聚类,将数据点分组,使得同一组内的数据点相似度更高。
这些模型有助于发现数据中的人造分组或形式。
4. 分类模型分类模型如决策树和SVM,经过学习已标志数据的特色来预测新数据的类别。
这些模型在二分类或多分类疑问中十分有用。
5. 关联规定模型关联规定模型如Apriori算法,用于发现大数据集中的东西或事情之间的幽默相关。
例如,超市购物篮剖析可以发现顾客购置某些商品的偏差。
6. 期间序列模型期间序列模型如ARIMA和节令性合成期间序列预测(SARIMA),用于剖析和预测数据随期间的变动趋向。
7. 意外检测模型意外检测模型如孤立森林和高斯混合模型,用于识别数据集中的意外值或离群点。
这些模型在欺诈检测和安保监控等畛域十分关键。
8. 协同过滤模型协同过滤模型经过火析用户行为和偏好,为用户介绍东西。
这种模型宽泛运行于电影、音乐和商品介绍系统中。
9. 主题模型主题模型如隐含狄利克雷调配(LDA),用于文本数据的剖析,以识别文档汇合中的主题散布。
10. 门路和归因模型门路剖析、漏斗剖析和归因模型,用于了解用户如何经过一系列步骤达成特定指标或成功转化。
这些模型在在线营销和用户行为剖析中尤为关键。
这些模型各自有不同的运行场景和长处,它们在数据剖析和开掘畛域中表演着关键角色。