当前位置:主页 > 数学统计论文 >

用python实现非结构化教育数据分析

更新时间:2019-11-14
所需金币80 [1金币=1元] 资料包括:原始论文 点击这里给我发消息 QQ在线咨询
文档格式:doc/docx 全文字数:11600 ↓↓立即下载全文 **温馨提示**
以下仅列出文章摘要、目录等部分内容,如需获取完整论文资料,或原创定制、长期合作,请随时联系。
微信QQ:312050216
点击这里给我发消息
扫一扫 扫一扫
用python实现非结构化教育数据分析

摘  要


在教育领域,对知识掌握情况有一个全面的认识是相对重要的,但获取却困难的。现代教育理论不仅要求给定一个能够评价受试者能力水平的分数,还要求提供受试者的知识结构、认知缺陷等信息。知识空间理论提供了一种表达知识结构的方法,在指导教师教学、学生学习方面起到辅助、建议功能。该理论已经发展成为测试系统中有效直观的知识表示语言。本文选取了101位学生的统计学试卷A、B卷成绩数据,运用知识空间理论进行分析。本文主要工作包括:
1.对两份试卷进行基本的描述性分析和聚类分析。
计算得出52人A卷及49人B卷数据的均值、方差、众数等指标,对两份试卷分数分布情况等信息进行基础统计分析,初步了解A、B卷难度信息,章节覆盖及出题难度分布情况,粗略判断两份试卷A卷难度高于B卷。
本文采用K-means聚类,以学生答题正确率为聚类标准(正确率高、正确率较高、正确率较低、正确率低),分别将A、B卷试题各聚为4类,对4类试题群数据分别和出题难度、章节设置结合进行交叉分析,得出试卷出题人和学生对试题理解的差异,分析学生对章节内容的掌握情况。聚类的结果有助于简化知识空间理论计算的复杂度,有利于知识结构的简化和进一步分析。
2. 分别对聚类结果进行知识空间理论分析,建立知识结构。
由于知识空间理论随着试题数量的上升,知识状态愈发庞杂,导致计算复杂度急剧上升,本文将题目数量较多的正确率高的试题群随机分为3组,与其他试题群构成6个试题群,依据试题间的猜测关系和蕴含关系等,构建试题间的关系,完成知识状态的表达,进行知识空间理论分析。本文假设试题难度连续递增,将每个试题群构建对应的知识结构连接成整份试题的知识网络,并对该网络进行简要分析。本文对2个具有代表性的知识结构进行重点分析,分析了知识最长链及试题难度层次等内容。
最后,结合本文试题数据内容及理论结果,我们给出了基于知识空间理论的相关建议和结论,把实践过程中的感受和知识空间理论相应缺陷、发展空间写在最后。
 
关键词:知识空间理论 K-means聚类 数据分析


目录

1绪论 2
1.1课题背景及研究意义 2
1.2本文工作 2
1.3本文组织结构 2
2 知识空间理论综述 2
2.1 知识空间理论综述 2
2.2 国内外研究现状 3
2.3知识空间理论的优缺点 4
3 模型介绍 5
3.1 知识空间理论 5
3.2 K-means聚类 6
4 结果分析 7
4.1 描述性统计分析及聚类分析结果 7
4.1.1 描述性统计分析 7
4.1.2 聚类分析结果 9
4.2 知识空间理论结果分析 12
5 结论 16
参考文献 18