本节内容可联系 心理统计学 - 刘红云
一、数据分析的类型
教育研究中的数据处理是指运用测量学和统计学的原理和方法对教育现象所进行的数据收集、整理、推断与解释,从而揭示教育规律和心理规律的过程。主要包括:
- 描述统计
- 推断统计
- 利用 SPSS 数据统计软件
二、描述统计
(一)描述统计的内涵与作用
- 内涵:教育研究中的描述统计是就针对教育现象进行调查和实验所获取的大量数据进行分析,从而进一步描述一组数据的全貌,显示其分布特征,表示事物的性质,主要包括数据分布特征量的统计。
- 作用:它既能使研究者了解事物的性质,又可作为对事物进行推断统计的依据。
(二)描述统计的步骤
- 数据的检查
- 主要检查数据的完整性和正确性。完整性即依据所调查的项目逐项检查,看填写是否完整,避免遗漏或重复;正确性即检查所收集的资料是否真实可靠。
- 数据的分类
- 数据分类指根据某一属性或指标将收集到的数据进行分组归类,要求做到不遗漏不混淆。数据分类一般分为数量分类和品质分类,分别处理的对应数据类型为量化数据和类别数据。如:
- “某高中每学年的化学实验器材的购置开支共 1000 元,物理实验器材的购置开支为 1500 元”,这是数量分类;
- 某年级学生中男生共 496 人(54%)、女生共 424(46%);又如对某班级学生的理解能力的测量结果为“好”(21%)、“较好”(24%)、“一般”(40%),“差”(15%),这是品质分类。
- 数据分类指根据某一属性或指标将收集到的数据进行分组归类,要求做到不遗漏不混淆。数据分类一般分为数量分类和品质分类,分别处理的对应数据类型为量化数据和类别数据。如:
- 数据的排序
- 数据的排序是将各数据按大小逻辑进行排列,从而可以较明显的表示数据的简单分布情况。包括顺序排列、等级排列和频数排列。
- 顺序排列是将数据从大到小或从小到大进行排列。
- 等级排列是根据顺序排列划分等级。和顺序排列的区别是,其大小是按数值所含的意义确定。如:若反映学习成绩,则以数值大的为第一等级; 若反映时间,则应以数值小的为第一等级。
- 数据的排序是将各数据按大小逻辑进行排列,从而可以较明显的表示数据的简单分布情况。包括顺序排列、等级排列和频数排列。
(三)描述统计与分析方法
1. 频数分布描述
(1)频数的概念
- 在教育统计工作中,调查对象可能是人,可能是物,也可能是相关事业单位,统计所得的名称数不同,为了方便,统计学上往往将人数、只数、个数等统称“次数”(亦称频数),用小写字母 f 表示。
(2)频数分布描述的方法:
- 频数分布表
- 频数分布图:条形图、饼形图、直方图、多边图
2. 常用特征参数及计算方法
- 频数分布表和频数分布图仅仅对一组一组数据进行归纳性描述,但要对数据进行进一步分析研究,还需计算一些能描述一组资料的数据特征指标,即特征量。
- 频数分布有集中趋势和离散趋势。集中趋势体现数据围绕分布中心上下波动性;离散趋势则体现数据的离中趋势。
- 常用特征量:
- 平均数
- 中位数
- 众数
- 方差和标准差
- 标准分数
3. 相关分析与相关系数
- 相关关系是指两个变量(因变量与自变量)之间不精确、不稳定的变化关系,研究两个变量之间的变化方向及其密切程度的分析叫相关分析。如学生的学习成绩与学习动机、教师的工作满意度与工作的强度之间都存在一定相关关系。相关一般分为正相关、负相关和零相关。
- 正相关指两个变量的变化方向一致,即一个变量变大时另一个变量也变大;
- 负相关指两个变量的变化方向相反,即一个变量变大时另一个变量变小;
- 零相关指两个变量之间没有相关。
(1)相关系数的内涵
- 相关系数是描述两个变量密切程度的特征量,记作 r,其取值范围在 -1.00-1.00 之间,r>0 表示正相关,r<0 表示负相关。完全相关时所有散点均落在一条直线上,当=1.00 时为完全正相关,当=-1.00 时为完全负相关。
(2)相关系数计算公式(略)
微课补充:
相关系数
- 相关系数只能用于比较,不能用于计算;
- 相关系数只能描述两个变量间的变化方向和密切程度,并不能揭示两者的内在本质。
积差相关系数 r_{XY}=\frac{\sum^n_\limits{i=1}(X-\overline X)(Y-\overline Y)}{nS_XS_Y}
数据统计要注意的问题:
- 数据之间的可比性
- 随机因素的影响
- 统计数据的质量
- 注意数据异常
- 注意数据的整理