一、复习资料一
1、教育统计学的内容主要包括:描述统计与推断统计。
2、测量结果能在其上取定数值的量尺,从量化水平高低的角度可分为:名义量尺、顺序量尺、等距量尺与比率量尺。在名义量尺上所指定的数字,只具有类别标志的意义,而无性质优劣,分量多寡的意义。顺序量尺上的数字量化水平则较高,有优劣、大小、先后之别,如学业成绩评定优劣。等距量尺上的数字量化水平又更高,这种数字是单位相等但零点可任意指定的线性连续体系上的值,如温度、可比可加。比率量尺是一种有绝对零点的,等单位的线性连续体系。如身高、体重等。能加、减、乘、除。
3、测量工作按一定的规则进行,体现为三种东西即:测量工具、施测和评分的程序与要求、结果解释参照系或参照物。
4、心理测量跟物理测量的两点突出差异:一间接性;二要抽样进行。
5、数据的种类①从数据来源分成计数数据、测量评估数据和人工编码数据②根据数据所反映的变量的性质分分为称名变量数据、顺序变量数据、等距变量和比率变量数据。
6、顺序变量数据之间虽有次序与等级关系,但不具有相等单位,也不具有绝对的数量大小和零点。因此只能进行顺序递推运算,不能做加减乘除运算。等距变量不能用乘、除法运算来反映两个数据之间的倍比关系,能做加减运算。比率变量数据可以进行加、减、乘、除运算。
7、数据三个特点①数据的离散性②数据的变异性③数据的规律性。
8、统计一批数据的次数分布两种方法:一、按不同的测量值逐点统计次数;二、为了简缩数据以区间跨度来统计次数。如分数段统计。
9、编制简单次数分布步骤①求全距②定组数③定组距④写组限⑤求组中值⑥归类划记⑦登记次数。
10、相对次数分布表主要能反映各组数据的百分比结构。
11、累积次数分布表还分成“以下”累积次数分布表与“以上”累积次数分布表两种。“以下”累积其目的在于反映位于某个分数“以下”的累积次数共有多少。
12、次数分布图两种表达方式:次数直方图和次数多边图。
13、次数分布曲线按形状有各种不同类型①单峰对称分布曲线。正态分布曲线也是这一类型曲线中的一种②非对称曲线即偏态分布。正偏态:次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,在一些考试中,若题目偏难,多数考分偏低时,可形成正偏态分布。而负偏态的次数分布偏向正好与正偏态相反。
14、几种常用统计分析图:散点图、线形图、条形图和圆形图。
15、圆形图有其独特的功能,特别适用于描述具有百分比结构的分类数据。
16、集中量数有三个作用①向人们提供整个分布中多数数据的集结点位置②集中反映一批数据在整体上的数量大小③一批数据的典型代表值。
17、集中量数有多个种类,最常用的是算术平均数、中位数和众数三种。其中算术平均数是使用最普通的一个集中量数。中数在下列情况中有较好的应用价值①数据分布中有个别异常值或极端值出现时,用平均数作分布的代表值倒不如用中数作分布的代表值来得客观合理②在次数分布的某端或两端的数据只有次数而没有确切数量时③在一些态度测验、价值观测验或一般的民意问卷测试中,通常向被调查对象提出一些事项,要求被调查对象对这些事项排序。那么,在这种资料的信息数据整理分析中可应用中数来概括各个事项的总体排序结果。
18、常用的差异量数是平均差、标准差和方差等指标。
19、差异系数又称为变异系数和变差系数,用符号CV表示。差异系数是一种反映相对离散程度的系数,即相对差异量数。它消去了单位,因而适合于不同性质数据的研究与比较。数据在次数分布中所处的地位可用百分等级来表示。百分等级也称百分位。用记号PR表示。百分等级反映的是某个观测分数以下数据个数占总个数的比例的百分数,在0到100之间取值。如百分等级PR=75,与其对应的这个百分位数,读作第75百分位数,记作P75。
20、相关:统计学上用相关系数来定量描述两个变量之间的直线性相关的强度与方向。如相互关联着的两变量,一个增大另一个也随之增大,一个减小另一个也随之减小,变化方向一致是正相关。如相互关联着的两变量,一个增大另一个反而减小,变化方向相反是负相关。相关系数用r表示,r在-1和+1之间取值。相关系数r的绝对值大小,表示两个变量之间的相关强度;相关系数r的正负号,表示相关的方向,分别为正相关和负相关;相关系数r=0,称零线性相关,简称零相关;相关系数|r|=1时,表示两个变量是完全相关。当0.7≤|r|<1,称为高相关;当0.4≤|r|<0.7时,称为中等相关;当0.2≤|r|<0.4时,称为低相关;当|r|<0。2时,称极低相关或接近零相关。
21、积差相关是应用最普遍、最基本的一种相关分析方法,尤其适合于对两个连续变量之间的相关情况进行定量分析。