正态分布的曲线应用

综述
⒈ 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例 。
⒉ 制定参考值范围
⑴正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标 。
⑵百分位数法 常用于偏态分布的指标 。表3-1中两种方法的单双侧界值都应熟练掌握 。
【正态分布的曲线应用】⒊ 质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值 。这样做的依据是:正常情况下测量(或实验)误差服从正态分布 。
⒋ 正态分布是许多统计方法的理论基础 。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布 。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的 。例1.10 某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-1.96s、X+-2.58s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较 。
本例,μ、σ未知但样本含量n较大,按式(3.1)用样本均数X和标准差S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17 。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10% 。该地18岁男大学生身高在168cm以下者,约占总数12.10% 。其它计算结果见表3 。
表3 100名18岁男大学生身高的实际分布与理论分布 分布
x+-s 身高范围(cm) 实际分布
人数 实际分布
百分数(%) 理论分布(%) X+-1s 168.69~176.71 67 67.00 68.27 X +-1.96s 164.84~180.56 95 95.00 95.00 X+-2.58s 162.35~183.05 99 99.00 99.00 考试成绩及学生综合素质研究
教育统计学统计规律表明,学生的智力水平,包括学习能力,实际动手能力等呈正态分布 。因而正常的考试成绩分布应基本服从正态分布 。考试分析要求绘制出学生成绩分布的直方图,以“中间高、两头低”来衡量成绩符合正态分布的程度 。其评价标准认为:考生成绩分布情况直方图,基本呈正态曲线状,属于好,如果略呈正(负)态状,属于中等,如果呈严重偏态或无规律,就是差的 。
从概率统计规律看,“正常的考试成绩分布应基本服从正态分布”是正确的 。但是必须考虑人与物的本质不同,以及教育的有所作为可以使“随机”受到干预,用曲线或直方图的形状来评价考试成绩就有失偏颇 。许多教育专家(如上海顾泠沅、美国布鲁姆等)已经通过实践论证,教育是可以大有作为的,可以做到大多数学生及格,而且多数学生可以得高分,考试成绩曲线是偏正态分布的 。但是长期受到“中间高、两头低”标准的影响,限制了教师的作为,抑制了多数学生能够学好的信心 。这是很大的误会 。通常正态曲线有一条对称轴 。当某个分数(或分数段)的考生人数最多时,对应曲线的最高点,是曲线的顶点 。该分数值在横轴上的对应点与顶点连接的线段就是该正态曲线的对称轴 。考生人数最多的值是峰值 。我们注意到,成绩曲线或直方图实际上很少对称的,称之为峰线更合适 。某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理 。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布 。

推荐阅读