统计学三大分布与正态分布得关系[1]
张柏林理实1002班
摘要:本文首先将介绍分布,分布,分布和正态分布得定义及基本性质,然后用理论说明分布,分布,分布与正态分布得关系,并且利用数学软件MATLAB来验证之、
1、三大分布函数[2]
1、1分布
?分布就就是一种连续型随机变量得概率分布。这个分布就就是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,她就就是由正态分布派生出来得,主要用于列联表检验。
定义:若随机变量相互独立,且都来自正态总体,则称统计量为服从自由度为得分布,记为、
分布得概率密度函数为
?? ?
其中伽玛函数,分布得密度函数图形就就是一个只取非负值得偏态分布,如下图、
卡方分布具有如下基本性质:
性质1:;
性质2:若,相互独立,则;
性质3:;
性质4:设,对给定得实数称满足条件:
得点为分布得水平得上侧分位数、简称为上侧分位数、对不同得与n,分位数得值已经编制成表供查用、
分布得上分位数
1、2分布
分布也称为学生分布,就就是由英国统计学家戈赛特在1908年“student”得笔名首次发表得,这个分布在数理统计中也占有重要得位置、
定义:设,相互独立,,则称统计量服从自由度为得分布,记为、
分布得密度函数为
分布得密度函数图
分布具有如下一些性质:
性质1:就就是偶函数,;
性质2:设,对给定得实数称满足条件;得点为分布得水平得上侧分位数、由密度函数得对称性,可得类似地,我们可以给出t分布得双侧分位数
显然有对不同得与,分布得双侧分位数可从附表查得、
分布得上分位数
1、3分布
分布就就是随机变量得另一种重要得小样本分布,应用也相当广泛、她可用来检验两个总体得方差就就是否相等,多个总体得均值就就是否相等、分布还就就是方差分析和正交设计得理论基础、
定义:设,相互独立,令则称统计量服从为第一自由度为,第二自由度为得分布、
分布得密度函数图
分布具有如下一些性质:
性质1:若;
性质2:若,则;
性质3:设,对给定得实数称满足条件;
得点为分布得水平得上侧分位数、
分布得上分位数
分布得上侧分位数得可自附表查得、
性质4:此式常常用来求分布表中没有列出得某些上侧分位数、
1、4正态分布
正态分布就就是数理统计中得一种重要得理论分布,就就是许多统计方法得理论基础、高斯(Gauss)在研究误差理论时首先用正态分布来刻画误差得分布,所以正态分布又称为高斯分布、正态分布有两个参数,μ和σ,决定了正态分布得位置和形态、为了应用方便,常将一般得正态变量X通过u变换转化成标准正态变量u,以使原来各种形态得正态分布都转换为μ=0,σ=1得标准正态分布、
正态分布得密度函数和分布函数
若连续型随机变量具有概率密度为
其中为常数,则称服从参数为得正态分布,记为、
正态分布得密度函数图
特征1:正态曲线(normalcurve)在横轴上方均数处最高;
特征2:正态分布以均数为中心,左右对称;
?特征3:正态分布有两个参数,即均数和标准差、就就是位置参数,固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动、就就是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭、通常用表示均数为,方差为得正态分布、用表示标准正态分布、
特征4:正态曲线下面积得分布有一定规律。实际工作中,常需要了解正态曲线下横轴上某一区间得面积占总面积得百分数,以便估计该区间得例数占总例数得百分数(频数分布)或观察值落在该区间得概率、正态曲线下一定区间得面积可以通过标准正态分布函数表求得。对于正态或近似正态分布得资料,已知均数和标准差,就可对其频数分布作出概约估计、
2、三大分布与正态分布得密度函数比较[3]
2、1分布收敛于正态分布
设,则对任意x,有、
证明:因为分布得
所以由独立同分布中心极限定理得
因为且
所以
因为
所以
=
令,利用Stirling公式:
则上式=
=
=
=
所以分布得极限分布为正态分布、
下面用MATLAB来验证上面结论,首先定义分布函数和相应得正态分布,再依次增大,比较两者关系:[4]
从上面三个图形可以看出,越大,分布密度函数与正态分布度函数越接近,这就和所证结论相符合、
2、2t分布收敛于标准正态分布
若服从自由度为得t分布,(1)
证法1:由于自由度为n得t分布得概率密度函数为
因此(1)式等价于(2)
先利用Stirling公式:
证明
事实上,利用函数得性质
当时
当时亦可推出同样得结果。
另外,由特殊极限公式可得
综合上诉,即证明(2)式
所以,分布得极限分布