第一章统计案例
1.2独立性检验的基本思想及其初步应用(2)
【学习目标】
1.了解独立性检验的基本思想、方法及其简单应用;
2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤.
【新知自学】
知识回顾:
列联表
等高条形图
统计量,=_____________________,
其中
新知梳理:
1、独立性检验
(1)定义
对于2×2列联表
总计
总计
构造随机变量=___________________,
利用来判断”两个分类变量有关系”的方法,称为独立性检验.
(2)具体步骤
①根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界.然后查表确定_________;
②利用公式计算随机变量的________;
③如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”
3、独立性检验临界值表
(R2≥k0)
0.50
0.40
0.25
0.15
0.10
k0
0.455
0.708
1.323
2.072
2.706
P(K2≥k0)
0.05
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
4、反证法原理与独立性检验原理的比较
反证法原理:在假设下,如果推出一个矛盾,就证明了不成立.
独立性检验原理:在假设下,如果出现一个与相矛盾的小概率事件,就推断不成立,且该推断犯错误的概率不超过这个小概率.
对点练习:
1、在一次独立性检验中,其把握性超过了99%,则随机变量的可能值为()
A.6.635B.5.024
C.7.897D.3.841
2、思考:
在运算时,在判断变量相关时,若的观测值,则和,哪种说法是正确的?
【合作探究】
典例精析:
【例1】某校对学生课外活动进行调查,结果整理成下表:
试用你所学过的知识进行分析,能否在犯错误的概率不超过的前提下,认为“喜欢体育还是文娱与性别有关系”?
体育
文娱
总计
男生
女生
总计
可用数据计算,再确定其中的具体关系.
变式练习:
打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:
患心脏病
未患心脏病
总计
每晚都打鼾
30
224
254
不打鼾
24
1355
1379
总计
54
1579
1633
根据列联表的独立性检验,能否在犯错误的概率不超过0.001的前提下认为每晚都打鼾与患心脏病有关系?
规律总结:
在实际问题中要记住以下几个常用值:
①有99%的把握认为“X与Y有关系”;
②有95%的把握认为“X与Y有关系”;
③有90%的把握认为“X与Y有关系”;
④就认为没有充分证据显示“X与Y有关系”.
【课堂小结】
【当堂达标】
1、在吸烟与患肺病是否相关的判断中,有下面的说法:
①若K2的观测值k6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
②从独立性检验可知,在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;
③从独立性检验可知,在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.
其中说法正确的是________.
①B.②
C.③D.以上都不正确
2、某高校“统计初步”课程的教师随机调查了该选修课的一些学生情况,具体数据如下表:
非统计专业
统计专业
男
13
10
女
7
20
为了检验主修专业是否与性别有关系,根据表中的数据,得到
因为,所以断定主修统计专业与性别有关系,这种判断出错的可能性为。
独立性检验所采用的思路是:要研究A,B两类型变量彼此相关,首先假设这两类变量彼此________(无关/有关).在此假设下构造随机变量K2,如果K2的观测值较大,那么在一定程度上说明假设________(成立/不成立).
【课时作业】
1、某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:
对于教育机构的研究项目,根据上述数据能得出什么结论.
支持教育改
革情况
学历
积极支持教育改革
不太赞成教育改革
总计
大学专科
以上学历
39
157
196
大学专科
以下学