资料简介
第一章
统计案例
1
.
1
独立性检验
1
.
了解两个事件相互独立的概念
.
2
.
了解独立性检验的基本思想及其初步应用
.
1
2
3
1
.
两个事件
A
与
B
独立
一般地,对于两个事件
A
,
B
,如果有
P
(
AB
)
=P
(
A
)
P
(
B
)
,就称事件
A
与
B
相互独立,简称
A
与
B
独立
.
名师点拨
(1)
当事件
A
与
B
独立时
,
事
件
(2)
依据定义容易验证必然事件、不可能事件与任何事件是相互独立的
.
因为必然事件与不可能事件的发生与否
,
是不受任何事件的影响的
,
也不影响其他事件是否发生
.
(3)
从直观上可以认为不论事件
A
发生还是不发生都对事件
B
发生的概率没有影响
,
即事件
A
与事件
B
没有关系
,
或者说
B
与
A
独立
.
巧记方法
:
各独立事件同时发生的概率等于各个事件发生的概率的积
.
1
2
3
【做一做
1
-
1
】
甲组中有3名男生、2名女生,乙组中有2名男生、3名女生,今从甲、乙两组中各选出1名同学参加演讲比赛,则“从甲组中选出1名男生”与“从乙组中选出1名女生”
相互独立事件
.
(填“是”或“不是”)
解析
:
设
“
从甲组中选出
1
名男生
”
为事件
A
,“
从乙组中选出
1
名女生
”
为事件
B
,
则
P
(
A
)
P
(
B
),
故事件
A
与
B
相互独立
.
答案
:
是
1
2
3
解析
:
设
“
甲命中目标
”
为事件
A
,“
乙命中目标
”
为事件
B
,
则
A
与
B
相互独立
,
1
2
3
2
.
χ
2
的计算公式
一张用字母表示的2
×
2列联表如下:
表中
:
n
+
1
=n
11
+n
21
,
n
+
2
=n
12
+n
22
,
n
1
+
=n
11
+n
12
,
n
2
+
=n
21
+n
22
,
n=n
11
+n
21
+n
12
+n
22
.
1
2
3
n=
42
+
32
+
160
+
170
=
404,
n
11
n
22
-n
12
n
21
=
42
×
170
-
160
×
32,
n
1
+
=
42
+
160
=
202,
n
2
+
=
32
+
170
=
202,
n
+
1
=
42
+
32
=
74,
n
+
2
=
160
+
170
=
330,
答案
:
1
.
65
【做一做
2
】
根据下表计算
χ
2
的值约为
.
(结果保留两位小数)
1
2
3
3
.
用
χ
2
进行独立性检验
在独立性检验中,
χ
2
有两个临界值:3
.
841与6
.
635
.
(1)当
χ
2
>
3
.
841时,有
95%
的把握说事件
A
与
B
有关;
(2)当
χ
2
>
6
.
635时,有
99%
的把握说事件
A
与
B
有关;
(3)当
χ
2
≤
3
.
841时,认为事件
A
与
B
是无关的
.
1
2
3
归纳总结
用
χ
2
统计量进行
独立性检验
,
要注意以下三点
:
(1)
要求表中的数据都要大于等于
5,
因而在选取样本的容量时要注意这一点
;
(2)
χ
2
计算公式中的
n
11
n
22
与
n
12
n
21
分别为表中主对角线
(
左上
→
右下
)
上的两数据之积和副对角线
(
右上
→
左下
)
上的两数据之积
,
不能混淆
,
其中
n
为样本容量
;
(3)
χ
2
的构造思路
:
当统计假设
H
0
:
P
(
AB
)
=P
(
A
)
P
(
B
)
成立时
,
都成立
,
实际计算中是用事件的频率近似代替相应的概率
,
因而
χ
2
的结果也受样本特征的影响
,
具有随机性
.
1
2
3
答案
:
事件
A
与
B
无关
1
2
1
.
如何使用
χ
2
统计量作
2
×
2
列联表的独立性检验
?
剖析
:
步骤如下
:
(1)
检查
2
×
2
列联表中的数据是否符合要求
,
即表中的
4
个数据都要大于等于
5;
(3)
将
χ
2
的数值与两个临界值
3
.
841
与
6
.
635
进行比较
,
作出统计推断
:
当
χ
2
>
3
.
841
时
,
有
95%
的把握说事件
A
与
B
有关
;
当
χ
2
>
6
.
635
时
,
有
99%
的把握说事件
A
与
B
有关
;
当
χ
2
≤
3
.
841
时
,
认为事件
A
与
B
是无关的
.
1
2
2
.
独立性检验的基本思想是什么
?
剖析
:
独立性检验的基本思想类似于数学中的反证法
.
要确认“
两个分类变量有关系
”
这一结论成立的可信度
,
首先假设该结论不成立
,
即假设结论
“
两个分类变量没有关系
”
成立
,
在该假设下
,
我们构造的随机变量
χ
2
应该很小
,
如果由观测数据计算得到的
χ
2
很大
,
则在一定程度上说明假设不合理
,
根据统计量
χ
2
的含义
,
可以通过
χ
2
的大小来评价假设不合理的程度有多大
,
从而说明
“
两个分类变量有关系
”
这一结论成立的可信程度有多大
.
警示
:(1)
由于
χ
2
的计算量较大
,
所以应准确代入数据并计算
,
然后进行比较与判断
.
(2)
使用
χ
2
统计量作
2
×
2
列联表的独立性检验时
,
要求表中的
4
个数据都大于等于
5
.
题型一
题型二
题型三
相互独立事件的概率
【例题
1
】
下
面
是某班英语及数学成绩的分布表,已知该班有50名学生,成绩分1
~
5共5个档次
.
如:表中所示英语成绩为第4档,数学成绩为第2档的学生有5人,现设该班任意一名学生的英语成绩为第
m
档,数学成绩为第
n
档
.
(1)
求
m=
4,
n=
3
的概率
;
(2)
若
m=
2
与
n=
4
是相互独立的
,
求
a
,
b
的值
.
题型一
题型二
题型三
分析
:
明确表中数据的含义是解决本题的关键
.
解
:
(1)
由表知英语成绩为第
4
档、数学成绩为第
3
档的学生有
7
人
,
而学生总数为
50,
故
(2)
由题意知
,
a+b=
3
.
①
又
m=
2
与
n=
4
相互独立
,
所以
P
(
m=
2)
P
(
n=
4)
=P
(
m=
2,
n=
4),
由
①②
,
解得
a=
2,
b=
1
.
题型一
题型二
题型三
反思
(1)
应用相互独立事件的概率公式
,
可求得相互独立事件同时发生的概率
.
(2)
检验事件
A
与
B
是否相互独立
,
应充分利用相互独立事件的性质
,
验证
P
(
AB
)
与
P
(
A
)
P
(
B
)
是否相等
,
若相等
,
则相互独立
;
若不相等
,
则不相互独立
.
解决这一类问题
,
关键在于准确求出基本事件的总数
,
确定事件
A
与
B
的概率
,
另一个关键点是正确理解题意
,
分析出
AB
中的基本事件数
,
求出
P
(
AB
),
即事件
A
与
B
同时发生的概率
.
题型一
题型二
题型三
用
χ
2
统计量来判断两个变量是否有关
【例题
2
】
为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
(1)
估计该地区老年人中
,
需要志愿者提供帮助的老年人的比例
.
(2)
能否有
99%
的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关
?
(3)
根据
(2)
的结论
,
能否提出更好的调查方法来估计该地区的老年人中
,
需要志愿者提供帮助的老年人的比例
?
说明理由
.
题型一
题型二
题型三
附
:
分析
:
题中给出了
2
×
2
列联表
,
从而可通过求
χ
2
的值进行判定
.
对于
(1)(3),
可依据古典概型及抽样方法分析求解
.
解
:
(1)
调查的
500
位老年人中有
70
位需要志愿者提供帮助
,
因此该地区老年人中
,
需要志愿者提供帮助的老年人的比例的估计值
为
由于
9
.
967
>
6
.
635,
所以有
99%
的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关
.
题型一
题型二
题型三
(3)
由
(2)
的结论知
,
该
地区
的
老年人是否需要志愿者提供帮助与性别有关
,
并且从样本数据能看出该地区男性老年人与女性老年人中需要志愿者提供帮助的比例有明显差异
,
因此在调查时
,
先确定该地区老年人中男、女的比例
,
再把老年人分成男、女两层
,
并采用分层抽样方法进行抽样
,
这比采用简单随机抽样方法更好
.
反思
进行独立性检验一般要经历三个步骤
:
(1)
作统计假设
H
0
:“
事件
A
与
B
相互独立
”,
P
(
AB
)
=P
(
A
)
P
(
B
);
(3)
作出统计判断
:
若
χ
2
>
6
.
635,
则有
99%
的把握说
事件
A
与
B
有关
;
若
χ
2
>
3
.
841,
则有
95%
的把握说
事件
A
与
B
有关
,
这样就可以拒绝统计假设
H
0
;
反之
,
若
χ
2
≤
3
.
841,
我们就认为没有充分的证据说事件
A
与
B
有关
.
题型一
题型二
题型三
易错题型
易错点
:
对相互独立事件理解不够而出错
.
【例题
3
】
有10个零件,其中3个次品,现从中任取2个,记
A
:恰好有1个次品,
B
:至少有1个次品,求
P
(
AB
)
.
错因分析
:
因为
A
:
恰好有
1
个次品
,
B
:
至少有
1
个次品
,
所以
AB
:
恰好有
1
个是次品
,
即
P
(
AB
)
=P
(
A
)≠
P
(
A
)
P
(
B
),
从而
A
与
B
不独立
,
不能使用
P
(
AB
)
=P
(
A
)
P
(
B
)
计算
P
(
AB
)
.
正解
:
因为
A
:
恰好有
1
个次品
,
B
:
至少有
1
个次品
,
则
AB
:
恰好有
1
个次品
.
1 2 3
1
甲、乙二人分别对一目标射击一次
.
记
“
甲射击一次
,
击中目标
”
为事件
A
,“
乙射击一次
,
击中目标
”
为事件
B
,
则在
A
与
B
,
A.1
对
B.2
对
C.3
对
D.4
对
答案
:
D
1 2 3
2
下列说法正确的有
(
)
①
事件
A
与
B
无关
,
即两个事件互不影响
;
②
事件
A
与
B
关系越密切
,
则
χ
2
就越大
;
③
若判定两个事件
A
与
B
有关
,
则
A
发生
B
一定发生
.
A.0
个
B.1
个
C.2
个
D.3
个
解析
:
事件
A
与
B
有关
,
不要误以为是因果关系
,
它是指统计上的关系
,
故
③
不正确
,
①②
均正确
.
答案
:
C
1 2 3
3
在吸烟与患肺病这两个分类变量的关系中
,
下列说法正确的是
(
)
A.
若统计量
χ
2
>
6
.
635,
我们有
99%
的把握说吸烟与患肺病有关
,
则若某人吸烟
,
那么他有
99%
的可能患有肺病
B.
若从统计量中求出有
99%
的把握说吸烟与患肺病有关
,
则在
100
个吸烟者中必有
99
个人患有肺病
C.
若从统计量中求出有
95%
的把握说吸烟与患肺病有关
,
是指有
5%
的可能性使得推断错误
D.
以上说法均不正确
答案
:
C
查看更多