资料简介
第二十章 数据的分析
20.1.1 平均数
第1课时
农科院为了选出适合某地种
植的甜玉米种子,对甲、乙两
个品种各用10块试验田进行试
验,得到各试验田每公顷的产
量如下表。根据这些数据,应
为农科院选择甜玉米种子提出
怎样的建议呢?
品种 各试验田每公顷产量(顿)
甲
7.65 7.50 7.62 7.59 7.65
7.64 7.50 7.40 7.41 7.41
乙
7.55 7.56 7.53 7.44 7.49
7.52 7.58 7.46 7.53 7.49
探究:某市三个郊县的人数及人均耕地面积如下表.
郊县 人数/万 人均耕地面积/公顷
A 15 0.15
B 7 0.21
C 10 0.18
这个市郊县人均耕地面积是多少(精确到0.01公顷)?
小明求得这个市郊县的人均耕地面积为:
你认为小明的做法有道理吗?为什么?
)(18.0
3
18.021.015.0
公顷
x
小明求得这个市郊县的人均耕地面积为:
你认为小明的做法有道理吗?为什么?
)(18.0
3
18.021.015.0
公顷
x
由于各郊县的人数不同,各郊县的人均耕地面积对这个
市郊县的人均耕地面积的影响不同,因此这个市郊县的人
均耕地面积不能是三个郊县人均耕地面积的算术平均数,
而应该是: )(17.0
10715
1018.0721.01515.0
公顷
0.15×15表示A县耕地面积吗?你能说
出这个式子中分子,分母各表示什么吗?
nxxx ,, , 21
nwww ,, , 21
若n个数 的权分别是
,则:
n
nn
wwww
wxwxwx
321
2211
叫做这n个数的加权平均数。
数据的权能够反映的数据的相对“重要程度”。
上面的平均数0.17称为3个数0.15、0.21、0.18的加权
平均数(weighted average),三个郊县的人数(单位是
万),15、7、10分别为三个数据的权(weight).
问题1 如果公司想招一名综合能力较强的翻译,请
计算两名应试者的平均成绩,应该录用谁?
应试者 听 说 读 写
甲 85 78 85 73
乙 73 80 82 83
乙的平均成绩为 .
73 80 82 83 79 5
4
+ + +
= .
显然甲的成绩比乙高,所以从成绩看,应该录取甲.
我们常用平均数
表示一组数据的“平
均水平”.
应试者 听 说 读 写
甲 85 78 85 73
乙 73 80 82 83
解: 甲的平均成绩为 ,
85 78 85 73 80 25
4
+ + +
= .
问题2 如果公司想招一名笔译能力较强的翻译,用
算术平均数来衡量他们的成绩合理吗?
应试者 听 说 读 写
甲 85 78 85 73
乙 73 80 82 83
听、说、读、写的成绩按照2:1:3:4的比确定.
重要程度
不一样!
73 2 80 1 82 3 83 4 80 4
2 1 3 4
+ + +
= = . .
+ + +
x
乙
因为乙的成绩比甲高,所以应该录取乙.
85 2 78 1 85 3 73 4 79 5
2 1 3 4
+ + +
= = .
+ + +
x
甲解: ,
思考 能把这种加权平均数的计算方法推广到一般吗?
85 78 85 72 1 3 4
2 1
3 79
3 4
5+ + +
= .
+ + +
1 1 2 2
1 2
+ + +
=
+ + +
n n
n
x w x w x w
x
w w w
一般地,若n个数x1,x2,…,xn的权分别
是w1,w2,…,wn,则
叫做这n个数的加权平均数.
问题4 与问题(1)、(2)、(3)比较,你能体
会到权的作用吗?
问题3 如果公司想招一名口语能力较强的翻译,则
应该录取谁?
应试者 听 说 读 写
甲 85 78 85 73
乙 73 80 82 83
听、说、读、写的成绩按照3:3:2:2的比确定.
例1. 某公司欲招聘一名公关人员.对甲、乙两位应试者
进行了面试和笔试,他们的成绩(百分制)如下表所示.
应试者 面试 笔试
甲 86 90
乙 92 83
(1)如果公司认为面试和笔试成绩同等重要,从他们的
成绩看,谁将被录取?
甲乙甲
解:根据题意,求甲、乙各项成绩的平均数,得:
88
2
9086
甲x 5.87
2
8392
乙x
答:因为___的平均成绩比_____高,所以___将被录取.
(2)如果公司认为,作为公关人员面试成绩应该比笔
试成绩更重要,并分别赋予它们6和4的权,计算甲、
乙两人各自的平均成绩,谁将被录取?
解:根据题意,求甲、乙各项成绩的加权平均数,得 :
6.87
%40%60
%4090%6086
甲x
4.88
%40%60
%4083%6092
乙x
答:因为_____>_____,所以_____将被录取.甲x乙x 乙
选手 演讲内容 演讲能力 演讲效果
A 85 95 95
B 95 85 95
例2 一次演讲比赛中,评委将从演讲内容、演
讲能力、演讲效果三个方面为选手打分.各项成绩均
按百分制计,然后再按演讲内容占50%、演讲能力
占40%、演讲效果占10%,计算选手的综合成绩
(百分制).进入决赛的前两名选手的单项成绩如表
所示,请确定两人的名次.
注:本题中演讲内容、演讲能力、演讲效果三项成
绩的权分别是 _______、________、________ 50% 40% 10%
解:选手A的最后得分是:
90
%10%40%50
%1095%4095%5085
Ax
选手B的最后得分是:
91
%10%40%50
%1095%4085%5095
Bx
答:由上可知选手____获得第一名,选手____
获得第二名.
B A
(1)加权平均数在数据分析中的作用是什么?
当一组数据中各个数据重要程度不同时,加权平
均数能更好地反映这组数据的平均水平.
(2)权的作用是什么?
权反映数据的重要程度,数据权的改变一般会影
响这组数据的平均水平.
第二十章 数据的分析
20.1.1 平均数
第2课时
1、如何求一组数据的平均数?
2、七位裁判给某体操运动员打的分数分别为:7.8,
8.1,9.5,7.4,8.4,6.4,8.3.如果去掉一个最高分,
去掉一个最低分,那么,这位运动员平均得分是
多少?
解:
n
x...xxxxx n4321
解: 8
5
3.84.84.71.88.7
x
3.晨光中学规定学生的学期体育成绩满分为100,
其中早锻炼及体育课外活动占20%,期中考试成绩占
30%,期末考试成绩占50%.小桐的三项成绩(百分制)
依次是95、90、85.小桐这学期的体育成绩是多少?
解:根据题意,得
5.88
%50%30%20
%5085%3090%2095
x
答:小桐这学期的体育成绩是88.5分。
n 学习目标:
1.理解算术平均数的简便算法与加权平均数的一致
性,会用计算器求加权平均数;
2.会根据频数分布计算加权平均数,理解它所体现
的统计意义,发展数据分析能力.
3. 会根据样本平均数估计数据总体的集中趋势,进
一步体会用样本估计总体的思想.
n 学习重点:
根据频数分布求加权平均数的近似值.
问题1 某跳水队有5个运动员,他们的身高(单
位:cm)分别为156,158,160,162,170.试求他们
的平均身高.
解:他们的平均身高为:
156 158 160 162 170 161 2
5
+ + + +
= .
所以他们的平均身高为161.2 cm.
问题2 某班级为了解同学年龄情况,作了一次年
龄调查,结果如下:13岁8人,14岁16人,15岁24人,
16岁2人.求这个班级学生的平均年龄(结果取整数).
13 8 14 16 15 24 16 2 14
8 16 24 2
+ + +
=
+ + +
x
解:这个班级学生的平均年龄为:
所以他们的平均年龄约为14岁.
在求 n 个数的算术平均数时,如果 x1 出现 f1 次, x2
出现 f2 次,…,xk 出现 fk 次(这里 f1 + f2 +…+ fk = n ),
那么这 n 个数的平均数
也叫做 x1 ,x2 ,…,xk 这 k个数的加权平均数,其中f1 ,
f2 ,…,fk 分别叫做x1 ,x2 ,…,xk 的权.
这种求平均数的方法与上一节课中的加权平均数
求法有什么相同之处?
1 1 2 2+ + +
= k kx f x f x f
x
n
说明 根据频数分布表求加权平均数时,统计中
常用各组的组中值代表各组的实际数据,把各组的频数
看作相应组中值的权.
载客量/人 组中值 频数(班次)
1≤x<21 11 3
21≤x<41 31 5
41≤x<61 51 20
61≤x<81 71 22
81≤x<101 91 18
101≤x<121 111 15
根据上面的频数分布表求加权平均
数时,统计中常用的各组的组中值代
表各组的实际数据,把各组频数看作
相应组中值的权。例如在1≤x<21之间
的载客量近似地看作组中值11,组中
值11的权是它的频数3,由此这天5路
公共汽车平均每班的载客量是:
)(73
15182220153
15111189122712051531311
人
x
从表中,你能知道这一天5路公共汽车大约有多
少班次的载客量在平均载客量以上吗?占全天总班次
的百分比是多少?
由表格可知, 81≤x<101的18个班次 和101≤x<
121的15个班次共有33个班次超过平均载客量,占全
天总班次的百分比为33/83等于39.8%
? 思 考
问题3 果园里有100 棵梨树,在收获前,果农常
会先估计果园里梨的产量.你认为该怎样估计呢?
梨的个数?
每个梨的质量?
150 2 152 153 154 155 3 157 159 154
10
+ + + + + +
= =x
所以平均每棵梨树上梨的个数为154.
(1)果农从100 棵梨树中任意选出10 棵,数出这10
棵梨树上梨的个数,得到以下数据:154,150,155,
155,159,150,152,155,153,157.你能估计出平均
每棵树的梨的个数吗?
梨的质量
x/kg 0.2≤x<0.3 0.3≤x<0.4 0.4≤x<0.5 0.5≤x<0.6
频数 4 12 16 8
(2)果农从这10 棵梨树的每一棵树上分别随机摘4
个梨,这些梨的质量分布如下表:
能估计出这批梨的平均质量吗?
0 25 4 0 35 12 0 45 16 0 55 8 0 42
4 12 16 8
. + . + . + .
= = .
+ + +
x
所以平均每个梨的质量约为0.42 kg.
用样本估计总体;
用样本平均数估计总体平均数.
(3)能估计出该果园中梨的总产量吗?
思考 这个生活中的问题是如何解决的,体现
了怎样的统计思想?
154 100 0 42 6468. =
所以该果园中梨的总产量约为6 468 kg.
例1 为了解全班学生做课外作业所用时间的情况,
老师对学生做课外作业所用时间进行调查,统计情况如
下表,求该班学生平均每天做课外作业所用时间(结果
取整数,可使用计算器).
所用时间t/min 人数
0<t ≤10 4
10<t ≤20 6
20<t ≤30 14
30<t ≤40 13
40<t ≤50 9
50<t ≤60 4
例2 某灯泡厂为了测量一批灯泡的使用寿命,从中
随机抽查了50只灯泡,它们的使用寿命如下表所示.这
批灯泡的平均使用寿命是多少?
解:据上表得各小组的组中值,于是
800 5 1200 10 1600 12 2000 17 2400 6
50
1672
+ + + +
=
=
x
使用寿命
x/h
600≤x
<1 000
1 000≤x
<1 400
1 400≤x
<1 800
1 800≤x
<2 200
2 200≤x
<2 600
灯泡只数 5 10 12 17 6
(1)当一组数据中有多个数据重复出现时,如何简便
地反映这组数据的集中趋势?
利用加权平均数.
(2)据频数分布求加权平均数时,你如何确定数据与
相应的权?试举例说明.
(3)在抽样调查得到样本数据后,你如何处理样本
数据并估计总体数据的集中趋势?
样本平均数估计总体平均数.
数据
权
频数
组中值
第二十章 数据的分析
20.1.2 中位数和众数
第1课时
1、下表是校女子排球队队员的年龄分布:
年龄 13 14 15 16
频数 1 4 5 2
求校女子排球队队员的平均年龄(可使用计算器).
)(7.14
2541
216515414113
岁
x
答:校女子排球队队员的平均年龄为14.7岁.
解:
2.为了绿化环境,柳荫街引进一批法国梧桐,
三年后这些树的树干的周长情况如图所示,计算(可以
使用计算器)这批法国梧桐树干的平均周长(精确到
0.1 cm).
0
2
4
6
8
10
12
14
40 50 60 70 80 90
频数
周长/cm
n 学习目标:
1.了解中位数和众数的意义,会求一组数据的中位
数和众数;
2.会用中位数和众数描述一组数据的集中趋势;
3.体会中位数、众数在估计数据集中趋势中的作用
,
体会平均数的特点和局限性.
n 学习重点:
体会中位数和众数的意义.
引 言
作为描述数据平均水平的统计量,平均数广泛应用于生
活实际中,例如我们经常听到诸如“居民人均年收
入”“人均住房面积”“人均拥有绿地面积”等术语.但
如果我们不了解平均数的特点,数据分析得到的结论就会
出现偏差,出现平均数偏离绝大多数数据很多,大多数数
据“被平均”的情况.
月收
入/元 45 000 18 000 10 000 5 500 5 000 3 400 3 000 1 000
人数 1 1 1 3 6 1 11 1
下表是某公司员工月收入的资料.
(1)计算这个公司员工月收入的平均数;
这个公司员工月收入的平均数为________6276
月收
入/元 45 000 18 000 10 000 5 500 5 000 3 400 3 000 1 000
人数 1 1 1 3 6 1 11 1
平均数远远大于绝大多数人(22人)的实际月工资,
绝大多数人“被平均”.
不合适.
下表是某公司员工月收入的资料.
(2)如果用(1) 算得的平均数反映公司全体员工
月收入水平,你认为合适吗?
“平均数”和“中等水平”谁更合理地反映了该
公司绝大部分员工的月工资水平?这个问题中,中等
水平的含义是什么?
该公司员工的中等收入水平大概是多少元?你是怎
样确定的?
月收
入/元 45 000 18 000 10 000 5 500 5 000 3 400 3 000 1 000
人数 1 1 1 3 6 1 11 1
一半人月工资高于该数值,另一半人月工资低于该
数值;中等水平的含义是中位数.
计算中间两个数据的平均值:
5 6 5 5
2
+
= .
有6户家庭的年收入分别为(单元:万元)4,5,5,
6,7,50.你认为这6户家庭的年收入水平大概是多少?
将一组数据按照由小到大(或由大到小)的顺序排
列,如果数据的个数是奇数,则称处于中间位置的数为
这组数据的中位数;如果数据的个数是偶数,则称中间
两个数据的平均数为这组数据的中位数.
如果一组数据中有极端数据,中位数能比平均数更
合理地反映该组数据的整体水平.
月收
入/元 45 000 18 000 10 000 5 500 5 000 3 400 3 000 1 000
人数 1 1 1 3 6 1 11 1
一组数据中出现次数最多的数据称为这组数据的众数.
如果小张是该公司的一名普通员工,那么你认为他
的月工资最有可能是多少元?
如果小李想到该公司应聘一名普通员工岗位,他最
关注的是什么信息?
有6户家庭的年收入分别为(单元:万元):4,5,
5,6,7,50.你认为这6户家庭的年收入水平大概是多
少?如果把数据50改成9,结果又会怎样?
平均数
中位数
众数
60
50
40
30
20
10
10
60 40 20 20 40 60 80
x3 + x4
2
= 5.50
x1 + x2 + x3 + x4 + x5 + x6
6
= 12.83
x6 = 50.00
x5 = 7.00
x4 = 6.00
x3 = 5.00
x2 = 5.00
x1 = 4.00
图 20.1.2(1)
平均数
中位数
众数
60
50
40
30
20
10
10
60 40 20 20 40 60 80
x3 + x4
2
= 5.50
x1 + x2 + x3 + x4 + x5 + x6
6
= 6.00
x6 = 9.00
x5 = 7.00
x4 = 6.00
x3 = 5.00
x2 = 5.00
x1 = 4.00
用哪些量描述这6户家庭年收入水平比较合理?原
因是什么?
原因:极端数据的影响.中位数或众数;
有6户家庭的年收入分别为(单元:万元):4,5,
5,6,7,50.你认为这6户家庭的年收入水平大概是多
少?如果把数据50改成9,结果又会怎样?
平均数
中位数
众数
60
50
40
30
20
10
10
60 40 20 20 40 60 80
x3 + x4
2
= 5.50
x1 + x2 + x3 + x4 + x5 + x6
6
= 12.83
x6 = 50.00
x5 = 7.00
x4 = 6.00
x3 = 5.00
x2 = 5.00
x1 = 4.00
图 20.1.2(1)
平均数
中位数
众数
60
50
40
30
20
10
10
60 40 20 20 40 60 80
x3 + x4
2
= 5.50
x1 + x2 + x3 + x4 + x5 + x6
6
= 6.00
x6 = 9.00
x5 = 7.00
x4 = 6.00
x3 = 5.00
x2 = 5.00
x1 = 4.00
根据例1 中的样本数据,你还有其他方法评价(2)
中这名选手在这次比赛中的表现吗?
1.在一次男子马拉松长跑比赛中,抽得12名选
手所用的时间(单位:min)如下:
136 140 129 180 124 154
146 145 158 175 165 148
(1)样本数据(12名选手的成绩)的中位数是多
少?
(2)一名选手的成绩是142 min,他的成绩如何?
尺码/cm 22 22.5 23 23.5 24 24.5 25
销售量/双 1 2 5 11 7 3 1
2.一家鞋店在一段时间内销售了某种女鞋30双,
各种尺码鞋的销售量如下表所示.
(1)你能根据表中的数据为这家鞋店提供进货建议
吗?
(2)分析表中的数据,你还能为鞋店进货提出哪些
建议?
3.某校男子足球队的年龄分布如条形图所示.请找出
这些队员年龄的平均数、众数、中位数,并解释它们的
意义(结果取整数).
人数
年龄/岁
10
8
6
4
2
0
13 15 14 16 17 18
(1)如何确定一组数据的中位数和众数?
(2)中位数和众数分别反映出一组数据的什么信息?
能举例说明它们的实际意义吗?
(3)平均数有什么特点,有什么局限性?
第二十章 数据的分析
20.1.2 中位数和众数
第2课时
n 学习目标:
1.在解决实际问题中进一步理解平均数、中位数、众
数作为数据代表的意义,能根据所给信息求出相应的统
计量;
2.能结合具体情境体会平均数、中位数、众数三者的
特点与差异,能根据具体问题选择这些统计量来分析数
据;
3.经历整理、描述、分析数据的过程,发展数据分析
观念.
n 学习重点:
结合具体问题情境,体会三种描述数据集中趋势的统
计量的各自特点.
什么是平均数、中位数和众数?
有6 户家庭的年收入分别为(单位:万元):4,5,
5,6,7,50.你认为这6户家庭的年收入水平大概是多
少?如果把数据50改成9,结果又会怎样?
(3)用众数估计: 众数= 5(万元).
(1)用平均数估计: (万元);
4 5 5 6 7 50 12 83
6
+ + + + +
= .x
(2)用中位数估计:中位数= (万元);
5 6 5 5
2
+
= .
平均数计算要用到所有的数据,任何一个数据的变
动都会相应引起平均数的变动,它能够充分利用所有的
数据信息,但它受极端值的影响较大.
众数是当一组数据中某一数据重复出现较多时,人
们往往关心的一个量,众数不受极端值的影响,这是它
的一个优势,缺点是当众数有多个且众数的频数相对较
小时可靠性小,局限性大.
请说说平均数、众数和中位数这三个统计量的各自
特点.
中位数仅与数据的排列位置有关,不易受极端值影
响,中位数可能出现在所给数据中,也可能不在所给的
数据中.当一组数据中的个别数据变动较大时,可用中
位数描述其趋势,中位数的计算很少.
请说说平均数、众数和中位数这三个统计量的各自
特点.
例1 某商场服装部为了调动营业员的积极性,决定
实行目标管理,根据目标完成的情况对营业员进行适当
的奖励.为了确定一个适当的月销售目标,商场服装部
统计了每个营业员在某月的销售额(单位:万元),数
据如下:
17 18 16 13 24 15 28 26 18 19
22 17 16 19 32 30 16 14 15 26
15 32 23 17 15 15 28 28 16 19
(1)月销售额在哪个值的人数最多?中间的月销售
额是多少?平均的月销售额是多少?
(2)如果想确定一个较高的销售目标,你认为月销
售额定为多少合适?说明理由.
(3)如果想让一半左右的营业员都能达到销售目标,
你认为月销售额定为多少合适?说明理由.
解:整理上面的数据得到图表如下:
销售额/万元 13 14 15 16 17 18 19
频数(人数) 1 1 5 4 3 2 3
销售额/万元 22 23 24 26 28 30 32
频数(人数) 1 1 1 2 3 1 2
(1)从表和图中可以看出,
样本的数据的众数是15,中
位数是18,求得这组数据的
平均数是20,可以推测,这
个服装部营业员的月销售额
为15万元的人数最多,中间
的销售额是18万元,平均销
售额大约是20万元。
人数
销售额/万元
答:这个目标可以定为每月20万元(平均数)。因为从样
本数据看,在平均数、中位数和众数中,平均数最大,可
以估计,月销售额定为每月20万元是一个较高目标,大约
会有 的营业员获得奖励。
答:月销售额可以为每月18万元(中位数),因为从样本
情况看,月销售额在18万元以上(含18万元)的有16人,
占总人数的一半左右,可以估计,如果月销售额定为18万
元,将有一半左右的营业员获得奖励。
(2)如果想确定一个较高的销售目标,你认为月销售额定
为多少合适?说明理由。
(3)想让一半左右的营业员都能达到目标,你认为月销
售额定为多少合适?说明理由。
1
3
例2 公园里有甲、乙两群游客正在做团体游戏,两
群游客的年龄如下:(单位:岁)
甲群:13、13、14、15、15、15、16、17、17.
乙群:3、4、4、5、5、6、6、54、57.
(1)甲群游客的平均年龄是 岁,中位数是多
少 岁,众数是 岁,其中能较好反映甲群
游客年龄特征的是 .
(2)乙群游客的平均年龄是 岁,中位数是多
少 岁,众数是 岁.其中能较好反映
乙群游客年龄特征的是 .
15
15 15
16
4、5、65
众数
众数
例3 八年级(1)班三位同学最近的五次数学测验
成绩(单位:分)分别是:
小华 62 94 95 98 98
小明 62 62 98 99 100
小丽 40 62 85 99 99
他们都认为自己的数学成绩比其他两位同学好,他
们比较的依据分别是什么?
你认为谁的数学成绩最好呢?
1、跳远比赛中,所有15位参赛者的成绩互不相同,
在已知自己成绩的情况下,要想知道自己是否进入
前8名,只需要知道所有参赛者成绩的( )
A、平均数 B、众数
C、中位数 D、加权平均数
2、数据8、9、9、8、10、8、9、9、8、10、7、9、
9、8的中位数是 ,众数是 。
C
9 9
3.下面是某校八年级(2)班两组女生的体重(单位:
kg):
第1组 35 36 38 40 42 42 75
第2组 35 36 38 40 42 42 45
(1)分别求这两组数据的平均数、众数、中位数,
并解释它们的实际意义(结果取整数);
(2)比较这两组数据的平均数、众数、中位数,谈
谈你对它们的认识.
数据的集中趋势描述:
(1)指出中位数与众数的区别和共同点;
(2)在一组数据中,平均数、中位数、众数都是唯一
的吗?
(3)在一组数据中,平均数、中位数、众数是否可能
为同一个数?试举例说明。
三个数据描述的存在性和意义:
平均数 中位数 众数
存在性 一个 一个(奇、偶有
别)
一个、多个或没有
意义 平均水平 中等水平 出现的次数最多
平均数、中位数和众数的异同点:
(1)平均数、众数和中位数都是描述一组数据
集中趋势的量;
(2)平均数、众数和中位数都有单位;
(3)平均数反映一组数据的平均水平,与这组
数据中的每个数都有关系,所以最为重要,
应用最广;
(4)中位数不受个别偏大或偏小数据的影响 ;
(5)众数与各组数据出现的频数有关,不受个
别数据的影响,有时是我们最为关心的数据。
第二十章 数据的分析
20.2 数据的波动程度
第1课时
n 1.平均数的计算要用到所有的数据,它能够充分利用数
据提供的信息,在现实生活中较为常用.但它受极端值
的影响较大.
2.当一组数据中某些数据多次重复出现时,众数往往
是人们关心的一个量,众数不受极端值的影响,这是它的
一个优势.
3.中位数只需很少的计算,不受极端值的影 响,这在有
些情况下是一个优点.
• 学习目标:
1. 经历方差的形成过程,了解方差的意义;
2.掌握方差的计算方法并会初步运用方差解决实际
问题.
• 学习重点:
方差意义的理解及应用.
问题1 农科院计划为某地选择合适的甜玉米种子.
选择种子时,甜玉米的产量和产量的稳定性是农科院所
关心的问题.为了解甲、乙两种甜玉米种子的相关情况,
农科院各用10 块自然条件相同的试验田进行试验,得到
各试验田每公顷的产量(单位:t)如下表:
甲 7.65 7.50 7.62 7.59 7.65 7.64 7.50 7.40 7.41 7.41
乙 7.55 7.56 7.53 7.44 7.49 7.52 7.58 7.46 7.53 7.49
根据这些数据估计,农科院应该选择哪种甜玉米种子呢?
7 54 7 52. .x x
甲 乙
,
(1)甜玉米的产量可用什么量来描述?请计算后说明.
说明在试验田中,甲、乙两种甜玉米的平均产量相
差不大.
可估计这个地区种植这两种甜玉米的平均产量相差
不大.
甲 7.65 7.50 7.62 7.59 7.65 7.64 7.50 7.40 7.41 7.41
乙 7.55 7.56 7.53 7.44 7.49 7.52 7.58 7.46 7.53 7.49
产量波动较大 产量波动较小
(2)如何考察一种甜玉米产量的稳定性呢?
①请设计统计图直观地反映出甜玉米产量的分布情况.
甲种甜玉米的产量 乙种甜玉米的产量
②统计学中常采用下面的做法来量化这组数据的波动大小:
设有n个数据x1,x2,…,xn,各数据与它们的平均
数 的差的平方分别是 ,
我们用这些值的平均数,即用
来衡量这组数据的波动大小,称它为这组数据的方差.
x 2 2 2
1 2- - -nx x x x x x( ),( ), ,( )
2 2 2 2
1 2
1
= - + - + + - ]ns x x x x x x
n
[( ) ( ) ( )
方差越大,数据的波动越大;
方差越小,数据的波动越小.
③请利用方差公式分析甲、乙两种甜玉米的波动程度.
两组数据的方差分别是:
2 2
2
27 65 7 54 7 50 7 54 7 41 7 54
10
0 01
. - . + . - . + + . - .
=
.
s
甲
( ) ( ) ( )
2 2
2
27 55 7 52 7 56 7 52 7 49 7 52
10
0 002
. - . + . - . + + . - .
=
.
s
乙
( ) ( ) ( )
③请利用方差公式分析甲、乙两种甜玉米的波动程度.
据样本估计总体的统计思想,种乙种甜玉米产量较
稳定.
显然 > ,即说明甲种甜玉米的波动较大,这
与
我们从产量分布图看到的结果一致.
2s
甲
2s
乙
甲 7.65 7.50 7.62 7.59 7.65 7.64 7.50 7.40 7.41 7.41
乙 7.55 7.56 7.53 7.44 7.49 7.52 7.58 7.46 7.53 7.49
甲团 163 164 164 165 165 166 166 167
乙团 163 165 165 166 166 167 168 168
哪个芭蕾舞团女演员的身高更整齐?
例 在一次芭蕾舞比赛中,甲、乙两个芭蕾舞团都
表演了舞剧《天鹅湖》,参加表演的女演员的身高(单
位:cm)分别是:
练习1 计算下列各组数据的方差:
(1) 6 6 6 6 6 6 6;
(2) 5 5 6 6 6 7 7;
(3) 3 3 4 6 8 9 9;
(4) 3 3 3 6 9 9 9.
练习2 如图是甲、乙两射击运动员的10 次射击训
练成绩的折线统计图.观察图形,甲、乙这10 次射击成
绩的方差哪个大?
成绩/环
次数
甲
乙
10
11
9
8
7
6
0
2 1 3 4 5 6 7 8 9 10
甲 乙
(1)方差怎样计算?
(2)你如何理解方差的意义?
方差越大,数据的波动越大;
方差越小,数据的波动越小.
方差的适用条件:
当两组数据的平均数相等或相近时,才利用方差
来判断它们的波动情况.
2 2 2 2
1 2
1
= - + - + + - ]ns x x x x x x
n
[( ) ( ) ( )
第二十章 数据的分析
20.2 数据的波动程度
第2课时
回顾 方差的计算公式,请举例说明方差的意义.
方差的适用条件:
当两组数据的平均数相等或相近时,才利用方差来
判断它们的波动情况.
2 2 2 2
1 2
1
= - + - + + - ]ns x x x x x x
n
[( ) ( ) ( )
方差越大,数据的波动越大;
方差越小,数据的波动越小.
• 学习目标:
1.能熟练计算一组数据的方差;
2.通过实例体会方差的实际意义.
• 学习重点:
方差的应用,用样本估计总体.
每个鸡腿的质量;鸡腿质量的稳定性.
抽样调查.
问题1 某快餐公司的香辣鸡腿很受消费者欢迎.现
有甲、乙两家农副产品加工厂到快餐公司推销鸡腿,两
家鸡腿的价格相同,品质相近.快餐公司决定通过检查
鸡腿的质量来确定选购哪家的鸡腿.
(1)可通过哪些统计量来关注鸡腿的质量?
(2)如何获取数据?
例 在问题1 中,检查人员从两家的鸡腿中各随机
抽取15 个,记录它们的质量(单位:g)如下表所示.
根据表中的数据,你认为快餐公司应该选购哪家加工厂
的鸡腿?
解:样本数据的平均数分别是:
74 74 72 73 75
15
+ + + +
=x
甲
75 73 71 75 75
15
+ + + +
=x
乙
样本平均数相同,估计
这批鸡腿的平均质量相近.
甲 74 74 75 74 76 73 76 73 76 75 78 77 74 72 73
乙 75 73 79 72 76 71 73 72 78 74 77 78 80 71 75
2
2 2 2 274 75 74 75 72 75 73 75 3
15
- + - + + - + -
=s
甲
( ) ( ) ( ) ( )
2 2 2 2
2 75 75 73 75 7 75 75 75 8
15
- + - + + 1- -
=s
乙
( ) ( ) ( ) ( )
解:样本数据的方差分别是:
由 可知,两家加工厂的鸡腿质量大致相等;
由 < 可知,甲加工厂的鸡腿质量更稳定,大小更均
匀.因此,快餐公司应该选购甲加工厂生产的鸡腿.
=x x
甲 乙
2s
甲
2s
乙
8:30—9:30 40 39.8 40.1 40.2 39.9 40 40.2 40.2 39.8 39.8
10:00—11:00 40 40 39.9 40 39.9 40.2 40 40.1 40 39.9
问题2 一台机床生产一种直径为40 mm的圆柱形零
件,正常生产时直径的方差应不超过0.01 mm2,下表是
某日8︰30—9︰30及10︰00—11︰00两个时段中各任意
抽取10 件产品量出的直径的数值(单位:mm).
试判断在这两个时段内机床生产是否正常.如何
对生产作出评价?
可借助计算
器完成计算.
问题3:在一次女子排球比赛中,甲、乙两队参赛
选手的年龄(单位:岁)如下:
(1)两队参赛选手的平均年龄分别是多少?
(2)你能说说两队参赛选手年龄波动的情况吗?
甲队 26 25 28 28 24 28 26 28 27 29
乙队 28 27 25 28 27 26 28 27 27 26
问题4:在体操比赛中,往往在所有裁判给出的分数中,去掉
一个最高分和一个最低分,然后计算余下分数的平均分.6个B组
裁判对某一运动员的打分数据(动作完成分)为:
9.4, 8.9,8.8,8.9,8.6, 8.7.
(1)如果不去掉最高分和最低分,这组数据的平均数和方差
分别是多少(结果保留小数点后两位)?
(2)如果去掉最高分和最低分,这组数据的平均数和方差又
分别是多少(结果保留小数点后两位)?
(3)你认为哪种统计平均分的方法更合理?
(3)去掉最高分和最低分的统计方法更合理.
(1)在解决实际问题时,方差的作用是什么?
反映数据的波动大小.
方差越大,数据的波动越大;方差越小,数据
的波动越小,可用样本方差估计总体方差.
(2)运用方差解决实际问题的一般步骤是怎样的?
先计算样本数据的平均数,当两组数据的平均数
相等或相近时,再利用样本方差来估计总体数据
的波动情况.
查看更多