资料简介
第
3
章 数据分析初步
3.1
平均数
情境引入
水果在收获前,果农怎样估计将会收获多少水果呢?
难道一个一个数吗?
某果农种植的
100
棵苹果树即将收获
.
果品公司在付给果农定金前,需要估计这些苹果树的总产量
.
(1)
果农随机摘下
20
个苹果,称得总质量为
4
千克
.
这
20
个苹果的平均质量是多少千克
?
4÷20=0.2
(千克)
情境引入
(2)
果农从
100
棵苹果树中随机选出
10
棵,数出每棵树上的苹果个数
,
得到以下数据
(
单位:个
)
:
154
,
150
,
155
,
155
,
159
,
150
,
152
,
155
,
153
,
157.
你能估计出平均每棵树的苹果个数吗
?
探究
1
(3)
根据上述两个问题,你能估计出这
100
棵苹果树的总产量吗
?
0.2× 154×100=3 080
(千克)
我们可以这样了解:
由(
1
)可知每个苹果为
0.2
千克(近似)
由(
2
)可知每棵树上有
154
个苹果(近似)
探究
1
由(
1
)可知每个苹果为
0.2
千克(近似)
由(
2
)可知每棵树上有
154
个苹果(近似)
这两个数字在数学中被称为什么呢?
探究
1
在日常生活中,我们用平均数表示一组数据的“平均水平”。
一般地,对于
n
个数
x
1
,
x
2
,
… ,
x
n
我们把
叫做这
n
个数的
算术平均数
, 简称
平均数
,
记做
(读作
x
拔)
.
总结
(
x
1
+
x
2
+ … +
x
n
)
求下列各组数据的平均数:
(
1
)
3
,
5
,
6
;
(
2
)
3
,
3
,
5
,
5
,
5
,
6
,
6
,
6
,
6
。
练习
1
例
1
统计一名射击运动员在某次训练中
15
次射击的中靶环数
,
获得如下数据
:6, 7, 8, 7, 7, 8, 10, 9, 8, 8, 9, 9, 8, 10, 9.
求这次训练中该运动员射击的平均成绩
.
典例精讲
解:
探究
2
好多重复的数字啊!我们可不可以把它们合并起来呢?
所以该运动员射击的平均成绩为
答
:
这次训练中该运动员射击的平均成绩为
8.2
环
.
分析:
成绩为
6
环的数据有
1
个
,7
环的数据有
3
个
,8
环的数据有
5
个
,9
环的数据有
4
个
,10
环的数据有
2
个
.
探究
2
是平均数
这种方式算出来的是不是平均数呢?
它和算术平均数有什么不同呢?
探究
2
在实际问题中,一组数据里的各个数据的
“重要程度”
未必相同。因而,计算这组数据时,往往给每个数据一个
“权 ”
。
“权”越大,也就说明重要程度越大,所以对平均数的影响也越大。
总结
加权平均数的概念:若
n
个数
x
1
,
x
2
,
…,
x
n
的权分别是
w
1
,
w
2
,
…,
w
n
,则
叫做这
n
个数的加权平均数
.
总结
例
2
某校在一次广播操比赛中
801
班、
802
班、
803
班
如下表:
典例精讲
(
1
)如果根据三项得分的平均成绩从高到底确定名次,那么三个班级的排名顺序怎样?
解:三个班得分的平均数分别为:
答:三个班的排名顺序为
802
班,
803
班,
801
班
.
典例精讲
(
2
)如果学校认为这三个项目的重要程度有所不同,而给予三个项目的权的比为
15
:
35
:
50
。以加权平均数来确定名次,那么三个班级的排名顺序又怎样?
解:三个班得分的加权平均数分别为:
答:三个班的排名顺序为
801
班,
803
班,
802
班
.
3
、某校规定学生的数学期末总评成绩由三部分组成。
平时参与数学活动情况占
25 %
,作业完成情况占
35%
,期末考试成绩占
40%
。小明平时参与数学活动、作业完成情况、期末考试成绩得分依次为
84
分、
92
分、
88
分。
则小明数学期末总评成绩是多少分?
解
:
x
=
2 5 %
×84 +
35%
×92 +
40%
×88
=21+32.2+35.2
=88.4(
分)
答:小明的平均分是
88.4
分。
解答
已知一组数据:
105
,
103
,
101
,
100
,
114
,
108
,
110
,
106
,
98
,
96
。求出这组数据的平均数。
=
100
+
=
104.1
应用提高
体验收获
今天我们学习了哪些知识?
1
、什么是算术平均数。
2
、什么是加权平均数。
第
3
章 数据分析初步
3.2
中位数和众数
在日常生活中,我们用平均数表示一组数据的“平均水平”。
一般地,对于
n
个数
x
1
,
x
2
,
… ,
x
n
我们把
叫做这
n
个数的
算术平均数
, 简称
平均数
,
记做
(读作
x
拔)
.
课前回顾
(
x
1
+
x
2
+ … +
x
n
)
加权平均数的
概念
:
课前回顾
若
n
个数
x
1
,
x
2
,
…,
x
n
的权分别是
w
1
,
w
2
,
…,
w
n
,则
叫做这
n
个数的加权平均数
.
情境引入
您公司员工收入怎样啊?
报酬不错
,
月平均工资是
3 860
元。
某技术员到某公司面试
不信
,
你看看公司的工资报表
.
探究
1
请大家帮忙算算该公司员工的月平均工资是多少
?
大家觉得平均工资
3860
元能够代表该公司工资的平均水平吗?
探究
1
探究
1
不能,大家很明显可以看出,公司大部分人的工资都
在
2 000-3 000
元。
为什么会出现这种情况呢?
因为
平均数易受极端数据的影响
,
所以这里的月平均工资不能客观地反映一般员工的实际收入水平
.
分析
这就要从平均数的缺点来分析:
那我们应该用什么数据来分析呢?
工资
3000
元和
2800
元
,
在公司算中等收入
.
好几个人工资都是
2800
元
.
探究
1
中位数
众数
中位数:
众数:
在一组数据中,出现
次数最多
的数据叫做这组数据的
众数。
一组数据按大小顺序排列,位于最中间的一个数据叫做这组数据的
中位数。
总结
最中间有两个数据,此时工资的中位数是多少呢?
探究
1
(
1
)将这一组数据
排列;
(
2
)若该数据有
奇数
个时,位于
_
的数是中位数;
(
3
)若该数据有
偶数
个时,位于
_
_______
是中 位数。
从小到大(或从大到小)
中间位置
中间两个数的平均数
总结
求中位数的一般步骤:
若一组数据的个数为
n
,
你知道
中间位置的数
如何确定吗?
当
n
为偶数时
,
中间位置是第
,
个数;
当
n
为奇数时
,
中间位置是第
个数。
先排序、看奇偶,再确定中位数。
总结
此时工资的众数是多少呢?
探究
1
在一组数据中,出现
次数最多
的数据叫做这组数据的
众数
。
所以众数
是
2 800
元。
平均数、中位数和众数的异同点:
(
1
)平均数、众数和中位数都是描述一组数据集中趋势的量;
(
2
)平均数、众数和中位数都有单位;
(
3
)平均数反映一组数据的平均水平,与这组数据中的每个
数都有关系,所以最为重要,应用最广;
(
4
)中位数不受个别偏大或偏小数据的影响 ;
(
5
)众数与各组数据出现的频数有关,不受个别数据的影
响,有时是我们最为关心的数据。
思考
数据
中位数
众数
15
,
20
,
20
,
22
,
35
20
20
21
20
和
35
17.5
没有
心得
:1
、一组数据的中位数是唯一的,但中位数不
一定在
原数据中出现
.
2
、一组数据的众数可能不止一个,也可能没有
.
15
,
22
,
20
,
20
,
35
,
35
15
,
-20
,
20
,
22
,
35
,
-35
练习
1
1.
一组数据的平均数一定只有一个
.
×
√
2.
一组数据的中位数一定只有一个
.
√
4.
一组数据的众数一定只有一个
.
5.
一组数据的平均数、中位数、
众数
可以是同一个数
.
3.
一组数据的中位数一定是这组数据中的某个数
.
√
练习
2
×
日期
1
日
2
日
3
日
4
日
5
日
6
日
7
日
…
人数(万人)
1.2
2
2.5
2
1.2
2
0.6
…
1
、某风景区在“五一”黄金周期间,每天接待的旅游人数统计如下:
表中表示人数这组数据中,众数和中位数分别是
,
。
2
、在一组数据
1
,
0
,
4
,
5
,
8
中插入一个
数据
x
,
使该组数据的中位数为
3
,则插入
数据
x
=
。
2
2
2
达标测评
3
、当
5
个整数从小到大排列,其中位数是
4
,若这个数集的唯一众数是
6
,则这
5
个整数可能最大的和是
( )
。
A.21 B.22 C.23 D.24
A
分析:设这
5
个整数按从小到大排列为
a
1
,
a
2
,
a
3
,
a
4
,
a
5
,因为它的中位数是
4
,所以
a
3
=
4
,而
6
是唯一的众数,所以
a
4
=
a
5
=
6
,
此时
,
a
2
最大只能取
3
,
a
1
最大取
2
,故
a
1
+
a
2
+
a
3
+
a
4
+
a
5
=
2+3+4+6+6
=
21.
故选
A.
达标测评
(
1
)样本数据(
12
名选手的成绩)的中位数是多少?
(
2
)一名选手的成绩是
142
分,他的成绩如何?
4
、在一次男子马拉松长跑比赛中,抽得
12
名选手的成绩如下(单位:分):
136
,
140
,
129
,
180
,
124
,
154
,
146
,
145
,
158
,
175
,
165
,
148.
(
3
)一名选手想知道自己是否进入前六名,他只需要知道这
12
名选手成绩的
.
中位数
达标测评
解:(
1
)先将样本数据按照由小到大的顺序排列:
124
,
129
,
136
,
140
,
145
,
146
,
148
,
154
,
158
,
165
,
175
,
180,
则这组数据的中位数为处于中间的两个数
146
,
148
的平均数,即
(146+148)÷2=147.
因此样本数据的中位数是
147.
(
2
)根据(
1
)中得到的样本数据的结论,可以估计,在这次马拉松比赛中,大约有一半选手的成绩快于
147
分,有一半选手的成绩慢于
147
分。这名选手的成绩是
142
分,快于中位数
147
分,可以推测他的成绩比一半以上的选手的成绩好
.
1
、已知一组数据
10
,
10,
x
,8
(
由大到小排列
)
的中位数与平均数
相等
,
求
x
的值
及这组数据的中位数
.
解:∵
10
,
10
,
x
,8
的中位数与平均数相等
,
∴
,
∴
x
=
8,
∴
这组数据的中位数是
9.
应用提高
2
、某商贸公司
10
名销售员,去年完成的销售额情况如下表:
销售额(单位:万元)
3
4
5
6
7
8
10
销售员人数(单位:人)
1
3
2
1
1
1
1
(
1
)求销售额的平均数、众数、中位数
.
(单位:万元)
(
2
)今年公司为了调动员工的积极性,提高销售额,准备采取超额有奖的措施
.
请根据(
1
)的结果,通过比较,合理确定今年每个销售员统一的销售额标准是多少万元?
解:(
1
)
众数为
4
万元,中位数为
5
万元
.
(
2
)若规定平均数
5.6
万元为标准,则多数人无法或不可能超额完成,会挫伤员工积极性;若规定众数
4
万元为标准,则绝大多数人不必努力就可以超额完成,不利于提高年销售额;规定中位数
5
万
元为标准,多数人能完成或超额,少数人经过努力也能完成,所以
5
万
元为标准较合理
.
体验收获
今天我们学习了哪些知识?
1.
什么
是中位数
.
2.
什么
是众数
.
3.
平均数
、中位数、
众数的联系与区别
.
第
3
章 数据分析初步
3.3
方差和标准差
中位数:
众数:
在一组数据中,出现
次数最多
的数据叫做这组数据的
众数
。
一组数据按大小顺序排列,位于最中间的一个数据或两个数据的平均数叫做这组数据的
中位数
。
课前回顾
(
1
)平均数、众数和中位数都是描述一组数据集中趋势
的量;
(
2
)平均数、众数和中位数都有单位;
(
3
)平均数反映一组数据的平均水平,与这组数据中的
每个数都有关系,所以最为重要,应用最广;
(
4
)中位数不受个别偏大或偏小数据的影响 ;
(
5
)众数与各组数据出现的频数有关,不受个别数据的
影响,有时是我们最为关心的数据。
课前回顾
情境引入
怎样选择选手去参加比赛呢?
难道算一下选手平时成绩的平均数?
选谁去参加比赛呢?
探究
1
我们先来算一算甲和乙命中环数的平均数吧!
咦
,
平均数一样耶!那怎么比较两人成绩的好坏呢?
探究
1
探究
1
大家可以看出甲的成绩和乙的成绩起伏变化
似乎不相同
我们来画折线图直观地比较一下
0
1
2
2
3
4
5
4
6
8
10
成绩(环)
甲
乙
甲、乙两人的平均成绩相同,但是甲每次的射击成绩都接近平均数
8
,而乙每次的射击成绩偏离平均数较大
.
评价数据的
稳定性
时
,
我们通常将各数据偏离平均数的波动程度作为指标。
探究
1
射击次序
甲射击成绩与平均成绩的偏差的和:
乙射击成绩与平均成绩的偏差的和:
(
7-8
)
+
(
8-8
)
+
(
8-8
)
+
(
8-8
)
+
(
9-8
)
=
(
10-8
)
+
(
6-8
)
+
(
10-8
)
+
(
6-8
)
+
(
8-8
)
=
0
0
探究
1
直接计算射击成绩与平均成绩偏差的和,发现它们是一样的。
(
10-8
)
2
+
(
6-8
)
2
+
(
10-8
)
2
+
(
6-8
)
2
+
(
8-8
)
2
=
?
(
7-8
)
2
+
(
8-8
)
2
+
(
8-8
)
2
+
(
8-8
)
2
+
(
9-8
)
2
=
?
现在我们计算一下甲、乙两人每次射击成绩与平均成绩的偏差的平方和
.
乙:
你发现了
甲、乙
的区别了吗?
甲:
探究
1
上述各偏差的平方和的大小还与什么有关?
——
与射击次数有关!
用
各偏差平方和的平均数
来衡量数据的稳定性
一般地,各数据与它们的平均数的差的平方的平均数
探究
1
叫做这组数据的
方差
.
(
7-8
)
2
+
(
8-8
)
2
+
(
8-8
)
2
+
(
8-8
)
2
+
(
9-8
)
2
=
甲的方差
< 乙的方差 探究 1 所以甲的成绩比乙的成绩稳定,应该选择甲去参加比赛。 ( 10-8 ) 2 + ( 6-8 ) 2 + ( 10-8 ) 2 + ( 6-8 ) 2 + ( 8-8 ) 2 = 3.2 乙: 0.4 甲: [ [ ] ] 刘亮和李飞参加射击训练的成绩 ( 单位:环 ) 如下: 刘亮: 7 , 8 , 8 , 9 , 7 , 8 , 8 , 9 , 7 , 9 ; 李飞: 6 , 8 , 7 , 7 , 8 , 9 , 10 , 7 , 9 , 9. ( 1 )两 人的平均成绩分别是多少? ( 2 )计算 这两组数据的方差? ( 3 )谁 的成绩比较稳定? 练习 1 刘亮、李飞的射击成绩的方差分别是 计算结果表明: s 2 李飞 >
s
2
刘亮
,这说明李飞的射击成绩波动大,而刘亮的射击成绩
波动小
,因此刘亮的射击成绩
稳定
.
解答
1
、利用平均数公式计算这组数据的
平均数
.
2
、利用方差公式计算这组数据的
方差
s
2
计算方差的一般步骤:
总结
即
例
为了考察甲、乙两种小麦的长势
,
分别从中抽出
10
株苗,
测得苗高如下
(
单位
:cm):
甲
: 12 13 14 15 10 16 13 11 15 11
乙
: 11 16 17 14 13 19 6 8 10 16
问:哪种小麦长得比较整齐
?
典型例题
S
2
甲
= (
cm
2
)
S
2
乙
= (
cm
2
)
解答
x
甲
= (
cm
)
x
乙
= (
cm
)
数据的单位与方差的单位一致吗?
S
2
甲
= (
cm
2
)
S
2
乙
= (
cm
2
)
不一致,方差的单位是数据单位的平方
.
分析
为了使单位一致,可用方差的算术平方根
来表示,并把它叫做
标准差
.
S
=
[ (
x
1
- )
2
+(
x
2
- )
2
+ +(
x
n
- )
2
]
特殊地:如果方差与标准差都为
0
,说明数据
没有偏差,即每个数都一样
.
总结
2
、数据
1
,
2
,
3
,
4
,
5
的方差是
_____,
标准差是
____.
2
1
、某样本的方差是
9
,则其标准差是
______.
3
达标测评
3
、已知一组数据为
2
,
0
,
-1
,
3
,
-4
,则这组数据的方差为
.
4
、甲、乙两名学生在相同的条件下各射靶
10
次,命中的环数如下:甲:
7
,
8
,
6
,
8
,
6
,
5
,
9
,
10
,
7
,
4
乙:
9
,
5
,
7
,
8
,
7
,
6
,
8
,
6
,
7
,
7
经过计算,两人射击环数的平均数相同,但
S
S
, 所以确定__去参加比赛
.
>
6
乙
达标测评
5
、
达标测评
2
已知三组数据
1,2,3,4,5
;
11,12,13,14,15
和
3,6,9,12,15
。
1
、求这三组数据的平均数、方差和标准差。
2
、对照以上结果,你能从中发现哪些有趣的结论?
平均数
方差
标准差
1,2,3,4,5
11,12,13,14,15
3,6,9,12,15
3
2
13
2
9
18
应用提高
请你用发现的结论来解决以下的问题:
已知数据
x
1
,
x
2
,
x
3
,
…
,
x
n
的平均数为
a
,方差为
b
,
标准差为
c
。则
①
数据
x
1
+3
,
x
2
+
3
,
x
3
+3
,
…
,
x
n
+3
的平均数为
--------
,方差为
-------
,
标准差为
----------
。
②
数据
x
1
-3
,
x
2
-3
,
x
3
-3
,
…
,
x
n
-3
的平均数为
----------
,方差为
--------
,
标准差为
----------
。
a
+3
b
a
-3
b
c
c
知识拓展
③
数据
3
x
1
,
3
x
2
,
3
x
3
,
…
,
3
x
n
的平均数为
-----------
,方差为
-----------
,
标准差为
----------
。
④
数据
2
x
1
-3
,
2
x
2
-3
,
2
x
3
-3
,
…
,
2
x
n
-3
的平均数为
----------
,方差为
---------
,
标准差为
----------
。
3
a
9
b
2
a
-3
4
b
3
c
2
c
知识拓展
体验收获
今天我们学习了哪些知识?
1
、什么是方差。
2
、
什么是标准差。
3
、求方差
的一般步骤
。
查看更多