资料简介
第6章 数据的分析
6.1 平均数、中位数、众数
6.1.1 平均数
在小学阶段,我们对平均数有过一些了
解,知道平均数是对数据进行分析的一
个重要指标.
一个小组10名同学的身高(单位:cm)如下表所示:
编号
身高 151 156 153 158 154 161 155 157 154 157
1 2 3 4 5 6 7 8 9 10
思考
(1) 计算10名同学身高的平均数.
平均数:
= 155.6(cm).
=(151+156+153+158+154+161+155+157+
154+157)÷10
编号
身高 151 156 153 158 154 161 155 157 154 157
1 2 3 4 5 6 7 8 9 10
(2)在数轴上标出表示这些同学的身高
及其平均数的点.
编号
身高 151 156 153 158 154 161 155 157 154 157
1 2 3 4 5 6 7 8 9 10
(3)考察表示平均数的点与其他的点的
位置关系,你能得出什么结论?
这些点都位于 的两
侧,不会都在平均数
的一侧.
可以作为这组同学的
身高的代表值,它反映
了这组同学的身高的平
均水平.
编号
身高 151 156 153 158 154 161 155 157 154 157
1 2 3 4 5 6 7 8 9 10
平均数作为一组数据的一个代表值,它
刻画了这组数据的平均水平.
【例1】某农业技术员试种了三个品种的棉花各10
株. 秋收时他清点了这30株棉花的结桃数如下表:
棉花品种 结桃数(个)
甲 84,79,81,84,85,82,83,86,87,
81
乙 85,84,89,79,81,91,79,76,82,
84
丙 83,85,87,78,80,75,82,83,81,
86
哪个品种较好?
棉花品种 结桃数(个)
甲 84,79,81,84,85,82,83,86,87,
81
乙 85,84,89,79,81,91,79,76,82,
84
丙 83,85,87,78,80,75,82,83,81,
86
分析:平均数可以作为一组数据的代表值,它刻画了这组
数据的平均水平.当我们要比较棉花的品种时,可以计算出
这些棉花结桃数的平均数,再通过平均数来进行比较.
则
解:设甲、乙、丙三个品种的平均结
桃数分别 为 ,
由于甲种棉花的平均结桃数高于其他两个品种的平均
结桃数,所以我们可以认为甲种棉花较好.
计算器一般有统计功能,我们可以利用该
功能求一组数据的平均数.
不同型号的计算器其操作步骤(按键)可能不同,
操作时需参阅计算器的说明书.
通常先按统计键,使计算器进入统计运算模式,然
后依次输入数据x1 , ,x2, ,…,最后按求平
均数的功能键,即可得到该组数据的平均数.
在一次全校歌咏比赛中,7位评委给一个班级
的打分分别是:
9.00,8.00,9.10,9.10,9.15,
9.00,9.58.
怎样评分比较公正?
思考
我们可以计算该班级歌咏比赛的
平均分
但实际上评委的评判受主观因素影响比较大,评分
也比较悬殊,为了消除极端数对平均数的影响,一
般去掉一个最高分和一个最低分,最后得分取
这个分数才比较合理地反映了这个班级的
最后得分.
1. 七年级(1)班举行1 min 跳绳比赛,以小组为单
位参赛.第1小组有8名同学,他们初赛和复赛时的成
绩如下表(单位:次):
编
号
初
赛 90 85 85 78 101 105 97 96
复
赛 100 90 86 78 98 100 106 98
1 2 3 4 5 6 7 8
练习
(1)计算这组同学初赛和复赛的平均成绩.
答:这组同学初赛的平均成绩为
92.125 ,复赛的平均成绩为94.5 .
(2)你认为这组同学的初赛成绩好,还是复
赛成绩好?
答:复赛的成绩好.
2. 某跳水队计划招收一批新运动员.请6位评委给选拔赛
参加者打分,平均分数超过8.5分才能被选上.刘明在比
赛时的成绩为8.30,8.25,8.45,8.20,8.30,9.60,你
认为刘明选得上吗?
答:刘明的平均分数为8.52,所以
刘明能被选上.
3. 小明班上同学的平均身高是1.4m,小强班上
同学的平均身高是1.45m. 小明一定比小强矮吗
?
答:不一定.
学校举行运动会,入场式中有七年级的一个队列.
已知这个队列共100人,排成10行,每行10人.其中
前两行同学的身高都是160cm,接着3行同学的身高
都是155cm,最后5行同学的身高都是150cm. 怎样求
这个队列的平均身高?
思考
100名同学的身高有
100个数,把它们加
起来再除以100,就
得到平均数.
这组数据中有许
多相同的数,相
同的数求和可用
乘法来计算.
用 表示平均身高,
则
在上面的算式中,0.2,0.3,0.5分别表示160,
155,150这三个数在数据组中所占的比例,分别
称它们为这三个数的权数:
160的权数是0.2,
三个权数之和为0.2+0.3+0.5=1.
153.5是160,155,150分别以0.2,0.3,0.5为权的
加权平均数.
155的权数是0.3,
150的权数是0.5,
有一组数据如下:
(1)计算这组数据的平均数.
1.60,1.60,1.60,1.64,1.64,
1.68,1.68,1.68.
这组数据的平均数为
思考
(2)这组数据中1.60,1.64,1.68的权数分别
是多少?求出这组数据的加权平均数.
有一组数据如下:
1.60,1.60,1.60,
1.64,1.64,1.68,
1.68,1.68.
(3)这组数据的平均数和加权平均数有什么
关系?
有一组数据如下:
1.60,1.60,1.60,
1.64,1.64,1.68,
1.68,1.68.
这组数据的平均数和加权平均数相等,都等于
1.64,意义也恰好完全相同.
但我们不能把求加权平均数看成是求平均数的简便
方法,在许多实际问题中,权数及相应的加权平均数都
有特殊的含义.
平均数可看做是权数相同的加权平均数.
【例2】某纺织厂订购一批棉花,棉花纤维长短不一,
主要有3cm,5cm,6cm三种长度. 随意地取出10g棉花
并测出三种长度的棉花纤维的含量,得到下面的结果:
纤维长度(cm) 3 5 6
含量(g) 2.5 4 3.5
问:这批棉花纤维的平均长度是
多少?
分析:在取出的10 g棉花中,长度为3cm,5cm
,6cm棉花的纤维各占25%,40%,35%,显
然含量多的棉花纤维的长度对平均长度的影响
大,所以要用求加权平均数的方法来求出这批
棉花纤维的平均长度.
解:这批棉花纤维的平均长度是
答:这批棉花纤维的平均长度
是4.85cm.
1. 某棒球运动员近50场比赛的得分情况如下表:
得分 0 1 2 3 4
次数 14 26 7 2 1
求该运动员50场比赛得分的平均数.
答:该运动员50场比赛得分的平均数为
(14×0+26×1+7×2+2×3+1×4)÷50=1.
2. 某出版社给一本书的作者发稿费,全书20
万字,其中正文占总字数的 ,每千字50元;
答案部分占总字数的 ,每千字30元.问全书
平均每千字多少元?
答:全书平均每千字为46元.
通过本节课,你有什么收获
?
你还存在哪些疑问,和同伴
交流。
我思 我进步
6.1.2 中位数
张某管理一家餐馆,下面是该餐馆所有工作人员在
2010年10月的工资情况:
张某:15 000元; 会计:1 800元;
厨师甲:2 500元;厨师乙:2 000元;
杂工甲:1 000元; 杂工乙:1 000元;
服务员甲:1 500元;服务员乙:1
200元;服务员丙:1 000元.
计算他们的平均工资,这个平均工资能反映该餐馆
员工在这个月收入的一般水平吗?
思考
解:设餐馆全体员工的平均工资为 ,
则(可用 计算器计算)
(元)
实际上,3000元不能代表餐馆员工在这个月收
入的一般水平,因为员工中除张某外工资最高
的厨师甲的月收入2500元都小于这个平均数.
若不计张某的工资,设8名员工的平均工资为 ,
则(可用计算器计算)
不计张某的工资,餐馆员工的月平均工资为1500
元,这个数据能代表餐馆员工在这个月收入的一
般水平.
还有没有别的方法
呢?
我们可以把餐馆中人员的月收入按从小到大的顺序
排列:
位于中间的数据,即第5个数据为1 500,
1000,1 000,1000,1200,1500,1800,2000,2500,15000.
它能比较合理地反映该餐馆员工的月收入水平.
1000,1000,1000,1200,1500,1800,2000
,2500,15000
中位数
把一组数据从小到大的顺序
排列,如果数据的个数是奇
数,那么位于中间的数称为
这组数据的中位数.
中间两个数的平
均数
1000,1000,1000,1200,1500,1800,2000,2500
如果数据的个数是偶数,那
么位于中间的两个数的平均
数称为这组数据的中位数.
【例】求下列两组数据的中位数:
(1)14,11,13,10,17,16,28
;(2)453,442,450,445,446,457,448,449
,
451,450
解: 把这组数据从小到大排
列:
10,11,13,14,16,17,28
位于中间的数是14,因此这组数据的
中位数是14.
中位数
把这组数据从小到大排列:
442,445,446,448,449,450,450,
451,453,457
位于中间的两个数是449和450,这两个数的平
均数是 449.5,因此这组数据的中位数是449.5.
中间的两
个数
中位数把一组数据分成相同数目的两部分,
其中一部分都小于或等于中位数,而另一
部分都大于或等于中位数.
因此,中位数常用来描述“中间位置”或“中等
水平”,但中位数没有利用数据组中所有的信息.
1. 求下列各组数据的中位数:
(1)100,75,80,73,50,60,70;
解:把这组数据从小到大排列:
50,60,70,73,75,80,100
位于中间的数是73,因此这组数据的中位数是
73.
练习
(2)120,100,130,200,80,140,
125,180.
解:把这组数据从小到大排列:
80,100,120,125,130,140,180,
200
位于中间的数是125和130,所以这两个
数的平均数是127.5,因此这组数据的中
位数是127.5 .
2. 求下面各组数据的中位数和平均数:
(1)17,12,5,9,5,14;
解:把这组数据从小到大排列:
5,5,9,12,14,17
位于中间的数是9和12,这两个数的
平均数是10.5,因此这组数据的中位
数是10.5;
这组数据的平均数是:
(17+12+5+9+5+14)÷6=10.3
(2)20,2,2,3,9,1,22,11,28
,2,0,8,3,29,8,1,5
解:把这组数据从小到大排列:
0,1,1,2,2,2,3,3,5,8,8,9,11,
20,22,28,29
位于中间的数是5,因此这组数据的中位数是5
;这组数据的平均数是:
(20+2+2+3+9+1+22+11+28+2+0+8+3+29+8
+1+5)÷17=9.06
通过本节课,你有什么收获
?
你还存在哪些疑问,和同伴
交流。
我思 我进步
6.1.3 众数
下面是一家鞋店在一段时间内各种尺码的男鞋
的销售情况统计表:
鞋的尺码(cm) 23 23.5 24 24.5 25 25.5 26 26.5
销售量(双) 5 6 6 10 17 10 12 7
思考
这家店销售量最多的男鞋是哪种尺码的?店
主最关心的问题是什么?
这家店销售量最多的是25cm的鞋,店
主最关心的就是销售量,所以店主下
次进货时可以多进这个尺码的鞋.
在一组数据中,把出现次数最多的数叫做这
组数据的众数.
在上面的问题中,25是鞋的尺码中出现次数
最多的数,所以25是这组数据的众数.
当一组数据中某数据多次重复出现时,常可以用众
数作为这组数据的数值的一个代表值.
一组数据的众数可以不止一个.
【例】某公司全体职工的月工资如下:
试求出该公司工资数据中的众数、中位
数和平均数.
月工资
(元) 18000 12000 8000 6000 4000 2500 2000 1500 1200
人数
1
(总经
理)
2
(副总
经理)
3 4 10 20 22 12 6
解: 在上述80个数据中,2000出现了22次,出
现的 次数最多,因此这组数据的众数是2000.
把这80个数据按从小到大的顺序
排列后,可以 发现位于中间的数是
2000,2500,因此这组数据的中位数
是
这组数据的平均数为
我们把这组数据的众数、中位数、平均数
表示在图中:
在例4中,你认为用平均数、中位数或众数中的哪
一个更能反映该公司的工资水平?
工资的平均数3115 偏高,因为大多数员
工的工资都达不到这个平均数,用它来
作为该公司员工工资的代表值并不合适.
众数是2000,中位数是2250,它们代表
了大多数人的工资水平,不偏高也不偏
低,较能反映工资水平的实际情况.
讨论
平均数、中位数和众数都是一组数据的代表,
它们从不同侧面反映了数据的集中趋势.
平均数的计算要用到所有的数据,它能够充分利用数
据提供的信息,因此在现实生活中应用较广,但它容
易受极端值的影响;
中位数对极端值不敏感,但没有利用数据中所
有的信息;
众数只能反映一组数据中出现次数最多的数据,
也没有利用数据中所有的信息.
1. 求下列各组数据的众数:
(1)3,4,4,5,3,5,6,5,6;
解:根据题意可知,5出现的次数最多,因此,
5是这组数据的众数.
练习
(2)1.0,1.1,1.0,0.9,0.8,0.9,1.1,0.9
解:根据题意可知,0.9出现的次数最多,
因此,0.9是这组数据的众数.
2. 某班30人所穿运动服尺码的情况为:穿75号码的有
5人,穿80号码的有6人,穿85号码的有15人,穿90
号码的有3人,穿95号码的有1人. 穿哪一种尺码衣
服的人最多?这个数据称为什么数?
解:根据题意可知,穿85号衣服的人最多.
因此85号是这组衣服尺码数据的众数.
通过本节课,你有什么收获
?
你还存在哪些疑问,和同伴
交流。
我思 我进步
查看更多