资料简介
2020 年概率最新好题荟萃
1.下列说法中错误的个数是( )
①从某社区 65 户高收入家庭,280 户中等收入家庭,105 户低收入家庭中选出 100 户调查社会购买力的某
一项指标,应采用的最佳抽样方法是分层抽样
②线性回归直线 一定过样本中心点
③对于一组数据 ,如果将它们改变为 ,则平均数与方差均发生变化
④若一组数据 1、 、2、3 的众数是 2,则这组数据的中位数是 2
⑤用系统抽样方法从编号为 1,2,3,…,700 的学生中抽样 50 人,若第 2 段中编号为 20 的学生被抽中,
按照等间隔抽取的方法,则第 5 段中被抽中的学生编号为 76
A.0 B.1 C.2 D.3
1.C①从某社区 65 户高收入家庭,280 户中等收入家庭,105 户低收入家庭中选出 100 户调查社会购买力
的某一项指标,采用分层抽样满足抽样合理性,正确;②线性回归直线 一定过样本中心点 ,
正确;③对于一组数据 ,如果将它们改变为 ,平均数由 变为
,方差
没发生变,不
正确;④因为众数是 2,所以 ,所以这组数据的中位数是 ,正确;⑤用系统抽样,700 个
抽样 50 每隔 14 人抽一次,第二次抽中编号为 20,则第三次是 34,第四次是 48.第五次是 62,不正确;所
以错误的是③⑤
2.从装有 3 双不同鞋子的柜子里,随机取出 2 只鞋子,则取出的 2 只鞋子不成对的概率为( )
A. B. C. D.
2.选 B.
3.关于圆周率 ,数学发展史上出现过许多很有创意的求法,如著名的蒲丰实验和查理斯实验.受其启发,
某同学通过下面的随机模拟方法来估计 的值:先用计算机产生 个数对 ,其中 , 都是区
间 上的均匀随机数,再统计 , 能与 构成锐角三角形三边长的数对 的个数 ﹔最后根据统
计数 来估计 的值.若 ,则 的估计值为( )
y bx a= + ( , )x y
1,2,3,4,5 11,12,13,14,15
a
y bx a= + ( ),x y
1,2,3,4,5 11,12,13,14,15 1 2 3 4 5 35
+ + + + =
11 12 13 14 15 135
+ + + + =
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )2 2 2 2 2 2 2 2 2 21 3 2 3 3 3 4 3 5 3 11 13 12 13 13 13 14 13 15 13
5 5
− + − + − + − + − − + − + − + − + −=
2a = 2 2 22
+ =
14
15
4
5
3
5
1
5
π
π 2000 ( ),x y x y
( )0,1 x y 1 ( ),x y m
m π 435m = π
A. B. C. D.
3.因为 , 都是区间 上的均匀随机数,所以有 , ,若 , 能与 构成锐角三角
形三边长,则 ,由几何概型的概率计算公式知 ,所以
.故选:B.
4. 博览会安排了分别标有序号为“1 号”“2 号”“3 号”的三辆车,等可能随机顺序前往酒店接嘉宾.某嘉宾
突发奇想,设计两种乘车方案.方案一:不乘坐第一辆车,若第二辆车的车序号大于第一辆车的车序号,
就乘坐此车,否则乘坐第三辆车;方案二:直接乘坐第一辆车.记方案一与方案二坐到“3 号”车的概率分
别为 P1,P2,则( )A.P1•P2= B.P1=P2= C.P1+P2= D.P1<P2
4.三辆车的出车顺序可能为:123、132、213、231、312、321 方案一坐车可能:132、213、231,所以,P1
= ;方案二坐车可能:312、321,所以,P1= ;所以 P1+P2= 故选 C.
5 购买一辆某品牌新能源汽车,在行驶三年后,政府将给予适当金额
的购车补贴.某调研机构对拟购买该品牌汽车的消费者,就购车补贴
金额的心理预期值进行了抽样调查,其样本频率分布直方图如图所
示.
(1)估计拟购买该品牌汽车的消费群体对购车补贴金额的心理预期
值的方差(同一组中的数据用该组区间的中点值作代表);
(2)将频率视为概率,从拟购买该品牌汽车的消费群体中随机抽取
人,记对购车补贴金额的心理预期值高于 万元的人数为 ,求
的分布列和数学期望;
(3)统计最近 个月该品牌汽车的市场销售量,得其频数分布表如下:
月份
销售量(万
辆)
试预计该品牌汽车在 年 月份的销售量约为多少万辆?
附:对于一组样本数据 , ,…, ,其回归直线 的斜率和截距的最小二
3.12 3.13 3.14 3.15
x y ( )0,1 0 1x< < 0 1y< < x y 1 2 2 1 1 x y x y + >
+ >
1 1 4354 11 1 4 2000
mP n
π
π× −
= = − = =×
4354 (1 )2000
π = × − = 3.13
1
4
1
3
5
6
3
6
2
6
5
6
4 3 X
X
5
2018.11 2018.12 2019.01 2019.02 2019.03
0.5 0.6 1.0 1.4 1.7
2019 4
( )1 1,x y ( )2 2,x y ( ),n nx y ˆˆ ˆy bx a= +
乘估计分别为 , .
5.(1)由频率分布直方图可知,消费群体对购车补贴金额的心理预期值的平均数的估计值为
,所以方差的估计值为
;
(2)由频率分布直方图可知,消费群体对购车补贴金额的心理预期值高于 3 万元的频率为
,则 ,所以 的分布列为
,数学期望 ;(3)将 2018 年 11 月至 2019
年 3 月的月份数依次编号为 1,2,3,4,5,记 , , , ,
, ,由 散 点 图可知,5 组样本数据呈线性相关关系,因为 , ,
, ,则
, ,所以回归直线方程为 ,当
时, ,预计该品牌汽车在 年 月份的销售量约为 2 万辆.
6.2018 年 11 月 5 日至 10 日,首届中国国际进口博览会在国家会展中心(上海)举行,吸引了 58 个“一带
一路”沿线国家的超过 1000 多家企业参展,成为共建“一带一路”的又一个重要支撑.某企业为了参加这次
盛会,提升行业竞争力,加大了科技投入.该企业连续 6 年来的科技投入 (百万元)与收益 (百万元)
的数据统计如下:
科技投入 2 4 6 8 10 12
收益 5.6 6.5 12.0 27.5 80.0 129.2
并根据数据绘制散点图如图所示:
( )( )
( )
1 1
2 2 2
1 1
ˆ
n n
i i i i
i i
n n
i i
i i
x x y y x y nxy
b
x x x nx
= =
= =
− − −
= =
− −
∑ ∑
∑ ∑
ˆˆa y bx= −
1.5 0.1 2.5 0.3 3.5 0.3 4.5 0.15 5.5 0.1 6.5 0.05 3.5× + × + × + × + × + × =
2 2(1.5 3.5) 0.1s = − × 2(2.5 3.5) 0.3+ − × 2(3.5 3.5) 0.3+ − × 2(4.5 3.5) 0.15+ − × 2(5.5 3.5) 0.1+ − ×
2(6.5 3.5) 0.05 1.7+ − × =
0.3 0.15 0.1 0.05 0.6P = + + + = (4,0.6)X B X
4
4( ) 0.6 0.4 , 0,1,2,3,4k k kP X k C k−= = = 4 0.6 2.4EX = × =
( 1,2,3,4,5)ix i i= = 1 0.5y = 2 0.6y = 3 1.0y =
4 1.4y = 5 1.7y = 3x = 1.04y =
1
0.5 1.2 3
n
i
i
ix y
=
= + +∑ 5.6 8.5 18.8+ + = 2
1
1 4 9 16 25 55
n
i
i
x
=
= + + + + =∑
18.8 5 3 1.04 0.3255 5 9b
− × ×= =− × 1.04 0.32 3 0.08a = − × = 0.32 0.08y x= +
6x = 0.32 6 0.08 2y = × + = 2019 4
x y
x
y
根据散点图的特点,甲认为样本点分布在指数曲线 的周围,据此他对数据进行了一些初步处理.
如下表:
43.5 4.5 854.0 34.7 12730.4 70
其中 , .
(1)(i)请根据表中数据,建立 关于 的回归方程(保留一位小数);
(ii)根据所建立的回归方程,若该企业想在下一年收益达到 2 亿,则科技投入的费用至少要多少?(其
中 )
(2)乙认为样本点分布在二次曲线 的周围,并计算得回归方程为 ,以及
该回归模型的相关指数 ,试比较甲乙两人所建立的模型,谁的拟合效果更好.
附:对于一组数据 , ,…, ,其回归直线方程 的斜率和截距的最小二
乘估计分别为 , ,相关指数: .
6.(1)(i) ,令 ;令 ,则 .
根据最小二乘估计可知: 从而 ,故回归
2bxy c= ⋅
y z ( )( )6
1
i i
i
x x y y
=
− −∑ ( )( )6
1
i i
i
x x z z
=
− −∑ ( )6 2
1
i
i
y y
=
−∑ ( )6 2
1
i
i
x x
=
−∑
2logi iz y=
6
1
1
6 i
i
z z
=
= ∑
y x
2log 5 2.3≈
2y mx n= + 20.92 12.0y x= −
2 0.94R =
( )1 1,u v ( )2 2,u v ( ),n nu v v uα β= +
( )( )
( )
1
2
1
n
i i
i
n
i
i
u u v v
u u
β =
=
− −
=
−
∑
∑ v uα β= −
( )
( )
2
2 1
2
1
1
n
ii
i
n
i
i
v v
R
v v
=
=
−
= −
−
∑
∑
2 4 6 8 10 12 76x
+ + + + += = 2 2log logz y bx c= = + 2loga c= z bx a= +
( )( )
( )
6
1
6 2
1
34.7 0.570
i i
i
i
i
x x z z
b
x x
=
=
− −
= = ≈
−
∑
∑
4.5 0.5 7 1a z bx= − = − × =
方程为 ,即 .
(ii)设 ,解得 ,即 故科技投入的费用至少要 13.2
百万元,下一年的收益才能达到 2 亿.
(2)甲建立的回归模型的残差:
5.6 6.5 12.0 27.5 80.0 129.2
4 8 16 32 64 128
1.6 -1.5 -4 -4.5 16 1.2
则 ,从而 ,
即甲建立的回归模型拟合效果更好.
7. 棉花的优质率是以其纤维长度来街量的,纤维越长的棉花晶质越高.棉花的品质分类标准为:纤维长度小
于等于 的为粗绒棉,纤维长度在 的为细绒棉,纤维长度大于 的为长绒棉,其中纤维
长度在 以上的棉花又名“军海 1 号”.某采购商从新疆某一棉花基地抽测了 根棉花的纤维长度,
得到数据如下图频率分布表所示:
纤维长度
根数
(1)若将频率作为概率, 根据以上数据,能否认为该基地的这批棉花符合“长绒棉占全部棉花的 以
上”的要求?
(2)用样本估计总体, 若这批榨花共有 ,基地提出了两种销售方案给采购商参考.方案一:不分
等级卖出,每千克按 元计算,方案二:对 棉花先分等级再销售,分级后不同等级的棉花售价
如下表:
纤维长度
售价
0.5 1z x= + 0.5 12 xy +=
0.5 12 200x+ ≥ 20.5 1 log 200x + ≥ 24 4log 5 13.2x ≥ + ≈
iy
iy
i iy y−
( )6 2
1
298.5i i
i
y y
=
− =∑ 2 298.51 1 0.02 0.98 0.9412730.4R = − ≈ − = >
25mm ( ]25,33 33mm
38mm 100
( )mm 25≤ ( ]25,33 ( ]33,38 38>
2 38 40 20
60%
10000kg
13.5 10000kg
( )mm 25≤ ( ]25,33 ( ]33,38 38>
( )/ kg元 2 8 15 25
从来购商的角度,请你帮他决策一下该用哪个方案.
(3)用分层抽样的方法从长绒棉中抽取 6 根棉花,再从此 根棉花中抽取两根进行检验.求抽到的两根棉花
只有一根是“军海 1 号”的概率.
7.解:由题意可得长绒棉的频数为: ,故 ,故可以认为该基地的这批棉花符
合“长绒棉占全部棉花的 以上;
(2)由题意可得方案一需花费: 元;方案二需花费:
.
所以,选方案一更好;
(3) 由题意结合用分层抽样的方法从长绒棉中抽取 6 根棉花,可得抽取的长绒棉为: 根,
抽取的军海 1 号为: 根,再从此 根棉花中抽取两根进行检验,可得总的抽取方法有
种,其中抽到的两根棉花只有一根是“军海 1 号”的抽取方法有 种,故抽到的两根棉花
只有一根是“军海 1 号”的概率为: .
8. 某公司为评估两套促销活动方案(方案 1 运作费用为 5 元/件;
方案 2 的运作费用为 2 元/件),在某地区部分营销网点进行试点
(每个试点网点只采用一种促销活动方案),运作一年后,对比该
地区上一年度的销售情况,制作相应的等高条形图如图所示.
(1)请根据等高条形图提供的信息,为该公司今年选择一套较为
有利的促销活动方案(不必说明理由);
(2)已知该公司产品的成本为 10 元/件(未包括促销活动运作费
用),为制定本年度该地区的产品销售价格,统计上一年度的 8 组售价 (单位:元/件,整数)和销量
(单位:件) 如下表所示:
售价 33 35 37 39 41 43 45 47
销量 840 800 740 695 640 580 525 460
①请根据下列数据计算相应的相关指数 ,并根据计算结果,选择合适的回归模型进行拟合;
②根据所选回归模型,分析售价 定为多少时?利润 可以达到最大.
6
40 20 60+ = 60 60%100P = =
60%
13.5 10000 135000× =
2 0.02 10000 8 0.38 10000 15 0.4 10000 25 0.2 10000 140800× × + × × + × × + × × =
406 440 20
× =+
206 240 20
× =+ 6
2
6 15C = 1 1
4 2 8C C× =
8
15P=
ix iy
( 1,2, ,8)i =
x
y
2R
x z
ˆ 1200ln 5000y x= − + ˆ 27 1700y x= − + 21ˆ 12003y x= − +
52446.95 13142 122.89
124650
(附:相关指数 )
8(1)由等高条形图可知,年度平均售额与方案 1 的运作相关性强于方案 2.
(2)①由已知数据可知,回归模型 对应的相关指数 ;
回归模型 对应的相关指数 ;
回归模型 对应的相关指数 .
因为 ,所以采用回归模型 进行拟合最为合适.
②由(1)可知,采用方案 1 的运作效果较方案 2 好,故年利润 ,
,当 时, 单调递增;当 时,
单调适减,故当售价 时,利润达到最大.
9. 为了保障某治疗新冠肺炎药品的主要药理成分在国家药品监督管理局规定的值范围内,武汉某制药厂
在该药品的生产过程中,检验员在一天中按照规定从该药品生产线上随机抽取 20 件产品进行检测,测量
其主要药理成分含量(单位:mg).根据生产经验,可以认为这条药品生产线正常状态下生产的产品的主
要药理成分含量服从正态分布 N(μ,σ2).在一天内抽取的 20 件产品中,如果有一件出现了主要药理成分
含量在(μ﹣3σ,μ+3σ)之外的药品,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对
本次的生产过程进行检查.
(1)下面是检验员在 2 月 24 日抽取的 20 件药品的主要药理成分含量:
9.78 10.04 9.92 10.14 10.04 9.22 10.13 9.91 9.95
( )8 2
1
ˆi i
i
y y
=
−∑
( )8 2
1
i
i
y y
=
−∑
( )
( )
2
2 1
2
1
ˆ
1
n
i i
i
n
i
i
y y
R
y y
=
=
−
= −
−
∑
∑
ˆ 1200ln 5000y x= − + 2
1 0.5792R =
ˆ 27 1700y x= − + 2
2 0.8946R =
21ˆ 12003y x= − + 2
3 0.9990R =
2 2 2
3 2 1R R R> > 21ˆ 12003y x= − +
21 1200 ( 15)3z x x = − + −
( 30)( 40)z x x′ = − + − (0,40)x∈ 21 1200 ( 15)3z x x = − + − (40, )x∈ +∞
21 1200 ( 15)3z x x = − + − 40x =
9.96 9.88 10.01 9.98 9.95 10.05 10.05 9.96 10.12
经计算得 xi=9.96,s 0.19;其中 xi 为抽取的第 i 件
药品的主要药理成分含量,i=1,2,…,20.用样本平均数 作为 μ 的估计值 ,用样本标准差 s 作为 σ
的估计值 ,利用估计值判断是否需对本次的生产过程进行检查?
(2)假设生产状态正常,记 X 表示某天抽取的 20 件产品中其主要药理成分含量在(μ﹣3σ,μ+3σ)之外
的药品件数,求 P(X=1)及 X 的数学期望.
附:若随机变量 Z 服从正态分布 N(μ,σ2),则 P(μ﹣3σ<Z<μ+3σ)≈0.9974,0.997419≈0.95.
9.(1)由 9.96,s=0.19.可得: 9.96, 0.19,由样品数据看出有一样药品的主要药理成分 9.22
含量在 =(9.39,10.53)之外的药品,因此需对本次的生产过程进行检查.
(2)抽取的一件药品中其主要药理成分含量在(μ﹣3σ,μ+3σ)之内的概率为 0.9974,而主要药理成分含
量在(μ﹣3σ,μ+3σ)之内的概率为 0.0026,故 X~B(20,0.0026),∴P(X=1)
0.997419×0.0026≈0.0494.
X 的数学期望 E(X)=20×0.0026≈0.052.
10. 某种大型医疗检查机器生产商,对一次性购买 2 台机器的客户,推出两种超过质保期后两年内的延保
维修优惠方案:方案一:交纳延保金 7000 元,在延保的两年内可免费维修 2 次,超过 2 次每次收取维修
费 2000 元;方案二:交纳延保金 10000 元,在延保的两年内可免费维修 4 次,超过 4 次每次收取维修费 1000
元.某医院准备一次性购买 2 台这种机器.现需决策在购买机器时应购买哪种延保方案,为此搜集并整理
了 50 台这种机器超过质保期后延保两年内维修的次数,得下表:
维修次数 0 1 2 3
台数 5 10 20 15
以这 50 台机器维修次数的频率代替 1 台机器维修次数发生的概率,记 X 表示这 2 台机器超过质保期后延
保的两年内共需维修的次数.
(1)求 X 的分布列;
(2)以所需延保金及维修费用的期望值为决策依据,医院选择哪种延保方案更合算?
10.解:(Ⅰ)푋所有可能的取值为 0,1,2,3,4,5,6,
푃(푋 = 0) = 1
10 × 1
10 = 1
100,푃(푋 = 1) = 1
10 × 1
5 × 2 = 1
25,푃(푋 = 2) = 1
5 × 1
5 + 2
5 × 1
10 × 2 = 3
25,
20
1
1
20 i
x
=
= ∑ 20 20
2 2 2
1 1
1 1( ) 2020 20i i
i i
x x x x
= =
= − = − ≈
∑ ∑
x µ
σ
x = µ = σ =
( )3 , 3µ σ µ σ− +
1
20
=
푃(푋 = 3) = 1
10 × 3
10 × 2 + 1
5 × 2
5 × 2 = 11
50,푃(푋 = 4) = 2
5 × 2
5 + 3
10 × 1
5 × 2 = 7
25,
푃(푋 = 5) = 2
5 × 3
10 × 2 = 6
25,푃(푋 = 6) = 3
10 × 3
10 = 9
100,
∴푋的分布列为
푋 0 1 2 3 4 5 6
푃 1
100 1
25 3
25 11
50 7
25 6
25 9
100
(Ⅱ)选择延保一,所需费用푌1元的分布列为:
푌1 7000 9000 11000 13000 15000
푃 17
100 11
50 7
25 6
25 9
100
퐸푌1 = 17
100 × 7000 + 11
50 × 9000 + 7
25 × 11000 + 6
25 × 13000 + 9
100 × 15000 = 10720(元).
选择延保二,所需费用푌2元的分布列为:
푌2 10000 11000 12000
푃 67
100 6
25 9
100
퐸푌2 = 67
100 × 10000 + 6
25 × 11000 + 9
100 × 12000 = 10420(元).
∵퐸푌1 > 퐸푌2,∴该医院选择延保方案二较合算.
11. 某景区的各景点从 2009 年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季
的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转
变.下表是从 2009 年至 2018 年,该景点的旅游人数 (万人)与年份 的数据:
第 年 1 2 3 4 5 6 7 8 9 10
旅游人数
(万人)
300 283 321 345 372 435 486 527 622 800
y x
x
y
该景点为了预测 2021 年的旅游人数,建立了 与 的两个回归模型:
模型①:由最小二乘法公式求得 与 的线性回归方程 ;
模型②:由散点图的样本点分布,可以认为样本点集中在曲线 的附近.
(1)根据表中数据,求模型②的回归方程 .( 精确到个位, 精确到 0.01).
(2)根据下列表中的数据,比较两种模型的相关指数 ,并选择拟合精度更高、更可靠的模型,预测 2021
年该景区的旅游人数(单位:万人,精确到个位).
回归方程 ① ②
30407 14607
参考公式、参考数据及说明:
①对于一组数据 ,其回归直线 的斜率和截距的最小二乘法估计
分别为 .②刻画回归效果的相关指数 ;③参
考数据: , .
y x
y x 50.8 169.7y x= +
ebxy a=
ˆ ebxy a= a b
2R
50.8 169.7y x= + ˆ ebxy a=
10
2
1
( )i i
i
y y
=
−∑
( ) ( ) ( )1 1 2 2, , , , , ,n nv w v w v w w vα β= +
1
2
1
( )( )
,
( )
n
i i
i
n
i
i
w w v v
w v
v v
β α β=
=
− −
= = −
−
∑
∑
2
2 1
2
1
( )
1
( )
n
i i
i
n
i
i
y y
R
y y
=
=
−
= −
−
∑
∑
5.46e 235≈ 1.43e 4.2≈
x y u
10
2
1
( )i
i
x x
=
−∑ ( )( )10
1
i i
i
x x y y
=
− −∑ ( )( )10
1
i i
i
x x u u
=
− −∑
5.5 449 6.05 83 4195 9.00
表中 .
解:(1)对 取对数,得 ,设 , ,先建立 关于 的线性回归方
程.
, ,
, 模型②的回归方程为 .
(2)由表格中的数据,有 30407>14607,即 ,
即 , ,模型①的相关指数 小于模型②的 ,
说明回归模型②的拟合效果更好.
2021 年时, ,预测旅游人数为 (万人).
10
1
1ln , 10i i i
i
u y u u
=
= = ∑
ebxy a= ln lny bx a= + lnu y= lnc a= u x
( )( )
( )
10
1
10 2
1
9.00 0.10883
i i
i
i
i
x x u u
b
x x
=
=
− −
= = ≈
−
∑
∑
6.05 0.108 5.5 5.456 5.46c u bx= − ≈ − × = ≈
5.46e e 235ca = ≈ ≈ ∴ 0.11235e xy =
10 10
2 2
1 1
30407 14607
( ) ( )i i
i i
y y y y
= =
>
− −∑ ∑
10 10
2 2
1 1
30407 146071 1
( ) ( )i i
i i
y y y y
= =
− < − − −∑ ∑ 2 2 1 2R R< 2 1R 2 2R 13x = 0.11 13 1.43235e 235e 235 4.2 987y ×= = ≈ × =
查看更多