资料简介
8.2一元线性回归模型及其应用(精练)【题组一样本中心解小题】1.(2021·广西钦州市)据统计,某产品的市场销售量y(万台)与广告费用投入x(万元)之间的对应数据的散点图如图所示,由图可知y与x之间有较强的线性相关关系,其线性同归方程是,则a的值是()A.2.5B.3C.3.5D.4【答案】A【解析】由题可知:将代入线性回归方程可得:故选:A2.(2021·湖北武汉市·武汉中学高二期末)设一个回归方程为,则变量增加一个单位时().A.平均增加12个单位B.平均增加3个单位C.平均减少1.2个单位D.平均减少3个单位【答案】A【解析】由回归直线斜率知:变量增加一个单位时,,平均增加个单位.故选:A.3.(2021·江西上饶市)在对具有线性相关的两个变量和进行统计分析时,得到如下数据:由表中数据求得关于的回归直线方程,则,,,这四个样本点中,距离回归直线最近的点是()A.B.C.D.
【答案】C【解析】,,根据回归直线方程的性质可知,平均值点在回归直线上,故选:C.4.(2021·江西)对具有线性相关关系的变量,,测得一组数据如表,利用最小二乘法得它们的回归直线方程为,据此模型来预测当时,的估计值为___________245682050607080【答案】213.5【解析】,,所以中心点为,所以,解得,所以回归直线方程为,所以当时,,故答案为:5.(2021·湖南省平江县第一中学高二月考)已知某产品的销售额(万元)与广告费用(万元)之间的关系如下表:(单位:万元)(单位:万元)若销售额与广告费用之间的线性回归方程为,预计当广告费用为万元时的销售额约为_____________(万元).【答案】【解析】由表格中的数据可得,,由于回归直线过样本的中心点,所以,,解得,所以,回归直线方程为,当时,.故答案为:.
6.(2021·福建漳州市·高二期末)某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元1234销售额y/万元23mn现已知,且回归方程中的,据此模型预测广告费用为10万元时,销售额为______万元.【答案】35【解析】由题意,∴,,时,.故答案为:35.7.(2021·江西高二期末(理))下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量与月份之间有较好的线性相关关系,其线性回归方程是,则_______.月份1234用水量4.5432.5【答案】5.25【解析】由题意知:,,将代入线性回归方程,即,解得:.故答案为:5.25.8.(2021·邱县第一中学高二期末)已知x与y之间的一组数据:x0123ym35.57已知关于y与x的线性回归方程为,则m的值为___________.
【答案】【解析】由表格中的数据可得由于回归直线过样本的中心点,所以所以,解得故答案为:9.(2021·贵州贵阳市)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程.零件数x(个)1020304050加工时间y(min)62758090现发现表中有一个数据看不清,请你推断该数据的值为___________.【答案】【解析】设阴影部分的数据为,由表中数据得:,,由于由最小二乘法求得回归方程,将,,代入回归直线方程,得.故答案为:.10.(2020·吉林油田第十一中学)已知与之间的一组数据:12343.24.87.5若关于的线性回归方程为,则的值为______.【答案】=4.5【解析】由题得,,所以,所以.故答案为:=4.5
【题组二一元线性方程】1.(2021·福建福州市·高二期末)为了研究某班男生身高和体重的关系,从该班男生中随机选取6名,得到他们的身高和体重的数据如下表所示:编号123456身高165171167173179171体重62m64747466在收集数据时,2号男生的体重数值因字迹模糊看不清,故利用其余5位男生的数话得到身高与体重的线性回归方程为.后来得到2号男生的体重精准数值m后再次计算得到线性回归方程为.(1)求回归方程;(2)若分别按照和来预测身高为的男生的体重,得到的估计值分别为,,且,求m的值;(3)指数是目前国际上常用的衡量人体胖瘦程度以及是否健康的一个标准,其中指数在24到27.9之间的定义为超重.通过计算可知这6人的指数分别为:22.8,27.4,22.9,24.7,23.1,22.6,现从这6人中任选2人,求恰有1人体重为超重的概率.附:回归直线的斜率和截距的最小二乘估计公式分别为:,.【答案】(1);(2);(3)【解析】(1),,所以,,
所以,,所以.(2)根据题意,将代入方程得,所以,所以,①另一方面,6名男生的身高的平均值为,体重的平均值为,所以,②,,所以,③综合①②③即可得:,.(3)设这6人分别记为,其中表示体重超标的两人,则从这6人中任选2人,所有的可能情况为:,共15种,其中恰有1人体重为超重有:,共8种,所以恰有1人体重为超重的概率为:.2.(2021·四川遂宁市)第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度和对应的销售额(万元)进行了调查得到以下数据:
时间第一天第二天第三天第四天第五天最满意度2234252019销售额(万元)7890867675(1)求销量额关于最满意度的相关系数;我们约定:销量额关于最满意度的相关系数的绝对值在以上(含)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额关于最满意度的线性回归方程(系数精确到0.1).参考数据:,,,,,.附:对于一组数据.其回归直线方程的斜率和截距的最小二乘法估计公式分别为:,,线性相关系数.【答案】(1),线性相关性较弱;(2)【解析】(1).因为,所以线性相关性较弱,(2)由(1)可得没有达到较强线性相关,则淘汰销售额为万元的数据.剔除数据后的,.,,
,,所以,.所以线性回归方程为.3.(2021·广西钦州市)2020年新型冠状病毒肺炎疫情期间,某医院随着医疗工作的有序开展,从2020年3月1日算第一天起,该医院每日治愈的新型冠状病毒肺炎人数(人)的近5天的具体数据如下表:第天12345治愈的新型冠状病毒肺炎人数(人)24818若在一定时间内,该医院每日治愈的新型冠状病毒肺炎病人数与天数具有相关关系,已知线性回归方程恒过定点,且,.(1)求的值和线性回归方程;(2)预测该医院3月11日能否可以实现“单日治愈人数突破40人”的目标?参考公式:,,,为样本平均值.【答案】(1),;(2)能实现.【解析】解:(1)由题意,,,∴,解得,∵,,所以,,,所以线性回归方程为.(2)在中,3月11日即,
取..∵,∴该医院3月11日能实现“单日治愈人数突破40人”的目标.4.(2020·贵州贵阳市·)统计中用相关系数来衡量两个变量之间的线性相关的强弱,若相应于变量的取值,变量的观测值,则两个变量的相关关系的计算公式为.对于变量,若,时,那么负相关很强;若,时,那么正相关很强;若,或,,那么相关性一般;若,,那么相关性较弱.下表是一位母亲给儿子作的成长记录:年龄/周岁34567身高/厘米9198104111116(1)根据公式以及上表数据,判断孩子在3岁到7岁期间年龄与身高线性相关的强弱;(2)根据上表数据,,求出年龄与身高的线性回归方程,并根据求得的回归方程,预估孩子8岁时的身高.,.【答案】(1)见解析(2);厘米【解析】(1)
则即孩子在3岁到7岁期间年龄与身高线性相关很强(2),则年龄与身高的线性回归方程为当时,身高为厘米5.(2021·安徽马鞍山市)天气寒冷,加热手套比较畅销,某商家为了解某种加热手套如何定价可以获得最大利润,现对这种加热手套进行试销售,统计后得到其单价x(单位;元)与销量y(单位:副)的相关数据如下表:单价x(元)80859095100销量y(副)1401301109080(1)已知销量y与单价x具有线性相关关系,求y关于x的线性回归方程;(2)若每副该加热手套的成本为65元,试销售结束后,请利用(1)中所求的线性回归方程确定单价为多少元时,销售利润最大?(结果保留到整数)附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线的斜率和截距的最小二乘估计分别为参考数据:【答案】(1);(2)单价应该定为元,销售利润最大.
【解析】(1)由表中数据,计算得,,则,,所以关于的线性回归方程为.(2)设定价为元,利润为,则(元)时,最大,所以为使得销售的利润最大,单价应该定为元.6.(2021·甘肃省永昌县第一高级中学高二期末(理))据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小(x/℃)与某植物糖积累指数(y/GI)之间的关系,得到如下数据:组数第一组第二组第三组第四组第五组第六组昼夜温差x/℃1011131286某植物糖积累指数y/GI202430281815该课题研究组确定的研究方案是先从这6组数据中选取4组数据求线性回归方程,再用剩下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y关于x的线性回归方程;(2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?
参考公式:回归直线方程的斜率和截距的最小二乘估计.【答案】(1);(2)是.【解析】(1)由表中2月至5月份的数据,得,,故有,,,,即关于的线性回归方程为;(2)由,当时,,,当时,,,则该小组所得线性回归方程是理想的.7.(2021·柳州市第二中学高二期末(理))广西某高三理科班名学生的物理测评成绩(满分120分)的频率分布直方图如图,已知分数在95—105的学生有27人.(1)求总人数和分数在110—120分的人数;
(2)求出该频率分布直方图的众数,中位数,平均数;(3)为了分析某个学生的学习状态,对其下一阶段的学生提供指导性建议,对他前7次考试的数学成绩(满分150分),物理成绩进行分析,如表是该生7次考试的成绩.数学888311792108100112物理949110896104101106已知该生的物理成绩与数学成绩是线性相关的,若该生的数学成绩达到130分,请你估计他的物理成绩大约是多少?其回归方程,,.其中.【答案】(1);9;(2)97.5,100,80.50;(3)可估计他的物理成绩为115分.【解析】(1)根据频率分布直方图的意义,分数在95—105的学生有27人,95—105的频率为:,可得总人数.直方图面积之和为,可得110—115的频率为0.1,即人数为人.的人数为,所以110—120人数为9人.(2)众数;由,所以中位数为100;平均数(分)(3)由表中数据:,,其中;∵∴物理成绩与数学成绩是线性其回归方程为:.当时,可得,即可估计他的物理成绩为115分.
8.(2020·江西吉安市)从2020年元月份以来,全世界的经济都受到了新冠病毒的严重影响,我国抗疫战斗取得了重大的胜利,全国上下齐心协力复工复产,抓经济建设;某公司为了提升市场的占有率,准备对一项产品实施科技改造,经过充分的市场调研与模拟,得到,之间的五组数据如下表:2357858121416其中,(单位:百万元)是科技改造的总投入,(单位:百万元)是改造后的额外收益;设是对当地生产总值增长的贡献值.(1)若从五组数据中任取两组,求恰有一组满足的概率;(2)记为时的任意两组数据对应的贡献值的和,求随机变量的分布列和数学期望;(3)利用表中数据,甲、乙两个调研小组给出的拟合直线方程分别为甲组:,乙组:,试用最小二乘法判断哪条直线的拟合效果更好?附:对于一组数据,其拟合直线方程的残差平方和为,越小拟合效果越好.【答案】(1);(2)分布列见解析;期望为;(3)甲组给出的拟合直线方程拟合效果更好.【解析】(1)设所给五组数据分别为,,,,(只有满足),从五组数据中任意取出两组的情况有:,,,,,,,,,共10种情况,其中,恰有一组满足的有:,,,共4种情况,故所求概率为;(2)满足的数据是后3组(贡献值分别为:22,28,32),∴的值为50,54,60,则,
,,∴的分布列为:505460数学期望;(3)用甲组给出的拟合直线方程列表如下:235785812141657111517用乙组给出的拟合直线方程列表如下:23578581214163.56111618.5由表中数据得,,,∴,故甲组给出的拟合直线方程拟合效果更好.【题组三非一元线性方程】1.(2020·全国高三专题练习)某地级市共有200000名中小学生,其中有7%的学生在2017年享受了“
国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5∶3∶2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元.经济学家调查发现,当地人均可支配收入较上一年每增加n%,一般困难的学生中有3n%会脱贫,脱贫后将不再享受“国家精准扶贫”政策,很困难的学生中有2n%转为一般困难,特别困难的学生中有n%转为很困难.现统计了该地级市2013年到2017年共5年的人均可支配收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份x取13时代表2013年,x与y(万元)近似满足关系式y=,其中C1,C2为常数(2013年至2019年该市中学生人数大致保持不变).2.31.23.14.621其中(1)估计该市2018年人均可支配收入;(2)求该市2018年的“专项教育基金”的财政预算大约为多少?附:①对于一组具有线性相关关系的数据(u1,v1),(u2,v2),…,(un,vn),其回归直线方程的斜率和截距的最小二乘估计分别为②2-0.72-0.320.121.721.821.90.60.81.13.23.53.73
【答案】(1)2.8万元;(2)1624万元.【解析】(1)因为=×(13+14+15+16+17)=15,所以=(-2)2+(-1)2+02+12+22=10.由k=y得k=2C1+C2x,所以C1=-C2=1.2-×15=-0.3,所以C1=2-0.3=0.8,所以y=.当x=18时,y=0.8×21.8=0.8×3.5=2.8(万元).即该市2018年人均可支配收入为2.8万元.(2)由题意知2017年时该市享受“国家精准扶贫”政策的学生有200000×7%=14000人,一般困难、很困难、特别困难的中学生依次有7000人、4200人、2800人,2018年人均可支配收入比2017年增长=20.1-1=0.1=10%,所以2018年该市特别困难的中学生有2800×(1-10%)=2520人.很困难的学生有4200×(1-20%)+2800×10%=3640人,一般困难的学生有7000×(1-30%)+4200×20%=5740人.所以2018年的“专项教育基金”的财政预算大约为5740×1000+3640×1500+2520×2000=16240000(元)=1624(万元).2.(2020·全国高二课时练习)某学生为了测试燃气灶烧水如何节省天然气的问题设计了一个试验,并获得了天然气开关旋钮旋转的弧度数与烧开一壶水所用时间(以下简称烧水时间)的一组数据,且进行了一定的数据处理(如下表),得到了散点图(如下图).
1.4720.60.782.350.8116.2表中.(1)根据散点图判断,与哪一个更适宜作为烧水时间关于开关旋钮旋转的弧度数的回归方程类型;(不必说明理由)(2)根据判断结果和表中数据,建立关于的回归方程;(3)如果旋转的弧度数与单位时间内天然气输出量成正比,那么为多少时,烧开一壶水最省天然气?附:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.【答案】(1);(2);(3).【解析】(1)更适宜作为烧水时间关于开关旋钮旋转的弧度数的回归方程类型.(2)由公式可得,,
所以所求回归方程为.(3)设,则天然气用量,当且仅当时取“=”,即(负值舍去)时,天然气用量最小.3.(2020·全国)红铃虫是棉花的主要害虫之一,能对农作物造成严重伤害.每只红铃虫的平均产卵数和平均温度有关.现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.平均温度/℃21232527293235平均产卵数/个71121246611532527.42981.2863.61240.182147.714表中,(1)根据散点图判断,与(其中为自然对数的底数)哪一个更适宜作为平均产卵数关于平均温度的回归方程类型?(给出判断即可不必说明理由)并由判断结果及表中数据,求出关于的回归方程.(计算结果精确到小数点后第三位)(2)根据以往统计,该地每年平均温度达到28℃以上时红铃虫会造成严重伤害,需要人工防治,其他情况均不需要人工防治,记该地每年平均温度达到28℃以上的概率为.(ⅰ)记该地今后5年中,恰好需要3次人工防治的概率为,求的最大值,并求出相应的概率.
(ⅱ)当取最大值时,记该地今后5年中,需要人工防治的次数为,求的数学期望和方差.附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为:,.【答案】(1)更适宜;;(2)(i),此时相应的概率为;(ii),.【解析】(1)根据散点图可以判断更适宜作为平均产卵数关于平均温度的回归方程类型.对两边取自然对数得,令,,,得.因为,所以,所以关于的线性回归方程为,所以关于的回归方程为.(2)(ⅰ)由,得,因为,令得,解得;令得,解得,所以在上单调递增,在上单调递减,所以有唯一极大值,也为最大值.所以当时,,此时响应的概率.(ⅱ)由(ⅰ)知,当取最大值时,,所以,所以,.4.(2020·
福建师大附中高二期中)疫苗能够使人体获得对病毒的免疫力,是保护健康人群最有效的手段.新冠肺炎疫情发生以来,军事医学科学院陈薇院土领衔的团队开展应急科研攻关,研制的重组新型冠状病毒疫苗(腺病毒载体),于4月12日开始招募志愿者,进入二期临床试验.根据普遍规律,志愿者接种疫苗后体内会产生抗体,人体中检测到抗体,说明有抵御病毒的能力.科研人员要定期从接种疫苗的志愿者身上采集血液样本,检测人体中抗体含量水平(单位:,百万国际单位/毫升).(1)IgM作为人体中首先快速产生的抗体,是人体抗感染免疫的“先头部队”.经采样分折,志愿者身体中IgM含量水平与接种天数x(接种后每满24小时为一天,)近似满足函数关系:,经研究表明,IgM含量水平不低于时是免疫的有效时段,试估计接种一次后IgM含量水平有效时段可经历的时间(向下取整).(参考数据:)(2)IgG虽然是接种后产生比较慢的抗体,却是血清和体液中含量最高的抗体,也是亲和力最强、人体内分布最广泛、具有免疫效应的抗感染“主力军”.科研人员每间隔3天检测一次(检测次数依次记为,)某志愿者人体中IgG的含量水平,记作,得到相关数据如下表:(次)12345670.090.380.954.853.357.4817.25①请画出散点图,并根据散点图判断线性拟合模型与指数拟合模型哪种更适合拟合z与t的关系(不必说明理由);②研究人员发现,上述数据中存在一组异常数据应当予以剔除.试根据余下的六组数据,利用①中选择的拟合模型计算回归方程,并估计原异常数据对应的值.附:回归系数与估计值均保留两位小数,由七组数据计算出的参考数据见下表,其中.4.910.60205.4839.87-2.840.440.821.58参考公式:线性回归直线的斜率和截距的最小二乘估计分别为:,【答案】(1)天;(2)①见解析,指数拟合模型适合拟合z与t的关系;②【解析】(1)时,单调递增,时,单调递减,得到时,
达到峰值,由得,,因为,,所以估计接种一次后IgM含量水平有效时段可经历的时间为天;(2)①散点图如下:根据散点图判断指数拟合模型更适合拟合z与t的关系;②根据散点图可得第组数据异常,应当予以剔除由得,,故,当时,估计原异常数据对应的值为.5.(2020·
安徽省太和第一中学高二月考(文))某工厂生产不同规格的一种产品,根据检测标准,其合格产品的质量与尺寸之间满足关系式为大于的常数),现随机抽取6件合格产品,测得数据如下:尺寸(mm)384858687888质量(g)16.818.820.722.42425.5对数据作了处理,相关统计量的值如下表:75.324.618.3101.4(1)根据所给数据,求关于的回归方程(提示:由已知与呈线性关系);(2)按照某项指标测定,当产品质量与尺寸的比在区间内时为优等品,现从抽取的6件合格产品中再任选3件,求恰好取得两件优等品的概率.(附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计值分别为)【答案】(1);(2).【解析】(1)对两边取自然对数得,令,得,,,得,故所求回归方程为.(2)由,解得,则,即优等品有3件.记“恰好取得两件优等品”为事件,
从件合格品中选出3件的方法数为,从件合格品中取3件,恰好2件为优等品的取法有种,则.故恰好取得两件优等品的概率为.
查看更多