1.在一次体能测试中,某学校对该校甲、乙两个班级作抽样调查,所得10名考生的成绩如下表所示:
甲 乙 67 69 72 73 75 75 79 80 67 69 82 81 88 89 80 82 70 71 90 91 (1)将甲、乙两班10名考生的成绩整理在如图所示的茎叶图中,并分别计算甲、乙两班10名考生成绩的平均数;
(2)若在乙班被抽取的10名考生中任选3人参加省体能测试,求被抽到的3人中,至少2人成绩超过80分的概率;
(3)若以甲班的体能测试情况估计该校所有学生的体能情况,则从该校随机抽取4人,记成绩在80分以上(含80分)的人数为X,求X的分布列及期望. 【解析】(1)茎叶图如下所示:
故甲班10名考生成绩的平均数为
1×(67+67+70+72+75+79+80+82+88+90)=77, 10乙班10名考生成绩的平均数为
1×(69+69+71+73+75+80+81+82+89+91)=78. 101C2C314C64(2)记至少2人成绩超过80分为事件A,则P(A). 33C10C103
故X的分布列为
X 0 1 2 3 4 P 812162169616 625625625625625
E(X)428. 552.已知对某高校80名篮球运动员的身高进行测量得到如图所示的频率分布直方图,记身高在[150,160),
[160,170),[170,180),[180,190),[190,200](单位:cm)内的人数分别为n1,n2,n3,n4,n5,其中
2n2n4n5,且n3=28.
(1)求n2,n5的值,并求篮球运动员的身高分别在[160,170)以及[190,200]内的频率;
(2)试求这80名篮球运动员的平均身高(用各组区间的中点值作代表);
(3)若身高在[190,200]内的篮球运动员中,有4名篮球运动员的身高超过195 cm,则从身高在
[190,200]内的篮球运动员中随机抽取4人,记身高超过195 cm的篮球运动员的人数为X,求X的
分布列以及数学期望.
(3)已知身高在[190,200]内的篮球运动员共有12名,所以X的可能取值为0,1,2,3,4,
43122C8C8C4224C8C416870,P(X1),, P(X0)4P(X2)44C12495C12495C124953C1C43218C44,P(X4)4, P(X3)4C12495C12495故X的分布列为
X P 0 1 2 3 4 70224168321 4954954954954957022416832141+2+3+4. 数学期望E(X)04954954954954953或X~B(4,),E(X)np134. 33.某生产企业研发了一种新产品,该新产品在某网店试销一个阶段后得到销售单价x和月销售量y之间的一组数据,如下表所示:
销售单价x(元) 月销售量y(万件) 9 11 9.5 10 10 8 10.5 6 11 5 (1)根据统计数据,求出y关于x的回归直线方程,并预测月销售量不低于12万件时销售单价的最大值;
(2)生产企业与网店约定:若该新产品的月销售量不低于10万件,则生产企业奖励网店1万元;若月销售量不低于8万件且不足10万件,则生产企业奖励网店5000元;若月销售量低于8万件,则没有奖励.现用样本估计总体,从上述5个销售单价中任选2个销售单价,下个月分别在两个不同的网店进行销售,求这两个网店下个月获得奖励的总额X的分布列及其数学期望.
ˆaˆbxˆ的斜率和截距的最小二参考公式:对于一组数据(x1,y1),(x2,y2),,(xn,yn),其回归直线yˆ乘估计分别为bxynxyiii1nnˆ. ˆybx,axi12inx25参考数据:
xyii15i392,xi2502.5.
i1
(2)由题意可得,销售单价共有5个,其中使得月销售量不低于10万件的有2个,月销售量不低于8万件且不足10万件的有1个,月销售量低于8万件的有2个.故X的可能取值只有2,1.5,1,0.5,0.
11C2C1C111222C12C2则P(X2)2;P(X1.5);; P(X1)22C510C55C551C1C2111C2. P(X0.5)2;P(X0)22C55C510所以X的分布列为
X P 故数学期望E(X)22 1.5 1 51 0.5 1 50 1 102 51 10112111.510.501(万元). 1055510
4.近年来随着我国在教育科研上的投入不断加大,科学技术得到迅猛发展,国内企业的国际竞争力得到大幅提升.伴随着国内市场增速放缓,国内有实力的企业纷纷进行海外布局,第二轮企业出海潮到来.如在智能手机行业,国产品牌已在赶超国外巨头,某品牌手机公司一直默默拓展海外市场,在海外共设有30多个分支机构,需要国内公司外派大量70后、80后中青年员工.该企业为了了解这两个年龄层的员工是否愿意被外派工作的态度,按分层抽样的方式从70后和80后的员工中随机调查了100位,得到数据如下表:
70后 愿意被外派 20 40 不愿意被外派 20 20 合计 40 60 80后 合计 60 40 100 (1)根据调查的数据, 能否在犯错误的概率不超过0.1的前提下认为“是否愿意被外派与年龄有关”,并说明理由;
80后员工参加.70(2)该公司举行参观驻海外分支机构的交流体验活动,拟安排6名参与调查的70后、
后员工中有愿意被外派的3人和不愿意被外派的3人报名参加,从中随机选出3人,记选到愿意被外派的人数为x;80后员工中有愿意被外派的4人和不愿意被外派的2人报名参加,从中随机选出3人,记选到愿意被外派的人数为y,求xy的概率. 参考数据:
P(K2k0) k0 20.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 n(adbc)2参考公式:K,其中nabcd.
(ab)(cd)(ac)(bd)n(adbc)2【解析】(1)计算得K的观测值为k
(ab)(cd)(ac)(bd)2100(20204020)24004001002.7782.706,
406060405760000所以能在犯错误的概率不超过0.1的前提下认为“是否愿意被外派与年龄有关”.
(2)“xy”包含“x0,y1”、“x0,y2”、“x0,y3”、 “x1,y2”、“x1,y3”、“x2,y3”,共6个互斥事件,
1即xy的概率为.
25.甲、乙两品牌计划入驻某大型商场,该商场批准两个品牌先进场试销10天.两品牌提供的返利方案如下:甲品牌无固定返利,卖出90件以内(含90件)的产品,每件产品返利5元,超出90件的部分每件返利7元;乙品牌每天固定返利a元,且每卖出一件产品再返利3元.经统计,两家品牌的试销情况的茎叶图如下:
(1)现从乙品牌试销的10天中抽取三天,求这三天的销售量中至少有一天低于90的概率. (2)若将频率视作概率,回答以下问题:
①记甲品牌的日返利额为X(单位:元),求X的分布列和数学期望;
②商场拟在甲、乙两品牌中选择一个长期销售,如果仅从日返利额的角度考虑,请利用所学的统计学知识为商场作出选择,并说明理由.
【解析】(1)方法一:记乙品牌“这三天的销售量中至少有一天低于90”为事件A, 由题意知抽取的10天中,销售量不低于90的有7天,销售量低于90的有3天.
21203C7C3C1177C3C7C3P(A)则. 3C1024方法二:记“这三天的销售量至少有一天低于90”为事件A, 则A为:“这三天的销售量都不低于90”,
03C3C77P(A), 则3C1024所以P(A)1P(A)1717. 2424
X 430 435 445 450 464 471 11111 5551010111111445.5(元). ∴EX4304354454504644715555101011121②依题意,乙品牌的日平均销售量为:868991929390.7,
1055510P 1 5
∴乙品牌的日平均返利额为:a90.73a272.1(元).
当a272.1445.5,即a173.4(元)时,推荐该商场选择乙品牌长期销售; 当a272.1445.5,即a173.4(元)时,该商场任意选择甲、乙品牌即可; 当a272.1445.5,即a173.4(元)时,推荐该商场选择甲品牌长期销售. 综上,当a173.4元时,推荐该商场选择乙品牌长期销售; 当a173.4元时,该商场任意选择甲、乙品牌即可; 当a173.4元时,推荐该商场选择甲品牌长期销售.
6. 随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加,下表是某购物网站2017年1~8月促销费用(万元)和产品销量(万件)的具体数据: 月份 促销费用 产品销量 1 2 1 2 3 1 3 6 2 4 10 3 5 13 6 21 5 7 15 4 8 18 (1)根据数据绘制的散点图能够看出可用线性回归模型拟合与的关系,请用相关系数加以说明(系数精确到
);
),如果该公司计划在9月份实现产品销量超6万
).
2ˆaˆbxˆ(系数精确到(2)建立关于的回归方程y件,预测至少需要投入促销费用多少万元(结果精确到参考数据:
xi11yi374.5,xi11i1i188340,yi316.5,
i182,
,其中,分别为第个月的促销费用和产品销量,
参考公式:
.
(1)样本xi,yii1,2,L,n的相关系数rxxyyiii1nxixyiyi1i1n2n. 2(2)对于一组数据,,„,
ˆaˆbxˆ的斜率和截距的最小二乘估计分,其回归方程y
ˆ别为bxxyyiii1nxixi1n2ˆ. ˆybx,a【解析】(1)由题可知
n,
将数据代入rxxyyiii1xixi1n2yiyi1n得2.
因为与的相关系数近似为0.995,说明与的线性相关性很强, 从而可以用回归模型拟合与的关系.
1. (湖南省益阳市2018届高三4月调研考试)某校高一年级共有
名,该校组织了一次口语模拟考试(满分为现按性别采用分层抽样抽取
,
频率,
,的频率与
名学生,其中男生
名,女生
分).为研究这次口语考试成绩为高分是否与性别有关,
,
,
,
,的
名学生的成绩,按从低到高分成
七组,并绘制成如图所示的频率分布直方图.已知
的频率之比为
,成绩高于
分的为“高分”.
的频率等于
(1)估计该校高一年级学生在口语考试中,成绩为“高分”的人数; (2)请你根据已知条件将下列
列联表补充完整,并判断能否在犯错误的概率不超过0.001的前提
分以上(含
分)为及格)与性别有
下认为该校高一年级学生在本次口语考试中的成绩是否及格(关?
男生 女生 合计 附临界值表:
2口语成绩及格 口语成绩不及格 合计 0.100 2.706 0.050 3.841 0.025 5.024 0.010 6.635 0.001 10.828 n(adbc)2参考公式:K,nabcd.
(ab)(cd)(ac)(bd)【答案】(1)200;(2)见解析.
(2)根据已知条件补充完整的列联表如下:
男生 女生 合计 70 口语成绩及格 30 口语成绩不及格 合计 40 60 计算得的观测值为,
所以能在犯错误的概率不超过0.001的前提下认为该校高一年级学生在本次口语考试中的成绩是否及格与性别有关.
2.(2018届河南省中原名校高三第六次质量考评)前几年随着网购的普及,线下零售遭遇挑战,但随着新零
售模式的不断出现,零售行业近几年呈现增长趋势,下表为位:亿元,数据经过处理,
年份代码 销售额 分别对应
1 95 2 165 ):
3 230 4 310 年中国百货零售业的销售额(单
(1)由上表数据可知,可用线性回归模型拟合与的关系,请用相关系数加以说明; (2)建立关于的回归方程,并预测2018年我国百货零售业的销售额;
(3)从年这4年的百货零售业销售额及2018年预测销售额这5个数据中任取2个数据,求这
2个数据之差的绝对值大于200亿元的概率. 参考数据:
yi800,xiyi2355,i1i1nii144yiyi1i42158.9,52.236.
参考公式:相关系数r(xx)(yy)(xx)(yy)2iii1i1nn,回归方程
2中斜率和截距的最小二乘估计
ˆ公式分别为bxxyyiii1nxixi1nˆ. ˆybx,a2【答案】(1)与的相关系数近似为0.999,说明与的线性相关程度相当高,从而可以用线性回归模型拟合与的关系;(2)关于的回归方程为377.5亿元;(3)
.
,预测2018年我国百货零售业的销售额为
ˆ(2)由(1)得bxxyyiii14xxii14235571,5,
则关于的回归方程为将2018年对应的
.
.
代入回归方程得
故预测2018年我国百货零售业的销售额为377.5亿元. (3)从这5个数据中任取2个数据,结果有:
,
,共 10个.
,共3个,
所取2个数据之差的绝对值大于200亿元的结果有:
所以所求概率为.
3.(2018届呼和浩特市高三年级第一次质量普查考试)为了了解校园噪音情况,学校环保协会对校园噪音
值(单位:分贝)进行了
天的监测,得到如下统计表:
噪音值(单位:分贝) 频数 (1)根据该统计表,求这
天校园噪音值的样本平均数(同一组的数据用该组的中点值作代表).
分贝,视为重度噪音污染;环境噪音值不超过
分
(2)根据国家声环境质量标准:“环境噪音值超过
贝,视为轻度噪音污染.”如果把由上述统计表算得的频率视作概率,回答下列问题:
(i)求周一到周五的五天中恰有两天校园出现重度噪音污染而其余三天都是轻度噪音污染的概率. (ii)学校要举行为期天的“汉字听写大赛”校园选拔赛,把这天校园出现的重度噪音污染天数记为,求的分布列和方差【解析】(1)由数据可知
.
.
(3)由题意故分布列为
,则.
.
4.(2018届陕西省高三教学质量检测)某高中随机抽取部分高一学生调查其上学路上所需的时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中上学路上所需时间的范围是据分组为
,样本数
(1)求直方图中的值;
(2)如果上学路上所需时间不少于1小时的学生可申请在学校住宿,若招生1200名,请估计新生中有多少名学生可以申请住宿;
(3)从学校的高一学生中任选4名学生,这4名学生中上学路上所需时间少于 40分钟的人数记为,求的分布列和数学期望.(以直方图中的频率作为概率) 【解析】( 1 )由直方图可得
.
.
(3)的可能取值为0,1,2,3,4.
由直方图可知,每位学生上学所需时间少于40分钟的概率为,
,
,
.
则的分布列为:
0 1 2 3 4
.
故
即的数学期望为.
1.(2018高考新课标I理)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产
品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为p(0p1),且各件产品是否为不合格品相互独立.
(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX; (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
(2)由(1)知,p0.1.
(i)令Y表示余下的180件产品中的不合格品件数,依题意知Y:B(180,0.1),X20225Y,即X4025Y.
所以EXE(4025Y)4025EY490.
(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元. 由于EX400,故应该对余下的产品作检验.
2.(2018高考新课标II理)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000ˆ30.413.5t;根据2010年2,…,17)建立模型①:y年至2016年的数据(时间变量t的值依次为1,ˆ9917.5t. 2,…,7)建立模型②:y至2016年的数据(时间变量t的值依次为1,(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
(2)利用模型②得到的预测值更可靠. 理由如下:
(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010
ˆ9917.5t可以较好地描述2010年以后的环境基础设施投资额年至2016年的数据建立的线性模型y
的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.
3.(2018高考新课标III理)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两
种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
第一种生产方式 第二种生产方式 超过m 不超过m (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2nadbc2abcdacbd,
PK2≥k 0.050 0.010 0.001 10.828k 3.841 6.635 【解析】(1)第二种生产方式的效率更高. 理由如下:
(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知m列联表如下:
第一种生产方式 第二种生产方式 2798180. 2超过m 15 5 不超过m 5 15 40(151555)2106.635,(3)由于K所以有99%的把握认为两种生产方式的效率有差异.
202020204.(2017高考新课标Ⅲ理)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每
瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表: 最高气温 天数 [10,15) [15,20) [20,25) [25,30) [30,35) [35,40) 2 16 36 25 7 4 以最高气温位于各区间的频率代替最高气温位于该区间的概率. (1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
【解析】(1)由题意知,X所有可能取值为200,300,500,由表格数据知 PX2002163625740.2,PX3000.4,PX5000.4. 909090因此X的分布列为
X P 200 300 500 0.2 0.4 0.4
若最高气温低于20,则Y62002n2004n8002n. 因此EY2n0.40.48002n0.21601.2n. 所以n=300时,Y的数学期望达到最大值,最大值为520元.
【名师点睛】离散型随机变量的分布列指出了随机变量X的取值以及取各值的概率;要理解两种特殊的概率分布——两点分布与超几何分布,并善于灵活运用两性质:一是pi≥0(i=1,2,„);二是p1+p2+„+pn=1检验分布列的正误.
5.(2017高考新课标I理)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(,2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(3,3)之外的零件数,求P(X1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(3,3)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)试说明上述监控生产过程方法的合理性; (ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
11611611622xi9.97,s经计算得x(xix)(xi16x2)0.212,其中xi为抽取的16i116i116i1第i个零件的尺寸,i1,2,,16.
ˆ,用样本标准差s作为的估计值ˆ,利用估计值判断是否需对当用样本平均数x作为的估计值ˆ3ˆ,ˆ3ˆ)之外的数据,天的生产过程进行检查?剔除(用剩下的数据估计和(精确到0.01).
附:若随机变量Z服从正态分布N(,2),则P(3Z3)0.997 4,
0.997 4160.959 2,0.0080.09.
(2)(i)如果生产状态正常,一个零件尺寸在(3,3)之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(3,3)之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
【名师点睛】数学期望是离散型随机变量中重要的数学概念,反映随机变量取值的平均水平.求解离散型随机变量的分布列、数学期望时,首先要分清事件的构成与性质,确定离散型随机变量的所有取值,然后根据概率类型选择公式,计算每个变量取每个值的概率,列出对应的分布列,最后求出数学期望.正态分布是一种重要的分布,之前考过一次,尤其是正态分布的3原则.
6.(2016高考新课标I理)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数. (1)求X的分布列;
(2)若要求P(Xn)0.5,确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在n19与n20之中选其一,应选用哪个?
【解析】(1)由柱状图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2,从而
P(X16)0.20.20.04;P(X17)20.20.40.16; P(X18)20.20.20.40.40.24; P(X19)20.20.220.40.20.24; P(X20)20.20.40.20.20.2;
P(X21)20.20.20.08;P(X22)0.20.20.04.
所以X的分布列为
X 16 17 18 19 20 21 22 P 0.04 0.16 0.24 0.24 0.2 0.08 0.04 (2)由(1)知P(X18)0.44,P(X19)0.68,故n的最小值为19.
【名师点睛】本题把随机变量的分布列与统计及函数结合在一起进行考查,有一定的综合性,但难度不是太大,求解的关键是读懂题意,所以提醒考生要重视数学中的阅读理解问题.
7.(2016高考新课标II理)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度出险次数的关联如下:
上年度出险次数 保 费 0 0.85a 1 2 1.25a 3 1.5a 4 1.75a 5 2a a 设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数 概 率 0 0.30 1 0.15 2 0.20 3 0.20 4 0.10 5 0. 05 (1)求一续保人本年度的保费高于基本保费的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率; (3)求续保人本年度的平均保费与基本保费的比值.
【解析】(1)设A表示事件:“一续保人本年度的保费高于基本保费”,则事件A发生当且仅当一年内出险次数大于1,故P(A)0.20.20.10.050.55.
(3)记续保人本年度的保费为X,则X的分布列为
X 0.85a a 1.25a 1.5a 1.75a 2a P 0.30 0.15 0.20 0.20 0.10 0.05 EX0.85a0.30a0.151.25a0.201.5a0.201.75a0.102a0.051.23a.因此续保人本年度的平均保费与基本保费的比值为1.23 【名师点睛】条件概率的求法:
(1)定义法:先求P(A)和P(AB),再由P(B|A)=
P(AB),求出P(B|A); P(A)
(2)基本事件法:当基本事件适合有限性和等可能性时,可借助古典概型概率公式,先求事件A包含的基本事件数n(A),再在事件A发生的条件下求事件B包含的基本事件数n(AB),得P(B|A)=
n(AB). n(A)求离散型随机变量均值的步骤:(1)理解随机变量X的意义,写出X可能取得的全部值;(2)求X取每个值时的概率;(3)写出X的分布列;(4)由均值定义求出EX.
8.(2017高考新课标II理)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽
取了100 个网箱,测量各箱水产品的产量(单位:kg).其频率分布直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
旧养殖法 新养殖法 箱产量<50 kg 箱产量≥50 kg (3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:
n(adbc)2,K(ab)(cd)(ac)(bd)2
(2)根据箱产量的频率分布直方图得列联表:
箱产量50kg 箱产量≥50kg
旧养殖法 新养殖法 K的观测值k262 34 238 66 200626634381001009610415.705,
由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关.
【名师点睛】(1)利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,随机变量的观测值k值越大,说明“两个变量有关系”的可能性越大.
(2)利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
9.(2016高考新课标III理)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:
yi17i9.32,tiyi40.17,i17(yy)ii1720.55,7≈2.646.
参考公式:相关系数r(tt)(yy)iii1n(tt)(yy)2iii1i1nn,
2bt中斜率和截距的最小二乘估计公式分别为:b 回归方程ya(ti1nit)(yiy)i(ti1nt)2=ybt. ,a
9.32ˆ1.331及(I)得b(2)由y7(ti17it)(yiy)i(ti17t)22.890.103, 28ˆ1.3310.10340.92. ˆybtaˆ0.920.10t. 所以,y关于t的回归方程为:yˆ0.920.1091.82. 将2016年对应的t9代入回归方程得:y所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.
【方法点拨】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数r公式求出r,然后根据r的大小进行判断.求线性回归方程时要严格按照公式求解,并一定要注意计算的准确性.
因篇幅问题不能全部显示,请点此查看更多更全内容