概率与统计常见题型
一、随机抽样和用样本估计总体
规律方法 (1)解答与抽样方法有关的问题的关键是深刻理解各种抽样方法的特点、适用围和实施步骤,熟练掌握系统抽样中被抽个体确实定方法,掌握分层抽样中各层人数的计算方法.
(2)与频率分布直方图、茎叶图有关的问题,应正确理解图表中各个量的意义,通过图表掌握信息是解决该类问题的关键.
(3)在做茎叶图或读茎叶图时,首先要弄清楚“茎〞和“叶〞分别代表什么,正确求出数据的众数和中位数;方差越小,数据越稳定.
频率
特别提醒:频率分布直方图中的纵坐标为,而不是频率值.
组距
1、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.假如在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,如此这四个社区驾驶员的总人数N为( ). A.101B.808C.1 212D.2 012
2、如图是根据局部城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].样本中平均气温低于22.5 ℃的城市个数为11,如此样本中平均气温不低于25.5 ℃的城市个数为__________.
3、如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,如此该运动员在这五场比赛中得分的方差为________.
1
(注:方差s2=[(x1-x)2+(x2-x)2+…+(xn-x)2],其中x为x1,x2,…,xn的平均数)
n
二、变量的相关性和统计案例
规律方法 解决线性回归问题的关键是:(1)正确理解计算b,a的公式并准确的计算,假如对数据作适当的预处理,可防止对大数字进展运算;(2)分析两个变量的相关关系时,可根据样本数据作散点图来确定两个变量之间是否具有相关关系,假如具有线性相关关系,如此可通过线性回归方程估计和预测变量的值. 4、某工厂为了对新研发的一种产品进展合理定价,将该产品按事先拟定的价格进展试销,得到如下数据:
单价x/元 销量y/件 ^^^^^
^
8 90 ^^ 84 83 80 9 75 68 (1)求回归直线方程y=bx+a,其中b=-20,a=y-bx;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的本钱是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-本钱) 5、某地最近十年粮食需求量逐年上升,下表是局部统计数据:
年份 需求量(万吨) 2002 2004 2006 2008 2010 236 246 257 ^^276 ^286 (1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;
- 1 - / 9
文档
(2)利用(1)中所求出的直线方程预测该地2013年的粮食需求量.
三、古典概型与几何概型
规律方法 (1)解决古典概型问题的关键是
①正确求出根本事件总数和所求事件包含的根本事件数.
m
②P(A)=既是古典概型的定义,又是求概率的计算公式,应熟练掌握.
n
(2)解决几何概型的关键是寻找试验的全部结果构成的区域和事件发生时构成的区域,有时需要设出变量,在坐标系中表示所需要的区域.
(3)假如事件正面情况比拟多、反面情况较少,如此一般利用对立事件进展计算.对于“至少〞、“至多〞等事件的概率计算,往往用这种方法求解.
6、如图,在圆心角为直角的扇形OAB中,分别以OA,OB为直径作两个半圆.在扇形OAB随机取一点,如11122
此此点取自阴影局部的概率是( ).A.- B.C.1-D.
2ππππ
第6题 第8题
7、有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性一样,如此这1123
两位同学参加同一个兴趣小组的概率为( ). A.B.C.D. 3234
8、如图,矩形ABCD中,点E为边CD的中点,假如在矩形ABCD部随机取一个点Q,如此点Q取自△ABE
1112
部的概率等于( ).A. B.C. D. 4323
四、概率统计综合问题
规律方法 1.抽样方法和概率问题的综合一般是从分层抽样开始,设置分层抽样中的一些计算问题,然后就分层抽样中各个层设置一个古典概型计算问题.虽然此类题目所考查的知识横跨两局部,但是分解开来后,并不难解决.
由于此类题目多与实际问题联系严密,题干较长,信息量大,且会有图表,因此要认真审题并要掌握解答题目所需的知识.要做到:
(1)分层抽样中的公式运用要准确. 样本容量各层样本容量
①抽样比==.
个体总量各层个体总量
②层1的数量∶层2的数量∶层3的数量=样本1的容量∶样本2的容量∶样本3的容量. (2)在计算古典概型概率时,根本事件的总数要计算准确. 2.频率分布与概率的综合主要有两种形式:
(1)题目中给出了样本的频率分布表,它反映了样本在各个组的频数和频率,要求根据频率分布表画出频率分布直方图,并根据样本在各组的频数,设置分层抽样和概率计算等.
(2)利用频率与概率的关系,频率近似于概率,给出某类个体中的一个个体被抽中的概率,从而求出样本容量与其他类个体的数量.在解决此类问题时,可将题目中所给概率作为此类个体被抽中的频率,从而求解.
- 2 - / 9
文档
9、近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1 000吨生活垃圾,数据统计如下(单位:吨):
厨余垃圾 可回收物 其他垃圾 “厨余垃圾〞箱 “可回收物〞箱 400 30 20 100 240 20 “其他垃圾〞箱 100 30 60 (1)试估计厨余垃圾投放正确的概率; (2)试估计生活垃圾投放错误的概率;
(3)假设厨余垃圾在“厨余垃圾〞箱、“可回收物〞箱、“其他垃圾〞箱的投放量分别为a,b,c,其中a>0,a+b+ca,b,c的方差s2最大时,写出a,b,c的值(结论不要求证明),并求此时s2的值.
1
(注:s2=[(x1-x)2+(x2-x)2+…+(xn-x)2],其中x为数据x1,x2,…,xn的平均数)
n
10、某河流上的一座水力发电站,每年六月份的发电量Y(单位:万千瓦时)与该河上游在六月份的降雨量X(单位:毫米)有关.据统计,当X=70时,Y=460;X每增加10,YX的值为:
140,110,160,70,200,160,140,160,220,200,110,160,160,200,140,110,160,220,140,160. (1)完成如下的频率分布表近20年六月份降雨量频率分布表
降雨量 70 110 140 160 200 220 频率 1 20 4 20 2 20(2)假定今年六月份的降雨量与近20年六月份降雨量的分布规律一样,并将频率视为概率,求今年六月份该水力发电站的发电量低于490(万千瓦时)或超过530(万千瓦时)的概率.
五、数形结合思想——解决有关统计问题
(1)通过频率分布直方图和频数条形图研究数据分布的总体趋势; (2)根据样本数据散点图确定两个变量是否存在相关关系. 解答时注意的问题: (1)频率分布直方图中的纵坐标为
频率
,而不是频率值; 组距
(2)注意频率分布直方图与频数条形图的纵坐标的区别.
11、为了解学生身高情况,某校以10%的比例对全校700名学生按性别进展分层抽样调查,测得身高情况的统计图如下:
(1)估计该校男生的人数;
(2)估计该校学生身高在170~185cm之间的概率;
(3)从样本中身高在180~190cm之间的男生中任选2人,求至少有1人身高在185~190cm之间的概率.
概率与统计练习:
1.在某次测量中得到的AB样本数据恰好是A样本数据每个都加2后所得数据,如此A,B两样本的如下数字特征对应一样的是( ).
A.众数 B.平均数C.中位数 D.标准差
2.对某商店一个月每天的顾客人数进展了统计,得到样本的茎叶图(如下列图),如此该样本的中位数、众数、极差分别是( ).A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53
- 3 - / 9
文档
3.在长为12 cm的线段AB上任取一点C.现作一矩形,邻边长分别等于线段AC,CB的长,如此该矩形面积大于20 cm2的概率为( ).
1124A.B.C.D.
6335
4.袋中有五卡片,其中红色卡片三,标号分别为1,2,3;蓝色卡片两,标号分别为1,2. (1)从以上五卡片中任取两,求这两卡片颜色不同且标号之和小于4的概率;
(2)向袋中再放入一标号为0的绿色卡片,从这六卡片中任取两,求这两卡片颜色不同且标号之和小于4的概率.
5.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为yx-85.71,如此如下结论中不正确的答案是( ).
A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(x,y)
D.假如该大学某女生身高为170c
6.要完成如下两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购置力的某项指标;②从某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为( ).
A.①简单随机抽样法,②系统抽样法B.①分层抽样法,②简单随机抽样法 C.①系统抽样法,②分层抽样法D.①②都用分层抽样法
7.容量为20的样本数据,分组后的频数如下表:如此样本数据落在区间[10,40)的频率为( ).
分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) 频数
0≤x≤2,
8.设不等式组表示的平面区域为D,在区域D随机取一个点,如此此点到坐标原点的距离
0≤y≤2
^
2 3 4 5 4 2
π-24-πππ
大于2的概率是( ). A.B.C.D.
4264
9.为了分析某同学在班级中的数学学习情况,统计了该同学在6次月考中的数学名次,用茎叶图表示如下列图,如此该组数据的中位数为__________.
10.假如某产品的直径长与标准值的差的绝对值不超过1 mm时,如此视为合格品,否如此视为不合格品,在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进展检测,结果发现有50件不合格品,计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:
分组 [-3,-2) [-2,-1) (1,2] (2,3] (3,4] 合计 (1)将上面表格补充完整;
(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]的概率;
- 4 - / 9
频数 频率 8 10 50 文档
(3)现对该厂这种产品的某个批次进展检查,结果发现有20件不合格品,据此估算这批产品中的合格品的件数.
11.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的假如干次预赛成绩中随机抽取5次,绘制成茎叶图如图:
(1)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加适宜?请说明理由; (2)假如在茎叶图中的甲、乙预赛成绩中各任取1次成绩分别记为a和b,求满足a>b的概率.
96N
1、解析:四个社区抽取的总人数为12+21+25+43=101,由分层抽样可知,=,解得N=808.应当选
12101B.
2、9 解析:由于组距为1,如此样本中平均气温低于22.5 ℃的城市频率为0.10+0.12=0.22.
11
平均气温低于22.5 ℃的城市个数为11,所以样本容量为=50.
0.22而平均气温高于25.5 ℃的城市频率为0.18,
所以,样本中平均气温不低于25.5 ℃的城市个数为50×0.18=9. 8+9+10+13+15
3、6.8 解析:∵x==11,
5
8-112+9-112+10-112+13-112+15-112
∴s2==6.8.
5
11
4、解:(1)由于x=(x1+x2+x3+x4+x5+x6)=8.5,y=(y1+y2+y3+y4+y5+y6)=80,
66
所以a=y-bx=80+20×8.5=250,从而回归直线方程为y=-20x+250. (2)设工厂获得的利润为L元,依题意得
^
^
^
33L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20x+361.25,
4当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.
5、解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,为此对数据预处理如下:
年份-2006 对预处理后的数据,容易算得 x=0,y=3.2,
^^-4×-21+-2×-11+2×19+4×29260
b===6.5,a=y-bx=3.2.
40-42+-22+22+42^
2-4 -2 -11 0 2 4 需求量-257 -21 0 19 29 - 5 - / 9
文档
由上述计算结果,知所求回归直线方程为
y-257=b (x-2 006)+a=6.5(x-2 006)+3.2,即y=6.5(x-2 006)+260.2. ① (2)利用直线方程①,可预测2013年的粮食需求量为: 6.5××7+260.2=305.7(万吨)≈306(万吨).
6、C 解析:设OA=OB=2R,连接AB,如下列图,由对称性可得,阴影的面积就等于直角扇形拱形的面积,π-2R2112
S阴影=π(2R)2-×(2R)2=(π-2)R2,S扇=πR2,故所求的概率是=1-.
42πR2π
7、A 解析:记三个兴趣小组分别为1,2,3,甲参加1组记为“甲1〞,如此根本事件为“甲1,乙1;甲1,乙2;甲1,乙3;甲2,乙1;甲2,乙2;甲2,乙3;甲3,乙1;甲3,乙2;甲3,乙3〞,共9个.
记事件A为“甲、乙两位同学参加同一个兴趣小组〞,如此事件A包含“甲1,乙1;甲2,乙2;甲3,31
乙3〞,共3个.因此P(A)==.
93
8、C 解析:由题意知,可设事件A为“点Q取自△ABE〞,构成试验的全部结果为矩形ABCD所有点,事1
件A为△ABE的所有点,又因为E是CD的中点,所以S△ABE=AD×AB,S矩形ABCD=AD×AB,
21
所以P(A)=.
2
9、解:(1)厨余垃圾投放正确的概率约为:
“厨余垃圾〞箱里厨余垃圾量4002
==.
厨余垃圾总量400+100+1003
^
^
^
^
(2)设生活垃圾投放错误为事件A,如此事件A表示生活垃圾投放正确.
事件A的概率约为“厨余垃圾〞箱里厨余垃圾量、“可回收物〞箱里可回收物量与“其他垃圾〞箱里其400+240+60
他垃圾量的总和除以生活垃圾总量,即P(A)约为=0.7,所以P(A)约为1-0.7=0.3.
1 000
(3)当a=600,b=c=0时,s2取得最大值.
11
因为x=(a+b+c)=200,所以s2=×[(600-200)2+(0-200)2+(0-200)2]=80 000.
33
10、解:(1)在所给数据中,降雨量为110毫米的有3个,为160毫米的有7个,为200毫米的有3个,故近20年六月份降雨量频率分布表为
降雨量 70 110 140 160 200 220 频率 1 203 204 207 203 202 20(2)P(“发电量低于490万千瓦时或超过530万千瓦时〞)
1323
=P(Y<490或Y>530)=P(X<130或X>210)=P(X=70)+P(X=110)+P(X=220)=++=.
202020103
故今年六月份该水力发电站的发电量低于490(万千瓦时)或超过530(万千瓦时)的概率为.
1011、解:(1)样本中男生人数为40,由分层抽样比例为10%估计全校男生人数为400.
(2)由统计图知,样本中身高在170~185cm之间的学生有14+13+4+3+1=35人,样本容量为70,所
- 6 - / 9
文档
35
以样本中学生身高在170~185cm之间的频率f==0.5,故由f估计该校学生身高在170~185cm之间的概率
70P1=0.5.
(3)样本中身高在180~185cm之间的男生有4人,设其编号为①,②,③,④,样本中身高在185~190cm之间的男生有2人,设其编号为⑤,⑥,从上述6人中任取2人的树状图为:
故从样本中身高在180~190cm之间的男生中任选2人的所有可能结果数为15,至少有1人身高在185~190cm之间的可能结果数为9,因此,所求概率P2=
93
=. 155
练习答案::
1.D 解析:由s=
x1-x2+x2-x2+…+xn-x2
,可知B样本数据每个变量增加2,平均数也增
n
加2,但(xn-x)2不变,应当选D.
2.A 解析:由茎叶图可知中位数为46,众数为45,极差为68-12=56.应当选A.
3.C 解析:此概型为几何概型,由于在长为12 cm的线段AB上任取一点C,因此总的几何度量为12,满82
足矩形面积大于20 cm2的点在C1与C2之间的局部,如下列图.因此所求概率为,即,应当选C.
123
4.解:(1)标号为1,2,3的三红色卡片分别记为A,B,C,标号为1,2的两蓝色卡片分别记为D,E,从五卡片中任取两的所有可能的结果为:(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共10种.
由于每一卡片被取到的机会均等,因此这些根本事件的出现是等可能的.
从五卡片中任取两,这两卡片颜色不同且它们的标号之和小于4的结果为:(A,D),(A,E),(B,D),共3
3种.所以这两卡片颜色不同且它们的标号之和小于4的概率为.
10
(2)记F为标号为0的绿色卡片,从六卡片中任取两的所有可能的结果为:(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15种.由于每一卡片被取到的机会均等,因此这些根本事件的出现是等可能的.
从六卡片中任取两,这两卡片颜色不同且它们的标号之和小于4的结果为:(A,D),(A,E),(B,D),(A,F),(B,F),(C,F),(D,F),(E,F),共8种.
8
所以这两卡片颜色不同且它们的标号之和小于4的概率为.
155.×170-85.71=58.79 kg.故D不正确.
6.①中总体由差异明显的几局部构成,宜采用分层抽样法,②中总体中的个体数较少,宜采用简单随机抽样法,应当选B.
9
7.B 解析:样本数据落在区间[10,40)的频数为2+3+4=9,故所求的频率为=0.45.
20
- 7 - / 9
文档
0≤x≤2,
8.D 解析:题目中表示的区域为如下列图的正方形,而动点D可以存在的位置为正方形面积
0≤y≤2
π2
2×2-·24-π
4
减去四分之一圆的面积局部,因此P==,应当选D.
42×2
18+19
9.18.5 解析:由茎叶图知中间两位数为18和19,所以中位数为=18.5.
210.解:(1)
分组 [-3,-2) [-2,-1) (1,2] (2,3] (3,4] 合计 频数 频率 5 8 25 10 2 50
(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]的概率约为0.50+0.20=0.70;
5020
(3)设这批产品中的合格品数为x件,依题意有=,
5 000x+205 000×20
解得x=-20=1 980.
50
所以该批产品中的合格品件数估计是1 980件. 7.解:由茎叶图知甲乙两同学的成绩分别为: 甲:88 82 81 80 79乙:85 85 83 80 77 (1)方法一:派乙参赛比拟适宜,理由如下:
甲的平均分x甲=82,乙的平均分x乙=82,甲、乙平均分一样;
222又甲的标准差的平方(即方差)s2甲=10,乙的标准差的平方(即方差)s乙=9.6,s甲>s乙,甲、乙平均分一样,
但乙的成绩比甲稳定,所以派乙去比拟适宜.
方法二:派乙参赛比拟适宜,理由如下:
12
从统计学的角度看,甲获得85分以上(含85分)的概率P1=,乙获得85分以上(含85分)的概率P2=,
55甲的平均分x甲=82,乙的平均分x乙=82,平均分一样,所以派乙去比拟适宜. 方法三:派乙参赛比拟适宜,理由如下:从得82分以上(含82分)去分析,
23
甲获得82分以上(含82分)的概率P1=,乙获得82分以上(含82分)的概率P2=,
55甲的平均分x甲=82,乙的平均分x乙=82,平均分一样,所以派乙去比拟适宜.
(2)甲、乙预赛成绩中各任取1次成绩分别记为(a,b),有(88,85),(88,85),(88,83),(88,80),(88,77),
- 8 - / 9
文档
(82,85),(82,85),(82,83),(82,80),(82,77),(81,85),(81,85),(81,83),(81,80),(81,77),(80,85),(80,85),(80,83),(80,80),(80,77),(79,85),(79,85),(79,83),(79,80),(79,77)共25种,满足a>b的有(88,85),(88,85),(88,83),(88,80),(88,77),(82,80),(82,77),(81,80),(81,77),(80,77),11
(79,77)共11种.满足a>b的概率为.
25
- 9 - / 9
因篇幅问题不能全部显示,请点此查看更多更全内容