从2007-2012年广东高考数学真题分析,可得出广东高考数学对于概率统计考查的宗旨:保持将统计中用抽样样本估计总体的思想与概率的数理分析有机地结合进行考查.更为重视数据处理能力在问题解决中的反映,强调与统计案例相结合考查统计与概率思想.故我们在备考中应以数据处理能力为中心,抓基本方法与基本技能落实为主,如图表的绘制与阅读,基本量(如中位数、平均数、标准差等)的含义与意义.理科要关注超几何分布、二项分布及其区别以及解答题中正态分布的可能.下面按照考试大纲及广东省的考试说明对具体的概率统计考点进行解读分析,供同学们复习时参考.
一、高考概率统计考点解读
考点1. 随机抽样
【考纲要求】① 理解随机抽样的必要性和重要性. ② 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.
【考纲解读】考纲中对“分层抽样和系统抽样”的要求是“了解”,但是分层抽样一直是高考试题中的一个重要考点,因此要熟练应用.
【例1】某校共有学生2000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )
A. 24 B. 18 C. 16 D. 12
【分析】根据分层抽样的意义,将总体分成几个部分,然后按各部分所占的比例进行抽样,因此本题可以根据抽样比,得到所要抽取的人数.
【解析】依题意我们知道二年级的女生有380人,那么三年级的学生的人数应该是500,即总体中各个年级的人数比例为3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为64×=16,故答案选C.
【例2】某单位200名职工的年龄分布情况如图1,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是 ;若用分层抽样方法,则40岁以下年龄段应抽取 人.
【分析】由系统抽样的意义知,它是一种等距抽样,确定初始号码后,样本的编号组成等差数列.
【解析】由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37. 40岁以下年龄段的职工数为200×0.5=100,则应抽取的人数为×100=20人.答案分别为37,20.
【命题趋势】预计2013年高考主要仍以应用题为背景,题型以选择题、填空题为主,也有可能是解答题的第(1)问,主要考查简单随机抽样、分层抽样、系统抽样的计算以及这三种抽样的区别,由于分层抽样是热点,故备受命题者青睐.
考点2. 用样本估计总体
【考纲要求】① 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.② 理解样本数据标准差的意义和作用,会计算数据标准差. ③ 能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释. ④ 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想. ⑤ 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
【考纲解读】考纲中明确要求考生要“会收集、整理、分析数据,能从大量数据中抽取对研究问题有用的信息,并作出判断.数据处理能力主要依据统计或统计案例中的方法对数据进行整理、分析,并解决给定的实际问题”,根据历年广东高考数学试题,考试对对样本估计总体的要求已经提升到能力的高度.
【例3】调查某市教师10000人的平均月薪(单位:元),其频率分布直方图如图2所示,则估计教师平均月薪在(2700,3000]的人数为__________.
【分析】由频率分布直方图可知,小矩形的面积即为数据落在区间范围内的频率,又因为频数=样本容量×频率,所以可得相应区间范围内的频数.
【解析】教师月薪在(2700,3000]的频率为0.001×300=0.3,则教师平均月薪在(2700,3000]的人数为10000×0.3=3000.
【例4】为了调查高一学生物理学习情况,抽查甲、乙两位学生5次物理测验成绩(100分制),用茎叶图记录如图3:
(1)求甲、乙两人物理成绩的中位数;
(2)从统计学的角度,对两位学生的物理成绩作出你的评价.
【分析】第(1)问识别茎叶图,中间的数(茎)表示分数的十位数,旁边的数(页)分别表示两个人得分的个位数,再将分数从小到大排列,因为个数是奇数,中位数是中间的数,第(2)问可以通过样本的平均数、方差的计算,然后根据这两个特征数的意义写出结论.
【解析】(1)由茎叶图可知甲乙的成绩如下:
甲 79 82 82 87 95
乙 75 80 85 90 95
从而可知,甲的中位数为82,乙的中位数为85.
(2)甲乙两个学生的物理平均成绩相同,但甲的成绩比较稳定.理由如下:
甲=(70×1+80×3+90×1+9+2+2+7+5)=85,
乙=(70×1+80×2+90×2+5+0+5+0+5)=85,
=[(79-85)2+(82-85)2+(82-85)2+(87-85)2+(95-85)2]=31.6,
=[(75-85)2+(80-85)2+(85-85)2+(90-85)2+(95-85)2]=50.
∵甲=乙,<,
∴甲乙的平均分相等,但甲的成绩比较稳定.
【命题趋势】用样本估计总体部分内容涉及知识点较多,概念性的内容也较多,但从高考的实际来看,这部分内容是统计考查的重心.预计2013年高考考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体思想的理解.高考题型多以选择题和填空题的形式出现,有时也会有解答题,但难度不大.
考点3. 变量的相关性、统计案例
【考纲要求】变量的相关性:① 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. ② 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 统计案例:了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.① 独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.② 回归分析:了解回归的基本思想、方法及其简单应用.
【考纲解读】考纲中对“变量的相关性”要求来看,有两个“会”、一个“了解”、一个“能”,是一个完整的作散点图、求回归 方程,并给出回归分析的统计过程,试题常体会在“会”、“能”两个要求上,不要求记忆线性回归方程系数公式,广东2007年及2011年的线性回归方程高考题作出了很好的示范.而对于统计案例,不要求记忆独立性检验随机变量K2值的计算公式,能根据公式计算结果给出独立性检验结论即可.
【例5】某数学老师身高176 cm,他爷爷、父亲、儿子的身高分别是173 cm、170 cm和182 cm,因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高是________cm.
【分析】用父亲的身高来预测儿子的身高,可把父亲的身高和儿子的身高看做变量,求出回归直线方程,再进行预测.
【解析】设父亲的身高为x,儿子的身高为y,则有(173,170)、(170,176)、(176,182)、(182,y0)(y0是题中所求的值).利用(173,170)、(170,176)、(176,182)求回归方程,再利用(182,y0)求y0.由=173,=176,=
==1,=-=176-173=3,得回归方程为=x+3,则y0=182+3=185.
【例6】第三十届夏季奥林匹克运动会(2012年伦敦奥运会)引发国内对体育运动的热烈讨论,某网站对16名男网友和14名女网友进行运动爱好调查.调查发现,男、女网友中是否喜爱运动的人数如下表.
根据上述列联表的数据,在犯错误的概率不超过0.10的前提下,可以得出结论:
参考公式:K2=,其中n=a+b+c+d.
独立性检验值表:
【分析】将给出的数据代入公式K2=,计算出结果后由独立性检验表即可写出结论.
【解析】假设是否喜爱运动与性别无关,由已知数据可求得:
K2=≈1.1575<2.706.
因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.
【命题趋势】广东高考题在2007、2010(文)、2011三年都考查了线性回归方程,说明其受到命题组的高度重视,2010www.dylw.net 第一论文网文科对于独立性检验以从表中数据直观分析收看新闻节目的观众是否与年龄有关,没有涉及到公式计算.参看其它新课标地区,由于高考对于文科考生的概率知识要求降低,必然加大对统计知识的考查力度,目的是提高考生的统计判断能力,解决实际问题,预计2013年高考如果考查统计案例,会通过2×2列联表进行考查.
考点4. 随机事件的概率与古典概型
【考纲要求】 ① 了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.② 了解两个互斥事件的概率加法公式.③ 理解古典概型及其概率计算公式.④会用列举法计算一些随机事件所含的基本事件数及事件发生的概率.
【考纲解读】考纲对随机事件的概率要求均为“了解”为主,古典概型中则一个“理解”,一个“会”,其中的互斥事件的概率加法公式成为概率考查的纵深表现.频率与概率的区别与联系是基础,古典概型的概率计算是核心,文科生对于事件概率的获得均是以列举法描述发生事件和基本事件的比来获取的,而理科生则侧重于与排列组合、随机变量的分布列与数学期望等知识进行综合考查.
【例7】(2012年高考江苏)现有10个数,它们能构成一个以1为首项,-3为公比的等比数列,若从这10个数中随机抽取一个数,则它小于8的概率是 .
【分析】先利用等比数列通项公式将10个数列举出来,求出其中小于8的数的个数,然后由随机事件的概率的公式求出“随机抽取一个数小于8”的概率.
【解析】∵以1为首项,-3为公比的等比数列的10个数为1,-3,9,-27,…其中有5个负数,1个正数1,共6个数小于8, ∴从这10个数中随机抽取一个数,它小于8的概率是=.
【例8】(2012年高考广东理)从个位数与十位数之和为奇数的两位数中任取一个,其个位数为0的概率是( )
A. B. C. D.
【分析】本题考古典概型,可以利用排列组合知识求出基本事件数,然后算出“个位数为0”发生的事件数,代入古典概型公式求出概率.
【解析】设个位数与十位数之和为奇数的两位数分别为m,n,则m+n=2k-1(k可取1、2、3、4、5、6、7、8、9).由m+n为奇数,得m,n必须一个为奇数且另一个为偶数. m为奇数且n为偶数的两位数有 ×=20个;m为偶数且n为奇数的两位数有×=25个. 个位数与十位数之和为奇数的两位数共有25+20=45(个).其中个位数是0、十位数为奇数的两位数有:10、30、50、70、90,共5个,故所求的概率是=.答案选D.
考点5. 随机数与几何概型
【考纲要求】 ① 了解随机数的意义,能运用模拟方法估计概率. ② 了解几何概型的意义.
【考纲解读】考纲要求“了解随机数的意义,了解几何概型的意义”,所以应在了解的基础上,还要理解,会运用模拟方法估计概率,会解决一些几何概型的求解问题.由于几何概型具有无限性和等可能性这两个特点,因此几何概型的求解与古典概型的求解思路是一样的,都属于比例解法.
【例9】设函数y=f(x)在区间上的均匀随机数x1,x2,…,xN和y1,y2,…,yN,由此得到N个点(xi,yi)(i=1,2,…,N).再数出其中满足yi≤f(xi)(i=1,2,…,N)的点数N1,那么由随机模拟方法可得S的近似值为 .
【分析】本题涉及的基本知识点包括:几何概型、随机模拟法及二者之间的关系.由题意,两者所得到的概率相等可以得到S的近似值.
【解析】如图所示,根据已知题设,设函数f(x)、直线x=0,x=1及x轴所围成的阴影面积S的近似值为S′.设对应正方形的面积为1,根据几何概型,随机点落在阴影部分的概率是P==S′;而由随机模拟法求得的随机点落在阴影部分的概率P′=,∵P=P′,∴S′=,故由随机模拟方法可得的近似值为.
【例10】(2012年高考北京理)设不等式组0≤x≤2,0≤y≤2表示的平面区域为D.在区域D内随机取一个点,则此点到坐标原点的距离大于2的概率是( )
A. B. C. D.
【分析】本小题是一道综合题,它涉及到的知识包括:线性规划,圆的概念和面积公式,几何概型(事件区域的度量为面积).
【解析】题目中0≤x≤2,0≤y≤2表示的区域表示正 方形区域,而动点D可以存在的位置为正方形面积减去四分之一的圆的面积部分,因此P==,故选D .
【命题趋势】随机数与几何概型在2007-2012年广东高考题没有出现过,考虑到其他新课标地区已经考查过,而且广东对于冷门知识点会突击考查,故也要重视,重点复习几何概型的求值问题.
考点6. (理科)概率
【考纲要求】① 理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性.② 理解超几何分布及其导出过程,并能进行简单的应用.③ 了解条件概率和两个事件相互独立的概念,能理解n次独立重复实验的模型及二项分布,并能解决一些简单的实际问题.④ 理解取有限个值的离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题.⑤ 利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义.
【考纲解读】理科的概率要求显然是从随机变量及其分布列着手的,即从统计分布的角度进入的.从知识要求层次“理解”的角度来看,重点应该关注随机变量及其分布列、超几何分布、二项分布(含n次独立重复实验的模型),“会”计算离散型随机变量均值、方差,并在上述基础上解决简单的实际问题,考查阅读分析、运用数学知识解决问题的能力.
【例11】已知随机变www.dylw.net 第一论文网量x服从正态分布N(3,1),且P(2≤x≤4)=0.6826,则P(x>4)=( )
A. 0.1588 B. 0.1587 C. 0.1586 D. 0.1585
【分析】考查正态分布的符号含义及图像的对称意义.
【解析】由于?滋=3,所以2,4关于3对称,由正态分布曲线对称性可知P(x>4)=P(x<2),所以p(x>4)=-P(3≤x≤4)=-0.3413=0.1587,故答案选B.
【说明】正态分布的问题的考查无非是符号本身的认识以及图像的了解.本题的设计仍然是基于考纲中的了解要求.对于考生而言,关键是了解每一个符号的含义及其在图像中的反映.
启示:该题是2010年广东高考题,在以后的复习中要注意正态分布的基础知识的复习!
【例12】某班从6名班干部(其中男生4人,女生2人)中选3人参加学校青年志愿者的竞选.在男生甲被选中的情况下,求女生乙也被选中的概率.
【分析】本题主要考查条件概率的计算,根据条件概率的计算公式P(B|A)=,确定好事件,分别计算P(AB)、P(A)即可获解.
【解析】设“男生甲被选中”为事件A,“女生乙被选中”为事件B,则P(A)==,P(AB)==, ∴P(B|A)==.故在男生甲被选中的情况下,女生乙也被选中的概率为.
【例13】某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上40件产品作为样本,称出它们的重量(单位:克),重量的分组区间为(490,495],(495,500],…,(510,515],由此得到样本的频率分布直方图,如图4所示.
(1)根据频率分布直方图,求重量超过505克的产品数量.
(2)在上述抽取的40件产品中任取2件,设Y为重量超过505克的产品数量,求Y的分布列.
(3)从流水线上任取5件产品,求恰有2件产品的重量超过505克的概率.
【分析】本题主要考查频率分布直方图、超几何分布、二项分布等知识,考查或然与必然的数学思想方法以及数据处理能力、运算求解能力和应用意识.
【解析】(1)解1:根据频率分布直方图可知,重量超过505克的产品数量为(0.01+0.05)×5×40=12(件).
解2:根据频率分布直方图可知,重量超过505克的产品所占频率为(0.01+0.05)×5=0.3.因此,重量超过505克的产品数量为0.3×40=12(件).
解3:根据频率分布直方图可知,重量在区间(505,510]的频率为0.05×5=0.25,
重量在区间(505,510]的数量为0.25×40=10(件).
重量在区间(510,515]的频率为0.01×5=0.05,
重量在区间(510,515]的数量为0.05×40=2(件).
因此,重量超过505克的产品数量为 10+2=12(件).
(2)Y的可能取值为0,1,2.
P(Y=0)==;P(Y=1)==;P(Y=2)==.
Y的分布列为:
(3)利用样本估计总体,该流水线上产品重量超过505克的概率为0.3.
令?孜为任取的5件产品中重量超过505克的产品数量,则?孜~B(5,0.3),故所求概率为P(?孜=2)=(0.3)2(0.7)3=0.3087.
【说明】本题是2010年广东高考理科数学概率统计解答题,属于数据处理能力考查下的典型问题(2011、2012年广东高考理科概率统计的解答题都与此题类似),涉及到图表信息获取,文字阅读理解等文字类应用问题常见的处理方式.本题最大的特色便是综合考查了超几何分布和二项分布,但不足也在此,过于追求全面而导致问题设计没有必要的深度.本题全省平均分7.92.难度反映在对于二项分布的理解,事实上,连续两年对二项分布都有考查,这一点不得不加以关注.启示:概率统计的题型几乎年年是高考的“常客”,每年以不同的新的背景出现,要重视概率统计的学习掌握,关键是要加强阅读理解能力、分析解决问题能力、数学转化能力等,这种类型是属于中等类型,要注意加强表达的规范!
【命题趋势】理科的概率选择填空题主要考查单个知识点,如古典概型等;解答题一般以统计为背景,综合考查离散型随机变量的分布列、均值与方差等,充分体现数学的应用价值.
二、2013年高考概率统计备考的建议
通过对考纲中概率统计部分的解读及广东高考真题的研究,我们可以发现广东高考题对于概率统计的考查具备广东的特色:命题形式特征和内容稳定,内容覆盖全面,难度是中等.试题通常是对常见问题进行改编,通过对基础知识的整合、变式和拓展.如分层抽样、频率分布直方图,只要考生熟练掌握通性通法,就能从多角度去解决问题.同时要关注知识交汇,如频率分布直方图与古典概型的交汇、茎叶图与方差的交汇、统计与算法框图的交汇等.因此我们在备考时,要针对考纲对概率统计部分的每一个知识点切实落实,不能抱有侥幸心理,忽略某些冷门考点(如2007年广东高考题解答题对线性回归方程的考查出乎当年广大高三师生的意料之外,许多老师都认为线性回归运算量大,不可能考大题,但该道高考题在高考试卷首提供公式,运算量并不太大). 同学们复习时如果按照考纲要求把课本中的概率统计内容认真通读,不遗漏任何一个知识点,独立做过一遍例题、习题 ,将2007—2012年广东高考数学试www.dylw.net 第一论文网题中的概率统计题反复做透,对训练过的每道题进行反思,分析其蕴含着的概率统计基本思想方法,规范书写,必要步骤不缺省,确保“对而全”,高考时在概率统计部分就一定能取得满意的成绩.
(作者单位:王位高,广东信宜砺儒中学;邓小雁,广东信宜中学)