題目列表(包括答案和解析)
2.對卡方統(tǒng)計量的表達式的由來,學(xué)生只需要了解,作為探究問題可以在課后學(xué)習(xí)。
統(tǒng)計的基本思維模式是歸納的,它的特征之一是通過部分數(shù)據(jù)來推測全體數(shù)據(jù)的性質(zhì),因此,統(tǒng)計推斷可能是錯誤的,也就是說,我們從數(shù)據(jù)上體現(xiàn)的只是統(tǒng)計上的關(guān)系,而不是因果關(guān)系
1.一般情況下,在尚未斷定兩個變量之間是否具有線性相關(guān)關(guān)系的情況下,應(yīng)先進行相關(guān)性檢驗.在確認其具有線性相關(guān)關(guān)系后,再求其回歸直線方程;由部分數(shù)據(jù)得到的回歸直線,可以對兩個變量間的線性相關(guān)關(guān)系進行估計,這實際上是將非確定性的相關(guān)關(guān)系問題轉(zhuǎn)化成確定性的函數(shù)關(guān)系問題進行研究.由于回歸直線將部分觀測值所反映的規(guī)律性進行了延伸,它在情況預(yù)報、資料補充等方面有著廣泛的應(yīng)用。
題型1:線性相關(guān)性檢驗
例1.一個工廠在某年里每月產(chǎn)品的總成本y(萬元)與該月產(chǎn)量x(萬件)之間由如下一組數(shù)據(jù):
x |
1.08 |
1.12 |
1.19 |
1.28 |
1.36 |
1.48 |
1.59 |
1.68 |
1.80 |
1.87 |
1.98 |
2.07 |
|
y |
2.25 |
2.37 |
2.40 |
2.55 |
2.64 |
2.75 |
2.92 |
3.03 |
3.14 |
3.26 |
3.36 |
3.50 |
|
1)畫出散點圖;2)檢驗相關(guān)系數(shù)r的顯著性水平;3)求月總成本y與月產(chǎn)量x之間的回歸直線方程.
解析:
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
xi |
1.08 |
1.12 |
1.19 |
1.28 |
1.36 |
1.48 |
1.59 |
1.68 |
1.80 |
1.87 |
1.98 |
2.07 |
yi |
2.25 |
2.37 |
2.40 |
2.55 |
2.64 |
2.75 |
2.92 |
3.03 |
3.14 |
3.26 |
3.36 |
3.50 |
xiyi |
2.43 |
2.264 |
2.856 |
3.264 |
3.590 |
4.07 |
4.643 |
5.090 |
5.652 |
6.096 |
6.653 |
7.245 |
=,==2.8475,=29.808,=99.2081,=54.243 |
1)畫出散點圖:
2)
r=
=
在“相關(guān)系數(shù)檢驗的臨界值表”查出與顯著性水平0.05及自由度12-2=10相應(yīng)的相關(guān)數(shù)臨界值r0.05=0.576<0.997891, 這說明每月產(chǎn)品的總成本y(萬元)與該月產(chǎn)量x(萬件)之間存在線性相關(guān)關(guān)系
3)設(shè)回歸直線方程,
利用
,
計算a,b,得b≈1.215, a=≈0.974,
∴回歸直線方程為:
例2(2009泉州理)某興趣小組欲研究晝夜溫差大小與患感冒人數(shù)多少之間的關(guān)系,他們分別到氣象局與某醫(yī)院抄錄了1至6月份每月10號的晝夜溫差情況與因患感冒而就診的人數(shù),得到如下資料:
該興趣小組確定的研究方案是:先從這六組數(shù)據(jù)中選取2組,用剩下的4組數(shù)據(jù)求線性回歸方程,再用被選取的2組數(shù)據(jù)進行檢驗
(Ⅰ)求選取的2組數(shù)據(jù)恰好是相鄰兩個月的概率;
若選取的是1月與6月的兩組數(shù)據(jù),請根據(jù)2至5月份的數(shù)據(jù),求出y關(guān)于x的線
性回歸方程;
(Ⅲ)若由線性回歸方程得到的估計數(shù)據(jù)與所選出的檢驗數(shù)據(jù)的誤差均不超過2人,則認
為得到的線性回歸方程是理想的,試問該小組所得線性回歸方程是否理想?
解 (1)設(shè)抽到相鄰兩個月的數(shù)據(jù)為事件A因為從6組數(shù)據(jù)中選取2組數(shù)據(jù)共有中情況,每種情況都是等可能出現(xiàn)的其中,抽到相鄰兩個月的數(shù)據(jù)的情況有5種
所以
(Ⅱ)由數(shù)據(jù)求得
由公式求得
再由
所以y關(guān)于x的線性回歸方程為
(Ⅲ)當(dāng)時,
同樣,當(dāng)時,
所以,該小組所得線性回歸方程是理想的
題型2:獨立性檢驗
例3.為了探究患慢性氣管炎是否與吸煙有關(guān),調(diào)查了339名50歲以上的人,調(diào)查結(jié)果如下表所示:
|
患慢性氣管炎 |
未患慢性氣管炎 |
合計 |
吸煙 |
43 |
162 |
205 |
不吸煙 |
13 |
121 |
134 |
合計 |
56 |
283 |
339 |
試問:50歲以上的人患慢性氣管炎與吸煙習(xí)慣有關(guān)嗎?
解析:由公式,因為7.469>6.635,所以我們有99%的把握說:50歲以上的人患慢性氣管炎與吸煙習(xí)慣有關(guān)。
例4.(2009遼寧文)(本小題滿分12分)某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在(29.94,30.06)的零件為優(yōu)質(zhì)品。從兩個分廠生產(chǎn)的零件中個抽出500件,量其內(nèi)徑尺寸,的結(jié)果如下表:
甲廠
試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;
(1)由于以上統(tǒng)計數(shù)據(jù)填下面列聯(lián)表,并問是否有99%的把握認為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”。
|
甲 廠 |
乙 廠 |
合計 |
優(yōu)質(zhì)品 |
|
|
|
非優(yōu)質(zhì)品 |
|
|
|
合計 |
|
|
|
附:
解 (1)甲廠抽查的產(chǎn)品中有360件優(yōu)質(zhì)品,從而甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為
;
乙廠抽查的產(chǎn)品中有320件優(yōu)質(zhì)品,從而乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為
(2)
|
甲廠 |
乙廠 |
合計 |
優(yōu)質(zhì)品 |
360 |
320 |
680 |
非優(yōu)質(zhì)品 |
140 |
180 |
320 |
合計 |
500 |
500 |
1000 |
所以有99%的把握認為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”。
題型3:獨立的概念及應(yīng)用
例5.有三種產(chǎn)品,合格率分別是0.90,0.95和0.95,各抽取一件進行檢驗
(1)求恰有一件不合格的概率;
(2)求至少有兩件不合格的概率(精確到0.001);
解析:設(shè)三種產(chǎn)品各抽取一件,抽到合格產(chǎn)品的事件分別為A、B和C,
(1)P(A)=0.90,P(B)=P(C)=0.95,則P()=0.10,P()=P()=0.05。
因為事件A、B、C相互獨立,恰有一件不合格的概率為:
P(A·B·)+P(A··C)+P(·B·C)
=P(A)·P(B)·P()+P(A)·P()·P(C)+P()·P(B)·P(C)
=2×0.90×0.95×0.05+0.10×0.95×0.95≈0.176
答:恰有一件不合格的概率為0.176.
(2)解法一:至少有兩件不合格的概率為:
P(A··)+P(·B·)+P(··C)+P(··)
=0.90×0.05×0.05+2×0.10×0.05×0.95+0.10×0.05×0.05≈0.012.
答:至少有兩件不合格的概率為0.012.
解法二:三件產(chǎn)品都合格的概率為:
P(A·B·C)=P(A)·P(B)·P(C)=0.90×0.95×0.95≈0.812.
由(1)知,恰有一件不合格的概率為0.176,所以,至少有兩件不合格的概率為1-[P(A·B·C)+0.176]=1-(0.812+0.176)=0.012.
答:至少有兩件不合格的概率為0.012.
點評:本題主要考查互斥事件有一個發(fā)生的概率和相互獨立事件概率的計算及運用數(shù)學(xué)知識解決問題的能力
例6.(2009山東卷理)某工廠對一批產(chǎn)品進行了抽樣檢測.右圖是根據(jù)抽樣檢測后的
產(chǎn)品凈重(單位:克)數(shù)據(jù)繪制的頻率分布直方圖,其中產(chǎn)品
凈重的范圍是[96,106],樣本數(shù)據(jù)分組為[96,98),[98,100),
[100,102),[102,104),[104,106],已知樣本中產(chǎn)品凈重小于
100克的個數(shù)是36,則樣本中凈重大于或等于98克并且
小于104克的產(chǎn)品的個數(shù)是 ( ).
A.90 B.75 C. 60 D.45
答案 A
解析 產(chǎn)品凈重小于100克的概率為(0.050+0.100)×2=0.300,
已知樣本中產(chǎn)品凈重小于100克的個數(shù)是36,設(shè)樣本容量為,
則,所以,凈重大于或等于98克并且小于
104克的產(chǎn)品的概率為(0.100+0.150+0.125)×2=0.75,所以樣本
中凈重大于或等于98克并且小于104克的產(chǎn)品的個數(shù)是
120×0.75=90.故選A.
[命題立意]:本題考查了統(tǒng)計與概率的知識,讀懂頻率分布直方圖,會計算概率以及樣本中有關(guān)的數(shù)據(jù).
題型4:隨機變量的分布列
例7.(2009全國卷Ⅱ理)(本小題滿分12分)某車間甲組有10名工人,其中有4名女工人;乙組有5名工人,其中有3名女工人,現(xiàn)采用分層抽樣方法(層內(nèi)采用不放回簡單隨機抽樣)從甲、乙兩組中共抽取3名工人進行技術(shù)考核
(1)求從甲、乙兩組各抽取的人數(shù);
(I2)求從甲組抽取的工人中恰有1名女工人的概率;
(3)記表示抽取的3名工人中男工人數(shù),求的分布列及數(shù)學(xué)期望。
分析 (1)這一問較簡單,關(guān)鍵是把握題意,理解分層抽樣的原理即可。另外要注意
此分層抽樣與性別無關(guān)。
(2)在第一問的基礎(chǔ)上,這一問處理起來也并不困難。
從甲組抽取的工人中恰有1名女工人的概率
(3)的可能取值為0,1,2,3
,,
,
分布列及期望略.
評析:本題較常規(guī),比08年的概率統(tǒng)計題要容易。在計算時,采用分類的方
法,用直接法也可,但較繁瑣,考生應(yīng)增強靈活變通的能力。
例8.設(shè)自動生產(chǎn)線在調(diào)整后出現(xiàn)廢品的概率為0.1,而且一旦出現(xiàn)廢品就要重新調(diào)整,求在兩次調(diào)整之間所生產(chǎn)的合格品的數(shù)目不小于5的概率。
分析:如果用隨機變量η表示兩次調(diào)整之間生產(chǎn)的產(chǎn)品的個數(shù),而且我們知道一旦出現(xiàn)廢品就重新調(diào)整生產(chǎn)線,所以兩次調(diào)整之間所生產(chǎn)的合格品是連續(xù)出現(xiàn)的,那么隨機變量η的取值就服從幾何分布,我們在解題時應(yīng)先求出η的分布列。然后再計算事件“合格品數(shù)不小于5”即{η>5}的概率。
解析:設(shè)隨機變量η表示兩次調(diào)整之間生產(chǎn)線所生產(chǎn)的產(chǎn)品的個數(shù),則η服從幾何分布,事件{η=k}就表示生產(chǎn)了k-1件合格品,且第k件產(chǎn)品是廢品。容易求得:
P(η=1)=0.1,
P(η=2)=(1-0.1)×0.1=0.09,
寫成分布列的形式為:
|
1 |
2 |
3 |
4 |
5 |
6 |
… |
P |
0.1 |
0.09 |
0.81 |
0.0729 |
0.06561 |
0.059049 |
… |
題目中要求計算“所生產(chǎn)的合格品數(shù)不小于5”的概率,即P(η>5),因為事件{η>5}所包含的基本事件為{η=6},{η=7},…,{η=n},…,所以有
P(η>5)=P(η=6)+P(η=7)+…+P(η=n)+…
我們應(yīng)用分布列的性質(zhì)計算上式的值.因為P(η>5)=1-P(η≤5),所以
P(η>5)=1-[P(η=1)+P(η=2)+P(η=3)+P(η=4)+P(η=5)]
=1-(0.1+0.09+0.081+0.0729+0.06561)=0.49049,
所以事件“兩次調(diào)整之間所生產(chǎn)的合格品數(shù)不小于5”的概率為0.49049
點評:這是一道綜合例題,包括了分列的計算及分布列的應(yīng)用兩個步驟。該題對于我們鞏固所學(xué)知識,深入了解分布列有很大幫助
題型5:隨機變量的均值
例9.(1)(2009湖南卷文) 一個總體分為A,B兩層,用分層抽樣方法從總體中抽取一個容量為
10的樣本.已知B層中每個個體被抽到的概率都為,則總體中的個體數(shù)為 .
答案 120
解析 設(shè)總體中的個體數(shù)為,則
(2)(2009四川卷文)設(shè)矩形的長為,寬為,其比滿足∶=,這種矩形給人以美感,稱為黃金矩形。黃金矩形常應(yīng)用于工藝品設(shè)計中。下面是某工藝品廠隨機抽取兩個批次的初加工矩形寬度與長度的比值樣本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根據(jù)上述兩個樣本來估計兩個批次的總體平均數(shù),與標(biāo)準值0.618比較,正確結(jié)論是
A.甲批次的總體平均數(shù)與標(biāo)準值更接近
B.乙批次的總體平均數(shù)與標(biāo)準值更接近
C.兩個批次總體平均數(shù)與標(biāo)準值接近程度相同
D.兩個批次總體平均數(shù)與標(biāo)準值接近程度不能確定
答案 A
解析 甲批次的平均數(shù)為0.617,乙批次的平均數(shù)為0.613
例10.設(shè)離散型隨機變量可能取的值為1,2,3,4。(1,2,3,4)。又的數(shù)學(xué)期望,則 ;
解析:設(shè)離散性隨機變量可能取的值為,所以,即,
又的數(shù)學(xué)期望,則,即,,∴ 。
點評:均值計算時要根據(jù)公式進行簡化計算,從而達到簡化運算的目的
題型6:隨機變量的方差
例11.甲、乙兩名工人加工同一種零件,兩人每天加工的零件數(shù)相等,所得次品數(shù)分別為ε、η,ε和η的分布列如下:
ε |
0 |
1 |
2 |
η |
0 |
1 |
2 |
P |
|
|
|
P |
|
|
|
試對這兩名工人的技術(shù)水平進行比較。
分析:一是要比較兩名工人在加工零件數(shù)相等的條件下出次品數(shù)的平均值,即期望;二是要看出次品數(shù)的波動情況,即方差值的大小
解析:工人甲生產(chǎn)出次品數(shù)ε的期望和方差分別為:
,
;
工人乙生產(chǎn)出次品數(shù)η的期望和方差分別為:
,
;
由Eε=Eη知,兩人出次品的平均數(shù)相同,技術(shù)水平相當(dāng),但Dε>Dη,可見乙的技術(shù)比較穩(wěn)定。
點評:期望僅體現(xiàn)了隨機變量取值的平均大小,但有時僅知道均值的大小還不夠。如果兩個隨機變量的均值相等,還要看隨機變量的取值如何在均值周圍變化,即計算方差。方差大說明隨機變量取值較分散,方差小說明取值分散性小或者取值比較集中、穩(wěn)定。
題型7:正態(tài)分布
例12.2009全國卷Ⅱ文)(本小題滿分12分)某車間甲組有10名工人,其中有4名女工人;
乙組有10名工人,其中有6名女工人。現(xiàn)采用分層抽樣(層內(nèi)采用不放回簡單隨即抽樣)從甲、乙兩組中共抽取4名工人進行技術(shù)考核
(1)求從甲、乙兩組各抽取的人數(shù);
(2)求從甲組抽取的工人中恰有1名女工人的概率;
(3)求抽取的4名工人中恰有2名男工人的概率。
解析 本題考查概率統(tǒng)計知識,要求有正確理解分層抽樣的方法及利用分類原理處理事件概率的能力,第一問直接利用分層統(tǒng)計原理即可得人數(shù),第二問注意要用組合公式得出概率,第三問關(guān)鍵是理解清楚題意以及恰有2名男工人的具體含義,從而正確分類求概率.
解 (1)由于甲、乙兩組各有10名工人,根據(jù)分層抽樣原理,要從甲、乙兩組中共抽
取4名工人進行技術(shù)考核,則從每組各抽取2名工人.
(2)記表示事件:從甲組抽取的工人中恰有1名女工人,則
(3)表示事件:從甲組抽取的2名工人中恰有名男工人,
表示事件:從乙組抽取的2名工人中恰有名男工人,
表示事件:抽取的4名工人中恰有2名男工人。
與獨立, ,且
故
6.正態(tài)分布
正態(tài)分布密度函數(shù):,均值為Eε=μ,方差為。
正態(tài)曲線具有以下性質(zhì):
(1)曲線在x軸的上方,與x軸不相交
(2)曲線關(guān)于直線x =μ對稱
(3)曲線在x =μ時位于最高點。
(4)當(dāng)x <μ時,曲線上升;當(dāng)x >μ時,曲線下降。并且當(dāng)曲線向左、右兩邊無限延伸時,以x軸為漸近線,向它無限靠近。
(5)當(dāng)μ一定時,曲線的形狀由σ確定。σ越大,曲線越“矮胖”,表示總體越分散;σ越小,曲線越“瘦高”,表示總體的分布越集中。
從理論上講,服從正態(tài)分布的隨機變量的取值范圍是R,但實際上取區(qū)間(μ-3σ,μ+3σ)外的數(shù)值的可能性微乎其微,在實際問題中常常認為它是不會發(fā)生的。因此,往往認為它的取值是個有限區(qū)間,即區(qū)間(μ-3σ,μ+3σ),這即實用中的三倍標(biāo)準差規(guī)則,也叫3σ規(guī)則。在企業(yè)管理中,經(jīng)常應(yīng)用這個規(guī)則進行產(chǎn)品質(zhì)量檢查和工藝生產(chǎn)過程控制。
5.幾種特殊的分布列
(1)兩點分步
兩點分布:對于一個隨機試驗,如果它的結(jié)果只有兩種情況,則我們可用隨機變量,來描述這個隨機試驗的結(jié)果。如果甲結(jié)果發(fā)生的概率為P,則乙結(jié)果發(fā)生的概率必定為1-P,所以兩點分布的分布列為:
|
1 |
0 |
P |
P |
1-p |
均值為E=p,方差為D=p(1-p)。
(2)超幾何分布
重復(fù)進行獨立試驗,每次試驗只有成功、失敗兩種可能,如果每次試驗成功的概率為p,重復(fù)試驗直到出現(xiàn)一次成功為止,則需要的試驗次數(shù)是一個隨機變量,用ξ表示,因此事件{ξ=n}表示“第n次試驗成功且前n-1次試驗均失敗”。所以,其分布列為:
ξ |
1 |
2 |
… |
n |
… |
P |
p |
p(1-p) |
… |
|
… |
(3)二項分布
如果我們設(shè)在每次試驗中成功的概率都為P,則在n次重復(fù)試驗中,試驗成功的次數(shù)是一個隨機變量,用ξ來表示,則ξ服從二項分布.則在n次試驗中恰好成功k次的概率為:
二項分布的分布列為:
ξ |
0 |
1 |
… |
|
… |
n |
P |
|
|
… |
|
… |
|
記ε是n次獨立重復(fù)試驗?zāi)呈录l(fā)生的次數(shù),則ε-B(n,p);其概率…。期望Eε=np,方差Dε=npq。
4.隨機變量的均值和方差
(1)隨機變量的均值
…;反映隨機變量取值的平均水平
(2)離散型隨機變量的方差:
……;反映隨機變量取值的穩(wěn)定與波動,集中與離散的程度。
基本性質(zhì):;。
3.獨立
相互獨立事件:事件A(或B)是否發(fā)生對事件B(或A)發(fā)生的概率沒有影響.這樣的兩個事件叫做相互獨立事件。
獨立重復(fù)試驗:若n次重復(fù)試驗中,每次試驗結(jié)果的概率都不依賴于其他各次試驗的結(jié)果,則稱這n次試驗是獨立的
公式
(1)兩個相互獨立事件同時發(fā)生的概率,等于每個事件發(fā)生的概率的積,即P(A·B)=P(A)·P(B);
推廣:若事件A1,A2,…,An相互獨立,則P(A1·A2…An)=P(A1)·P(A2)·…·P(n)。
(2)如果在一次試驗中某事件發(fā)生的概率為P,那么在n次獨立重復(fù)試驗中這個事件恰好發(fā)生k次的概率:Pn(k)=CPk(1-P)n-k。
2.離散性隨機變量的分布列
一般地,設(shè)離散型隨機變量可能取得值為:
X1,X2,…,X3,…,
取每一個值Xi(I=1,2,…)的概率為P(,則稱表
|
X1 |
X2 |
… |
xi |
… |
P |
P1 |
P2 |
… |
Pi |
… |
為隨機變量的概率分布,簡稱的分布列。
兩條基本性質(zhì):①…);②P1+P2+…=1。
1.隨機變量的概念
如果隨機試驗的結(jié)果可以用一個變量來表示,那么這樣的變量叫做隨機變量。隨機變量常用希臘字母ξ、η等表示。
對于隨機變量可能取的值,我們可以按一定次序一一列出,這樣的隨機變量叫做離散型隨機變量。
注:隨機變量ξ是關(guān)于試驗結(jié)果的函數(shù),即每一個試驗結(jié)果對應(yīng)著一個實數(shù);隨機變量ξ的線性組合η=aξ+b(a、b是常數(shù))也是隨機變量。
2.卡方檢驗
統(tǒng)計中有一個有用的(讀做“卡方”)統(tǒng)計量,它的表達式是:
,經(jīng)過對統(tǒng)計量分布的研究,已經(jīng)得到了兩個臨界值:3.841與6.635。當(dāng)根據(jù)具體的數(shù)據(jù)算出的k>3.841時,有95%的把握說事件A與B有關(guān);當(dāng)k>6.635時,有99%的把握說事件A與B有關(guān);當(dāng)k3.841時,認為事件A與B是無關(guān)的。
隨機變量
湖北省互聯(lián)網(wǎng)違法和不良信息舉報平臺 | 網(wǎng)上有害信息舉報專區(qū) | 電信詐騙舉報專區(qū) | 涉歷史虛無主義有害信息舉報專區(qū) | 涉企侵權(quán)舉報專區(qū)
違法和不良信息舉報電話:027-86699610 舉報郵箱:58377363@163.com