回歸分析在概率圖紙法中的運用

時間:2022-03-18 08:03:00

導語:回歸分析在概率圖紙法中的運用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

回歸分析在概率圖紙法中的運用

【關(guān)鍵詞】線性回歸;概率圖紙;Excel軟件;概率分布;

摘要:概率圖紙法在隨機變量分布的檢驗中有快捷簡便的優(yōu)點,但精確度不高。結(jié)合回歸分析理論,利用Excel軟件能克服這些缺點。

關(guān)鍵詞:線性回歸;概率圖紙;Excel軟件;概率分布;

分布參數(shù)一般在進行參數(shù)假設(shè)檢驗之前,需要對母體的分布類型進行推斷。概率圖紙法是一種常用的檢驗方法,目前常用的有正態(tài)、對數(shù)正態(tài)、二項分布、指數(shù)分布和威布爾分布概率圖紙等。概率圖紙法使用簡單,但準確性不高。運用回歸分析的方法,結(jié)合概率圖紙能對母體的分析類型和參數(shù)作出較為準確的推斷。本研究用線性回歸理論在正態(tài)概率圖紙法的運用中說明這種方法的過程。

1正態(tài)概率圖紙的構(gòu)造原理及使用

11構(gòu)造原理

設(shè)母體ξ的分布函數(shù)F(x)服從正態(tài)分布N(μ,θ)

F(x)=12π〖JF(Z〗x-∞e-(t-u)22σ2dt〖JF)〗=12π〖JF(Z〗t-uσ-∞e-z22dt〖JF)〗

=Φ(x-uσ)=Φ(z)

Z(x)服從標準正態(tài)分布N(0,1),函數(shù)Z(x)=x-uσ(I)是x的線性函數(shù),在(x,z(x))直角坐標平面上是一條直線。

正態(tài)概率圖紙上,橫軸的刻度表示x,縱軸上先刻出z的刻度(均勻),然后根據(jù)標準正態(tài)分布N(0,1)表查出對應(yīng)的分布函數(shù)值Φ(z),刻在z的位置上,然后把z的刻度去掉,留下x與F(x)(即Φ(z))的刻度,就構(gòu)成一張正態(tài)概率圖紙。

12使用方法

若假設(shè)的分布類型正確,則母體中抽得子樣數(shù)據(jù)在該種分布的概率圖紙上繪制的點基本在一條直線上,否則研究的隨機變量就不服從假設(shè)的分布類型。這種方法不僅可以檢驗分布類型還可以進行參數(shù)估計,但都采用目測,精確度不高。

2線性回歸理論在概率圖紙法中的運用

利用線性回歸理論,結(jié)合Excel軟件不僅可計算z與x間的線性相關(guān)程度,還可算出隨機變量x的分布參數(shù)的點估計什和區(qū)間估計。

21實例運用

檢驗?zāi)承吞柌AЪ埖臋M向延伸率是否服從正態(tài)分布,測得數(shù)據(jù)如下[1]:

右端點X36.538.540.542.544.546.548.550.5累計頻率%715263544567387概率F(X)0.070.150.260.350.440.560.730.87右端點X52.554.556.558.560.562.564.5累計頻率%929597979999100概率F(X)0.920.950.970.970.990.990.995步驟如下:

①把上表確立的點(x,F(x))標在正態(tài)概率圖紙上。觀察點的分布大概在一條直線附近,估計變量的分布服從正態(tài)分布。以下計算在Excel軟件中進行。

②編輯函數(shù)NORMINV(F(X),0,1)計算出每一個F(X)(即Φ(z)對應(yīng)的Z值),將正態(tài)概率圖紙上的點坐標轉(zhuǎn)為(X,Z)。X36.538.540.542.544.546.548.550.5Z-1.47579-1.03643-0.64335-0.38532-0.15097-0.1509690.6128131.126391X52.554.556.558.560.562.564.5Z1.4050721.6448541.8807941.8807942.3263482.3263482.575829③ZX有線性相關(guān)性的檢驗。用PEARSON相關(guān)系數(shù)r=SxzSxSz,|r|≤1,|r|的值越接近1則ZX線性相關(guān)程度越高。

其中:Sx=∑ni=1(xi-)2n,Sz=∑ni=1(zi-)2n,

Sxz=1n∑ni=1(xi-)(zi-)

編輯函數(shù)PEARSON(array1,array2),其中array1為X的集合,array2為Z的集合,r=0.989295,可見ZX之間相關(guān)性極高。

④求出回歸方程z=bx+a(II),其中b=∑ni=1(xi-)(zi-)∑ni=1(xi-)2,a=-b

編輯函數(shù)SLOPE(array1,array2)計算出b=0.147011的值,其中array1為Z的集合,array2為X的集合,在Excel中編輯函數(shù)INTERCEPT(array1,array2)計算出a=-6.60818的值,則ZX間的線性回歸方程為Z=0.147011x-6.60818,根據(jù)線性回歸理論可得分布參數(shù)的點估計值σ=1b=6.802203,u=-ab=44.95015。

⑤回歸方程的顯著性檢驗:構(gòu)造統(tǒng)計量F=SSR/1SSE/(n-2)~F(1,n-2)進行檢驗。其中SSR=∑(i-)2,SSE=∑(zi-)2,計算得F=597.4379。取顯著水平α=0.01,編輯函數(shù)FINE(0.01,1,n-2)得臨界值F0.01(1,13)=9.073806,則ZX間的線性回歸方程z=0.147011x-6.60818在顯著水平=0.01的水平下有顯著意義。

⑥分布區(qū)間的參數(shù)估計:回歸方程z=bx+a中的回歸系數(shù)b的可信區(qū)間為b±tα/2,n-2Sb,其中:Sb=Szxlxx,Szx=SSEn-2,lxx=∑ni=1(xi-)2=1120。編輯函數(shù)TINVE(0.05,n-2)得t臨界值。

t(0.025,13)=2.160369,Sb=0.040774,b的0.95的置信區(qū)間為(0.058925,0.235097),由a=-b得a的0.95的置信區(qū)間為(-11.0565,-2.15984)。

由分布參數(shù)的點估計σ=1b,u=-ab,a=-b得σ和u的區(qū)間估計。

σ的區(qū)間估計為(4.253561,16.97065),u的區(qū)間估計為(36.6538,47.0296),置信度均為0.95。3推廣應(yīng)用

從上述過程中可見對于母體分布能用概率圖紙法檢驗,就可結(jié)合回歸理論進行精確計算。同時,對于某些隨機變量的函數(shù),若其分布能用某種概率圖紙法檢驗,也可用上述方法計算。

參考文獻

1魏宗舒.概率論與數(shù)理統(tǒng)計教程高等教育出版社,2002

2王曉明Excel2002高級運用―數(shù)理統(tǒng)計機械工業(yè)出版社,2003

3劉璋溫,戴樹森,方開泰概率紙淺說科學出版社,1980