chapter14simplelinearregression内容摘要:
Σ(xi x)2 σ t 檢定 由於 σ值未知,所以用 s值來估計 σ,再求出 σb1的估計值,記作 sb1。 b1的估計標準差 sb1 = Σ(xi x)2 s 利用 t 檢定檢驗簡單線性迴歸的顯著性 H0: β1 =0 Ha: β1≠0 檢定統計量 t = 拒絕法則 P值法:若 p≦ α,則拒絕 H0 臨界值法:若 t ≦ tα/2或 t ≧ tα/2 ,則拒絕 H0 其中, tα/2係依自由度 n2之 t分配求得 b1 sb1 檢定亞曼披薩屋的變數間是否有顯著關係 : 顯著水準是 α=,雙尾檢定 檢定統計量 t = = = → 由 t分配表可得,自由度為 n2=8時, t值為。 → 由於此檢定為雙尾檢定 ,我們將此值加倍後,可知與 t= p *2= →reject H0 β1≠0 ,學生人數與銷售額存在顯著的關係 b1 sb1 5 β1的信賴區間 β1的信賴區間形式如下: b1 177。 tα/2 sb1 若要對亞曼披薩屋的 β1建立 99%的信賴區間,查表可得,對應於 α= n2=8的自由度,t = → β 1的 99%信賴區間估計值是 b1 177。 tα/2 sb1 =5 177。 ()=5 177。 或 β1的信賴區間 以 t 檢定做顯著性檢定時,檢定的假設是: H0: β1 =0 Ha: β1≠0 → 在 α=,由於 β1的假設值為0,並不在信賴區間 ,因此拒絕虛無假設 H0。 → 學生人數與銷售額間有統計上的顯著關係。 F 檢定 如果只有一個自變數,在檢定迴歸關係顯著性時, F檢定與 t檢定的結論相同。 但是如果有一個以上的自變數時, 只有 F檢定可以測試全體自變數與應變數間的顯著關係。 使用 F檢定決定迴歸關係是否有顯著性所根據的邏輯是由兩個互相獨立的 σ2估計值發展而得。 F 檢定 σ2的兩個估計值 (1)誤差均方 MSE= (2)若 H0: β1 =0為真 迴歸均方 MSR= = SSR 迴歸自由度 自變數個數 SSR SSE n 2 利用 F 檢定檢驗簡單線性迴歸的顯著性 H0: β1 =0 Ha: β1≠0 檢定統計量 F = 拒絕法則 P值法:若 p≦ α,則拒絕 H0 臨界值法:若 F≧ Fα ,則拒絕 H0 其中, Fα係依分子自由度為 1,分母自由度為 n2之 F分配求得 MSR MSE 簡單線性迴歸的 ANOVA表的一般形式 變異來源 自由度 均方 平方和 F 迴歸項 誤差項 總和 SSR SSE SST 1 n 1 n 2 MSR= SSR 1 MSE= SSE n 2 MSR MSE F= 以亞曼披薩屋為例進行 F檢定: 檢定統計量 → 根據 F分配表,分子自由度為 1,分母自由度為 n2=8時, F=。 → F= →P < =α Reject H0 學生人數與銷售額間存在顯著關係 MSR MSE F = = 14200 = 亞曼的披薩屋的 ANOVA表 變異來源 自由度 均方 平方和 F 迴歸項 誤差項 總和 14200 1530 15730 1 9 8 14200 1 =14200 1530 8 14200 = = 解釋顯著性檢定時的注意事項 拒絕 H0: β1 =0並得到 x和 y存在顯著關係的結論,並不等於認定 x與 y間有因果關係。 拒絕 H0: β1 =0並證明存在統計顯著性,並不能認定 x與 y有線性關係,僅能說 x與 y有相互關係。 當顯著關係已知時,樣本中觀察到的 x範圍可以放心地用估計迴歸方程式做預測。 但超過此自變數範圍進行預測時應該非常小心。 非線性關係之線性近似的例子 x y y = b0+ b1x ^ 實際關係 x之 最小值 x之 最大值 可觀察到的 x範圍 運用最小平方法,我們獲得估計的簡單線性迴歸方程式。 若結果顯示 x與 y間在統計上有顯著關係,而且估計迴歸方程式的適合度甚佳,則利用此估計迴歸方程式應該有助於進行估計與預測。 點估計 在披薩屋一例中 ,估計迴歸方程式 y=60+5x是學生人數 x與每季銷售額 y間關係的估計。 利用此估計迴歸方程式來求算特定 x值所對應 y的平均數之點估計值或者預測對應已知 x值之單獨 y值。 因此,對所有鄰近學生人數為 10,000人 (x= 10)之校園的餐廳而言,平均每季銷售額的點估計為 y=60+5 (10) =110,即 $110,000。 ˆ ˆ 區間估計 第一種型態的區間估計,信賴區間(confidence interval),係對一已知 x值所對應之 y平均數做區間估計。 第二種型態的區間估計,預測區間(prediction interval),則用於對一已知 x值所對應之個別 y值做區間估計。 xp=自變數 x的特定值或已知值 yp=對應於已知 xp值的應變數 y值 E(yp)=對應於已知 xp值的應變數 y值的平均數或期望值 yp= b0+ b1 xp=E(yp)的點估計值,當 x=xp Y之平均數的信賴區間估計 ˆ 通常,我們不能期望 yp恰等於 E(yp)。 如果希望推論有關 yp與實際每季平均銷售額 E(yp)的接近程度,則必須估計 yp的變異數。 ˆ ˆ ˆ Syp=s2[ + ] ̂ 1 n ( xP – x )2 Σ ( xi – x )2 2 () () Syp=s + ̂ 1 n (xP x)2 Σ (xi x)2 再給定的 xp下,估計 yp之變異數時的公式,記作Syp ,表示如下。 2 ˆ ˆ Yp標準差的估計值為式 ()的平方根,公式如下。 ̂ = .1282 = Syp= + ̂ 1 10 (1014)2 568 s=。chapter14simplelinearregression
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。