第五章自变量的选择内容摘要:
pppppppppxBxxXXxxDxDyxyD )~()ˆ( ppxyDxyD ][ 11111112 qqqppqpp xDxxCDBxxCDxxBCCDBx 0)()( 1112 qpqp xxBCDxxBC (3) 由于22 )]~([)~()~(pppppp xyExyDxyE 又 : qpqqppppp CBXXXXE 11)(~ )()()]~[()()~(112111pqqqpqppqpqqpqqqpppppxBCxxBCxxyExBCxCBxxCBxxxxyE 22 1 1111 2 11ˆ( ) ( )[ ( ) ( ) ][ ( ) ( ) ]( ) ( ) ( ) 0ppq p q pq p q q q pq p q q q pD y x E y xx C B x D x C B xx C B x x C B xx C B x D x C B x 注 : 由上述定理说明 , 若全模型为真的而误用选模型ppx ~作为y值的预测的话 , 所得的估计是有偏的 . 但预测方差会有所下降。 而对有偏的估计,一般可用均方差去表明估计的好坏 , 在均方误差的意义下,预测的均方误差也是会下降。 所以删去一些影响不大,但回归系数方差过大的变量(用qqqD ˆ为非负定矩阵来表示) , 对预测精度的提高是 有利的 . 综合以上所述 , 一般我们尽可能使模型的变量少而精 , 要引入对y有显著影响的变量 , 而对y并不很显著的变量要删除 , 这样不仅对估计而且对预测也有利 . 167。 自变量选择准则 若一个多元回归的问题中有t可供选择的自变量,那么所有可能的回归方程有 12 t 个 , 下面给出一些自变量选择的准则,希望能从 12 t 个回归方程中选择一个最合理的方程 . 先给出一些记号: 对全模型,记: SSTSSERXXXXHYHIYSSE 1,)(,)(21 对选模型,记: SSTSSERXXXXHYHIYSSEppppppppp1,)(,)(21 前面已说明对一切p有22pp RRS SES SE ,即全模型的残差平方和总达到最小,而复相关系数总达到最大, 因此残差平方和和复相关系数均不能作为选择变量的准则。 下面从不同的角度给出自变量选择的准则。 从模型拟合角度考虑 . 准则 1 平均残差平方和达到最小 . pnSSE Pp2~ pS S E随p的增加而减少 , 但pn 也随p的增加而减少。 但前面的ix,由于其对y的作用很显著 , 使pS S E减少得 较快 , 能使pnSSEp随的p增加而减少 , 但当ix对y的作用不明显时 , 随差p的增加,pS S E减少的很慢,而pn 1随p的增加继续增加,这就使()PSS E n p随p的增加而增加,取()PSS E n p的最小值所对应的p。 当然相应入选p个变量是所有t个变量是所有自变量中最显著的。 (其显著性由计算t统计量或 F统计量得出)。 准则 2 修正的复相关系数2PR达到最大。 其中2PR的定义为, )1()(12nSSTpnSSER PP pnnR p1)1(1 2 可以证明在0q时,22qpp RR ,故取2pR达到最大的方程为好。 从预测角度考虑。 为了叙述方便,先给出下面记号。 记: nqnpqpqpnxxxxxxxxxX221139。 39。 239。 1 其中 : iqipixxx,ni 2,1 从而有 qqpqqpppXXXXXXXXXX 其中: 39。 ipippp xxXX,39。 iqipqp xxXX , 39。 ipiqpq xxXX , 39。 iqiqqq xxXX 准则 3 预测偏差的方差pJJ达到最小 2~)(pp pnJJ 前节中已计算 ppxyD ~39。 =2139。 ))(1( pppp xXXx,所以在n个样本点上的预测偏差的平方和为: 39。 39。 1 2( ) ( 1 ( ) )i i p p i p p p i piiD y x x X X x 239。 12)( iipipppxxXXtrn 2)( pn 2 是未知参数,用2~p作为 2。第五章自变量的选择
相关推荐
產權者,為具備該款之意圖。 」 刑事責任 • 著 93 • 有下列情形之一者,處二年以下有期徒刑、拘役,或科或併科新臺幣五十萬元以下罰金: ……………………………… • 四、違反第八十七條第一項第七款規定者。 行政介入權 • 著 97條之 1 – 事業以公開傳輸之方法,犯第九十一條、第九十二條及第九十三條第四款之罪,經法院判決有罪者,應即停止其行為;如不停止
vrsvrs SS )(x 無內彙自由度 自旋為 0 ‧ 無荷 )(j ,LLi=0 ‧ 完全集展開 kax )()()()( xxx )(v2 1 ki k xki k xk kaeaew場算符 x tkx k2122 )( mw 色散關係 四維波向量 ))0,()0
址 — 网络号为 “ 0”,向本网络某主机发送报文。 “ 0”—“本 ” 回送地址 — 用于测试 IP的分配目前由 INTERNET名字和编号分配协会( ICNN)管理 需要注意的 IP地址。 IP实质上是对应一个节点的物理连接。 (类似现实中一个单位有 2个门牌)。 故 IP不是节点的 唯一性标识。 2个门牌时,从 A门出和 B门出可能有不同的效果。 若 A门不通时,而
εmax为 : 1 104 L mol1cm- 1。 ⑷ n → π * 跃迁 需能量最低,吸收波长 λ200nm。 这类跃迁在跃迁选律上属于禁阻跃迁,摩尔吸光系数一般为 10~ 100 Lmol1 cm1, 吸收谱带强度较弱。 分子中孤对电子和 π键同时存在时发生 n →π * 跃迁。 丙酮 n →π * 跃迁的 λ为 275nm εmax为 22 Lmol1 cm 1( 溶剂环己烷 )。