多元统计分析多元正态分布(编辑修改稿)内容摘要:

统聚类法是诸聚类分析方法中使用最多的一种,按下列步骤进行: 计算 n个样品两两之间的距离,构成距离矩阵 合并距离最近的两类为一新类 计算新类与当前各类的距离。 再合并、计算,直至只有一类为止 画聚类图,解释 类与类之间的距离 (single linkage) (plete linkage) (median method) (centroid method) (average linkage) (flexiblebeta method) (Ward39。 s minimum variance method) (一) 最短距离法 (single linkage, nearest neighbor) 类类间 :两类间两两 样品距离最短。 x21• x12• x22• x11• 13d递推公式 最短距离法 聚类的步骤 定义样品之间的距离,计算初始距离矩阵 D(0) 找出 D(0)中非对角线上的最小值,设为 Dpq,将对应的两类 Gp和 Gq合并成一个新类,记为 Gr ,即 Gr=(Gp, Gq) 计算新类与其它类之间的距离,得距离矩阵 D(1)。 用 D(1)代替 D(0),重复 3的过程得 D(2),如此下去直到所有样品合并成一类为止。 例 1 设抽取五个样品 , 每个样品只侧一个指标 , 他们是 1, 2, , 7, 9, 试用最短距离法对五个样品进行分类。 D( 0) 表 1 D(0) G1={X1}G2={X2}G3={X3}G4={X4}G5={X5} G1={X1} 0 G2={X2} 1 0 G3={X3} 0 G4={X4} 6 5 0 G5={X5} 8 7 2 0 D( 1) 表 2 D(1) G6 G3 G4 G5 G6={X1, X2} 0 G3={X3} 0 G4={X4} 5 0 G5={X5} 7 2 0 D( 2) 表 3 D(2) G7 G4 G5 G7={X1, X2,X3} 0 G4={X4} 0 G5={X5} 2 0 D( 3) 表 4 D(3) G7 G8 G7={X1, X2,X3} 0 G8={X4,X5} 0 聚类谱系图 (二) 最 长 距离法 ( Furthest Neighbor ) 类类间 :两类间两两样品距离最长的 • • • x11• x21• • • • 12d递推公式 D( 0) 表 1 D(0) G1 G2 G3 G4 G5 G1={X1} 0 G2={X2} 1 0 G3={X3} 0 G4={X4} 6 5 0 G5={X5} 8 7 2 0 D( 1) 表 2 D(1) G6 G3 G4 G5 G6={X1, X2} 0 G3={X3} 0 G4={X4} 6 0 G5={X5} 8 2 0 D( 2) 表 3 D(2) G6 G7 G3 G6={X1, X2} 0 G7={X4, X5} 8 0 G3={X3} 0 D( 3) 表 4 D(3) G7 G8 G7={X4,X5 } 0 G8={X1, X2,X3} 8 0 (三)中间距离法 Median method 如果在某一步将类 Gp与 Gq类合并为 Gr, 任一类 Gk和新Gr的距离公式为: 当 时 , 由初等几何知就是上面三角形的中线。 D2( 0) G1 G2 G3 G4 G5 G1={X1} 0 G2={X2} 1 0 G3={X3} 0 G4={X4} 36 25 0 G5={X5} 64 49 4 0 D2( 1) G6 G3 G4 G5 G6={X1, X2} 0 G3={X3} 4 0 G4={X4} 0 G5={X5} 4 0 D2( 2) G7 G4 G5 G7 0 G4 0 G5 4 0 D2( 3) G7 G8 G7={X1, X2,X3} 0 G8={X4,X5 } 0 (四) 重心法 ( Centroid clustering): • • 类类间 : 两类重心之间的距离即 均值点间的距离 递推公式 注意 :初始距离用欧式距离则有下列 D2( 0) G1 G2 G3 G4 G5 G1={X1} 0 G2={X2} 1 0 G3={X3} 0 G4={X4} 36 25 0 G5={X5} 64 49 4 0 D2( 1) G6 G3 G4 G5 G6={X1, X2} 0 G3={X3} 4 0 G4={X4} 0 G5={X5} 4 0 D 2( 2) G7 G4 G5 G7={X1, X2 X3} 0 G4={X4} 0 G5={X3}。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。