市场研究中数据分析方法培训讲义(编辑修改稿)内容摘要:
1 . 8 0 01 1 . 2 4 7 3 . 9 6 4 4 . 1 4 2 2 . 0 3 6 1 0 . 7 2 41 2 ** . 0 0 0 3 . 9 7 4 8 5 . 9 3 4 1 . 0 2 6 9 3 . 1 9 41 1 . 8 6 2 3 . 9 9 6 . 7 4 8 2 . 0 0 4 1 1 . 6 5 51 1 . 6 4 6 3 . 9 4 5 1 . 6 6 0 2 . 0 5 5 7 . 3 6 22 2 . 9 3 4 3 . 9 8 4 . 4 2 8 1 . 0 1 6 8 . 6 9 82 2 . 0 6 2 3 . 9 4 6 7 . 3 2 0 1 . 0 5 4 1 3 . 0 4 22 1 ** . 0 9 1 3 1 . 0 0 0 6 . 4 5 7 2 . 0 0 0 2 1 . 7 9 02 2 . 5 7 4 3 1 . 0 0 0 1 . 9 9 4 1 . 0 0 0 1 7 . 4 2 82 2 . 0 2 7 3 1 . 0 0 0 9 . 2 0 8 1 . 0 0 0 4 5 . 5 3 9C a s e N u m b e r123456789101112131415123456789101112O r i g i n a lC r o s s v a l i d a t e daA c t u a l G r o u pP r e d i c t e dG r o u p p dfP ( D d | G = g )P ( G = g | D = d )S q u a r e dM a h a l a n o b i sD i s t a n c e t oC e n t r o i dH i g h e s t G r o u pG r o u p P ( G = g | D = d )S q u a r e dM a h a l a n o b i sD i s t a n c e t oC e n t r o i dS e c o n d H i g h e s t G r o u pF u n c t i o n 1D i s c r i m i n a n tS c o r e sF o r t h e o r i g i n a l d a t a , s q u a r e d M a h a l a n o b i s d i s t a n c e i s b a s e d o n c a n o n i c a l f u n c t i o n s .F o r t h e c r o s s v a l i d a t e d d a t a , s q u a r e d M a h a l a n o b i s d i s t a n c e i s b a s e d o n o b s e r v a t i o n s .M i s c l a s s i f i e d c a s e* * . C r o s s v a l i d a t i o n i s d o n e o n l y f o r t h o s e c a s e s i n t h e a n a l y s i s . I n c r o s s v a l i d a t i o n , e a c h c a s e i s c l a s s i f i e d b y t h e f u n c t i o n s d e r i v e d f r o m a l l c a s e s o t h e r t h a n t h a tc a s e .a . 表中最大概率组一栏是判别分析得出的组别。 1 15号代理商属于“非购买组”,14号代理商属于“购买组”。 第三节 聚类分析 一、聚类分析的基本思想 • 聚类分析 (又称数字分类学 )是新近发展起来的一种研究分类问题的多元统计分析方法。 • 样品聚类是对事件进行聚类,或是说对观测量进行聚类,是对反映被观测对象的特征的变量值进行分类。 • 变量聚类则是当反映事物特点的变量很多时,根据所研究的问题选择部分变量对事物的某一方面进行研究的聚类方法。 二、距离与相似系数 (一)常用的距离指标有 • 欧式距离 • 欧式距离的平方 • 曼哈顿距离 • 切比雪夫距离 (二)常用的相似系数指标主要有 余弦系数 皮尔逊相关系数 (三)定类数据的距离 卡方距离 法方距离 三、聚类方法 1.层次聚类法 2.迭代聚类法 四、聚类分析的主要步骤 确定研究 的问题 计算 相似性 聚类 聚类结果的 解释和证实 • 某家具公司为了对市场进行的细分,对购买家具的顾客进行了一次市场调查。 这次调查的指标有:喜爱的款式(老式为 1,新式为 2),图案(素式为 1,格字为 2,花纹为 3);颜色(蓝色为 1,黄色为 2,红色为 3,绿色为 4)。 调查样本为 30人。 五、实例分析: 顾客 式样 图案 颜色 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26。市场研究中数据分析方法培训讲义(编辑修改稿)
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。