第3章资料的探索内容摘要:

Education Taiwan) 視覺化技術:直方圖  直方圖 :通常用來顯示單一屬性的分佈情形  範例:鳶尾花屬性的直方圖(分別有 10和 20個箱子) 169。 2020 台灣培生教育出版 (Pearson Education Taiwan) 二維直方圖  將每個屬性分成兩個區間,再將其區間的資料視為兩個維度  範例:顯示花瓣長和花瓣寬的二維直方圖 – 從中可以發現什麼。 169。 2020 台灣培生教育出版 (Pearson Education Taiwan) 視覺化技術:盒狀圖  盒狀圖 – J. Tukey 發明 – 另一種呈現單一數值屬性分佈的作法 – 下圖是萼長的盒狀圖,在箱子的最底層及最上層分別為第 25及第 75個百分位數,而中間的線則為第 50個百分位數。 上方及下方的線分別為第 10及第90個百分位數。 離群值則用「 +」來表示 169。 2020 台灣培生教育出版 (Pearson Education Taiwan) 盒狀圖的範例  盒狀圖可以用來比較不同物件類別間屬性的差異 169。 2020 台灣培生教育出版 (Pearson Education Taiwan) 視覺化技術:散佈圖  散佈圖 – 用來呈現兩個屬性間的關係 – 可用來偵測非線性關係 – 二維或三維圖形可用來表示額外的屬性,但資料愈多,視覺化圖形會愈複雜,更不易解釋 169。 2020 台灣培生教育出版 (Pearson Education Taiwan) 鳶尾花資料的散佈圖 169。 2020 台灣培生教育出版 (Pearson Education Taiwan) 視覺化技術:等高線圖  等高線 – 對於三維度資料而言,二維度屬性是指平面上的位置,第三維是連續值,像是氣溫等,這時就可以用等高線圖來將平面分成不同區域,第三個屬性的值(如溫度或海拔高度)大都相等。 常見的等高線圖範例是顯示陸地的海拔高度 169。 2020 台灣培生教育出版 (Pearson Education Taiwan) 等高線範例 Celsius 1998年 12月平均海平面溫度的等高線圖 169。 2020 台灣培生教育出版 (Pearson Education Taiwan) 視覺化技術:矩陣(高維度資料)  矩陣 – 其圖形可以視為一個點矩陣,每個陣列上的元素都是一個顏色或是亮度,所以資料矩陣上的元素都是圖形上的像素資訊 – 若其類別標記已知,重新排序資料矩陣是有必要的,如此一來可以將類別中的物件聚類在一起 – 若要偵測是否所有類別中的物件具有相似的屬性,如其屬性有不同的全距,則其屬性通常可以將其標準化,使其平均數為 0且標準差為 1。 這可以避免屬性的值過大或太小而決定了圖形 – 可以。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。