企业智慧报告内容摘要:

最代表性的演算法之ㄧ  Apriori利用簡單且循序漸進的方式,找出資料項目間的關聯規則。 Apriori演算法 (2/2)  Apriori演算法分為四個階段 :  發掘高頻項目集 L1  產生候選項目 : 1) 高頻項目集組合 2) 刪減候選項目集  掃描整個資料庫,根據刪減後之 Ck+1進行比對,找出 Lk+1。  重複以上步驟,直到無法發掘出高頻項目集為止,並根據發掘之高頻項目集推導出關聯規則 資料庫簡述與選取 (1/3)  資料庫來源  資料來源為行政院農委會農糧署農產品交易行情資料庫,有效資料共有 11個水果批發市場之行情交易資料。  資料庫選取範圍  研究選取台北一市、台北二市、三重市、台中市、嘉義市、高雄市六個消費地果品批發市場。  資料庫選取期間  研究選取 1996年元月至 2020年 2月之夏季、冬季果品。  資料類型  由於月資料大多用於生產種植與投資決策,對於短期銷售決策助益不大,基於研究之目的,選取果品日交易資料作為資料類型。 資料庫簡述與選取 (2/3) 進行資料探勘前,需將資料庫進行前置處理,將無效、重複資料清除,並將資料轉為探勘之格式,已利探勘之進行與結果之解讀。 下圖為資料探勘詳細流程: 原始資料匯入 SQL資料庫 選取夏、冬季日資料,清除無效資料 計算各果品夏、冬兩季 1. 價格之平均值、標準差 2. 交易量平均值、標準差 3. 價格和交易量之變動 將計算資料匯入日資料表,已計算 價格、交易量之 Z分數值 彙整成編碼表 彙整編碼表,將資料表轉換成數字 型式 應用 OLAP Manager 建立 Data Cube 透過 DB Miner 進行資料探勘 資料庫簡述與選取 (3/3)  將原始資料匯入 SQL Server 農委會所提供資料庫格式為 Access 格式,須利用 SQL Server 所提供的 DTS 功能,將原始資料 Access 資料庫轉至 SQL Server 資料庫。 為方便 SQL 查詢語法之使用,在資料轉換時將原始欄位由中文名稱轉為英文代號,並將資料型態予以規定如下表。 欄位名稱 英文代號 資料型態 日期 Date Datetime(6) 水果代號 Item Varchar(10) 價格 Price Float(8) 交易量 Qty Float(8) 資料分析  前言  各果品資料庫之高頻項目。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。