Data Mining 954907 廖凡升 954919 莊秉諺 954911 陳家翔 954913 呂冠龍 954924 余如惠 954963 陳芷瀅
Data mining <ul><li>Extracting knowledge from large amount of data.  </li></ul><ul><li>The exploration and analysis, by au...
Data  定義  <ul><li>[ 技術定義 ] </li></ul><ul><li>結構化 </li></ul><ul><li>半結構化 </li></ul><ul><li>非結構化資料 ( 分佈在網路 : 異構資料 ?!) </li><...
Mining  定義 <ul><li>[ 定義 ] </li></ul><ul><li>對資料庫中資料進行 ( 萃取 / 轉化 / 分析 / 模式化 / 處理 ) </li></ul><ul><li>從中萃取輔助決策 </li></ul>
為什麼會有 data mining? <ul><li>發展 起因 (1989) </li></ul><ul><li>超大型資料庫的出現  ( 資料倉儲 ) </li></ul><ul><li>先進電腦技術  ( 網路技術  /  平行處理系統 ...
Data Mining 應用範圍 <ul><li>1.  資訊管理 </li></ul><ul><li>2.  決策支援 </li></ul><ul><li>3.  查詢最佳化 </li></ul><ul><li>4.  程序控制 </li><...
Data mining  步驟 <ul><li>釐清目標 </li></ul><ul><li>獲取相關技術與知識 </li></ul><ul><li>整合與查核 </li></ul><ul><li>去除錯誤、不一致與不完整  </li></ul...
Data mining  的功能 <ul><li>分類 (Classification) </li></ul><ul><li>推估 (Estimation) </li></ul><ul><li>群集化 (Cluster) </li></ul><...
分類 (Classification)  [ 類型分析 ] <ul><li>區分為兩大種類  </li></ul><ul><ul><li>離散變數 (discrete variables) </li></ul></ul><ul><ul><li>...
推估 (Estimation )  [ 預測分析 ] <ul><li>迴歸分析 </li></ul><ul><li>未知連續數值的走向與趨勢 </li></ul><ul><li>範例 : </li></ul><ul><ul><li>金融商品價格...
群集化 (Cluster)  [ 群集分析 ] <ul><li>根據相似性 , 將相似的事物分群 </li></ul><ul><li>綜合各項屬性的研判 , 找出事務相似性的內部結構 </li></ul><ul><li>一種資料清理的步驟 </...
同質分組 (Affinity Group)  [ 鏈結分析 ] <ul><li>找出事物間隱藏的關聯性 </li></ul><ul><li>關聯規則 (association rule) </li></ul><ul><li>購物籃分析 (bas...
序列 (Sequential)  [ 次序相關分析 ] <ul><li>事務發生的先後順序 </li></ul><ul><li>時序規則 (sequential pattern) </li></ul><ul><li>範例 : </li></ul...
描述 (Description) <ul><li>透過視覺化以及觀察來找出續多有意義的規則 </li></ul>
Data Warehouse  主要功能 <ul><li>主題導向的資料組織 </li></ul><ul><li>資料的整合性 </li></ul><ul><li>資料的一致性 </li></ul><ul><li>資料的時間差異性 </li><...
Data Warehouse  的主要目的 <ul><li>為了即時支援重要的企業決策所以 data warehouse  才因應而生 </li></ul>
備忘錄 <ul><li>新增一個案例解釋流程 </li></ul><ul><li>異構資料 </li></ul><ul><li>跟他約咪咪很挺  不如去問陳家楨 </li></ul><ul><li>找案例 </li></ul><ul><ul><...
Upcoming SlideShare
Loading in …5
×

Data Mining

1,302 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,302
On SlideShare
0
From Embeds
0
Number of Embeds
36
Actions
Shares
0
Downloads
21
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • Data Mining

    1. 1. Data Mining 954907 廖凡升 954919 莊秉諺 954911 陳家翔 954913 呂冠龍 954924 余如惠 954963 陳芷瀅
    2. 2. Data mining <ul><li>Extracting knowledge from large amount of data. </li></ul><ul><li>The exploration and analysis, by automatic or semi-automatic means, of large quantities of data in order to discover meaningful patterns and rules. </li></ul>
    3. 3. Data 定義 <ul><li>[ 技術定義 ] </li></ul><ul><li>結構化 </li></ul><ul><li>半結構化 </li></ul><ul><li>非結構化資料 ( 分佈在網路 : 異構資料 ?!) </li></ul>
    4. 4. Mining 定義 <ul><li>[ 定義 ] </li></ul><ul><li>對資料庫中資料進行 ( 萃取 / 轉化 / 分析 / 模式化 / 處理 ) </li></ul><ul><li>從中萃取輔助決策 </li></ul>
    5. 5. 為什麼會有 data mining? <ul><li>發展 起因 (1989) </li></ul><ul><li>超大型資料庫的出現 ( 資料倉儲 ) </li></ul><ul><li>先進電腦技術 ( 網路技術 / 平行處理系統 ) </li></ul><ul><li>管理的需求 ( 經濟全球化 / 市場壓力 ) </li></ul><ul><li>對資料採擷的精深計算能力 ( 統計學 / 集合論 / 認識論 / 人工智慧 ) </li></ul>
    6. 6. Data Mining 應用範圍 <ul><li>1. 資訊管理 </li></ul><ul><li>2. 決策支援 </li></ul><ul><li>3. 查詢最佳化 </li></ul><ul><li>4. 程序控制 </li></ul>
    7. 7. Data mining 步驟 <ul><li>釐清目標 </li></ul><ul><li>獲取相關技術與知識 </li></ul><ul><li>整合與查核 </li></ul><ul><li>去除錯誤、不一致與不完整 </li></ul><ul><li>取樣與試驗 </li></ul><ul><li>研發模式( model ) </li></ul><ul><li>測驗與檢核 </li></ul><ul><li>找出假設並解釋 </li></ul>
    8. 8. Data mining 的功能 <ul><li>分類 (Classification) </li></ul><ul><li>推估 (Estimation) </li></ul><ul><li>群集化 (Cluster) </li></ul><ul><li>同質分組 (Affinity Group) </li></ul><ul><li>序列 (Sequential) </li></ul><ul><li>描述 (Description) </li></ul>
    9. 9. 分類 (Classification) [ 類型分析 ] <ul><li>區分為兩大種類 </li></ul><ul><ul><li>離散變數 (discrete variables) </li></ul></ul><ul><ul><li>連續變數 (continuous variables) </li></ul></ul><ul><li>二元對立的概念 </li></ul><ul><li>範例 : </li></ul><ul><ul><li>交叉銷售 ( 客戶是否購買 ) </li></ul></ul><ul><ul><li>信用風險預測 ( 是否會呆帳違約 ) </li></ul></ul>
    10. 10. 推估 (Estimation ) [ 預測分析 ] <ul><li>迴歸分析 </li></ul><ul><li>未知連續數值的走向與趨勢 </li></ul><ul><li>範例 : </li></ul><ul><ul><li>金融商品價格趨勢變化預測 </li></ul></ul><ul><ul><li>進貨、銷貨、存貨價量變化趨勢預測 </li></ul></ul>
    11. 11. 群集化 (Cluster) [ 群集分析 ] <ul><li>根據相似性 , 將相似的事物分群 </li></ul><ul><li>綜合各項屬性的研判 , 找出事務相似性的內部結構 </li></ul><ul><li>一種資料清理的步驟 </li></ul><ul><li>範例 : </li></ul><ul><ul><li>顧客分群 ( 根據顧客屬性相似度 ) </li></ul></ul><ul><ul><li>晶圓製程瑕疵分布 ( 根據瑕疵分部空間相似度 ) </li></ul></ul>
    12. 12. 同質分組 (Affinity Group) [ 鏈結分析 ] <ul><li>找出事物間隱藏的關聯性 </li></ul><ul><li>關聯規則 (association rule) </li></ul><ul><li>購物籃分析 (basket analysis) </li></ul><ul><li>範例 : </li></ul><ul><ul><li>網頁結構分析 </li></ul></ul><ul><ul><li>病例關鍵字關聯性分析 </li></ul></ul>
    13. 13. 序列 (Sequential) [ 次序相關分析 ] <ul><li>事務發生的先後順序 </li></ul><ul><li>時序規則 (sequential pattern) </li></ul><ul><li>範例 : </li></ul><ul><ul><li>逾期繳款行為模式 </li></ul></ul><ul><ul><li>網頁瀏覽序列分析 </li></ul></ul>
    14. 14. 描述 (Description) <ul><li>透過視覺化以及觀察來找出續多有意義的規則 </li></ul>
    15. 15. Data Warehouse 主要功能 <ul><li>主題導向的資料組織 </li></ul><ul><li>資料的整合性 </li></ul><ul><li>資料的一致性 </li></ul><ul><li>資料的時間差異性 </li></ul><ul><li>資料的不變動性 </li></ul>
    16. 16. Data Warehouse 的主要目的 <ul><li>為了即時支援重要的企業決策所以 data warehouse 才因應而生 </li></ul>
    17. 17. 備忘錄 <ul><li>新增一個案例解釋流程 </li></ul><ul><li>異構資料 </li></ul><ul><li>跟他約咪咪很挺 不如去問陳家楨 </li></ul><ul><li>找案例 </li></ul><ul><ul><li>1. 資訊管理 </li></ul></ul><ul><ul><li>2. 決策支援 </li></ul></ul><ul><ul><li>3. 查詢最佳化 </li></ul></ul><ul><ul><li>4. 程序控制 </li></ul></ul>

    ×