1.7 機器學習概念
機器學習是一門人工智慧的科學,
主要研究如何讓電腦可以自動學習,
從資料中自動分析獲得規律對未知資料進行預測。
2
“ “
Table
of
Content
Part 1 怎麼訓練機器?
- Holdout 驗證
- K-fold 驗證
Part 2 問題的種類?
- 分類問題(監督式學習)
- 分群問題(非監督式學習)
Part 3 分類問題的學習方法
- 決策樹(Decision Tree)
- 最近鄰居法(k-Nearest Neighbors)
- 支持向量機(SVM)
Part 4 分群問題的學習方法
- k-平均演算法(k-means clustering)
- 主成分分析(Principal Component Analysis)
怎麼訓練機器?
• Holdout 驗證
• K-fold 驗證
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
怎麼訓練機器?
• Holdout 驗證
訓練數據
驗證數據
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
怎麼訓練機器?
• K-fold 驗證
訓練數據
驗證數據
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
怎麼訓練機器?
• K-fold 驗證
驗證數據
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
怎麼訓練機器?
• K-fold 驗證
驗證數據
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
怎麼訓練機器?
• K-fold 驗證
驗證數據
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
怎麼訓練機器?
• K-fold 驗證
驗證數據
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
• Holdout 驗證 • K-fold 驗證
怎麼訓練機器?
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
問題的種類
• 監督式學習
- 回歸問題 Regression
- 分類問題 Classification
• 非監督式學習
- 分群問題 Clustering
尋找資料中潛在的族群
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分類問題
• 決策樹 Decision Trees
• 最近鄰居 k-Nearest Neighbors (k-NN)
• 支持向量機 Support-Vector Machine (SVM)
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分類問題
對象願意見面
對象不願意見面
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分類問題
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分類問題
• 決策樹(Decision Trees)
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
找出變異量最大的變項作為分割準則
幫助確定一個最可能達到目標的策略
不同種問題的學習方法——分類問題
• 最近鄰居 (k-Nearest Neighbors)
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
在特徵空間中, k 個最接近的樣本的類別
不同種問題的學習方法——分類問題
• 支持向量機 SVM
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
用最大間隔把兩個類別的資料點分開。
H1 H2
不同種問題的學習方法——分類問題
• 支持向量機 SVM
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
把p維向量的資料點,用(p-1)維的超平面分開。
不同種問題的學習方法——分類問題
• 決策樹 • 最近鄰居 • 支持向量機SVM
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分群問題
• k-平均演算法(k-means clustering)
• 主成分分析
(Principal Component Analysis)
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分群問題
• k-平均演算法(k-means clustering)
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分群問題
• k-平均演算法(k-means clustering)
Step1: 猜測中心點
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分群問題
• k-平均演算法(k-means clustering)
Step2: 依據資料群調整中心點
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分群問題
• k-平均演算法(k-means clustering)
Step3: 根據新中心點,重新分群
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分群問題
• k-平均演算法(k-means clustering)
猜測中心點
調整中心點
重新分群
得到滿意的分群方式
…
…
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
調整中心點
27
• k-平均演算法
出處:https://www.youtube.com/watch?v=q23HJFdvNHc
出處: https://www.pinotspalette.com/montrose-houston-tx/event/316532
不同種問題的學習方法——分群問題
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
28
• k-平均演算法
實際應用:
不同種問題的學習方法——分群問題
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分群問題
• 主成分分析(Principal Component Analysis)
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分群問題
• 主成分分析(Principal Component Analysis)
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分群問題
• 主成分分析(Principal Component Analysis)
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分群問題
• 主成分分析(Principal Component Analysis)
降低資料維度,取得主要成分,
避免太多冗雜的資料和雜訊影響效能
“ “
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法
不同種問題的學習方法——分群問題
• k-平均演算法 • 主成分分析
怎
麼
訓
練
機
器
問
題
的
種
類
分
類
問
題
的
學
習
方
法
分
群
問
題
的
學
習
方
法

Lab405ML01

Editor's Notes

  • #4 2. 主要在解決什麼問題 3 4. 不同問題怎麼學習
  • #5 典型的方法
  • #6 我們天生知道什麼是貓什麼是狗 50張貓狗 什麼是貓?什麼是狗? 20-30%
  • #13 付現還是刷卡? 尋找資料中潛在的族群
  • #14 如何學習分類問題 數學國文學習方法不同
  • #15 交友軟體?聯誼軟體?相親軟體? 有些人有約到 有些人沒有約到 分類問題-->兩類 電腦學習 新的人加入,會不會成功的約到人
  • #30 統計分析、簡化數據集的方法。它利用正交變換來對一系列可能相關的變數的觀測值進行線性變換,從而投影為一系列線性不相關變數的值,這些不相關變數稱為主成分(Principal Components)。具體地,主成分可以看做一個線性方程式,其包含一系列線性係數來指示投影方向。