Machine Learning
簡單線性回歸 & K-Means
SJ
sj@toright.com
https://blog.toright.com
簡單線性回歸 (Linear Regression)
找出自變數與因變數的線性關係
假設問題
公共場合出現人數與正妹數的關係
資料分佈
編號 人數 正妹數
i ti yi
1 208 21.6
2 152 15.5
3 113 10.4
4 227 31
5 137 13
6 238 32.4
7 178 19
8 104 10.4
9 191 19
10 130 11.8
總和(Σ) 1678 184.1 https://zh.wikipedia.org/wiki/最小二乘法 (範例修改)
找出那條回歸線
簡單線性模型
y = b0 + b1t
透過「最小平方法」求值
誰發明最小平方法 (羅生門)
高斯發表於 1809 年的著作《天體運動論》中使用的「最小平方法」
法國科學家勒讓德於1806年獨立發現「最小平方法」
來證明一下最小平方法
別鬧了,直接看公式
編號 人數 正妹數 ti - t yi - y
i ti yi ti* yi* ti* yi* ti* ti* yi* yi*
1 208 21.6 40.2 3.19 128.238 1616.04 10.1761
2 152 15.5 -15.8 -2.91 45.978 249.64 8.4681
3 113 10.4 -54.8 -8.01 438.948 3003.04 64.1601
4 227 31 59.2 12.59 745.328 3504.64 158.5081
5 137 13 -30.8 -5.41 166.628 948.64 29.2681
6 238 32.4 70.2 13.99 982.098 4928.04 195.7201
7 178 19 10.2 0.59 6.018 104.04 0.3481
8 104 10.4 -63.8 -8.01 511.038 4070.44 64.1601
9 191 19 23.2 0.59 13.688 538.24 0.3481
10 130 11.8 -37.8 -6.61 249.858 1428.84 43.6921
總和(Σ) 1678 184.1 0 0 3287.82 20391.6 574.849
求回歸線 b0 與 b1
y = - 8.6394 + 0.1612 t
公共場合不足 54 人
不會有正妹出現
AI?
https://zh.wikipedia.org/wiki/最小二乘法
利用回歸式預測y = - 8.6394 + 0.1612 t
K-Means Cluster
簡單說就是物以類聚
實現步驟
1. 準備資料並正規劃
2. 投點 (k 個點)
3. 分群 (歐基里德距離)
4. 調整「群中心」
5. 判定收斂條件
6. 重複 3~5 步驟
http://www.csie.ntnu.edu.tw/~u91029/Classification.html
不適合分群的資料分佈
http://www.csie.ntnu.edu.tw/~u91029/Classification.html
Thanks
sj@toright.com
https://blog.toright.com

簡單線性回歸 & K-Means (Machine learning)