AI overview

過度期望的
⾼峰階段
泡沫化的
⾕底階段
穩步爬升的
光明階段
實質⽣產的
⾼峰階段
科技創新的
啟動階段
時間
能
⾒
度

5~10年⼯作經驗的資料科學家

Source: Where do Data Science experts exists?

深度學習等於⼈⼯智慧

Credit
A little learning is a dangerous thing
- Alexander Pope

機器學習就是⼀些類神經網路

不喜歡數學
所以⼈⼯智慧與我無關

數學符號只是⼀種精簡⼜精確的⽅法
表達某⼈的直覺之躍 - Terence Parr

從⼩學就要學習⼈⼯智慧

我也準備轉⾏當資料科學家

六⾏程式寫出⼈臉辨識應⽤
Source: ageitgey / face_recognition

Source: Train Object Detection AI with 6 lines of code

別⼈的專業有這麼容易速成？

你覺得統計系就是在學這些？

Artificial intelligence is
actually statistics, but it uses
a very gorgeous rhetoric,
which is actually statistics
Thomas J. Sargent,
Nobel Prize 2011

雲端⼤廠紛紛推出AutoML⼯具
我們也應該投入NAS(類神經網路架構⾃動搜尋)

https://www.youtube.com/watch?v=kSa3UObNS6o&t=1674s

⼈⼯智慧將會取代⼈類

Source: keplerlounge
~1500 machine
4TPU/machine
3 days
$US 2 million
~1300 machine
4TPU/machine
40 days
$US 20 million

Source: SAE International
純粹⼈員駕駛，無任何輔助⼈類為主，電腦提供輔助電腦駕駛為主，⼈類輔助駕駛
基本⾃動駕駛，⼈類應急處理⾼度⾃動駕駛，⼈類仍可參與完全⾃動駕駛，⼈類純粹乘坐

為什麼⼤廠都開源他們的⼯具

More data beats clever algorithms
but better data beats more data
Peter Norvig,
Director of research at Google Inc.

Source: Nvidia
人工智慧歷史的演進

Rule-Based
寫⼀隻程式，分辨圖片內是不是貓

Rule-Based
如果耳朵 = 2
且腳 = 4
且尾巴 = 1
且牙⿒ = 30
…..
回傳這是貓

Rule-Based
如果耳朵 = 2
且腳 = 4
且尾巴 = 1
且牙⿒ = 30
…..
回傳這是貓
這是貓
⽤窮舉法列出所有規則

IBM Watson
• 90台 Server

• 2880顆 CPU

• 灌入2億⾴的內容

• 600萬條規則

• 3秒內回答問題
Source: ⼈⼯智慧新⾰命--超級電腦「華⽣」

Machine Learning
機器學習演算法

Machine Learning
機器學習演算法貓的模型

Machine Learning
機器學習演算法貓的模型
這是貓貓的模型

What is Training/Learning
Source: GIPHY

80年代學術界的共識
多層神經網路是沒有前途的死胡同
事實

多深才叫做深層網路
How Deep is Deep

⼈⼯智慧的第三次復興

Deep Learning on
Speech Recognition
2012

ImageNet
1500 萬張圖片，涵蓋 22,000 種類別
2012

Don't throw away the needle
when you get a sword
- Hindi couplet

Decision Tree (決策樹)
天氣溫度濕度有風打球嗎
1 晴天 85 85 沒有不打
2 晴天 80 90 有
不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有
不打
7 陰天 64 65 有
打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有
打
12 陰天 72 90 有
打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打
Source: Wiki
⾼爾夫球場，⼈員管理問題

Decision Tree (決策樹)
天氣溫度濕度有風打球嗎
2 晴天 80 90 有
不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有
不打
7 陰天 64 65 有
打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有
打
12 陰天 72 90 有
打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打
天氣
(9/5)
濕度
(2/3)
有風
打球
(4/0)
陰天雨天晴天
打球
(3/0)
不打
(0/2)
打球
(2/0)
不打
(0/3)
<=70 >70 有沒有
Source: Wiki
⾼爾夫球場，⼈員管理問題

# imports
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
# prepare dataset
iris = load_iris()
X = iris.data
Y = iris.target
# split
seed = 7
test_size = 0.33
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=test_size, random_state=seed)
# training
model = DecisionTreeClassifier(max_depth=2)
model.fit(X_train, y_train)
# prediction
y_pred = model.predict(X_test)
predictions = [round(value) for value in y_pred]
# evaluation
accuracy = accuracy_score(y_test, predictions)
print("Accuracy: %.2f%%" % (accuracy * 100.0))

Ensemble Method
Source: General Ensemble Method

Random Forest (隨機森林)天氣溫度濕度有風打球嗎
2 晴天 80 90 有
不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有
不打
7 陰天 64 65 有
打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有
打
12 陰天 72 90 有
打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打

2 晴天 80 90 有
不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有
不打
7 陰天 64 65 有
打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有
打
12 陰天 72 90 有
打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打
天氣溫度溫度濕度濕度有風溫度有風
部分特徵

2 晴天 80 90 有
不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有
不打
7 陰天 64 65 有
打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有
打
12 陰天 72 90 有
打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打
部分特徵
⼀堆專家

2 晴天 80 90 有
不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有
不打
7 陰天 64 65 有
打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有
打
12 陰天 72 90 有
打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打
部分特徵
⼀堆專家
多數決

Gradient Boost
假設某⼈今年30歲，⽤GBM來猜測他的年齡

Gradient Boost
20

Gradient Boost
20 相差10

Gradient Boost
20 相差10
6

Gradient Boost
20 相差10
6 相差4

Gradient Boost
20 相差10
6 相差4
3

Gradient Boost
20 相差10
6 相差4
3 相差1

Gradient Boost
20 相差10
6 相差4
3 相差1
1

Gradient Boost
20 相差10
6 相差4
3 相差1
1 相差0

# imports
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
# prepare dataset
iris = load_iris()
X = iris.data
Y = iris.target
# split
seed = 7
test_size = 0.33
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=test_size, random_state=seed)
# training
model = DecisionTreeClassifier(max_depth=2)
model.fit(X_train, y_train)
# prediction
y_pred = model.predict(X_test)
predictions = [round(value) for value in y_pred]
# evaluation
accuracy = accuracy_score(y_test, predictions)
print("Accuracy: %.2f%%" % (accuracy * 100.0))
model = XGBClassifier()
from xgboost import XGBClassifier

AI overview

Recommended

Recommended

More Related Content

More from Jamie (Taka) Wang

More from Jamie (Taka) Wang (20)

AI overview

***AI*** overview

Recommended

Recommended

More Related Content

More from Jamie (Taka) Wang

More from Jamie (Taka) Wang (20)

***AI*** overview

AI overview

AI overview