20200226 - AI Overview

AI Overview
Taka Wang
2020/02/26

過度期望的
高
峰階段
泡沫化的
谷
底階段
穩步爬升的
光明階段
實質
生
產的
高
峰階段
科技創新的
啟動階段
時間
能
見
度

5~10年
工
作經驗的資料科學家

Source: Where do Data Science experts exists?

深度學習等於
人
工
智慧

Credit
A little learning is a dangerous thing
- Alexander Pope

機器學習就是
一
些類神經網路

不喜歡數學
所以
人
工
智慧與我無關

數學符號只是
一
種精簡
又
精確的
方
法
表達某
人
的直覺之躍 - Terence Parr

從
小
學就要學習
人
工
智慧

我也準備轉
行
當資料科學家

六
行
程式寫出
人
臉辨識應
用
Source: ageitgey / face_recognition

Source: Train Object Detection AI with 6 lines of code

別
人
的專業有這麼容易速成？

你覺得統計系就是在學這些？

Artificial intelligence is
actually statistics, but it uses
a very gorgeous rhetoric,
which is actually statistics
Thomas J. Sargent,
Nobel Prize 2011

雲端
大
廠紛紛推出AutoML
工
具
我們也應該投入NAS(類神經網路架構動搜尋)

https://www.youtube.com/watch?v=kSa3UObNS6o&t=1674s

人
工
智慧將會取代
人
類

Source: keplerlounge
~1500 machine
4TPU/machine
3 days
$US 2 million
~1300 machine
4TPU/machine
40 days
$US 20 million

Source: SAE International
純粹
人
員駕駛，無任何輔助
人
類為主，電腦提供輔助電腦駕駛為主，
人
類輔助駕駛
基本
自
動駕駛，
人
類應急處理
高
度
自
動駕駛，
人
類仍可參與完全
自
動駕駛，
人
類純粹乘坐

為什麼
大
廠都開源他們的
工
具

More data beats clever algorithms
but better data beats more data
Peter Norvig,
Director of research at Google Inc.

Source: Nvidia
人工智慧歷史的演進

Rule-Based
寫
一
隻程式，分辨圖片內是不是貓

Rule-Based
寫
一
如果耳朵 = 2
且腳 = 4
且尾巴 = 1
且牙
齒
= 30
…..
回傳這是貓

Rule-Based
寫
一
如果耳朵 = 2
且腳 = 4
且尾巴 = 1
且牙
齒
= 30
…..
回傳這是貓
這是貓
用
窮舉法列出所有規則

IBM Watson
Source:
人
工
智慧新
革
命--超級電腦「華
生
」

IBM Watson
• 90台 Server
• 2880顆 CPU
• 灌入2億
頁
的內容
• 600萬條規則
• 3秒內回答問題
Source:
人
工
智慧新
革
命--超級電腦「華
生
」

Machine Learning
機器學習演算法

Machine Learning
機器學習演算法貓的模型

Machine Learning
機器學習演算法貓的模型
這是貓
貓的模型

What is Training/Learning
Source: GIPHY

Source:
人
工
智慧
大
歷史

80年代學術界的共識
多層神經網路是沒有前途的死胡同
事實

多深才叫做深層網路
How Deep is Deep

人
工
智慧的第三次復興

Deep Learning on
Speech Recognition
2012

ImageNet
1500 萬張圖片，涵蓋 22,000 種類別
2012

Don't throw away the needle
when you get a sword
- Hindi couplet

Source: The State of Computer Vision and AI: we are really, really far away

Decision Tree (決策樹)
天氣溫度濕度有風打球嗎
1 晴天 85 85 沒有不打
2 晴天 80 90 有不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有不打
7 陰天 64 65 有打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有打
12 陰天 72 90 有打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打
Source: Wiki
高
爾夫球場，
人
員管理問題

Decision Tree (決策樹)
2 晴天 80 90 有不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有不打
7 陰天 64 65 有打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有打
12 陰天 72 90 有打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打
天氣
(9/5)
濕度
(2/3)
有風
打球
(4/0)
陰天雨天
晴天
打球
(3/0)
不打
(0/2)
打球
(2/0)
不打
(0/3)
<=70 >70 有沒有
Source: Wiki
高
爾夫球場，
人
員管理問題

# imports
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
# prepare dataset
iris = load_iris()
X = iris.data
Y = iris.target
# split
seed = 7
test_size = 0.33
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=test_size, random_state=seed)
# training
model = DecisionTreeClassifier(max_depth=2)
model.fit(X_train, y_train)
# prediction
y_pred = model.predict(X_test)
predictions = [round(value) for value in y_pred]
# evaluation
accuracy = accuracy_score(y_test, predictions)
print("Accuracy: %.2f%%" % (accuracy * 100.0))

Ensemble Method
Source: General Ensemble Method

Random Forest (隨機森林)
2 晴天 80 90 有不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有不打
7 陰天 64 65 有打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有打
12 陰天 72 90 有打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打

2 晴天 80 90 有不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有不打
7 陰天 64 65 有打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有打
12 陰天 72 90 有打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打
天氣溫度溫度濕度濕度有風溫度有風
部分特徵

2 晴天 80 90 有不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有不打
7 陰天 64 65 有打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有打
12 陰天 72 90 有打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打
部分特徵
一
堆專家

2 晴天 80 90 有不打
3 陰天 83 78 沒有打
4 雨天 70 96 沒有打
5 雨天 68 80 沒有打
6 雨天 65 70 有不打
7 陰天 64 65 有打
9 晴天 69 70 沒有打
10 雨天 75 80 沒有打
11 晴天 75 70 有打
12 陰天 72 90 有打
13 陰天 81 75 沒有打
14 雨天 71 80 有不打
部分特徵
一
堆專家
多數決

Gradient Boost
假設某
人
今年30歲，
用
GBM來猜測他的年齡

Gradient Boost
假設某
人
今年30歲，
用
20

Gradient Boost
假設某
人
今年30歲，
用
20 相差10

Gradient Boost
假設某
人
今年30歲，
用
20 相差10
6

Gradient Boost
假設某
人
今年30歲，
用
20 相差10
6 相差4

Gradient Boost
假設某
人
今年30歲，
用
20 相差10
6 相差4
3

Gradient Boost
假設某
人
今年30歲，
用
20 相差10
6 相差4
3 相差1

Gradient Boost
假設某
人
今年30歲，
用
20 相差10
6 相差4
3 相差1
1

Gradient Boost
假設某
人
今年30歲，
用
20 相差10
6 相差4
3 相差1
1 相差0

# imports
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
# prepare dataset
iris = load_iris()
X = iris.data
Y = iris.target
# split
seed = 7
test_size = 0.33
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=test_size, random_state=seed)
# training
model = DecisionTreeClassifier(max_depth=2)
model.fit(X_train, y_train)
# prediction
y_pred = model.predict(X_test)
predictions = [round(value) for value in y_pred]
# evaluation
accuracy = accuracy_score(y_test, predictions)
print("Accuracy: %.2f%%" % (accuracy * 100.0))
model = XGBClassifier()
from xgboost import XGBClassifier

Titanic Dataset
Kaggle Notebooks

20200226 - AI Overview

Recommended

Recommended

More Related Content

More from Jamie (Taka) Wang

More from Jamie (Taka) Wang (20)

20200226 - AI Overview