!1
AI 與特徵⼯工程
【PM觀點】
彭其捷
foxfirejack@gmail.com
2019/11/22
QuestionABOUT ME
關於我⼤大家是管理理者/PM?
⼤大家是技術⼈人員?

2
QuestionABOUT ME
關於我聽過特徵⼯工程?
實作過特徵⼯工程?
3
PM 表⽰示:
QuestionABOUT ME
關於我PM 在 AI 專案/特徵⼯工
程的⾓角⾊色?
5
ABOUT ME
關於我
6
關於我 About Me
!7
【卡米爾】專案經理理
【台⼤大】地理理與環境博班
負責領域:資料科學、系統設計
研究領域:空間分析演算法
【資策會】研發替代役
數據系統設計、系統開發、前端⼯工
程師、資料庫管理理員
【交⼤大】資訊管理理研究所
研究領域:資料探勘與資料庫
相關教學 / 演講 / 經歷
!8
我的相關著作
!9
專案經歷:環保署透過 AI 糾舉惡惡意排放⼯工廠
!10
特徵⼯工程
12
特徵⼯工程,指針對原始數據進⾏行行⼀一
系列列的⼯工程處理理,將其提煉為特
徵,作為輸入供算法和模型使⽤用,
⽤用來來描述問題和預測模型之間的參參
數關係。
https://daodu.tech/06-28-2018-how-to-discuss-machine-learning
有反光點
⽑毛⾊色變化的漸
層
眼窩的陰影
類似嘴巴的弧形
特徵
特徵
特徵
特徵
有反光點的亮
點、⼤⼩
⽑⾊的變化漸層
數據
眼窩的陰影⾯積
類似嘴巴的弧形
特徵
特徵
特徵
特徵
創意特徵
技術特徵
Question
⼈人類擅長找尋創意特徵,
機器擅長最佳化技術特徵
●PM相對擅長處理理創意特徵
●RD相對擅長技術特徵
AI 專案
機器學習技術
空氣污染預測
21
有⼈人出⾨門會關⼼心空氣
品質狀狀況嗎?
”
“
Question
22
氣象領域,已經可以提供長短期的預測結果,為何空品不⾏行行?
天氣預報,包括
1,2,3 ⼩小時的短時間預
測,以及6⼩小時之後的長
時間預測
24
Question
哪些因素,適合作為空氣污
染AI預測的合適特徵呢?
假設:你是⼀一個超強的
AI ⼯工程師/科學家~
⾕谷歌AI⾸首席女科學家李⾶飛⾶飛
特徵⼯工程⽅方法
⾕谷歌AI⾸首席女科學
家李⾶飛⾶飛
Hello ⾶飛⾶飛姊,請
問哪些因素,適合
作為空氣污染預測
的合適特徵呢?
⾕谷歌AI⾸首席女科學
家李⾶飛⾶飛
記者
作者:提姆.歐萊禮(Tim O’Reilly)
AI技巧&團隊創意,是找
到有⽤用特徵的關鍵能⼒力力
除了了AI技巧、團隊創意之
外、領域知識,也是找到
有⽤用特徵的關鍵能⼒力力
透過與領域專家的互動,取得之各類創意特徵特徵⼯工程
!33
氣象資料
環保署
測站資料
機器學習
參參數選擇
時間因素
演算法相關資料特徵(共 4 ⼤大類別特徵)特徵⼯工程
34
PM 2.5
O3

NO2
PM10
風速
雨量量
風向
氣壓 時間因素
逐步優化:(1) 歷史紀錄 (2) 近期空污 (3) 未來來氣象條件
過去10年年的空
污歷史紀錄,
像是歷史上的
今天,現在時
間等等
過去 12 ⼩小時
空氣污染
(t-12 , t-11 …. t -1)
未來來6⼩小時
(1) 氣象條件(雨量量、溫度、氣壓、風向、風速)
(2) 時間因素(季節、星期幾、時間絕對值 ex. 每天 03:00)
歷史表現
本測站過去歷史紀
錄表現
特徵⼯工程
建立實驗之【Baseline】:線性迴歸(Linear Regression)
簡單好⽤用,可作為分數的基礎(Baseline)
特徵⼯工程
實驗結果特徵⼯工程
引入領域專家知識:幫助優化特徵
AI V1:線性迴歸
前 30 ⼩小時
PM2.5 變化
前 13 ⼩小時 & 未
來來 12 ⼩小時之
天氣變化
交通⾞車車流之上下
班時間
Final ⽅方法
空氣品
質專家
氣象
專家
環境
專家
特徵⼯工程
最終:新增了了 51 個特徵,預測準確度⼤大幅提升
QuestionABOUT ME
關於我PM 在 AI 專案/特徵⼯工
程的⾓角⾊色?
38
良好特徵⼯工程三⼤大要點:AI技巧、團隊創意、領域知識
⼯工程師/科學家:持續學習
各類AI特徵⼯工程技巧
PM:引導團隊發揮創意
共同找尋有⽤用特徵
PM:結識(勾搭?) 專家的經
驗,從巨⼈人的肩膀上看事情
AI 技巧 團隊創意 領域知識
!40
彭其捷
foxfirejack@gmail.com
讓 PM,成為你
的 AI 好夥伴
AI ⾼高⼿手
PM
技術特徵
創意特徵

【人工智慧學校】2019/11/22 AI 與特徵工程:PM觀點(彭其捷)