1
15 out of 20 attendants filled out the
questionnaire. 
 
Data Science Program (DSP) 
資料科學計畫簡介

Code for Healthcare


Etu 負責人 蔣居裕 (Fred Chiang)
April 18th, 2014
2
Who am I? 蔣居裕 Fred Chiang
Open xxx 的愛好者
資料價值的探索者
Etu 負責人
精誠集團 產品創新中心
助理副總經理
! Blog —《Fred 豢養的雲中象》http://fredbigdata.blogspot.tw
all about Hadoop and Big Data
台灣少見以探討 Big Data 趨勢、技術、商業價值為主軸的專業部落格
3
前 情 提 要
4
[想像]
要萃取 Big Data 的價值,必須有資料科學家
[真實]
資料科學家萬中選一,不如培養資料科學團隊
Big Data 的真實與想像
5
Harvard
Business
Review
October 2012
http://cromi.org/main/wp-content/uploads/2012/10/Davenport-2012-data-scientist.pdf
資料科學,
我們是要仰仗這位性感的傢伙嗎?
6
Superman, or Scientist
7
No one person can be the perfect
data scientist, so we need teams
Source: Next-Gen Data Scientist, Dr. Rachel Schutt
Data Science Profiles
8
Monetize Data ( ) End-to-End 
處理者
分析者策略者
策略者
Source: Next-Gen Data Scientist, Dr. Rachel Schutt
70%~85% 的工作時間
9
Data Science Program
10
緣起華山 – 2013.5.16
11
Data Weekend #5 – 2013.8.17
http://www.slideshare.net/fchiangtw/data-weekend-5
12
Data Weekend #6 – 2013.9.28
13
最後籌備期:2013.09.29 ~ 2013.12.13
執行委員會
執行長 (CEO) / 執行秘書
行政部
營運長 (COO)
教學部
課程長 (CCO)
行銷部
行銷長 (CMO)
顧問團
顧問長
14
執行委員會組成
Phase 0

1.  CEO: CK Liu (CfT 代表)
2.  Principal Secretory: Fred Chiang (SYSTEX/Etu 代表) 
3.  COO: Fred Chiang (SYSTEX/Etu 代表)
4.  CCO: CK Liu (CfT 代表)
5.  CMO: T.h. Schee (CfT 代表)
15
《資料科學團隊養成計畫》
Data Science Program (DSP)
人才為本
應用為價值
在3年內,為台灣培養300位
資料科學團隊成員
16
Data Science Program
【資料科學計畫 ─ 團訓班】
實踐報告
第 1 期:2013.12.14 ~ 2014.01.11
第 2 期:2014.03.08 ~ 2014.03.29
17
http://www.etusolution.com/DSP 報名開始…
18
學員篩選 – 79 選 33 (1期)
中研院、國研院、大學、太空中心、電信、網路服務、
醫療、NPO、金融、資服、商業顧問、市調、高科技
製造、法人
19
專業分工組隊
•  Campaigner
•  Analyst
•  Hygienist
•  Designer
20
講師介紹
(Johnson)
(Rafe)
20
Business Flight Ticket
(Jerry)
IT 。
21
講師介紹
(CK)
open
data data journalism
(Fred Chiang) Open Source
Open Data Open Development
Hadoop Big Data Etu
22
助教介紹
(Muyueh)
TEDx
、
2,000
(Tim) APP
Open Data
x
…
講師介紹
23
2424
25
[心法傳授範例 1]
26
[心法傳授範例 2]
27
[課後檢討會議] 講師、助教、工作人員、學員代表
28
Dataset 1:內政部不動產實價登錄資料
•  民國 101.08 ~ 102.09
•  全台灣
•  租賃、買賣、預售
•  約 47 萬筆資料
29
Dataset 2:PIXNET Hackathon 開放資料
1.  熱門照片的相關資料 (metadata)
2.  相片的 EXIF 資料
3.  人氣部落格的詮釋資料 (metadata)
4.  人氣部落格的訪客記錄 (visitor logs)
* 部落格與相片的內容資料,可以透過 PIXNET API 取得。
30
Data Fiesta:DSP 結訓成果交流
31
Team Project
團訓班第 1 期 團訓班第 2 期
#1
我要成為天聾人股份有限公司
《Bargaining Power》
無殼蝸牛聯盟
《房價正義》
#2
遊戲茄子
《驚爆房地產》
航海王
《部落客銀行》
#3
逆轉人生全球顧問股份有限公司
《小資男女翻身計畫》
愛。住易
《找尋銀髮幸福宅》
#4
光點選址服務
《小火鍋創業選址模型》
小資“救世“組
《千金買房‧萬金買鄰》
#5
財團法人避稅剋星
《土地買賣稅費異常資料查詢平台》
Captain
《Hot Zone》
32
- Infographic download: http://goo.gl/fKdXXi
33
參加 DSP 的 n 個理由
1.  Team Player 尋找資料科學團隊遺缺的夥伴
2.  迷惑者尋找資料分析的心法明燈
(重新認識資料分析)
3.  資深工作者重燃對資料分析的熱情

n. …… 您的理由
34
「DSP 結訓學員」使用說明
1.  安全返回到工作崗位,回饋所學給親愛的公司
2.  結夥創業賺大錢
3.  結夥做資料科學公益
4.  加入 DSP 工作團隊:行政、行銷、教學
5.  繼續宣揚 DSP 精神,推薦更多下線
台灣 ‧ 海外
DSP 顧問任務團
DSP 校友團 – 【邀請制】
35
DSP Roadmap
下一梯:7 月
資料爬理析 Python
實戰班:5/10-11
CfT.io
Pixnet
Fellowship
Program
36
Lessons Learned
37
變與不變 ─ 從第 1 期到第 2 期
變
1.  收費:NT$ 6,000 - NT$ 12,000
2.  工具:從無到用 R Language
3.  內容:時數增加 6 小時 (Hands-on Labs)
4.  報名者的背景:Hygienist  Designer 減少,Campaigner 增加
5.  志工:行銷與助教人數
不變
1.  講師對 Team Project Pitch 提出挑戰
2.  認真的學員與投入的講師
3.  持續改進課程的精神
38
多與少 ─ DSP 教我的事
1.  多一點生活,少一點正義
2.  多一點策略,少一點包裝
3.  多一點資料,少一點想像
4.  多一點分析,少一點美術
5.  多一點關聯,少一點加總
6.  多一點跨界,少一點純粹
39
結論
1.  一位朋友說得好:當 Small Data 都不想玩、
玩不起來的時候,要 Big Data 何用?
2.  對資料有感,讓應用有感,是資料科學訓練
的成功關鍵要素。
3.  資料科學是一個連續的、End-to-End 的資
料科學過程,跨界專業分工團隊,是萃取資
料價值的必要實踐。
4.  台灣不是沒人才,人才不是沒有競爭力,缺
的可能是 Team Up 的組織力。
40
Contact, Community, and Reference
Contact
Web: datasci.co
Mail: hello@datasci.co
Community
Forum: CfT.io/categories/dsp
FB: www.facebook.com/CodeForTomorrow
Reference
•  Slideshare《 ─ DSP 》
https://www.slideshare.net/fchiangtw/dsp-30076214
•  團訓班 2 期成果報導《 》
http://datasci.co/2014/03/30/dsp-datafiesta-2/#more-277
•  講師 Johnson 文章《 》
http://readata.org/datasci/about-data-science/
•  傑出成果:愛住易 ─《找尋銀髮幸福宅》Infographic
http://goo.gl/fKdXXi
41
Taipei, Taiwan
Add : 318, Rueiguang Rd., Taipei 114, Taiwan
Tel : +886-2-77201888
Fax : +886-2-87986069
www.etusolution.com

DSP 資料科學計畫簡介