資料科學團隊人才培育分享
以

為例



15 out of 20 attendants filled out the
questionnaire. 
 




精誠集團

負責人 蔣居裕
Who am I?

蔣居裕 Fred Chiang
Open xxx 的愛好者
資料價值的探索者
Etu 負責人
精誠集團 產品創新中心
助理副總經理

!  Blog —《Fred 豢養的雲中象》http://fredbigdata.blogspot.tw

all about Hadoop and Big Data
台灣少見以探討 Big Data 趨勢、技術、商業價值為主軸的專業部落格
Big Data 的真實與想像
Big Data 要處理的資料量級 (sizing)
•  !Yo$abyte
•  !Ze$abyte

•  !Gigabyte
•  !Megabyte
•  !Kilobyte
想像
許多人正面臨
真實


的問題

的應用尚未普遍化,具有針對性
當今的資料科學,大部分都還在面對
TB 以下的量級

Source: Analyzing the Analyzers, O’reilly (June, 2013)
想像
處理與分析的
真實


是半 非結構化資料

多半要處理成結構化資料才能分析
整合:從 Big Data 到 Total Data
聲音檔案
影片檔案
圖形檔案

Web, Mobile,
CRM, ERP, SCM,
…

$

文件檔案
文字資料
XML檔案

回饋/歷史資料

OLTP

商務交易
與
行為互動

Web Logs
點擊事件
SQL

社交網路
關聯圖譜
新聞 Feeds
感應器
嵌入設備
RFID Tags
地理資訊
GPS 點位
事件
其他



New
SQL

EDW

Big Data
精煉處理場

NoSQL

MPP

New
SQL

#

預處理

多結構資料
儲存/彙整/轉換/運算

$%

回饋/歷史資料
Dashboard,
Report,
Visualization, …



傳統 ETL

商業智慧
與
線上分析
OLAP

Original source: http://hortonworks.com/blog/big-data-refinery-fuels-next-generation-data-architecture
想像
要萃取

的價值,必須有資料科學家

真實
資料科學家萬中選一,不如培養資料科學團隊
資料科學,
我們是要仰仗這位性感的傢伙嗎 
Harvard
Business
Review
October 2012

http://cromi.org/main/wp-content/uploads/2012/10/Davenport-2012-data-scientist.pdf
No one person can be the perfect
data scientist,



Data Science Profiles

Source: Next-Gen Data Scientist, Dr. Rachel Schutt
!
資料價值驅動!

Monetize Data



處
理





分
析

策
略

Ac0on!

暑假計畫要從台灣南騎到北,目
標在 3 天內完成

Insight!

台灣夏季由北騎到南,一般人不
可能達到平均時速 15 公里

Knowledge!

一般人騎單車的時速約 15 公里;
台灣夏季吹南風,冬季吹東北風

Informa0on! 台灣南北全長 394 公里
Data!

394 公里

詳情參見:
http://fredbigdata.blogspot.tw/2013/05/big-data.html
Data Science Process 現實版

處理者

70%~85% 的工作時間

策略者
策略者

Source: Next-Gen Data Scientist, Dr. Rachel Schutt

分析者
資料科學團隊成員定義
具備以下一項或多項技能與素質者
類別

技能與素質

策略者

•  設定議題
•  具備洞見
•  依據資料分析輔助決策,策劃行動

分析者

• 
• 
• 
• 
• 
• 

處理者

•  資料處理程式設計

問對問題
跨領域溝通
發現資料關聯性,用資料說故事
數理、統計、演算法則、建立模型、數據挖掘、機器學習
資料視覺化
資料統計/分析程式設計

計畫以分析者與處理者為主要培育對象。
Data Science Program
緣起華山 – 2013.5.16
Data Weekend #5 – 2013.8.17

http://www.slideshare.net/fchiangtw/data-weekend-5
Data Weekend #6 – 2013.9.28
Data Weekend #05 -
最後籌備期:2013.09.29 ~ 2013.12.13
執行委員會
執行長

執行秘書

顧問團
顧問長

行政部
營運長

教學部


課程長

行銷部


行銷長
單位

主要任務



執行委
員會

• 
策略擬定
•  各種作業原則訂定
•  跨部溝通平台
•  顧問遴選

行政部

• 
• 
• 
• 
• 
• 

志工招募
總務
財會
講師 學員聯繫
課程執行支援
活動執行支援

•  營運長

教學部

• 
• 
• 
• 

課程開發
課程執行
課後檢定與追蹤
活動執行支援

•  課程長

行銷部

• 
• 
• 
• 
• 
• 

學員招募 設定 
•  行銷長
網站 報名系統建置
社群經營
活動企劃與執行
企業贊助
公關宣傳

顧問團

•  由各種專業資深人
士組成,義務提供
專業諮詢
•  顧問由執委會聘任

•  執行長
•  執行秘書



•  顧問長






• 

員會當然成員

為執行委









非優先項目,可在
行啟動

年再
執行委員會組成
預計

進入





 
 
 
 
 

代表 
代表 
代表 
代表 
代表
財務運作
• 
• 

學費由精誠資訊代收,存入「精誠資訊資料科學養成專戶」,發票亦由精誠
資訊開立。
相關費用支出 如講師費、教材製作費、餐點費用 作業原則如下:
–  執委會屆時要如何決議每一筆錢該如何花用?
•  由執委會集體討論與決策,採過半數決。
–  如何跟跟財務請款?
•  由行政部經手人拿著支出書面資料,上有執委員所有委員、經手人之簽名去跟
財務請款。
–  發票是由誰來開?
•  在
基金會正式成立前,發票由精誠資訊開立給學
員 個人或具法人統編 。

• 
• 

待
基金會正式成立後,即會將專戶結餘款撥給基金會;日後收入、支出、
發票各項事務皆由
基金會接手。
若
基金會日後因故未能設立,則在雙方 精誠與
籌備會 同意下,結
餘款將捐贈給第三方公益單位。
Data Science Program
【資料科學計畫 ─ 團訓班】
第 0 期實踐報告
2013.12.14 ~ 2014.1.11
《資料科學團隊養成計畫》
Data Science Program (DSP)

人才為本
應用為價值

3年內,為台灣培養300位

在

資料科學團隊成員
任務宣言
資料的大量增長已經是事實,如何能夠提取資料的價值,也成了社會、
商業、政府共同的利益課題。綜觀資料價值的提取,資料科學的能量,
在不同的領域,均扮演關鍵的價值轉兌力量。
吾人已知資料科學是跨界的,與其寄希望於難覓的資料科學家一人,不
如更關注於如何培養一個專業分工的資料科學團隊。本計畫的宗旨,即
在希望透過對生活資料的收集、處理、分析、視覺化呈現、故事形塑、
擬定行動的過程,分門規劃,引發社會各界對資料科學的興趣,從中培
養對應人才,最終回饋於社會。
http://j.mp/dsp-2013

報名開始…
學員篩選 – 79 選 33
中研院、國研院、大學、太空中心、電信、網路服務、
醫療、NPO、金融、資服、商業顧問、市調、高科技
製造、法人
學員篩選 – 79 選 33
專業分工組隊
講師介紹
(Johnson)

(Rafe)
20
Business Flight Ticket
(Jerry)
IT

。
講師介紹
(CK)
open

data data journalism

(Fred Chiang)
Open Source
Open Data Open Development
Hadoop Big Data

Etu
助教介紹
TEDx

(Muyueh)
作品

(Tim)

APP
Open Data

…

x
2013.12.11 (Sat) DSP 團訓班開課了
[課中分組專題 Pitch]
[心法傳授範例 1]
[心法傳授範例 2]
[心法傳授範例 3]
[心法傳授範例 4]
[課後檢討會議] 講師、助教、工作人員、學員代表
Dataset:內政部不動產實價登錄資料
• 
• 
• 
• 

民國 101.08 ~ 102.09
全台灣
租賃、買賣、預售
約 47 萬筆資料
2014.1.11 Data Fiesta:DSP 結訓生死鬥
1.
2.
3.
4.



租金
 
人潮



消費力
5.
參加 DSP 的 n 個理由
  博士生要成為博士
 

尋找資料科學團隊遺缺的夥伴

  迷惑者尋找資料分析的心法明燈
重新認識資料分析 
  資深工作者重燃對資料分析的熱情

您的理由
「DSP 結訓學員」使用說明
 
 
 
 
 

安全返回到工作崗位,回饋所學給親愛的公司
結夥創業賺大錢
台灣 ‧ 海外
結夥做資料科學公益
顧問任務團
加入
工作團隊:行政、行銷、教學
繼續宣揚
精神,推薦更多下線

校友團

【邀請制】
DSP Positioning
DSP Roadmap
結論
  一位朋友說得好:當
玩不起來的時候,要

都不想玩、
何用?

  對資料有感,讓應用有感,是資料科學訓練
的成功關鍵要素。
  資料科學是一個連續的、
的資
料科學過程,跨界專業分工團隊,是萃取資
料價值的必要實踐。
  台灣不是沒人才,人才不是沒有競爭力,缺
的可能是
的組織力。
Taipei, Taiwan

Beijing, China

Add : 318, Rueiguang Rd., Taipei 114, Taiwan
Tel : +886-2-77201888
Fax : +886-2-87986069
www.etusolution.com

Add : Room B-26, Landgent Center, No. 24, East
Third Ring Middle Rd., Beijing, China 100022
Tel : +86-10-84417988
Fax : +86-10-84417227
www.etusolution.com
資料科學團隊人才培育分享 ─ 以 DSP 為例
資料科學團隊人才培育分享 ─ 以 DSP 為例
資料科學團隊人才培育分享 ─ 以 DSP 為例
資料科學團隊人才培育分享 ─ 以 DSP 為例

資料科學團隊人才培育分享 ─ 以 DSP 為例