SlideShare a Scribd company logo
1 of 14
Download to read offline
臺灣資料工程協會
Taiwan Data Engineering Association
20170815 SITCON社群闖關活動
關於TDEA
王耀聰,臺灣資料工程協會共同發起人之一,他表示大數據分析不只需要資
料科學家或資料分析師,實務上,國外常見還需要資料工程師和資
料架構師的角色,培養這兩類人才正是臺灣資料工程
協會的成立目的。
資料分析不只得先蒐集各式各樣的資料(買菜),還得先完成資料梳理(洗
菜、備料、熬湯),才有辦法進行不同的大數據分析(煮菜)。
「資料工程的任務就是準備資料科學家需要的資料,就像大廚也需要有二廚
備料,兩者缺一不可。」
臺灣資料工程協會將串連原有臺灣大數據技術社群,共同推動相關大數據活
動,也計畫參與Cloudera BASE計畫 (Big Analytics Skills Enablement) 大數
據分析技能訓練計畫,來培養臺灣業界資料工程人力。
資料科學人才種類
資料來源:經理人月刊137期
3
我們建造資料池
我們架構資料管線
資料科學家vs.資料工程師
4
資料來源:Data Scientist vs Data Engineer / Data Science 101
台灣資科人才需求上看10萬人
5
資料來源:104人力網/iThome
資料工程領域技術(你是我們的會員嗎?)
1. Hadoop Ecosystem
2. Spark
3. NoSQL Database (e.g. Mongo DB, Cassandra)
4. Relational Database (e.g. Oracle, MSSQL, DB2)
5. ETL Tools (e.g. Informatica)
6. Data Warehourse Solutions (e.g. SAP, Teradata)
7. Operation System (e.g. Linux)
8. Python, Java
認識Apache開源計畫與台灣貢獻者
Apache Projects and Contributors
Apache軟體基金會
成立於1999年,非營利組織,英文名稱 Apache Software Foundation,簡
稱 ASF,
最早源於開發Apache HTTP伺服器的一個愛好者組織「Apache組織」。
Apache軟體基金會主要為開源項目提供組織、法務和其他形式的支持,它
所支持的項目和軟體產品都遵循Apache授權(Apache License)。
Apache軟體基金會目前取得成功的原因,如不干涉技術、權限分明的管理
架構、保持獨立與公開等原則。
Apache社區名言「社區勝於代碼」的理解、ASF重要里程碑與部分重要項目。
(原文網址:https://kknews.cc/zh-tw/tech/3ml6po.html)
資料工程與大數據開源專案的關係
十年前Doug Cutting所開發的Hadoop
不僅開啟了大數據時代,更成為孕育
大數據技術的搖籃。如今Hadoop生態
圈發展出許多企業隨手可得的大數據
開源技術,
哪幾位台灣人貢獻了哪些開源專案呢?
答案在…資料工程協會FB公開社團專頁!
或…萬事問Google大神
陳恩平 葉祐欣 謝良奇、蔡東邦
蔡嘉平莊偉赳
戴資力
9/30 DataConf.TW 在張榮發基金會
跟Apache開源專案臺灣貢獻者們見面!
祝大家都能把資料變鑽石喔!

More Related Content

What's hot

Big Data 現象,以及現象中的我們
Big Data 現象,以及現象中的我們Big Data 現象,以及現象中的我們
Big Data 現象,以及現象中的我們Fred Chiang
 
Data Leaders in Action - 資料價值領袖風範與關鍵行動
Data Leaders in Action - 資料價值領袖風範與關鍵行動Data Leaders in Action - 資料價值領袖風範與關鍵行動
Data Leaders in Action - 資料價值領袖風範與關鍵行動Etu Solution
 
資料科學的第一堂課 Data Science Orientation
資料科學的第一堂課 Data Science Orientation資料科學的第一堂課 Data Science Orientation
資料科學的第一堂課 Data Science OrientationRyan Chung
 
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖Etu Solution
 
從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合Gene Hong
 
啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道Etu Solution
 
Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Etu Solution
 
Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力Etu Solution
 
Report 106553012 - copy
Report 106553012 - copyReport 106553012 - copy
Report 106553012 - copyJacky Zou
 
那些你知道的,但還沒看過的 Big Data 風景
那些你知道的,但還沒看過的 Big Data 風景那些你知道的,但還沒看過的 Big Data 風景
那些你知道的,但還沒看過的 Big Data 風景Etu Solution
 
大數據獲利模式 Ch 2
大數據獲利模式 Ch 2大數據獲利模式 Ch 2
大數據獲利模式 Ch 2Hans Shih
 
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)codefortomorrow
 
20140206 victor gau - r簡介 @ ksdg
20140206   victor gau - r簡介 @ ksdg20140206   victor gau - r簡介 @ ksdg
20140206 victor gau - r簡介 @ ksdgVictor Gau
 
【人工智慧學校】2019/11/22 AI 與特徵工程:PM觀點(彭其捷)
【人工智慧學校】2019/11/22 AI 與特徵工程:PM觀點(彭其捷)【人工智慧學校】2019/11/22 AI 與特徵工程:PM觀點(彭其捷)
【人工智慧學校】2019/11/22 AI 與特徵工程:PM觀點(彭其捷)彭其捷 Jack
 
2020/8/15 AI學校:如何推動組織的 AI 團隊文化?(講者:彭其捷)
2020/8/15 AI學校:如何推動組織的 AI 團隊文化?(講者:彭其捷)2020/8/15 AI學校:如何推動組織的 AI 團隊文化?(講者:彭其捷)
2020/8/15 AI學校:如何推動組織的 AI 團隊文化?(講者:彭其捷)彭其捷 Jack
 
Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
Big Data Taiwan 2014 Opening: Converge . Discover . MonetizeBig Data Taiwan 2014 Opening: Converge . Discover . Monetize
Big Data Taiwan 2014 Opening: Converge . Discover . MonetizeEtu Solution
 
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data – 意圖,讓我們聚在這裡
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data  – 意圖,讓我們聚在這裡Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data  – 意圖,讓我們聚在這裡
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data – 意圖,讓我們聚在這裡Etu Solution
 
Postmortem of 'Person of Interest' - Big data rc sharing
Postmortem of 'Person of Interest' - Big data rc sharingPostmortem of 'Person of Interest' - Big data rc sharing
Postmortem of 'Person of Interest' - Big data rc sharingGandalf Huang
 
Track C-1 大數據時代的產品 ─ 創新與洞察決策
Track C-1 大數據時代的產品 ─ 創新與洞察決策Track C-1 大數據時代的產品 ─ 創新與洞察決策
Track C-1 大數據時代的產品 ─ 創新與洞察決策Etu Solution
 

What's hot (20)

Big Data 現象,以及現象中的我們
Big Data 現象,以及現象中的我們Big Data 現象,以及現象中的我們
Big Data 現象,以及現象中的我們
 
Data Leaders in Action - 資料價值領袖風範與關鍵行動
Data Leaders in Action - 資料價值領袖風範與關鍵行動Data Leaders in Action - 資料價值領袖風範與關鍵行動
Data Leaders in Action - 資料價值領袖風範與關鍵行動
 
資料科學的第一堂課 Data Science Orientation
資料科學的第一堂課 Data Science Orientation資料科學的第一堂課 Data Science Orientation
資料科學的第一堂課 Data Science Orientation
 
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
 
從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合從社群資料來看 工人(群眾)智慧與人工智慧 的結合
從社群資料來看 工人(群眾)智慧與人工智慧 的結合
 
啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道
 
Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享
 
Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力Data without Boundaries - 圍繞第一方數據,找到商業驅動力
Data without Boundaries - 圍繞第一方數據,找到商業驅動力
 
Report 106553012 - copy
Report 106553012 - copyReport 106553012 - copy
Report 106553012 - copy
 
那些你知道的,但還沒看過的 Big Data 風景
那些你知道的,但還沒看過的 Big Data 風景那些你知道的,但還沒看過的 Big Data 風景
那些你知道的,但還沒看過的 Big Data 風景
 
大數據獲利模式 Ch 2
大數據獲利模式 Ch 2大數據獲利模式 Ch 2
大數據獲利模式 Ch 2
 
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
 
20140206 victor gau - r簡介 @ ksdg
20140206   victor gau - r簡介 @ ksdg20140206   victor gau - r簡介 @ ksdg
20140206 victor gau - r簡介 @ ksdg
 
【人工智慧學校】2019/11/22 AI 與特徵工程:PM觀點(彭其捷)
【人工智慧學校】2019/11/22 AI 與特徵工程:PM觀點(彭其捷)【人工智慧學校】2019/11/22 AI 與特徵工程:PM觀點(彭其捷)
【人工智慧學校】2019/11/22 AI 與特徵工程:PM觀點(彭其捷)
 
2020/8/15 AI學校:如何推動組織的 AI 團隊文化?(講者:彭其捷)
2020/8/15 AI學校:如何推動組織的 AI 團隊文化?(講者:彭其捷)2020/8/15 AI學校:如何推動組織的 AI 團隊文化?(講者:彭其捷)
2020/8/15 AI學校:如何推動組織的 AI 團隊文化?(講者:彭其捷)
 
Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
Big Data Taiwan 2014 Opening: Converge . Discover . MonetizeBig Data Taiwan 2014 Opening: Converge . Discover . Monetize
Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
 
Power BI x R
Power BI x RPower BI x R
Power BI x R
 
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data – 意圖,讓我們聚在這裡
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data  – 意圖,讓我們聚在這裡Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data  – 意圖,讓我們聚在這裡
Big Data Taiwan 2014 Keynote 1: Why and How We Monetize Data – 意圖,讓我們聚在這裡
 
Postmortem of 'Person of Interest' - Big data rc sharing
Postmortem of 'Person of Interest' - Big data rc sharingPostmortem of 'Person of Interest' - Big data rc sharing
Postmortem of 'Person of Interest' - Big data rc sharing
 
Track C-1 大數據時代的產品 ─ 創新與洞察決策
Track C-1 大數據時代的產品 ─ 創新與洞察決策Track C-1 大數據時代的產品 ─ 創新與洞察決策
Track C-1 大數據時代的產品 ─ 創新與洞察決策
 

Similar to SITCON開源城社群大闖關-臺灣資料工程協會

20151203行政院會 國發會 政府資料開放(open data)具體成效(m)
20151203行政院會 國發會 政府資料開放(open data)具體成效(m)20151203行政院會 國發會 政府資料開放(open data)具體成效(m)
20151203行政院會 國發會 政府資料開放(open data)具體成效(m)releaseey
 
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告R.O.C.Executive Yuan
 
[TOxAIA台中分校] AI 引爆新工業革命,智慧機械首都台中轉型論壇
[TOxAIA台中分校] AI 引爆新工業革命,智慧機械首都台中轉型論壇[TOxAIA台中分校] AI 引爆新工業革命,智慧機械首都台中轉型論壇
[TOxAIA台中分校] AI 引爆新工業革命,智慧機械首都台中轉型論壇台灣資料科學年會
 
資訊立法策進聯盟成員介紹
資訊立法策進聯盟成員介紹資訊立法策進聯盟成員介紹
資訊立法策進聯盟成員介紹YenLin Huang
 
[台中分校] 第一期結業典禮 - 執行長談話
[台中分校] 第一期結業典禮 - 執行長談話[台中分校] 第一期結業典禮 - 執行長談話
[台中分校] 第一期結業典禮 - 執行長談話台灣資料科學年會
 
行政院會簡報 經濟部 開放經濟資料運用案例分享(m)
行政院會簡報 經濟部 開放經濟資料運用案例分享(m)行政院會簡報 經濟部 開放經濟資料運用案例分享(m)
行政院會簡報 經濟部 開放經濟資料運用案例分享(m)releaseey
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況Jazz Yao-Tsung Wang
 
106智慧srb會議 公眾討論簡報-3加速產業發展與市場拓展-0622
106智慧srb會議 公眾討論簡報-3加速產業發展與市場拓展-0622106智慧srb會議 公眾討論簡報-3加速產業發展與市場拓展-0622
106智慧srb會議 公眾討論簡報-3加速產業發展與市場拓展-0622b0stey
 
台灣人工智慧學校台中分校第五期開學典禮談話簡報
台灣人工智慧學校台中分校第五期開學典禮談話簡報台灣人工智慧學校台中分校第五期開學典禮談話簡報
台灣人工智慧學校台中分校第五期開學典禮談話簡報AI.academy
 
医药企业的数字化转型 - 逻辑数据结构策略
医药企业的数字化转型 - 逻辑数据结构策略医药企业的数字化转型 - 逻辑数据结构策略
医药企业的数字化转型 - 逻辑数据结构策略Denodo
 
3652院會 報一
3652院會 報一3652院會 報一
3652院會 報一releaseey
 
20190523【簡報】科技部:「衝入世界前十大的臺灣超級電腦-AI主機臺灣杉二號」
20190523【簡報】科技部:「衝入世界前十大的臺灣超級電腦-AI主機臺灣杉二號」20190523【簡報】科技部:「衝入世界前十大的臺灣超級電腦-AI主機臺灣杉二號」
20190523【簡報】科技部:「衝入世界前十大的臺灣超級電腦-AI主機臺灣杉二號」R.O.C.Executive Yuan
 
逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构Denodo
 
Data Science: Z > B 的資料科學
Data Science: Z > B 的資料科學Data Science: Z > B 的資料科學
Data Science: Z > B 的資料科學ckliu
 
資料科學計劃的成果與展望
資料科學計劃的成果與展望資料科學計劃的成果與展望
資料科學計劃的成果與展望Johnson Hsieh
 
[台灣人工智慧學校] 校友年會開幕式
[台灣人工智慧學校] 校友年會開幕式[台灣人工智慧學校] 校友年會開幕式
[台灣人工智慧學校] 校友年會開幕式台灣資料科學年會
 
Data Science Program by Code for Tomorrow
Data Science Program by Code for TomorrowData Science Program by Code for Tomorrow
Data Science Program by Code for Tomorrowckliu
 

Similar to SITCON開源城社群大闖關-臺灣資料工程協會 (20)

台灣人工智慧學校成果發表會
台灣人工智慧學校成果發表會台灣人工智慧學校成果發表會
台灣人工智慧學校成果發表會
 
20151203行政院會 國發會 政府資料開放(open data)具體成效(m)
20151203行政院會 國發會 政府資料開放(open data)具體成效(m)20151203行政院會 國發會 政府資料開放(open data)具體成效(m)
20151203行政院會 國發會 政府資料開放(open data)具體成效(m)
 
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告
20151203國家發展委員會:「政府資料開放(OPEN DATA)具體成效」報告
 
[TOxAIA台中分校] AI 引爆新工業革命,智慧機械首都台中轉型論壇
[TOxAIA台中分校] AI 引爆新工業革命,智慧機械首都台中轉型論壇[TOxAIA台中分校] AI 引爆新工業革命,智慧機械首都台中轉型論壇
[TOxAIA台中分校] AI 引爆新工業革命,智慧機械首都台中轉型論壇
 
資訊立法策進聯盟成員介紹
資訊立法策進聯盟成員介紹資訊立法策進聯盟成員介紹
資訊立法策進聯盟成員介紹
 
[台中分校] 第一期結業典禮 - 執行長談話
[台中分校] 第一期結業典禮 - 執行長談話[台中分校] 第一期結業典禮 - 執行長談話
[台中分校] 第一期結業典禮 - 執行長談話
 
行政院會簡報 經濟部 開放經濟資料運用案例分享(m)
行政院會簡報 經濟部 開放經濟資料運用案例分享(m)行政院會簡報 經濟部 開放經濟資料運用案例分享(m)
行政院會簡報 經濟部 開放經濟資料運用案例分享(m)
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
 
楷明個人簡歷
楷明個人簡歷楷明個人簡歷
楷明個人簡歷
 
106智慧srb會議 公眾討論簡報-3加速產業發展與市場拓展-0622
106智慧srb會議 公眾討論簡報-3加速產業發展與市場拓展-0622106智慧srb會議 公眾討論簡報-3加速產業發展與市場拓展-0622
106智慧srb會議 公眾討論簡報-3加速產業發展與市場拓展-0622
 
台灣人工智慧學校台中分校第五期開學典禮談話簡報
台灣人工智慧學校台中分校第五期開學典禮談話簡報台灣人工智慧學校台中分校第五期開學典禮談話簡報
台灣人工智慧學校台中分校第五期開學典禮談話簡報
 
医药企业的数字化转型 - 逻辑数据结构策略
医药企业的数字化转型 - 逻辑数据结构策略医药企业的数字化转型 - 逻辑数据结构策略
医药企业的数字化转型 - 逻辑数据结构策略
 
3652院會 報一
3652院會 報一3652院會 報一
3652院會 報一
 
20190523【簡報】科技部:「衝入世界前十大的臺灣超級電腦-AI主機臺灣杉二號」
20190523【簡報】科技部:「衝入世界前十大的臺灣超級電腦-AI主機臺灣杉二號」20190523【簡報】科技部:「衝入世界前十大的臺灣超級電腦-AI主機臺灣杉二號」
20190523【簡報】科技部:「衝入世界前十大的臺灣超級電腦-AI主機臺灣杉二號」
 
10708
1070810708
10708
 
逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构
 
Data Science: Z > B 的資料科學
Data Science: Z > B 的資料科學Data Science: Z > B 的資料科學
Data Science: Z > B 的資料科學
 
資料科學計劃的成果與展望
資料科學計劃的成果與展望資料科學計劃的成果與展望
資料科學計劃的成果與展望
 
[台灣人工智慧學校] 校友年會開幕式
[台灣人工智慧學校] 校友年會開幕式[台灣人工智慧學校] 校友年會開幕式
[台灣人工智慧學校] 校友年會開幕式
 
Data Science Program by Code for Tomorrow
Data Science Program by Code for TomorrowData Science Program by Code for Tomorrow
Data Science Program by Code for Tomorrow
 

SITCON開源城社群大闖關-臺灣資料工程協會