SlideShare a Scribd company logo
1 of 26
Download to read offline
HadoopCon 2014 
那些你知道的,但還沒看過的 Big Data 風景 
─ 致 Hadooper 
Etu 負責人 蔣居裕 
@fredchiang 
fredchiang@etusolution.com 
September 13, 2014
2 
Who am I? 
蔣居裕 Fred Chiang 
Open xxx 的愛好者 
資料價值的探索者 
社群的參與者 
Etu 負責人 
) Blog —《Fred 豢養的雲中象》http://fredbigdata.blogspot.tw 
all about Hadoop and Big Data 
台灣少見以探討 Big Data 趨勢、技術、商業價值為主軸的專業部落格
3 
第六屆台灣 Hadoop 社群年會
4 
那麼今天 
中央研究院 人文社會科學館 國際會議廳 
(a.k.a 阿宅的豪華網咖,歡迎自帶網線) 
到底有何風景可以看?
5 
社群的風景 
速度的風景 
資料科學的風景 
Hadoop的風景
6 
社群的風景
7 
感謝贊助商 
更感謝講者 
Satoshi Tagomori 
Chris Huang 
Masahiro Nakagawa 
張日昇 
謝良奇 
Raymond 
范姜冠宇 Simon Su 
徐瑞興 
Kewang 
江孟峰 
張雅芳 葉祐欣 
李佳修
8 
最最感謝志工團 
周采萱 
陳唯綸 
劉世偉 
Renata Chang (れな) 陳俊廷 戴資力 李佳勳 
何永安 
方紹昌 
劉澤恩 
Randy macJack 鍾振杰 
林書宇 顏若庭
9 
關注大大 ● 大大關注 
Jazz Wang 
台灣 Hadoop 社群 
拿最大支大聲公的 
傳教士 
最近很欠人手, 
要不要來 Etu ? 
Hadooper: 
我還有問題要問, 
請保重身體
10 
關注大大 ● 大大關注 
Wisely Chen 
(a.k.a The Giive) 
“因為中國 Hadoop 
根基不深,很大程 
度「降低了推廣 
Spark 的阻力」” 
Hadooper: 
我愛 Hadoop, 
我也愛 Spark
11 
速度的風景
12 
速度是成本的加項 
分散式運算成本若是⽤用乘的,那速度就是倍數加快 
Volume 
資料量 
Velocity 
處理時效 
Variety 
資料格式
Pre-processing Query Streaming 
Transaction 
Small-scale 
In-memory 
Large-scale 
Near 
Real-time Real-time 
13 
運算速度的級別 
Persistent Data 
Large-Large-scale 
Batch 
Hrs Secs Millisecs
14 
資料科學的風景
15 
Data Science 的要素 
人 
分工 
團隊 
知識 
技能 
工具 
資料 
Domain 
Pain 
Point 
Value 
Up
How a typical software vendor approaches 
16 
Data Science 
(generally a bunch of developers) 
The Data Science Venn Diagram 
1. 
Developers think they 
can handle the domain 
properly, but actually 
is not fully able to. 
Approach 
Listen to customers. 
Result 
Customers realize 
the developer’s 
capabilities are just 
coding. They have 
never dealt with the 
danger zone. 
http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram 
2. 
Developers think they 
can handle the 
algorithm as easy as 
an SQL command, but 
actually is not able to. 
Approach 
Calls for help. 
Result 
Developers are just 
coders. Machine 
learning is a dream. 
PRISM 
稜鏡計畫 
Technical Support Manager
17 
Hadoop的風景
18 
你講的是哪個 
Hadoop ? 
Hadoop 1 
MRv1 
HDFS 
MRv2 
Hadoop 2 
HBase 
Storm Spaek 
YARN 
HDFS2
19 
你講的 Hadoop 
包含什麼 ?
不同的 Use Case, 
你需要不同的 
Ecosystem 組合 
20
21 
企業市場:Hadoop Big Data,我們還在跨越鴻溝 
Geoffrey Moore’s Technology Adoption Lifecycle 
We are here, 
crossing the 
Chasm 
1. Early Market (早期市場) → 專案 (Project) 市場 
2. Bowling Alley (保齡球道) → 特定領域可重複銷售的解決方案 (Solution) 市場 
3. Tornado (龍捲風暴) → 標準化產品 (Product) 市場 
4. Main Street (康莊大道) → 系統 (System) 市場
22 
台灣 Hadooper,您填問卷了嗎? 
https://zh.surveymonkey.com/s/hadoopcon2014 
今天晚上就去看電影 
現場填,下午抽獎 
今天不要用這個填
23 
www.etusolution.com/esd2014 
Oct. 8 (Wed) @台北君悅
24 
Etu is Hiring 
1. Software Engineer, Hadoop Platform 
2. Software Engineer, Etu Recommender / Etu Insight 
3. Professional Service Engineer 
4. Data Analysis / Data Mining Engineer 
5. Technical Support Manager 
Resume mail to : hr@etusolution.com
25 
謝謝
Contact 
www.etusolution.com 
info@etusolution.com 
Taipei, Taiwan 
318, Rueiguang Rd., Taipei 114, Taiwan 
T: +886 2 7720 1888 
F: +886 2 8798 6069

More Related Content

What's hot

轉兌數據的價值 — 從導購到策購
轉兌數據的價值 — 從導購到策購轉兌數據的價值 — 從導購到策購
轉兌數據的價值 — 從導購到策購Fred Chiang
 
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖Etu Solution
 
Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Etu Solution
 
資料價值 — 一位資料產品經理的視野
資料價值 — 一位資料產品經理的視野資料價值 — 一位資料產品經理的視野
資料價值 — 一位資料產品經理的視野Fred Chiang
 
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座NTC.im(Notch Training Center)
 
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Jazz Yao-Tsung Wang
 
淺談台灣巨量資料產業發展現況
淺談台灣巨量資料產業發展現況淺談台灣巨量資料產業發展現況
淺談台灣巨量資料產業發展現況Jazz Yao-Tsung Wang
 
数据的价值和灵魂
数据的价值和灵魂数据的价值和灵魂
数据的价值和灵魂学峰 司
 
啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道Etu Solution
 
浅谈数据科学
浅谈数据科学浅谈数据科学
浅谈数据科学学峰 司
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況Jazz Yao-Tsung Wang
 
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法Jazz Yao-Tsung Wang
 
Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望Jazz Yao-Tsung Wang
 
台灣生活資料科學團隊養成計畫 (@Data Weekend #5)
台灣生活資料科學團隊養成計畫 (@Data Weekend #5)台灣生活資料科學團隊養成計畫 (@Data Weekend #5)
台灣生活資料科學團隊養成計畫 (@Data Weekend #5)Fred Chiang
 
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TWHadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TWJazz Yao-Tsung Wang
 
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)codefortomorrow
 
如何備料:資料的抓取、清理以及串接
如何備料:資料的抓取、清理以及串接如何備料:資料的抓取、清理以及串接
如何備料:資料的抓取、清理以及串接muyueh
 

What's hot (20)

轉兌數據的價值 — 從導購到策購
轉兌數據的價值 — 從導購到策購轉兌數據的價值 — 從導購到策購
轉兌數據的價值 — 從導購到策購
 
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
 
Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享Hadoop Big Data 成功案例分享
Hadoop Big Data 成功案例分享
 
資料價值 — 一位資料產品經理的視野
資料價值 — 一位資料產品經理的視野資料價值 — 一位資料產品經理的視野
資料價值 — 一位資料產品經理的視野
 
大數據
大數據大數據
大數據
 
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
 
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)
 
淺談台灣巨量資料產業發展現況
淺談台灣巨量資料產業發展現況淺談台灣巨量資料產業發展現況
淺談台灣巨量資料產業發展現況
 
数据的价值和灵魂
数据的价值和灵魂数据的价值和灵魂
数据的价值和灵魂
 
啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道
 
浅谈数据科学
浅谈数据科学浅谈数据科学
浅谈数据科学
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
 
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
 
Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望
 
台灣生活資料科學團隊養成計畫 (@Data Weekend #5)
台灣生活資料科學團隊養成計畫 (@Data Weekend #5)台灣生活資料科學團隊養成計畫 (@Data Weekend #5)
台灣生活資料科學團隊養成計畫 (@Data Weekend #5)
 
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TWHadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TW
 
Hadoop.TW : Now and Future
Hadoop.TW : Now and FutureHadoop.TW : Now and Future
Hadoop.TW : Now and Future
 
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
 
如何備料:資料的抓取、清理以及串接
如何備料:資料的抓取、清理以及串接如何備料:資料的抓取、清理以及串接
如何備料:資料的抓取、清理以及串接
 
When R meet Hadoop
When R meet HadoopWhen R meet Hadoop
When R meet Hadoop
 

Viewers also liked

Summary of Insights Learned from the Data Science Program Team Training
Summary of Insights Learned from the Data Science Program Team TrainingSummary of Insights Learned from the Data Science Program Team Training
Summary of Insights Learned from the Data Science Program Team TrainingFred Chiang
 
KMT 公司简介
KMT 公司简介KMT 公司简介
KMT 公司简介Jinseh Kim
 
2014 年十大商业智能趋势
2014 年十大商业智能趋势2014 年十大商业智能趋势
2014 年十大商业智能趋势Tableau Software
 
研華 智聯工廠與智能設備雙引擎|實踐智慧製造
研華 智聯工廠與智能設備雙引擎|實踐智慧製造  研華 智聯工廠與智能設備雙引擎|實踐智慧製造
研華 智聯工廠與智能設備雙引擎|實踐智慧製造 鼎新電腦
 
R統計軟體簡介
R統計軟體簡介R統計軟體簡介
R統計軟體簡介Person Lin
 
Big-data analytics: challenges and opportunities
Big-data analytics: challenges and opportunitiesBig-data analytics: challenges and opportunities
Big-data analytics: challenges and opportunities台灣資料科學年會
 
R統計軟體 -安裝與使用
R統計軟體 -安裝與使用R統計軟體 -安裝與使用
R統計軟體 -安裝與使用Person Lin
 
資料科學的第一堂課 Data Science Orientation
資料科學的第一堂課 Data Science Orientation資料科學的第一堂課 Data Science Orientation
資料科學的第一堂課 Data Science OrientationRyan Chung
 
機率統計 -- 使用 R 軟體
機率統計 -- 使用 R 軟體機率統計 -- 使用 R 軟體
機率統計 -- 使用 R 軟體鍾誠 陳鍾誠
 
吳齊軒/漫談 R 的學習挑戰與 R 語言翻轉教室
吳齊軒/漫談 R 的學習挑戰與 R 語言翻轉教室吳齊軒/漫談 R 的學習挑戰與 R 語言翻轉教室
吳齊軒/漫談 R 的學習挑戰與 R 語言翻轉教室台灣資料科學年會
 
不會寫程式的人友善上手機器學習-淺談 Azure machine learning studio
不會寫程式的人友善上手機器學習-淺談 Azure machine learning studio不會寫程式的人友善上手機器學習-淺談 Azure machine learning studio
不會寫程式的人友善上手機器學習-淺談 Azure machine learning studioR Ladies Taipei
 
[DSC 2016] 系列活動:許懷中 / R 語言資料探勘實務
[DSC 2016] 系列活動:許懷中 / R 語言資料探勘實務[DSC 2016] 系列活動:許懷中 / R 語言資料探勘實務
[DSC 2016] 系列活動:許懷中 / R 語言資料探勘實務台灣資料科學年會
 
智慧應用與物聯網發展趨勢 (A Development Trend of Smart Applications and IoT)
智慧應用與物聯網發展趨勢 (A Development Trend of Smart Applications and IoT)智慧應用與物聯網發展趨勢 (A Development Trend of Smart Applications and IoT)
智慧應用與物聯網發展趨勢 (A Development Trend of Smart Applications and IoT)William Liang
 
Collaboration with Statistician? 矩陣視覺化於探索式資料分析
Collaboration with Statistician? 矩陣視覺化於探索式資料分析Collaboration with Statistician? 矩陣視覺化於探索式資料分析
Collaboration with Statistician? 矩陣視覺化於探索式資料分析台灣資料科學年會
 
曾韵/沒有大數據怎麼辦 ? 會計師事務所的小數據科學
曾韵/沒有大數據怎麼辦 ? 會計師事務所的小數據科學曾韵/沒有大數據怎麼辦 ? 會計師事務所的小數據科學
曾韵/沒有大數據怎麼辦 ? 會計師事務所的小數據科學台灣資料科學年會
 
初學R語言的60分鐘
初學R語言的60分鐘初學R語言的60分鐘
初學R語言的60分鐘Chen-Pan Liao
 
「資料視覺化」有志一同場次 at 2016 台灣資料科學年會
「資料視覺化」有志一同場次 at 2016 台灣資料科學年會「資料視覺化」有志一同場次 at 2016 台灣資料科學年會
「資料視覺化」有志一同場次 at 2016 台灣資料科學年會台灣資料科學年會
 

Viewers also liked (20)

Summary of Insights Learned from the Data Science Program Team Training
Summary of Insights Learned from the Data Science Program Team TrainingSummary of Insights Learned from the Data Science Program Team Training
Summary of Insights Learned from the Data Science Program Team Training
 
KMT 公司简介
KMT 公司简介KMT 公司简介
KMT 公司简介
 
2014 年十大商业智能趋势
2014 年十大商业智能趋势2014 年十大商业智能趋势
2014 年十大商业智能趋势
 
研華 智聯工廠與智能設備雙引擎|實踐智慧製造
研華 智聯工廠與智能設備雙引擎|實踐智慧製造  研華 智聯工廠與智能設備雙引擎|實踐智慧製造
研華 智聯工廠與智能設備雙引擎|實踐智慧製造
 
新手村-資料探索
新手村-資料探索新手村-資料探索
新手村-資料探索
 
R統計軟體簡介
R統計軟體簡介R統計軟體簡介
R統計軟體簡介
 
Big-data analytics: challenges and opportunities
Big-data analytics: challenges and opportunitiesBig-data analytics: challenges and opportunities
Big-data analytics: challenges and opportunities
 
R統計軟體 -安裝與使用
R統計軟體 -安裝與使用R統計軟體 -安裝與使用
R統計軟體 -安裝與使用
 
資料科學的第一堂課 Data Science Orientation
資料科學的第一堂課 Data Science Orientation資料科學的第一堂課 Data Science Orientation
資料科學的第一堂課 Data Science Orientation
 
第一場預測
第一場預測第一場預測
第一場預測
 
機率統計 -- 使用 R 軟體
機率統計 -- 使用 R 軟體機率統計 -- 使用 R 軟體
機率統計 -- 使用 R 軟體
 
吳齊軒/漫談 R 的學習挑戰與 R 語言翻轉教室
吳齊軒/漫談 R 的學習挑戰與 R 語言翻轉教室吳齊軒/漫談 R 的學習挑戰與 R 語言翻轉教室
吳齊軒/漫談 R 的學習挑戰與 R 語言翻轉教室
 
不會寫程式的人友善上手機器學習-淺談 Azure machine learning studio
不會寫程式的人友善上手機器學習-淺談 Azure machine learning studio不會寫程式的人友善上手機器學習-淺談 Azure machine learning studio
不會寫程式的人友善上手機器學習-淺談 Azure machine learning studio
 
[DSC 2016] 系列活動:許懷中 / R 語言資料探勘實務
[DSC 2016] 系列活動:許懷中 / R 語言資料探勘實務[DSC 2016] 系列活動:許懷中 / R 語言資料探勘實務
[DSC 2016] 系列活動:許懷中 / R 語言資料探勘實務
 
智慧應用與物聯網發展趨勢 (A Development Trend of Smart Applications and IoT)
智慧應用與物聯網發展趨勢 (A Development Trend of Smart Applications and IoT)智慧應用與物聯網發展趨勢 (A Development Trend of Smart Applications and IoT)
智慧應用與物聯網發展趨勢 (A Development Trend of Smart Applications and IoT)
 
Collaboration with Statistician? 矩陣視覺化於探索式資料分析
Collaboration with Statistician? 矩陣視覺化於探索式資料分析Collaboration with Statistician? 矩陣視覺化於探索式資料分析
Collaboration with Statistician? 矩陣視覺化於探索式資料分析
 
曾韵/沒有大數據怎麼辦 ? 會計師事務所的小數據科學
曾韵/沒有大數據怎麼辦 ? 會計師事務所的小數據科學曾韵/沒有大數據怎麼辦 ? 會計師事務所的小數據科學
曾韵/沒有大數據怎麼辦 ? 會計師事務所的小數據科學
 
初學R語言的60分鐘
初學R語言的60分鐘初學R語言的60分鐘
初學R語言的60分鐘
 
「資料視覺化」有志一同場次 at 2016 台灣資料科學年會
「資料視覺化」有志一同場次 at 2016 台灣資料科學年會「資料視覺化」有志一同場次 at 2016 台灣資料科學年會
「資料視覺化」有志一同場次 at 2016 台灣資料科學年會
 
李育杰/The Growth of a Data Scientist
李育杰/The Growth of a Data Scientist李育杰/The Growth of a Data Scientist
李育杰/The Growth of a Data Scientist
 

Similar to 那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper

阿里云Hadoop在云上的最佳实践
阿里云Hadoop在云上的最佳实践阿里云Hadoop在云上的最佳实践
阿里云Hadoop在云上的最佳实践dragoncaol
 
High Throughput Computing Technologies
High Throughput Computing TechnologiesHigh Throughput Computing Technologies
High Throughput Computing TechnologiesJazz Yao-Tsung Wang
 
What could hadoop do for us
What could hadoop do for us What could hadoop do for us
What could hadoop do for us Simon Hsu
 
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來Wei-Yu Chen
 
淺談台灣巨量資料產業供應鏈串聯現況
淺談台灣巨量資料產業供應鏈串聯現況淺談台灣巨量資料產業供應鏈串聯現況
淺談台灣巨量資料產業供應鏈串聯現況Jazz Yao-Tsung Wang
 
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Etu Solution
 
高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DBEtu Solution
 
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹Anna Yen
 
吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践jins0618
 
Data Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTUREData Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTUREJazz Yao-Tsung Wang
 
Hadoop与数据分析
Hadoop与数据分析Hadoop与数据分析
Hadoop与数据分析George Ang
 
Search engine
Search engineSearch engine
Search engineSamchu Li
 
「所知有雲」:維基百科雲端運算中文條目編輯行動發起說明
「所知有雲」:維基百科雲端運算中文條目編輯行動發起說明「所知有雲」:維基百科雲端運算中文條目編輯行動發起說明
「所知有雲」:維基百科雲端運算中文條目編輯行動發起說明Fred Chiang
 
選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲Herman Wu
 
Dreaming Infrastructure
Dreaming InfrastructureDreaming Infrastructure
Dreaming Infrastructurekyhpudding
 
Azure HDInsight 介紹
Azure HDInsight 介紹Azure HDInsight 介紹
Azure HDInsight 介紹Herman Wu
 

Similar to 那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper (20)

Hadoop 介紹 20141024
Hadoop 介紹 20141024Hadoop 介紹 20141024
Hadoop 介紹 20141024
 
Hadoop
HadoopHadoop
Hadoop
 
阿里云Hadoop在云上的最佳实践
阿里云Hadoop在云上的最佳实践阿里云Hadoop在云上的最佳实践
阿里云Hadoop在云上的最佳实践
 
High Throughput Computing Technologies
High Throughput Computing TechnologiesHigh Throughput Computing Technologies
High Throughput Computing Technologies
 
What could hadoop do for us
What could hadoop do for us What could hadoop do for us
What could hadoop do for us
 
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來
 
淺談台灣巨量資料產業供應鏈串聯現況
淺談台灣巨量資料產業供應鏈串聯現況淺談台灣巨量資料產業供應鏈串聯現況
淺談台灣巨量資料產業供應鏈串聯現況
 
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
 
高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB
 
Big Data Communities in Taiwan
Big Data Communities in TaiwanBig Data Communities in Taiwan
Big Data Communities in Taiwan
 
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
 
吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践
 
Data Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTUREData Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTURE
 
Cracking Biz PowerPoint
Cracking Biz PowerPointCracking Biz PowerPoint
Cracking Biz PowerPoint
 
Hadoop与数据分析
Hadoop与数据分析Hadoop与数据分析
Hadoop与数据分析
 
Search engine
Search engineSearch engine
Search engine
 
「所知有雲」:維基百科雲端運算中文條目編輯行動發起說明
「所知有雲」:維基百科雲端運算中文條目編輯行動發起說明「所知有雲」:維基百科雲端運算中文條目編輯行動發起說明
「所知有雲」:維基百科雲端運算中文條目編輯行動發起說明
 
選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲
 
Dreaming Infrastructure
Dreaming InfrastructureDreaming Infrastructure
Dreaming Infrastructure
 
Azure HDInsight 介紹
Azure HDInsight 介紹Azure HDInsight 介紹
Azure HDInsight 介紹
 

More from Fred Chiang

Action Intelligence for Social Good
Action Intelligence for Social GoodAction Intelligence for Social Good
Action Intelligence for Social GoodFred Chiang
 
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)Fred Chiang
 
ESD 2012 Keynote: What Is the next Big Data?
ESD 2012 Keynote: What Is the next Big Data?ESD 2012 Keynote: What Is the next Big Data?
ESD 2012 Keynote: What Is the next Big Data?Fred Chiang
 
Etu Appliance - 2012 TAITRONICS Technology Innovation Awards
Etu Appliance - 2012 TAITRONICS Technology Innovation AwardsEtu Appliance - 2012 TAITRONICS Technology Innovation Awards
Etu Appliance - 2012 TAITRONICS Technology Innovation AwardsFred Chiang
 
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Fred Chiang
 
破雲而出 — 重新發現您的雲端策略
破雲而出 — 重新發現您的雲端策略破雲而出 — 重新發現您的雲端策略
破雲而出 — 重新發現您的雲端策略Fred Chiang
 
所知有雲 Team meetup 2
所知有雲 Team meetup 2所知有雲 Team meetup 2
所知有雲 Team meetup 2Fred Chiang
 
所知有雲 Team meetup 1
所知有雲 Team meetup 1所知有雲 Team meetup 1
所知有雲 Team meetup 1Fred Chiang
 
Elaster Labs, the 1st PaaS in Taiwan
Elaster Labs, the 1st PaaS in TaiwanElaster Labs, the 1st PaaS in Taiwan
Elaster Labs, the 1st PaaS in TaiwanFred Chiang
 
那些雲端運算教我的事
那些雲端運算教我的事那些雲端運算教我的事
那些雲端運算教我的事Fred Chiang
 

More from Fred Chiang (10)

Action Intelligence for Social Good
Action Intelligence for Social GoodAction Intelligence for Social Good
Action Intelligence for Social Good
 
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
 
ESD 2012 Keynote: What Is the next Big Data?
ESD 2012 Keynote: What Is the next Big Data?ESD 2012 Keynote: What Is the next Big Data?
ESD 2012 Keynote: What Is the next Big Data?
 
Etu Appliance - 2012 TAITRONICS Technology Innovation Awards
Etu Appliance - 2012 TAITRONICS Technology Innovation AwardsEtu Appliance - 2012 TAITRONICS Technology Innovation Awards
Etu Appliance - 2012 TAITRONICS Technology Innovation Awards
 
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
 
破雲而出 — 重新發現您的雲端策略
破雲而出 — 重新發現您的雲端策略破雲而出 — 重新發現您的雲端策略
破雲而出 — 重新發現您的雲端策略
 
所知有雲 Team meetup 2
所知有雲 Team meetup 2所知有雲 Team meetup 2
所知有雲 Team meetup 2
 
所知有雲 Team meetup 1
所知有雲 Team meetup 1所知有雲 Team meetup 1
所知有雲 Team meetup 1
 
Elaster Labs, the 1st PaaS in Taiwan
Elaster Labs, the 1st PaaS in TaiwanElaster Labs, the 1st PaaS in Taiwan
Elaster Labs, the 1st PaaS in Taiwan
 
那些雲端運算教我的事
那些雲端運算教我的事那些雲端運算教我的事
那些雲端運算教我的事
 

那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper

  • 1. HadoopCon 2014 那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper Etu 負責人 蔣居裕 @fredchiang fredchiang@etusolution.com September 13, 2014
  • 2. 2 Who am I? 蔣居裕 Fred Chiang Open xxx 的愛好者 資料價值的探索者 社群的參與者 Etu 負責人 ) Blog —《Fred 豢養的雲中象》http://fredbigdata.blogspot.tw all about Hadoop and Big Data 台灣少見以探討 Big Data 趨勢、技術、商業價值為主軸的專業部落格
  • 4. 4 那麼今天 中央研究院 人文社會科學館 國際會議廳 (a.k.a 阿宅的豪華網咖,歡迎自帶網線) 到底有何風景可以看?
  • 5. 5 社群的風景 速度的風景 資料科學的風景 Hadoop的風景
  • 7. 7 感謝贊助商 更感謝講者 Satoshi Tagomori Chris Huang Masahiro Nakagawa 張日昇 謝良奇 Raymond 范姜冠宇 Simon Su 徐瑞興 Kewang 江孟峰 張雅芳 葉祐欣 李佳修
  • 8. 8 最最感謝志工團 周采萱 陳唯綸 劉世偉 Renata Chang (れな) 陳俊廷 戴資力 李佳勳 何永安 方紹昌 劉澤恩 Randy macJack 鍾振杰 林書宇 顏若庭
  • 9. 9 關注大大 ● 大大關注 Jazz Wang 台灣 Hadoop 社群 拿最大支大聲公的 傳教士 最近很欠人手, 要不要來 Etu ? Hadooper: 我還有問題要問, 請保重身體
  • 10. 10 關注大大 ● 大大關注 Wisely Chen (a.k.a The Giive) “因為中國 Hadoop 根基不深,很大程 度「降低了推廣 Spark 的阻力」” Hadooper: 我愛 Hadoop, 我也愛 Spark
  • 13. Pre-processing Query Streaming Transaction Small-scale In-memory Large-scale Near Real-time Real-time 13 運算速度的級別 Persistent Data Large-Large-scale Batch Hrs Secs Millisecs
  • 15. 15 Data Science 的要素 人 分工 團隊 知識 技能 工具 資料 Domain Pain Point Value Up
  • 16. How a typical software vendor approaches 16 Data Science (generally a bunch of developers) The Data Science Venn Diagram 1. Developers think they can handle the domain properly, but actually is not fully able to. Approach Listen to customers. Result Customers realize the developer’s capabilities are just coding. They have never dealt with the danger zone. http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram 2. Developers think they can handle the algorithm as easy as an SQL command, but actually is not able to. Approach Calls for help. Result Developers are just coders. Machine learning is a dream. PRISM 稜鏡計畫 Technical Support Manager
  • 18. 18 你講的是哪個 Hadoop ? Hadoop 1 MRv1 HDFS MRv2 Hadoop 2 HBase Storm Spaek YARN HDFS2
  • 19. 19 你講的 Hadoop 包含什麼 ?
  • 20. 不同的 Use Case, 你需要不同的 Ecosystem 組合 20
  • 21. 21 企業市場:Hadoop Big Data,我們還在跨越鴻溝 Geoffrey Moore’s Technology Adoption Lifecycle We are here, crossing the Chasm 1. Early Market (早期市場) → 專案 (Project) 市場 2. Bowling Alley (保齡球道) → 特定領域可重複銷售的解決方案 (Solution) 市場 3. Tornado (龍捲風暴) → 標準化產品 (Product) 市場 4. Main Street (康莊大道) → 系統 (System) 市場
  • 22. 22 台灣 Hadooper,您填問卷了嗎? https://zh.surveymonkey.com/s/hadoopcon2014 今天晚上就去看電影 現場填,下午抽獎 今天不要用這個填
  • 23. 23 www.etusolution.com/esd2014 Oct. 8 (Wed) @台北君悅
  • 24. 24 Etu is Hiring 1. Software Engineer, Hadoop Platform 2. Software Engineer, Etu Recommender / Etu Insight 3. Professional Service Engineer 4. Data Analysis / Data Mining Engineer 5. Technical Support Manager Resume mail to : hr@etusolution.com
  • 26. Contact www.etusolution.com info@etusolution.com Taipei, Taiwan 318, Rueiguang Rd., Taipei 114, Taiwan T: +886 2 7720 1888 F: +886 2 8798 6069