SlideShare a Scribd company logo
1 of 28
Download to read offline
高通量運算技術與平台
High Throughput Computing Technologies
and NCHC's Platform Service
國家高速網路與計算中心
王耀聰 <jazz@narlabs.org.tw>
2013/09/13 - 2013 Big Data 前瞻論壇
22
知識源自彙整過去,
    智慧在能預測未來
http://www.pursuantgroup.com/blog/tag/dikw-model/
資料多寡不是
重點,重點是
我們想要產生
什麼價值呢?
時效合理嘛?
成本合理嘛?
33
大家都說「資料是金礦」,
  那就讓我們拿採礦當類比吧!
Open Data資料集
分析資料的合法性
資料鑑價?
個資法
商業模式
金礦
開採權
含金度
提煉廠 分析平台與工具軟體 SMAQ
開採成本 總擁有成本 軟硬體投資
國際金價 提供給客戶的價值 產品通路
44
巨量資料的三大挑戰
3 Vs of Big Data
巨量資料的挑戰在於如何管理「數量」、「增加率」與「多樣性」
Volume 資料數量
(amount of data)
Velocity 資料增加率
(speed of data in/out)
Variety 資料多樣性
(data types, sources)
Batch ( 批次作業 )
Realtime ( 即時資料 )
TB
EB
Unstructured
非結構化資料
Semi-structured
半結構化資料
Structured
結構化資料
PB
參考來源:
[1] Laney, Douglas. "3D Data Management: Controlling
Data Volume, Velocity and Variety" (6 February 2001)
[2] Gartner Says Solving 'Big Data' Challenge Involves
More Than Just Managing Volumes of Data, June 2011
55
處理巨量資料的三類技術 (1)
Data at Rest – MapReduce Framework
Volume
VelocityVariety
TB
EB
PB
Realtime
Batch
Structured
Unstructured
M
apReduce
Fram
ework
PetabyteFileSystem
HadoopHadoop
HPCCHPCC
6
巨量資料處理的資訊架構
The SMAQ stack for big data
做網頁相關的人可能聽過 LAMP
未來處理海量資料的人必需知道
SMAQ ( Storage, MapReduce and Query )
參考來源: The SMAQ stack for big data , Edd Dumbill , 22 September 2010 ,   
      http://radar.oreilly.com/2010/09/the-smaq-stack-for-big-data.html
圖片來源: http://smashingweb.ge6.org/wp-content/uploads/2011/10/apache-php-mysql-ubuntu.png
7
高資料通量處理平台 Hadoop
Key Concept : Data Locality
Hadoop 是一個讓使用者簡易撰寫並
執行處理海量資料應用程式的軟體平台。
亦可以想像成一個處理海量資料的生產線,只須
學會定義 map 跟 reduce 工作站該做哪些事情。
就像工廠的倉庫
存放生產原料跟待售貨物
HDFS 存放
待處理的非結構化資料
與處理後的結構化資料
生產機台
Map
一進一出
包裝機台
Reduce
多進一出
8
批次作業的運算時間
Processing Time of Batch Jobs
99
處理巨量資料的三類技術 (2)
Data in Motion – In-Memory Processing
Volume
VelocityVariety
TB
EB
PB
Realtime
Batch
Structured
Unstructured
HBase / DrillHBase / Drill
/ Impala/ Impala
10
Google 的技術演進 vs
Apache 專案
Google File System
(2003)
MapReduce
(2004)
BigTable
(2006)
Percolator
(2010)
Pregel
(2009)
Dremel
(2010)
HDFS
(2006)
Hadoop MapReduce
(2006)
Apache HBase
(2007)
Graph Database
Big Query
(JSON, SQL-like)
Incremental Index Update
(Caffeine)
Apache Drill
(2012)
Apache Giraph
(2011)
1111
令人眼花撩亂的多樣化資料庫選擇
NoSQL vs NewSQL
http://www.infoq.com/news/2011/04/newsql
12
In-Memory Processing 的運算時間
以 HBase 為例
1313
處理巨量資料的三類技術 (3)
Streaming Data Collection
Volume
VelocityVariety
TB
EB
PB
Realtime
Batch
Structured
Unstructured
Message QueueMessage Queue
Storm / KafkaStorm / Kafka
1414
巨量資料的奇幻漂流
     Life of Big Data
15
Twitter Storm
+ Apache Kafka
http://blog.infochimps.com/2012/10/30/next-gen-real-time-streaming-storm-kafka-integration/
16
混合模式的巨量資料處理架構
Lambda Architecture
Source: Lambda Architecture, 8. March 2013
http://www.ymc.ch/en/lambda-architecture-part-1
HBase
Storm
ElephantDB
Or
Voldemort
高通量運算平台現況與未來規劃
國家高速網路與計算中心
王耀聰 <jazz@narlabs.org.tw>
2013/09/13 - 2013 Big Data 前瞻論壇
1818
hadoop.nchc.org.tw 現況

2009-04-13 對外開放申請帳號, 12 台

2010-10-20 完成升級, 21 台

截至 2013-09-10 ,共計 4012 人次申請

系統現況: 6 台故障, 15 台繼續服務中

累計服務對象數: ( 根據註冊資料整理結果 )

94 所大學

33 間民間公司

3 所醫院 ( 國泰 / 童綜合 / 龍泉榮民醫院 )
19
目前系統架構
Current Architectre
20
全台首座公用 Hadoop 實驗叢集
On-Demand Self Service
Powered by Zterm
http://zhouer.org/ZTerm/
21
讓網路受限的用戶更便利
- Web-based Console
22
便利熟悉高階語言的資料分析用戶
- RStudio 開發環境
http://hadoop.nchc.org.tw/rstudio/
23
營運經驗分享
Lesson Learned

善用 CDH 或 HDP2 的套件 : 好處是易於管理跟升級

大量帳號的管理:
– 用 DRBL 內建指令大量建立帳號 /opt/drbl/sbin/drbl-useradd
– 超過 5000+ 帳號該怎麼管理? LDAP + OpenID 帳號整合
– 生命週期管理! ( 多人共用環境,由生到滅,要訂好遊戲規則 )

使用者預設 HDFS 家目錄
– 跑迴圈切換使用者,下 hadoop fs -mkdir tmp

安全性:設定使用者 HDFS 權限
– 跑迴圈切換使用者,下 hadoop dfs -chown $(id) /usr/$(id)
– 然後跑 hadoop dfs -chmod -R 700 /usr/$(id)
24
營運經驗分享
Lesson Learned

硬碟規劃
– JBOD 架構,不用硬體 RAID 。
– I/O 分流: HDFS 一顆 ( 以上 ) 硬碟, MapReduce 一顆硬碟

記憶體規劃
– 面對記憶體怪物,記得切 SWAP Partition
– 未來面對 In-Memory Processing 的需求,記得多買記憶體

規劃黃金法則 @ 2013
– 1 core : 2~8 GB RAM : 2 TB Disk
25
用戶需求分享
Lesson Learned from Users

使用者不熟悉該如何使用我們提供的服務
– 對外開辦教育訓練還不夠,直接深入各個需求單位會更好!

應用為王:資料庫、網頁服務與 Mobile App 整合需求頗高
– 該挑選 NoSQL 還是 NewSQL 呢?端看 I/O 特性!

上游: Open Data ,下游:統計分析應用
– Data as a Service :資料集提供本身就是一種服務
– 不要期待使用者改變寫程式的方法,儘量迎合他們熟悉的工具

整合虛擬化
– 許多論文都需要跑不同節點數的效能比較
– 個人研究資料如何保密?網路如何切割?透過虛擬化作隔離!
26
未來規劃
Future Plan
分散式儲存 (HDFS,MooseFS, 提升同時讀寫資料通量 )
支援在地運算的工作排程 (MapReduce)
分散式資料庫 (Ex. HBase)
資料倉儲 (Ex. Hive) 高階語言
介面
(Ex. Pig)
資料探勘工具庫 (Ex. Nutch, Lucene , Solr)
分析預測工具庫 (Ex. R, Mahout)
多
租
戶
帳
號
管
理
與
系
統
監
控
自
動
化
安
裝
佈
署
使用者介面 ( Web-based GUI / IDE )
網路化虛擬 (Ex. Open vSwitch)
虛擬化管理軟體 (Ex. KVM + OpenNebula)
27
虛擬化雲端服務平台
( 晶片組須支援虛擬化 )
vSwitch
Power User
For
Analytics
Hadoop
Cluster
VM#1
Hadoop
Cluster
VM#2
Hadoop
Cluster
VM#3
8 VCPU 4 VCPU 4 VCPU 4 VCPU
16G RAM 32G RAM 32G RAM 32G RAM
4 SATA 4 SATA 4 SATA
MooseFS ( for VM )
ATA over Ethernet
(AoE)
4 SATA 4 SATA 4 SATA
4 SATA 4 SATA 4 SATA
DN DN
NM NM
NN 1
RM
NN 2
YARN
4 SATA
4 SATA
高通量資料分析平台
(JBOD 儲存架構 )
28
問題與討論
Questions?

More Related Content

What's hot

Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來Wei-Yu Chen
 
Using Alluxio in Tencent's News and Personalized Push Services
Using Alluxio in Tencent's News and Personalized Push ServicesUsing Alluxio in Tencent's News and Personalized Push Services
Using Alluxio in Tencent's News and Personalized Push ServicesAlluxio, Inc.
 
Hdfs introduction
Hdfs introductionHdfs introduction
Hdfs introductionbaggioss
 
数据的价值和灵魂
数据的价值和灵魂数据的价值和灵魂
数据的价值和灵魂学峰 司
 
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Jazz Yao-Tsung Wang
 
浅谈数据科学
浅谈数据科学浅谈数据科学
浅谈数据科学学峰 司
 
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結James Chen
 
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 HadooperFred Chiang
 
大數據獲利模式 Ch 2
大數據獲利模式 Ch 2大數據獲利模式 Ch 2
大數據獲利模式 Ch 2Hans Shih
 
对My sql dba的一些思考
对My sql dba的一些思考对My sql dba的一些思考
对My sql dba的一些思考thinkinlamp
 
杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务hdhappy001
 
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰Ching-Lin Tao
 
MongoDB介绍
MongoDB介绍MongoDB介绍
MongoDB介绍popeast
 
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pubChao Zhu
 
資訊管理 CH6 資料倉儲、資料探勘與巨量資料分析系統 (Data Warehouse、Data Mining、Big Data Analytic sys...
資訊管理 CH6 資料倉儲、資料探勘與巨量資料分析系統 (Data Warehouse、Data Mining、Big Data Analytic sys...資訊管理 CH6 資料倉儲、資料探勘與巨量資料分析系統 (Data Warehouse、Data Mining、Big Data Analytic sys...
資訊管理 CH6 資料倉儲、資料探勘與巨量資料分析系統 (Data Warehouse、Data Mining、Big Data Analytic sys...luna chen
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践hdhappy001
 

What's hot (20)

Hadoop 介紹 20141024
Hadoop 介紹 20141024Hadoop 介紹 20141024
Hadoop 介紹 20141024
 
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來
 
Using Alluxio in Tencent's News and Personalized Push Services
Using Alluxio in Tencent's News and Personalized Push ServicesUsing Alluxio in Tencent's News and Personalized Push Services
Using Alluxio in Tencent's News and Personalized Push Services
 
Hdfs introduction
Hdfs introductionHdfs introduction
Hdfs introduction
 
数据的价值和灵魂
数据的价值和灵魂数据的价值和灵魂
数据的价值和灵魂
 
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)
 
浅谈数据科学
浅谈数据科学浅谈数据科学
浅谈数据科学
 
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
 
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
 
Life of Big Data Technologies
Life of Big Data TechnologiesLife of Big Data Technologies
Life of Big Data Technologies
 
大數據獲利模式 Ch 2
大數據獲利模式 Ch 2大數據獲利模式 Ch 2
大數據獲利模式 Ch 2
 
Hadoop.TW : Now and Future
Hadoop.TW : Now and FutureHadoop.TW : Now and Future
Hadoop.TW : Now and Future
 
对My sql dba的一些思考
对My sql dba的一些思考对My sql dba的一些思考
对My sql dba的一些思考
 
杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务
 
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
 
数据仓库
数据仓库数据仓库
数据仓库
 
MongoDB介绍
MongoDB介绍MongoDB介绍
MongoDB介绍
 
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub
 
資訊管理 CH6 資料倉儲、資料探勘與巨量資料分析系統 (Data Warehouse、Data Mining、Big Data Analytic sys...
資訊管理 CH6 資料倉儲、資料探勘與巨量資料分析系統 (Data Warehouse、Data Mining、Big Data Analytic sys...資訊管理 CH6 資料倉儲、資料探勘與巨量資料分析系統 (Data Warehouse、Data Mining、Big Data Analytic sys...
資訊管理 CH6 資料倉儲、資料探勘與巨量資料分析系統 (Data Warehouse、Data Mining、Big Data Analytic sys...
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
 

Viewers also liked

Big Data Tools : PAST, NOW and FUTURE
Big Data Tools : PAST, NOW and FUTUREBig Data Tools : PAST, NOW and FUTURE
Big Data Tools : PAST, NOW and FUTUREJazz Yao-Tsung Wang
 
Unattended Apache BigTop installer CD using preseed
Unattended Apache BigTop installer CD using preseedUnattended Apache BigTop installer CD using preseed
Unattended Apache BigTop installer CD using preseedJazz Yao-Tsung Wang
 
Introduction to TreasureData Cloud
Introduction to TreasureData CloudIntroduction to TreasureData Cloud
Introduction to TreasureData CloudJazz Yao-Tsung Wang
 
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform SecurityJazz Yao-Tsung Wang
 
Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望Jazz Yao-Tsung Wang
 
Hadoop and Spark Analytics over Better Storage
Hadoop and Spark Analytics over Better StorageHadoop and Spark Analytics over Better Storage
Hadoop and Spark Analytics over Better StorageSandeep Patil
 
Introduction to Diskless Remote Boot in Linux
Introduction to Diskless Remote Boot in LinuxIntroduction to Diskless Remote Boot in Linux
Introduction to Diskless Remote Boot in LinuxJazz Yao-Tsung Wang
 
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TWHadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TWJazz Yao-Tsung Wang
 
ClassCloud: switch your PC Classroom into Cloud Testbed
ClassCloud: switch your PC Classroom into Cloud TestbedClassCloud: switch your PC Classroom into Cloud Testbed
ClassCloud: switch your PC Classroom into Cloud TestbedJazz Yao-Tsung Wang
 
The Trend Of Cloud Computing And How Should Public Sectors Adjust
The Trend Of Cloud Computing And How Should Public Sectors AdjustThe Trend Of Cloud Computing And How Should Public Sectors Adjust
The Trend Of Cloud Computing And How Should Public Sectors AdjustJazz Yao-Tsung Wang
 
Big Data : The Missing Puzzle of Mobile Computing
Big Data : The Missing Puzzle of Mobile ComputingBig Data : The Missing Puzzle of Mobile Computing
Big Data : The Missing Puzzle of Mobile ComputingJazz Yao-Tsung Wang
 
淺談台灣巨量資料產業供應鏈串聯現況
淺談台灣巨量資料產業供應鏈串聯現況淺談台灣巨量資料產業供應鏈串聯現況
淺談台灣巨量資料產業供應鏈串聯現況Jazz Yao-Tsung Wang
 
Cloud Computing for Bioinformatics
Cloud Computing for BioinformaticsCloud Computing for Bioinformatics
Cloud Computing for BioinformaticsJazz Yao-Tsung Wang
 
Unattended Apache BigTop installer CD using preseed
Unattended Apache BigTop installer CD using preseedUnattended Apache BigTop installer CD using preseed
Unattended Apache BigTop installer CD using preseedJazz Yao-Tsung Wang
 
RMLL 2013 : Build Your Personal Search Engine using Crawlzilla
RMLL 2013 : Build Your Personal Search Engine using CrawlzillaRMLL 2013 : Build Your Personal Search Engine using Crawlzilla
RMLL 2013 : Build Your Personal Search Engine using CrawlzillaJazz Yao-Tsung Wang
 
Big data taiwan_supply_chain_and_communities_20130912
Big data taiwan_supply_chain_and_communities_20130912Big data taiwan_supply_chain_and_communities_20130912
Big data taiwan_supply_chain_and_communities_20130912Jazz Yao-Tsung Wang
 

Viewers also liked (20)

Big Data Tools : PAST, NOW and FUTURE
Big Data Tools : PAST, NOW and FUTUREBig Data Tools : PAST, NOW and FUTURE
Big Data Tools : PAST, NOW and FUTURE
 
Unattended Apache BigTop installer CD using preseed
Unattended Apache BigTop installer CD using preseedUnattended Apache BigTop installer CD using preseed
Unattended Apache BigTop installer CD using preseed
 
Introduction to TreasureData Cloud
Introduction to TreasureData CloudIntroduction to TreasureData Cloud
Introduction to TreasureData Cloud
 
When R meet Hadoop
When R meet HadoopWhen R meet Hadoop
When R meet Hadoop
 
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security
 
Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望Hadoop 生態系十年回顧與未來展望
Hadoop 生態系十年回顧與未來展望
 
Hadoop and Spark Analytics over Better Storage
Hadoop and Spark Analytics over Better StorageHadoop and Spark Analytics over Better Storage
Hadoop and Spark Analytics over Better Storage
 
Introduction to Diskless Remote Boot in Linux
Introduction to Diskless Remote Boot in LinuxIntroduction to Diskless Remote Boot in Linux
Introduction to Diskless Remote Boot in Linux
 
Enterprise Data Lake in Action
Enterprise Data Lake in ActionEnterprise Data Lake in Action
Enterprise Data Lake in Action
 
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TWHadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TW
 
ClassCloud: switch your PC Classroom into Cloud Testbed
ClassCloud: switch your PC Classroom into Cloud TestbedClassCloud: switch your PC Classroom into Cloud Testbed
ClassCloud: switch your PC Classroom into Cloud Testbed
 
13 11-08
13 11-0813 11-08
13 11-08
 
The Trend Of Cloud Computing And How Should Public Sectors Adjust
The Trend Of Cloud Computing And How Should Public Sectors AdjustThe Trend Of Cloud Computing And How Should Public Sectors Adjust
The Trend Of Cloud Computing And How Should Public Sectors Adjust
 
Big Data : The Missing Puzzle of Mobile Computing
Big Data : The Missing Puzzle of Mobile ComputingBig Data : The Missing Puzzle of Mobile Computing
Big Data : The Missing Puzzle of Mobile Computing
 
淺談台灣巨量資料產業供應鏈串聯現況
淺談台灣巨量資料產業供應鏈串聯現況淺談台灣巨量資料產業供應鏈串聯現況
淺談台灣巨量資料產業供應鏈串聯現況
 
Cloud Computing for Bioinformatics
Cloud Computing for BioinformaticsCloud Computing for Bioinformatics
Cloud Computing for Bioinformatics
 
Unattended Apache BigTop installer CD using preseed
Unattended Apache BigTop installer CD using preseedUnattended Apache BigTop installer CD using preseed
Unattended Apache BigTop installer CD using preseed
 
RMLL 2013 : Build Your Personal Search Engine using Crawlzilla
RMLL 2013 : Build Your Personal Search Engine using CrawlzillaRMLL 2013 : Build Your Personal Search Engine using Crawlzilla
RMLL 2013 : Build Your Personal Search Engine using Crawlzilla
 
HPC For Bioinformatics
HPC For BioinformaticsHPC For Bioinformatics
HPC For Bioinformatics
 
Big data taiwan_supply_chain_and_communities_20130912
Big data taiwan_supply_chain_and_communities_20130912Big data taiwan_supply_chain_and_communities_20130912
Big data taiwan_supply_chain_and_communities_20130912
 

Similar to High Throughput Computing Technologies

云存储与虚拟化分论坛 基于云计算的海量数据挖掘
云存储与虚拟化分论坛 基于云计算的海量数据挖掘云存储与虚拟化分论坛 基于云计算的海量数据挖掘
云存储与虚拟化分论坛 基于云计算的海量数据挖掘Riquelme624
 
Challenges and opportunities computing Kuo-Yi Chen
Challenges and opportunities computing   Kuo-Yi ChenChallenges and opportunities computing   Kuo-Yi Chen
Challenges and opportunities computing Kuo-Yi Chenkuoyichen
 
Greenplum技术
Greenplum技术Greenplum技术
Greenplum技术锐 张
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里li luo
 
3D systems整理概況分析
3D systems整理概況分析3D systems整理概況分析
3D systems整理概況分析Gina Chang
 
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理Kay Yan
 
Top100summit 夏彦刚-视频cdn系统建设关键要点探讨
Top100summit 夏彦刚-视频cdn系统建设关键要点探讨Top100summit 夏彦刚-视频cdn系统建设关键要点探讨
Top100summit 夏彦刚-视频cdn系统建设关键要点探讨drewz lin
 
Hadoop大数据实践经验
Hadoop大数据实践经验Hadoop大数据实践经验
Hadoop大数据实践经验Hanborq Inc.
 
Data Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTUREData Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTUREJazz Yao-Tsung Wang
 
Dtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnDtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnyp_fangdong
 
海量計算的學習歷程分析與雲端資料庫管理系統Sqlmr appliance一體機開發計畫書 20140101
海量計算的學習歷程分析與雲端資料庫管理系統Sqlmr appliance一體機開發計畫書 20140101海量計算的學習歷程分析與雲端資料庫管理系統Sqlmr appliance一體機開發計畫書 20140101
海量計算的學習歷程分析與雲端資料庫管理系統Sqlmr appliance一體機開發計畫書 20140101Jackie Liu
 
03 李实恭-乘云之势以智致远 0611
03 李实恭-乘云之势以智致远 061103 李实恭-乘云之势以智致远 0611
03 李实恭-乘云之势以智致远 0611ikewu83
 
海通证券金融云思考与实践(数据技术嘉年华2017)
海通证券金融云思考与实践(数据技术嘉年华2017)海通证券金融云思考与实践(数据技术嘉年华2017)
海通证券金融云思考与实践(数据技术嘉年华2017)Zhaoyang Wang
 
2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratch2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratchFEG
 
逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构Denodo
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践Wensong Zhang
 

Similar to High Throughput Computing Technologies (20)

云存储与虚拟化分论坛 基于云计算的海量数据挖掘
云存储与虚拟化分论坛 基于云计算的海量数据挖掘云存储与虚拟化分论坛 基于云计算的海量数据挖掘
云存储与虚拟化分论坛 基于云计算的海量数据挖掘
 
Challenges and opportunities computing Kuo-Yi Chen
Challenges and opportunities computing   Kuo-Yi ChenChallenges and opportunities computing   Kuo-Yi Chen
Challenges and opportunities computing Kuo-Yi Chen
 
Greenplum技术
Greenplum技术Greenplum技术
Greenplum技术
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
 
3D systems整理概況分析
3D systems整理概況分析3D systems整理概況分析
3D systems整理概況分析
 
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理
 
Top100summit 夏彦刚-视频cdn系统建设关键要点探讨
Top100summit 夏彦刚-视频cdn系统建设关键要点探讨Top100summit 夏彦刚-视频cdn系统建设关键要点探讨
Top100summit 夏彦刚-视频cdn系统建设关键要点探讨
 
Dell
DellDell
Dell
 
Hadoop大数据实践经验
Hadoop大数据实践经验Hadoop大数据实践经验
Hadoop大数据实践经验
 
Data Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTUREData Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTURE
 
Dtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnDtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cn
 
海量計算的學習歷程分析與雲端資料庫管理系統Sqlmr appliance一體機開發計畫書 20140101
海量計算的學習歷程分析與雲端資料庫管理系統Sqlmr appliance一體機開發計畫書 20140101海量計算的學習歷程分析與雲端資料庫管理系統Sqlmr appliance一體機開發計畫書 20140101
海量計算的學習歷程分析與雲端資料庫管理系統Sqlmr appliance一體機開發計畫書 20140101
 
03 李实恭-乘云之势以智致远 0611
03 李实恭-乘云之势以智致远 061103 李实恭-乘云之势以智致远 0611
03 李实恭-乘云之势以智致远 0611
 
Java@taobao
Java@taobaoJava@taobao
Java@taobao
 
海通证券金融云思考与实践(数据技术嘉年华2017)
海通证券金融云思考与实践(数据技术嘉年华2017)海通证券金融云思考与实践(数据技术嘉年华2017)
海通证券金融云思考与实践(数据技术嘉年华2017)
 
Emc keynote 1130 1200
Emc keynote 1130 1200Emc keynote 1130 1200
Emc keynote 1130 1200
 
網路規劃與設計
網路規劃與設計網路規劃與設計
網路規劃與設計
 
2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratch2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratch
 
逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践
 

High Throughput Computing Technologies