SlideShare a Scribd company logo
1 of 43
Faster and Easier for HBase 
亦思科技Hubert 范姜冠宇
Who are we? 
• 位於新竹科學園區 
• 過去主要客戶為園區各大製造廠 
• 未來願景: 全球HBase最專業的軟體廠商 
• 努力方向: 
– 提供HBase較好的使用介面 
– 改善HBase效能,提高Availability 
– 提供各產業完善的HBase解決方案
What we done? 
• 2010.7 以研發雲端計算軟體工具之投資計畫獲准進駐新竹科學園區 
• 2011 與清華大學資工系鍾葉青教授合作進行產學合作 
• 少數獲邀參與國際雲端計算研討會IEEE CloudCom的專業公司 
• 少數已經有實際經驗協助客戶完成建置Hadoop 系統的資訊廠商 
• 2012.01 JackHare (ANSI SQL JDBC Driver) 
• 2012.11 HareDB Hbase Client 
• 2012.12 HareDB Data Model Management 
• 2013.08 Hare ( High Speed Query in HBase)
Who am I ? 
• 姓名: 范姜冠宇Hubert 
• 任職: 亦思科技 
• 功能: 
– 設計HBase相關產品與解決方案 
– 替苦悶的RD工程師打氣 
– 在嚴肅場合說冷笑話
TALK ABOUT HBASE
HBase 原生介面
不方便的HBase 
• 資料傾倒問題 
• Table 管理問題 
– Schema 管理問題 
• 查詢問題(方便,效能) 
• 程式學習門檻問題
資料傾倒問題
資料傾倒問題
資料傾倒問題
TABLE管理問題
Table管理
查詢問題
查詢問題(UI Query)
查詢問題(SQL Query)
程式學習門檻問題
如何降低門檻 
• ODBC/JDBC Driver 
• HareSQL Driver 
• Example with R
ODBC DRIVER
ODBC Driver 
• http://www.microsoft.com/en-us/download/details.aspx?id=40886
設定HareDB連線資訊 
• 在`開始`搜尋odbc administrator(如圖) 
• 若作業系統為X64,請執行64-bit;X86請 
執行32-bit。
設定HareDB連線資訊 
• 點選新增,建立新資料來源。 
• 選擇`Microsoft Hive ODBC Driver`後,點 
選完成。
設定HareDB連線資訊
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
SQL STRING
與應用系統整合– ( R )
FASTER
Client 
Hare Executor Coprocessor Windup Server 
Region 4 
HBase 
Hight Speed ? 
HiveQL 
Hive Parser HareDriver 
Hare Planner 
Hare Executor Coprocessor 
Hare Optimizer 
Region 3 
EndPoint 
Instance 
EndPoint 
Instance 
Region 2 
EndPoint 
Instance 
Region 1 
Region 5
SQL A SQL B SQL C SQL E SQL F SQL G SQL H 
Faster 
Impala in Hadoop 115 s 13 s 91 s 78 s 7 s 6 s 
Impala in HBase 2925 s 0.26 s 2338 s 5876 s 5832 s oom 
Hare 
(only for HBase) 
1410 s 9 s 1355 s 1303 s 1283 s 1258 s 1640 s 
Hive in Hadoop 113 s 107 s 110 s 161 s 154 s 163 s 157 s 
Hive mr2 10694 s 22 s 9661 s 9462 s 9461 s 9484 s 9032 s
One more thing ….
Easier and Faster for hbase in HadoopCon 2014

More Related Content

What's hot

阿里自研数据库 Ocean base实践
阿里自研数据库 Ocean base实践阿里自研数据库 Ocean base实践
阿里自研数据库 Ocean base实践drewz lin
 
Kyligence Leverages Alluxio to Accelerate OLAP in the Cloud
Kyligence Leverages Alluxio to Accelerate OLAP in the CloudKyligence Leverages Alluxio to Accelerate OLAP in the Cloud
Kyligence Leverages Alluxio to Accelerate OLAP in the CloudAlluxio, Inc.
 
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lakeJames Chen
 
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...Etu Solution
 
Azure Data Lake 簡介
Azure Data Lake 簡介Azure Data Lake 簡介
Azure Data Lake 簡介Herman Wu
 
如何利用 Amazon EMR 及Athena 打造高成本效益的大數據環境
如何利用 Amazon EMR 及Athena 打造高成本效益的大數據環境如何利用 Amazon EMR 及Athena 打造高成本效益的大數據環境
如何利用 Amazon EMR 及Athena 打造高成本效益的大數據環境Amazon Web Services
 
00.exalogic概览
00.exalogic概览00.exalogic概览
00.exalogic概览Meng He
 
運用MMLSpark 來加速Spark 上 機器學習專案
運用MMLSpark 來加速Spark 上機器學習專案運用MMLSpark 來加速Spark 上機器學習專案
運用MMLSpark 來加速Spark 上 機器學習專案Herman Wu
 
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pubChao Zhu
 
数据科学分析协作平台CDSW
数据科学分析协作平台CDSW数据科学分析协作平台CDSW
数据科学分析协作平台CDSWJianwei Li
 
Distributed Data Analytics at Taobao
Distributed Data Analytics at TaobaoDistributed Data Analytics at Taobao
Distributed Data Analytics at TaobaoMin Zhou
 
2021 二月 Kasten K10 介紹與概觀
2021 二月 Kasten K10 介紹與概觀2021 二月 Kasten K10 介紹與概觀
2021 二月 Kasten K10 介紹與概觀Wales Chen
 
阿里云技术实践
阿里云技术实践阿里云技术实践
阿里云技术实践drewz lin
 
Sql server 2014 新功能探索
Sql server 2014  新功能探索Sql server 2014  新功能探索
Sql server 2014 新功能探索Rico Chen
 
The practice of enjoying apache
The practice of enjoying apacheThe practice of enjoying apache
The practice of enjoying apachejixuan1989
 
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結James Chen
 
Cloudera企业数据中枢平台
Cloudera企业数据中枢平台Cloudera企业数据中枢平台
Cloudera企业数据中枢平台Jianwei Li
 

What's hot (20)

阿里自研数据库 Ocean base实践
阿里自研数据库 Ocean base实践阿里自研数据库 Ocean base实践
阿里自研数据库 Ocean base实践
 
Hadoop hive
Hadoop hiveHadoop hive
Hadoop hive
 
Kyligence Leverages Alluxio to Accelerate OLAP in the Cloud
Kyligence Leverages Alluxio to Accelerate OLAP in the CloudKyligence Leverages Alluxio to Accelerate OLAP in the Cloud
Kyligence Leverages Alluxio to Accelerate OLAP in the Cloud
 
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
 
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
 
Azure Data Lake 簡介
Azure Data Lake 簡介Azure Data Lake 簡介
Azure Data Lake 簡介
 
如何利用 Amazon EMR 及Athena 打造高成本效益的大數據環境
如何利用 Amazon EMR 及Athena 打造高成本效益的大數據環境如何利用 Amazon EMR 及Athena 打造高成本效益的大數據環境
如何利用 Amazon EMR 及Athena 打造高成本效益的大數據環境
 
00.exalogic概览
00.exalogic概览00.exalogic概览
00.exalogic概览
 
運用MMLSpark 來加速Spark 上 機器學習專案
運用MMLSpark 來加速Spark 上機器學習專案運用MMLSpark 來加速Spark 上機器學習專案
運用MMLSpark 來加速Spark 上 機器學習專案
 
Databases on AWS
Databases on AWSDatabases on AWS
Databases on AWS
 
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub
 
数据科学分析协作平台CDSW
数据科学分析协作平台CDSW数据科学分析协作平台CDSW
数据科学分析协作平台CDSW
 
Distributed Data Analytics at Taobao
Distributed Data Analytics at TaobaoDistributed Data Analytics at Taobao
Distributed Data Analytics at Taobao
 
Mapreduce
MapreduceMapreduce
Mapreduce
 
2021 二月 Kasten K10 介紹與概觀
2021 二月 Kasten K10 介紹與概觀2021 二月 Kasten K10 介紹與概觀
2021 二月 Kasten K10 介紹與概觀
 
阿里云技术实践
阿里云技术实践阿里云技术实践
阿里云技术实践
 
Sql server 2014 新功能探索
Sql server 2014  新功能探索Sql server 2014  新功能探索
Sql server 2014 新功能探索
 
The practice of enjoying apache
The practice of enjoying apacheThe practice of enjoying apache
The practice of enjoying apache
 
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
 
Cloudera企业数据中枢平台
Cloudera企业数据中枢平台Cloudera企业数据中枢平台
Cloudera企业数据中枢平台
 

Viewers also liked

3rd Hour- Homelessness Around The World. By. Emily A. Scharich.(:
3rd Hour- Homelessness Around The World. By. Emily A. Scharich.(:3rd Hour- Homelessness Around The World. By. Emily A. Scharich.(:
3rd Hour- Homelessness Around The World. By. Emily A. Scharich.(:yourpassport
 
S.s presentation Zachary
S.s presentation ZacharyS.s presentation Zachary
S.s presentation Zacharyyourpassport
 
Japan earthquake Austin Tyndall
Japan earthquake Austin TyndallJapan earthquake Austin Tyndall
Japan earthquake Austin Tyndallyourpassport
 
Poaching Tyler Amburgey
Poaching Tyler AmburgeyPoaching Tyler Amburgey
Poaching Tyler Amburgeyyourpassport
 
AFP 2011 report universal
AFP 2011 report universalAFP 2011 report universal
AFP 2011 report universalarchforpeople
 
Introduction to Apache Spark
Introduction to Apache Spark Introduction to Apache Spark
Introduction to Apache Spark Hubert Fan Chiang
 
Il segreto del Dio di Michelangelo
Il segreto del Dio di MichelangeloIl segreto del Dio di Michelangelo
Il segreto del Dio di MichelangeloGiulio Maira
 
Domestic violence Hunter g
Domestic violence Hunter gDomestic violence Hunter g
Domestic violence Hunter gyourpassport
 
Marine biology adl
Marine biology adlMarine biology adl
Marine biology adlyourpassport
 
Child abuse worldwide,Jurnee
Child abuse worldwide,JurneeChild abuse worldwide,Jurnee
Child abuse worldwide,Jurneeyourpassport
 

Viewers also liked (20)

3rd Hour- Homelessness Around The World. By. Emily A. Scharich.(:
3rd Hour- Homelessness Around The World. By. Emily A. Scharich.(:3rd Hour- Homelessness Around The World. By. Emily A. Scharich.(:
3rd Hour- Homelessness Around The World. By. Emily A. Scharich.(:
 
Cvmaira[1]
Cvmaira[1]Cvmaira[1]
Cvmaira[1]
 
S.s presentation Zachary
S.s presentation ZacharyS.s presentation Zachary
S.s presentation Zachary
 
Adaptació
AdaptacióAdaptació
Adaptació
 
Wind dylanhearns
Wind dylanhearnsWind dylanhearns
Wind dylanhearns
 
Devon 2
Devon 2Devon 2
Devon 2
 
Japan earthquake Austin Tyndall
Japan earthquake Austin TyndallJapan earthquake Austin Tyndall
Japan earthquake Austin Tyndall
 
Cyclones,quentin
Cyclones,quentinCyclones,quentin
Cyclones,quentin
 
Slide
SlideSlide
Slide
 
Child abuse: eric
Child abuse: ericChild abuse: eric
Child abuse: eric
 
5 indikatorov
5 indikatorov5 indikatorov
5 indikatorov
 
Poaching Tyler Amburgey
Poaching Tyler AmburgeyPoaching Tyler Amburgey
Poaching Tyler Amburgey
 
AFP 2011 report universal
AFP 2011 report universalAFP 2011 report universal
AFP 2011 report universal
 
Liver cancer
Liver cancerLiver cancer
Liver cancer
 
Introduction to Apache Spark
Introduction to Apache Spark Introduction to Apache Spark
Introduction to Apache Spark
 
Child labor
Child laborChild labor
Child labor
 
Il segreto del Dio di Michelangelo
Il segreto del Dio di MichelangeloIl segreto del Dio di Michelangelo
Il segreto del Dio di Michelangelo
 
Domestic violence Hunter g
Domestic violence Hunter gDomestic violence Hunter g
Domestic violence Hunter g
 
Marine biology adl
Marine biology adlMarine biology adl
Marine biology adl
 
Child abuse worldwide,Jurnee
Child abuse worldwide,JurneeChild abuse worldwide,Jurnee
Child abuse worldwide,Jurnee
 

Similar to Easier and Faster for hbase in HadoopCon 2014

高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DBEtu Solution
 
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系Wei-Yu Chen
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里li luo
 
吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践jins0618
 
2015中国软件技术大会-开放云介绍
2015中国软件技术大会-开放云介绍2015中国软件技术大会-开放云介绍
2015中国软件技术大会-开放云介绍Li Jiansheng
 
選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲Herman Wu
 
Bigdata introduction
Bigdata introductionBigdata introduction
Bigdata introductionTechwiser
 
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TWHadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TWJazz Yao-Tsung Wang
 
云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路li luo
 
Zh120226techparty velocity2011-review
Zh120226techparty velocity2011-reviewZh120226techparty velocity2011-review
Zh120226techparty velocity2011-reviewZoom Quiet
 
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎hdhappy001
 
HDInsight for Microsoft Users
HDInsight for Microsoft UsersHDInsight for Microsoft Users
HDInsight for Microsoft UsersKuo-Chun Su
 
Hbase在淘宝的应用与优化 修改
Hbase在淘宝的应用与优化 修改Hbase在淘宝的应用与优化 修改
Hbase在淘宝的应用与优化 修改yp_fangdong
 
Raising The MySQL Bar-Manyi Lu
Raising The MySQL Bar-Manyi LuRaising The MySQL Bar-Manyi Lu
Raising The MySQL Bar-Manyi Lu郁萍 王
 
Paas研究介绍
Paas研究介绍Paas研究介绍
Paas研究介绍snakebbf
 
Hbase optimization and apply summary in taobao
Hbase optimization and apply summary in taobaoHbase optimization and apply summary in taobao
Hbase optimization and apply summary in taobaomingjian deng
 
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...acelyc1112009
 

Similar to Easier and Faster for hbase in HadoopCon 2014 (20)

高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB高科技產業資料分析解決方案 Hare DB
高科技產業資料分析解決方案 Hare DB
 
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
 
Hadoop 介紹 20141024
Hadoop 介紹 20141024Hadoop 介紹 20141024
Hadoop 介紹 20141024
 
吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践
 
2015中国软件技术大会-开放云介绍
2015中国软件技术大会-开放云介绍2015中国软件技术大会-开放云介绍
2015中国软件技术大会-开放云介绍
 
選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲選擇正確的Solution 來建置現代化的雲端資料倉儲
選擇正確的Solution 來建置現代化的雲端資料倉儲
 
Bigdata introduction
Bigdata introductionBigdata introduction
Bigdata introduction
 
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TWHadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TW
 
云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路
 
大數據
大數據大數據
大數據
 
Zh120226techparty velocity2011-review
Zh120226techparty velocity2011-reviewZh120226techparty velocity2011-review
Zh120226techparty velocity2011-review
 
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
 
HDInsight for Microsoft Users
HDInsight for Microsoft UsersHDInsight for Microsoft Users
HDInsight for Microsoft Users
 
Hbase在淘宝的应用与优化 修改
Hbase在淘宝的应用与优化 修改Hbase在淘宝的应用与优化 修改
Hbase在淘宝的应用与优化 修改
 
Raising The MySQL Bar-Manyi Lu
Raising The MySQL Bar-Manyi LuRaising The MySQL Bar-Manyi Lu
Raising The MySQL Bar-Manyi Lu
 
Paas研究介绍
Paas研究介绍Paas研究介绍
Paas研究介绍
 
Hbase optimization and apply summary in taobao
Hbase optimization and apply summary in taobaoHbase optimization and apply summary in taobao
Hbase optimization and apply summary in taobao
 
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
 
Hbase
HbaseHbase
Hbase
 

Easier and Faster for hbase in HadoopCon 2014

Editor's Notes

  1. 左邊的Table是 HBase Table + Hive Table 右邊HBase的欄位也會出現