Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Sho Shimauchi
5,245 views
20分でわかるHBase
PyFes 2012.07 で発表したときのスライドです。 HBaseのアーキテクチャ周りを中心に話しました
Technology
◦
Read more
40
Save
Share
Embed
Embed presentation
Download
Downloaded 107 times
1
/ 48
2
/ 48
3
/ 48
4
/ 48
5
/ 48
6
/ 48
7
/ 48
8
/ 48
9
/ 48
10
/ 48
11
/ 48
12
/ 48
13
/ 48
14
/ 48
15
/ 48
16
/ 48
17
/ 48
18
/ 48
19
/ 48
20
/ 48
21
/ 48
22
/ 48
23
/ 48
24
/ 48
25
/ 48
26
/ 48
27
/ 48
28
/ 48
29
/ 48
30
/ 48
31
/ 48
32
/ 48
33
/ 48
34
/ 48
35
/ 48
36
/ 48
37
/ 48
38
/ 48
39
/ 48
40
/ 48
41
/ 48
42
/ 48
43
/ 48
44
/ 48
45
/ 48
46
/ 48
47
/ 48
48
/ 48
More Related Content
PDF
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
by
Cloudera Japan
PDF
なぜApache HBaseを選ぶのか? #cwt2013
by
Cloudera Japan
PDF
5分でわかる Apache HBase 最新版 #hcj2014
by
Cloudera Japan
PDF
HBaseを用いたグラフDB「Hornet」の設計と運用
by
Toshihiro Suzuki
PDF
Osc2012 spring HBase Report
by
Seiichiro Ishida
PPTX
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
by
LINE Corporation
PPTX
HBase×Impalaで作るアドテク「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
by
Michio Katano
PDF
刊行記念セミナー「HBase徹底入門」
by
cyberagent
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
by
Cloudera Japan
なぜApache HBaseを選ぶのか? #cwt2013
by
Cloudera Japan
5分でわかる Apache HBase 最新版 #hcj2014
by
Cloudera Japan
HBaseを用いたグラフDB「Hornet」の設計と運用
by
Toshihiro Suzuki
Osc2012 spring HBase Report
by
Seiichiro Ishida
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
by
LINE Corporation
HBase×Impalaで作るアドテク「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
by
Michio Katano
刊行記念セミナー「HBase徹底入門」
by
cyberagent
What's hot
PPTX
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
by
Cloudera Japan
PDF
CDH4.1オーバービュー
by
Cloudera Japan
PDF
HDFS HA セミナー #hadoop
by
Cloudera Japan
PDF
第25回 Hadoopソースコードリーディング 「HBase 最新情報」
by
Toshihiro Suzuki
PPTX
HDFS Supportaiblity Improvements
by
Cloudera Japan
PDF
HBase at Ameba
by
Toshihiro Suzuki
PDF
MapR M7 技術概要
by
MapR Technologies Japan
PDF
HBase at LINE
by
Shun Nakamura
PPTX
Cloudera Impala Seminar Jan. 8 2013
by
Cloudera Japan
PPTX
Cloudera大阪セミナー 20130219
by
Cloudera Japan
PDF
Evolution of Impala #hcj2014
by
Cloudera Japan
PDF
Hadoopのシステム設計・運用のポイント
by
Cloudera Japan
PDF
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
by
Insight Technology, Inc.
PDF
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
by
Hadoop / Spark Conference Japan
PDF
Cloudera Manager 5 (hadoop運用) #cwt2013
by
Cloudera Japan
PDF
HBaseCon 2012 参加レポート
by
NTT DATA OSS Professional Services
PDF
Cloudera impalaの性能評価(Hiveとの比較)
by
Yukinori Suda
PDF
Guide to Cassandra for Production Deployments
by
smdkk
PDF
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
by
Sho Shimauchi
PDF
CDH5最新情報 #cwt2013
by
Cloudera Japan
Introduction to Impala ~Hadoop用のSQLエンジン~ #hcj13w
by
Cloudera Japan
CDH4.1オーバービュー
by
Cloudera Japan
HDFS HA セミナー #hadoop
by
Cloudera Japan
第25回 Hadoopソースコードリーディング 「HBase 最新情報」
by
Toshihiro Suzuki
HDFS Supportaiblity Improvements
by
Cloudera Japan
HBase at Ameba
by
Toshihiro Suzuki
MapR M7 技術概要
by
MapR Technologies Japan
HBase at LINE
by
Shun Nakamura
Cloudera Impala Seminar Jan. 8 2013
by
Cloudera Japan
Cloudera大阪セミナー 20130219
by
Cloudera Japan
Evolution of Impala #hcj2014
by
Cloudera Japan
Hadoopのシステム設計・運用のポイント
by
Cloudera Japan
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会...
by
Insight Technology, Inc.
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
by
Hadoop / Spark Conference Japan
Cloudera Manager 5 (hadoop運用) #cwt2013
by
Cloudera Japan
HBaseCon 2012 参加レポート
by
NTT DATA OSS Professional Services
Cloudera impalaの性能評価(Hiveとの比較)
by
Yukinori Suda
Guide to Cassandra for Production Deployments
by
smdkk
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
by
Sho Shimauchi
CDH5最新情報 #cwt2013
by
Cloudera Japan
Viewers also liked
PDF
Facebook Messages & HBase
by
强 王
PPT
Cassandra v0.6-siryou
by
あしたのオープンソース研究所
PPT
Hbase勉強会(第一回)メモ
by
Takashi Kambayashi
PPTX
HBase スキーマ設計のポイント
by
daisuke-a-matsui
PPTX
Mongo sharding
by
Takahiro Inoue
PDF
MongoDBで作るソーシャルデータ新解析基盤
by
Takahiro Inoue
PDF
Hadoop概要説明
by
Satoshi Noto
PDF
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
by
NTT DATA OSS Professional Services
PDF
20090713 Hbase Schema Design Case Studies
by
Evan Liu
PDF
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
by
Recruit Technologies
PDF
リクルート式ビッグデータ活用術
by
Recruit Technologies
PDF
Cassandraとh baseの比較して入門するno sql
by
Yutuki r
Facebook Messages & HBase
by
强 王
Cassandra v0.6-siryou
by
あしたのオープンソース研究所
Hbase勉強会(第一回)メモ
by
Takashi Kambayashi
HBase スキーマ設計のポイント
by
daisuke-a-matsui
Mongo sharding
by
Takahiro Inoue
MongoDBで作るソーシャルデータ新解析基盤
by
Takahiro Inoue
Hadoop概要説明
by
Satoshi Noto
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
by
NTT DATA OSS Professional Services
20090713 Hbase Schema Design Case Studies
by
Evan Liu
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
by
Recruit Technologies
リクルート式ビッグデータ活用術
by
Recruit Technologies
Cassandraとh baseの比較して入門するno sql
by
Yutuki r
Similar to 20分でわかるHBase
PDF
Hadoopエコシステムのデータストア振り返り
by
NTT DATA OSS Professional Services
PDF
Lars George HBase Seminar with O'REILLY Oct.12 2012
by
Cloudera Japan
PDF
20120423 hbase勉強会
by
Toshiaki Toyama
DOC
cassandra調査レポート
by
Akihiro Kuwano
PDF
HBase Across the World #LINE_DM
by
Cloudera Japan
PDF
Facebookのリアルタイム Big Data 処理
by
maruyama097
KEY
NHN techcon-20120519-fujimoto
by
Masaki Fujimoto
PDF
Hadoop, NoSQL, GlusterFSの概要
by
日本ヒューレット・パッカード株式会社
PDF
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
by
Cloudera Japan
PDF
TokyoWebminig カジュアルなHadoop
by
Teruo Kawasaki
PDF
OSC2012 OSC.DB Hadoop
by
Shinichi YAMASHITA
PPT
Googleの基盤クローン Hadoopについて
by
Kazuki Ohta
PPT
Hadoop ~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
PDF
WDD2012_SC-004
by
Kuninobu SaSaki
PDF
Cloudian nosql casestudy_20120318
by
CLOUDIAN KK
PDF
20120317 IT系勉強会 in 神戸
by
Takahiro Iwase
PDF
HBase活用事例 #hbase_ca
by
Cloudera Japan
PPTX
Hadoop summit 2012 report
by
Sho Shimauchi
PDF
20120405 setsunaセミナー
by
Takahiro Iwase
PPT
Inside mobage platform
by
Toru Yamaguchi
Hadoopエコシステムのデータストア振り返り
by
NTT DATA OSS Professional Services
Lars George HBase Seminar with O'REILLY Oct.12 2012
by
Cloudera Japan
20120423 hbase勉強会
by
Toshiaki Toyama
cassandra調査レポート
by
Akihiro Kuwano
HBase Across the World #LINE_DM
by
Cloudera Japan
Facebookのリアルタイム Big Data 処理
by
maruyama097
NHN techcon-20120519-fujimoto
by
Masaki Fujimoto
Hadoop, NoSQL, GlusterFSの概要
by
日本ヒューレット・パッカード株式会社
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
by
Cloudera Japan
TokyoWebminig カジュアルなHadoop
by
Teruo Kawasaki
OSC2012 OSC.DB Hadoop
by
Shinichi YAMASHITA
Googleの基盤クローン Hadoopについて
by
Kazuki Ohta
Hadoop ~Yahoo! JAPANの活用について~
by
Yahoo!デベロッパーネットワーク
WDD2012_SC-004
by
Kuninobu SaSaki
Cloudian nosql casestudy_20120318
by
CLOUDIAN KK
20120317 IT系勉強会 in 神戸
by
Takahiro Iwase
HBase活用事例 #hbase_ca
by
Cloudera Japan
Hadoop summit 2012 report
by
Sho Shimauchi
20120405 setsunaセミナー
by
Takahiro Iwase
Inside mobage platform
by
Toru Yamaguchi
20分でわかるHBase
1.
20分でわかるHBase Python Developers Festa
2012.07 #pyfes 2012/07/28 @shiumachi
2.
アジェンダ • HBaseとは
• HBaseのデータ構造 • HBaseのテーブル構造とアーキテクチャ • リージョン分割〜HBaseにおけるシャーディン グ〜 • アーキテクチャから見るHBaseの使い方 • ???
3.
お前誰よ? • Sho
Shimauchi ( @shiumachi ) • Cloudera の問い合わせ担当 • ここ最近で一番衝撃的だった問い合わせは、 私の個人ブログの内容について説明してほし いというもの(しかも4年前の記事)
4.
HBase 本日本語訳出ました
• Cloudera の Lars George が書いた HBase のバイ ブル • 訳は安心の玉川さん • レビュー手伝ってました • 今日話すことは全部こ の「馬本」に書いてます
5.
HBaseとは
6.
HBase とは •
分散DB • 列ファミリ指向DB • ソートマップDB • キーバリューストア
7.
なぜHBaseを使うのか RDBMSにデータが入りきらない シャーディングしなきゃいけない
だるい
8.
なぜHBaseを使うのか 頑張ってシャーディングした 書き込みがスケールしない
\(^o^)/オワタ
9.
なぜHBaseを使うのか • シャーディングをサポートしてる
– 自動シャーディング – コマンド一発で手動シャーディング • 書き込みがスケールする • データの耐障害性も確保されてる – これはHadoopのファイルシステムHDFSの機能
10.
HBaseのデータ構造
11.
HBaseのデータ構造 シンプルなキーバリュー型
キー 値
12.
HBaseのデータ構造 キーが「行」「列ファミリ」「列」「タイムスタンプ」 に分かれている
タイム 行キー 列ファミリ 列 値 スタンプ
13.
HBaseのデータ構造 キーバリューがソートされてならんでいる
タイム 行キー 列ファミリ 列 値 スタンプ r1 cf1 c1 1000 ‘python’ r1 cf1 c2 1000 ‘php’ r1 cf2 c1 1000 ‘ruby’ r2 cf1 c2 1000 ‘java’
14.
CM データ構造の話は馬本の 9章冒頭に詳しく書かれて います
是非買って読んでください
15.
HBaseのテーブル構造と アーキテクチャ
16.
HBaseのテーブル構造 • テーブルはリージョン/列ファミリごとに別ファ
イルに保存される • リージョンは、指定された行キーの範囲で分 割される
17.
HBaseのテーブル構造 • 1リージョンには列ファミリの数だけストアファイルが存在
• 実際はもう少し複雑だがここでは簡略化して説明 列ファミリ1 列ファミリ1 リージョン ストアファイル a -‐ c リージョン d -‐ f リージョン d -‐ f
18.
HBaseのアーキテクチャ • RegionServer
– リージョンを管理する • Zookeeper – リージョンサーバの配置や管理テーブルの配置 など、HBaseの中核情報を管理する • HMaster – データそのものは扱わず、管理情報を収集し管 理インタフェースを提供する
19.
リージョンサーバ クライアントはリージョン
クライアント サーバのリージョンに 直接アクセスする リージョンサーバ リージョンサーバ リージョン リージョン
20.
リージョンの位置を知るには? • .META.
テーブル – リージョンサーバとリージョンのマップ情報 – クライアントは .META. テーブルに問い合せて場所を 確認 • ROOT テーブル – .META. の場所をポイントするだけのテーブル – クライアントはROOTテーブルを見て.META.テーブル を探す – ROOTテーブルの場所はZooKeeperに保存されている
21.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
22.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンAに書き込みたい リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
23.
リージョンAにアクセスする場合 クライアント
ZooKeeper ROOTテーブルどこよ? リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
24.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンサーバ1にあるよ リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
25.
リージョンAにアクセスする場合 クライアント
ZooKeeper .META.テーブルどこよ? リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
26.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンサーバ2にあるよ リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
27.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンAはどこよ? リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
28.
リージョンAにアクセスする場合 クライアント
ZooKeeper リージョンサーバ2にあるよ リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
29.
リージョンAにアクセスする場合 クライアント
ZooKeeper ようやくアクセスできた! 場所はキャッシュしたので、 もうZooKeeperや管理テー ブルを見る必要はない! リージョンサーバ1 リージョンサーバ2 ROOT .META. リージョンA
30.
CM データの流れの話は馬本 の8章に詳しく書かれてい ます
是非買って読んでください
31.
リージョン分割〜HBaseにおける シャーディング〜
32.
リージョン分割 • リージョンが大きくなりすぎるとHBaseはリー
ジョンを自動で分割する • 分割はコストがかかる上管理が大変になるの で、手動による分割を推奨 • 特にデータ投入前の事前分割は強く推奨
33.
リージョン分割
このリージョンは大きくなり すぎたので分割しよう リージョンサーバ リージョンサーバ リージョン
34.
リージョン分割 リージョンサーバ
リージョンサーバ リージョン リージョン
35.
リージョン分割
分割したうちの片方は他の リージョンサーバに渡そう リージョンサーバ リージョンサーバ リージョン リージョン
36.
リージョン分割 ZooKeeperは分割を常に監
ZooKeeper 視している 分割完了後、.META.も更新 される リージョンサーバ リージョンサーバ ROOT .META. リージョン リージョン
37.
アーキテクチャから見るHBaseの 使い方
38.
スキーマ設計 • 列ファミリだけはテーブル作成時に定義しな
ければいけない – 列は任意の数だけ追加可能(所詮はただのキー) • 列ファミリの数だけファイル数が増える – 通常1つ、多くとも3つにとどめる
39.
行キー設計 • ランダムかシーケンシャルか
• ランダムアクセス重視 – 書き込みをリージョンで散らす – 行キーをハッシュにしてしまうなど • シーケンシャル重視 – スキャン(一括取得)したい場合など – 行キーを並べておく
40.
CM データの流れの話は馬本 の8章に詳しく書かれてい ます スキーマ設計の話は9章 に書いてます
是非買って読んでください
41.
まとめ
42.
今日話したこと •
HBaseのデータ構造(キーバリュー) • HBaseのアーキテクチャ • リージョンの考え方 • スキーマ・行キー設計
43.
今日話していないこと(一部) • 先行書き込みログ
– HBaseが壊れてもデータが残っていることを保証 • メムストア – メモリキャッシュのようなもの • フラッシュとコンパクション • HBase API – Java – Thri (python もあるよ) – REST – hbase shell (jruby ベースのインタラクティブシェル) • フィルタ • コプロセッサ • HBCK • MapReduce • データのインポート・エクスポートツール
44.
CM もちろん馬本には全部書 いてあります
是非買って読んでください
45.
まとめ • HBase
を使うことはそんなに難しくありません – 少なくとも自力でシャーディングするよりマシ • 性能を引き出そうとすればそれなりの知識が 必要です – 他の技術も同じ • 正しく活用して、高速かつスケーラブルな HBaseをエンジョイしましょう!
46.
CM HBaseを使いこなすにはド キュメントは必須です 現在手に入る唯一にして 最高のHBase本、それが 馬本です
是非買って読んでください
47.
HBase トレーニング始めました 7月30日(来週の月曜)から、日本語でもHBase トレーニングを始めます
馬本だけじゃ無理という人は是非参加してくだ さい h]p://www.cloudera.co.jp/university/ hbase.html
48.
おしまい
Download