• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
[B27] エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション by Masataka Oka
 

[B27] エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション by Masataka Oka

on

  • 896 views

 

Statistics

Views

Total Views
896
Views on SlideShare
896
Embed Views
0

Actions

Likes
2
Downloads
10
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    [B27] エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション by Masataka Oka [B27] エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション by Masataka Oka Presentation Transcript

    • エンタ プライズ エンタープライズ NoSQL/Hbase プラットフォーム MapR M R M7 エディシ ン エディション MapR Technologies 株式会社 ソリューション・アーキテクト 岡 昌孝 ©MapR Technologies ‐ Confidential 1
    • MapR M7エディションは 企業利⽤を前提とした、Apache HBase 完全互換のNoSQL プラットフォームです プラットフォ ムです。 信頼性 ©MapR Technologies ‐ Confidential ⾼速性 2 運⽤性
    • たとえば… ⾼速性 他の Hadoop YCSB Benchmark        MapR 3.0.1 YCSB Benchmark 3.0.1  ディストリビューション M7 Advantage デ トリビ シ d (M7エディション)  (ops/sec/node) (HBase) 50% read, 50% update 50% read 50% update 7965 2918 2.7x 2 7x 95% read,  5% update 3850 1541 2.5x Random Read  5934 865 6.9x Range Scan (50 rows) Range Scan (50 ) 838 274 3.1x 3 1x Hardware Configuration ©MapR Technologies ‐ Confidential CPU : Intel® Xeon® CPU E5645  2.40GHz  12 cores x2 RAM : 48 GB Data Disk : 12x 3TB  (7200 rpm) Size – record size = 1k, data size = 2TB OS : CentOS Release 6.2 (Final) 3 10‐Node Cluster
    • アジェンダ  Apache Hb A h Hbase のア キテクチ と課題 のアーキテクチャと課題  MapR とは?/MapRの優位点  MapR M7 エディション  まとめ ©MapR Technologies ‐ Confidential 4
    • Apache HBase のアーキテクチャ Name Node HBaseMaster ZooKeeper ZooKeeper ZooKeeper JVM JVM JVM JVM JVM マスタノード RegionServer RegionServer RegionServer RegionServer JVM JVM JVM JVM ・・・・・・・・・・・ Data Node Data Node Data Node Data Node Data Node Data Node Data Node JVM JVM JVM JVM スレーブノード スレ ブノ ド ©MapR Technologies ‐ Confidential 5
    • Apache HBase のアーキテクチャ RegionServer RegionServer RegionServer RegionServer JVM JVM JVM JVM ・・・・・・・・・・・ Data Node Data Node Data Node Data Node JVM JVM JVM JVM キ レンジ キーレンジ1 リージョン1 キ キーレンジ2 ンジ リージョン2 キ キーレンジ3 ンジ リージョン3 HDFS ©MapR Technologies ‐ Confidential 6 ・・・・・・・・・・・ キ キーレンジn ジ リージョンn
    • Apache HBase ユーザーが抱える課題 ネームノードに単⼀障害点がある 信頼性 パフォーマンスが安定(⼀定)しない ハードウェア障害のデータ損失は防ぐことがで きても操作ミスの復旧の⼿⽴てがない ⾼速性 コンパクションに時間がかかる 複数ユーザーでクラスタを共⽤するときに個別 複数ユ ザ でクラスタを共⽤するときに個別 の権限や運⽤ポリシーの設定が難しい ノ ドを増やしても実際にはリニアにスケ ル ノードを増やしても実際にはリニアにスケール しない 運⽤には経験値の⾼い⼈員が常に不可⽋ ©MapR Technologies ‐ Confidential 7 運⽤性
    • Apache Hadoop に起因する課題 ネームノードに単⼀障害点がある 信頼性 パフォーマンスが安定(⼀定)しない ハードウェア障害のデータ損失は防ぐことがで きても操作ミスの復旧の⼿⽴てがない ⾼速性 コンパクションに時間がかかる 複数ユーザーでクラスタを共⽤するときに個別 複数ユ ザ でクラスタを共⽤するときに個別 の権限や運⽤ポリシーの設定が難しい ノ ドを増やしても実際にはリニアにスケ ル ノードを増やしても実際にはリニアにスケール しない 運⽤には経験値の⾼い⼈員が常に不可⽋ ©MapR Technologies ‐ Confidential 8 運⽤性
    •  Apache HB A h HBase のア キテクチ と課題 のアーキテクチャと課題  MapR とは?/MapR の優位点  MapR M7 エディション  まとめ ©MapR Technologies ‐ Confidential 9
    • MapR = Apache Hadoop + Innovation Apache HBase Table JVM HDFS File File File JVM Linux ファイルシステム Ext3/Ext4 ディスクデバイス Apache HBase Table JVM File File MapR‐FS File ディスクデバイス Table File File MapR‐FS File ディスクデバイス その他のHadoop ディストリビューション MapR-FS: ランダムアクセスとNFSマウントが可能なファイルシステム ©MapR Technologies ‐ Confidential 10
    • アーキテクチャ設計と再実装による性能向上 Apahce Hadoop Java API MapR 100%互換 Java API MapReduce HDFS MB/s 様々な追加機能 MapReduce 再設計 C/C++実装 MapR-FS DFSIO性能 • J bT k HA JobTracker • Direct Shuffle • • • • • • ランダムアクセス 分散NameNode NFSアクセス ボリューム ミラーリング スナップショット ハードウェアの限界性能を引き出すため のアーキテクチャ設計・再実装 MapR • • • • 10ノード, 2xクアッドコア, 24GBメモリ, 11x7200rpm SATA ©MapR Technologies ‐ Confidential 11 ビルトイン圧縮によるI/O削減 分散NameNode RPC経由のShuffle転送 Java GCの影響の排除
    • MapRの⾼い信頼性 単⼀障害点の完全な排除 分散NameNode Apache Hadoop JobTracker HA アクティブなJobTracker MapR Name Node Data Node Hadoop Node NN Data Node Data Node Hadoop Node NN Data Node Hadoop Node NN Hadoop Node NN Data Node Data Node Hadoop Node NN Hadoop Node NN ノード2 ノード3 ノード4 ノード5 Hadoop Node NN Data Node ノード1 Hadoop Node NN JobTracker サービス TaskTracker サービス FileServer サ ビス サービス NFS サービス NameNode機能の分散配置による 耐障害性、スケーラビリティの向上 耐障害性 ビ 向上 ©MapR Technologies ‐ Confidential JobTracker稼働ノードの障害でも 中断されるJob/Taskはない 中断 12
    • システム管理機能の充実によるコスト削減 NFS経由の効率的なデータ⼊出⼒ Web サーバ 処理結果 MapR FS NFSマウント マウントポイント: xx 容量上限: xx レプリケーション数: x 管理権限: xx アプリケーショ プ ン MapReduce ログ出⼒ ボリューム活⽤によるマルチテナント運⽤ ボリュ ムC ミラ 設定 ボリュームC ミラー設定 NFSマウント xxx 「ボリューム」単位でファイルシステムを論理分割し、異 なるポリシーを設定して運⽤管理を分離 スナップショットによるデータ喪失への備え 差分更新 xxx ボリュームB ログの出⼒を直接Hadoopファイルシステムにして中 間ファイルサーバやデータ移動の⼿順を削減 ⽉曜⽇の スナップショッ ト ボリュームA クラスタ稼働状況の瞬時の把握と集中管理 ボリューム ⽕曜⽇の スナップショッ ト 差分更新 使いやすい Web管理画⾯と “Heat Map” 表⽰、アラーム ⽔曜⽇の スナップショッ ト 差分更新 最新版 スナップショットはHadoop ファイルシステム内に作られ、差分のみを格納 ©MapR Technologies ‐ Confidential 13
    • MapR のミラーリング(バックアップ) 容易なバックアップ、災害対応 容易なバックアップ 災害対応 開発環境 本番環境 効率的なバックアップ   データセンター1 WAN データセンター2 差分のみの更新 圧縮、およびチェックサムの上転送 管理、運⽤の容易性 管理 運⽤の容易性   ©MapR Technologies ‐ Confidential WAN クラウド環 境 14 LAN/WAN経由、  本番環境 設定により定期的、またはオンデマ ンドでバックアップ可能 バックアップ時点でのデータの⼀貫 性
    • ボリューム クラスタを構成するノードを論理的に束ねることで、ボリュームを構成 することができます。 •各ボリュームはROOTボリュームを頂点とするファイルシステムの単⼀ネームス 各ボリュ ムはROOTボリュ ムを頂点とするファイルシステムの単 ネ ムス ペースにマウントされます。 ラック#1 ラック#2 ラック#3 ラック#4 / (ROOT) / (ROOT) HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD user/ HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD HDD SSD SSD SSD SSD SSD SSD SSD SSD SSD SSD SSD SSD vol_1/ fast/ /user/vol_1/ /user/vol 1/ /fast/ •ボリューム機能の利点 •ボリューム毎にレプリケーション数、ユーザーアクセスコントロール、クォータ、スナップショット、ミ ラーリングの設定ができる。→マルチテナンシー •特定のデータを間接的に特定のノードに配置できる。→アクセススピードが求められるデータをSSDノー ドに格納する。 •使⽤状況に応じてボリューム毎にノードの拡張、縮退がオンラインのまま可能。 ©MapR Technologies ‐ Confidential 15
    • ファイル/チャンク/コンテナ •MapRクラスタに格納するファイルは256MB(デフォルト)の“チャンク”に分解されます。 •各チャンクは16GB(デフォルト)の“データコンテナ”に格納されます(各コンテナは複数のファ 各チャンクは16GB(デフォルト)の データコンテナ に格納されます(各コンテナは複数のファ イルのチャンクを格納します)。 •各コンテナはボリューム内で複数のノードにレプリケートされます。 ファイル: チャンク チャンク チャンク 256MB 256MB 256MB ・・・・・・・・・・・・・・・・・・・・・・・・・・・・ コンテナ: ・・・・・・・・・・・・・・・・・・・・・ ノード ノード ノード ボリューム: ©MapR Technologies ‐ Confidential 16 ノード
    • CLDB (Container Location Database) CLDBはコンテナの位置情報を提供します。 •CLDBプロセスは複数のノードに常駐し、冗⻑構成します。これらのノードの⼀つにCLDBコン テナが作成され、他のCLDBプロセスノードにレプリケートされます。 •CLDBコンテナにはクラスタ内のすべてのコンテナのノード情報が記録されます。CLDBプロセ スはCLDBコンテナの内容をメモリにロードします。 •各ボリュームにはネームコンテナが配置されます。ネームコンテナはボリューム内のファイルの 位置情報が記録されます。 位置情報が記録されます CLDBコンテナ ネームコンテナ ボリューム名→ネームコンテナID •ノード#1 コンテナID → •ノード#2 •ノード#3 ファイルパス ァ ↓ マウント先ボリューム名/ データコンテナID 例:/user/vol_1/test.data のデータコンテナ解決 “/(ROOT)”ボリューム→ CLDB →“user/”ボリューム→ “ /”ボリ ム “vol_1/”ボリューム→ CLDB CLDB CLDB →ネームコンテナID/ノード/”/user/vol_1/test.data”→ →ネームコンテナID/ノード/”vol_1/test.data”→ ネ ム ンテナID/ノ ド/” l 1/t t d t ” →ネームコンテナID/ノード/”test.data”→ ROOT:ネームコンテナ user:ネームコンテナ ネ ナ Vol_1:ネームコンテナ →データコンテナID→ →ノード/データコンテナID/”test.data”→ データコンテナ •クライアントはCLDB/ネームコンテナの検索結果を常にキャッシュします。 ©MapR Technologies ‐ Confidential 17 →
    • ネームノード vs. CLDB CLDB CLDB CLDB MapR Apache Hadoop CLDB コンテナ NameNode ネームコンテナ ネ ムコンテナ DataNode DataNode ネームコンテナ ネ ムコンテナ DataNode データコンテナ データコンテナ データコンテナ ボリューム ©MapR Technologies ‐ Confidential ネームコンテナ ネ ムコンテナ 18 データコンテナ データコンテナ ボリューム データコンテナ ボリューム
    • ネームノード・ボトルネックの解消 他 ディ リ 他のディストリ ビューション Advantage Rate (creates/s) 14‐16K 335‐360 40x Scale (files) 6B 1.3M 4615x ファイ イル生成/秒 MapR 18000 MapR 16000 400 350 300 250 200 150 100 50 0 他のディストリビュ ション 他のディストリビューション 0 0.5 1 1.5 百万ファイル フ ファイル生成 成/秒 14000 12000 10000 8000 6000 4000 2000 Benchmark: File creates (100B) Hardware: 10 nodes, 2 x 4 cores, 24 GB  RAM, 12 x 1 TB 7200 RPM 他のディストリビューション 0 00             100            200            400            600            800           1000    1000 2000 3000 4000 5000 6000 ©MapR Technologies ‐ Confidential 百万ファイル 19
    •  Apache HB A h HBase のア キテクチ と課題 のアーキテクチャと課題  MapR とは?/MapR の優位点  MapR M7 エディション  まとめ Table File MapR‐FS File MapR FS File ディスクデバイス ©MapR Technologies ‐ Confidential 20
    • HBaseテーブルとファイルシステムの融合 $ mount maprnode:/mapr /mapr $ cd /mapr/default/user/dave $ pwd /mapr/default/user/dave NFS マウント $ ls file1  file2  table1  table2 file1 file2 table1 table2 $ hbase shell hbase(main):003:0> create '/user/dave/table3', 'cf1', 'cf2', 'cf3' 0 row(s) in 0.1570 seconds $ ls file1  file2  table1  table2  table3 file1 file2 table1 table2 table3 $ hadoop fs ‐ls /user/dave Found 5 items ‐rw‐r‐‐r‐‐ 3 mapr mapr ‐rw‐r‐‐r‐‐ 3 mapr mapr trwxr‐xr‐x   3 mapr mapr trwxr xr x   3 mapr mapr trwxr‐xr‐x 3 mapr trwxr‐xr‐x   3 mapr mapr ©MapR Technologies ‐ Confidential Hadoop API 16 2012‐09‐28 08:34 /user/dave/file1 22 2012‐09‐28 08:34 /user/dave/file2 2 2012‐09‐28 08:32 /user/dave/table1 2 2012 09 28 08:33 /user/dave/table2 2 2012‐09‐28 08:33 /user/dave/table2 2 2012‐09‐28 08:38 /user/dave/table3 21
    • MapR プラットフォームの拡張 Hive M MapR% Control% System% S) (MC Pig Cascading Oozie Mahout Flume MapR% Distribu‐ on% for Apache% Hadoop HCatalog Sqoop Whirr Apache% HBase MapReduce HBase& API MapR% Data% Pla*orm% (MDP) NFS% interface HDFS% API HMaster、RegionServer は存在しない。 、 g は存在しな 。 ©MapR Technologies ‐ Confidential 22
    • 複雑すぎるコンポーネント連携 Apache HBase のリージョン割り当て手順 ©MapR Technologies ‐ Confidential 23
    • Apache HBase HFile の構造 それぞれのセルはキー・バリューペア(レコードではない) - カラムの数だけキーを繰り返す 昇順にソート 昇順にソ ト されたキー・ バリューペア 64Kバイトのブ ロック単位で圧縮 圧縮ブロックへのインデッ クスが付加される ©MapR Technologies ‐ Confidential 24
    • HBase リージョンオペレーション  各HFileの典型的サイズは数GB~数⼗GB  リージョンサーバはデータをメモリ上に保持しますが、 上限に達した時点で新しいHFileとしてディスクに書き 出します 新 旧 当該リージョンのキーレンジ ©MapR Technologies ‐ Confidential 25
    • HBase で増⼤するリードオペレーション  get/scanオペレ ションでレコ ドを取得するには全て get/scanオペレーションでレコードを取得するには全て のHFileを読み込む必要がある – スキーマレスなのでどこに必要なカラムがあるのかわからない 新 旧 ©MapR Technologies ‐ Confidential 26
    • HFile のコンパクション  データ読み込み時間を短縮するためにHBaseは定期的に 複数のHFileをひとつのHFileに統合します デフォルトではHFileが⼀定数に達した時点で⾃動的に実⾏され る – コンパクション中はディスクI/Oストームが発⽣し、パフォー マンスが著しく低下する – 週末に⼿動実⾏? – コンパクションはすべてのHFileを読込んでひ とつのファイルに書き出します。 ©MapR Technologies ‐ Confidential 27
    • なぜコンパクションが必要なのか?  HDFS Map/Reduce バッチ処理を想定したファイルシステム – ⼤きなファイルに順次アクセスする –ク クローズ済みのファイルに書き込むことはできない ズ済み フ イルに書き込む とは きな –  MapR-FS ランダムアクセスが可能 – ファイルサイズを問わない – クローズ済みのファイルに編集・追記が可能 – ©MapR Technologies ‐ Confidential 28
    •  Apache HB A h HBase のア キテクチ と課題 のアーキテクチャと課題  MapR とは?/MapR の優位点  MapR M7 エディション  まとめ ©MapR Technologies ‐ Confidential 29
    • 企業ユーザが求めるクオリティの実現 信頼性 ⾼速性 運⽤性 ©MapR Technologies ‐ Confidential 30
    • 企業ユーザが求めるクオリティの実現 分散ネームノード(CLDB) 信頼性 ランダムアクセス可能なMapR-FS NFSアクセス コンパクションの排除 ⾼速性 スナップショット・ミラーリング HMaster、RegionServerの排除 運⽤性 ボリューム定義/管理 真のスケ ラビリティ 真のスケーラビリティ ©MapR Technologies ‐ Confidential 31
    • Apache HBase との⽐較 MapR M7 Apache HBase Apache HBase ファイル/テーブル・ネームス ペースの統合 〇 X クォータ制御 ク タ制御 〇 X データ配置制御 〇 X ネットワ クトラフィックの圧縮 ネットワークトラフィックの圧縮 〇 X 特定ストレージの割当 〇 X SSDノードへの明示的な割当 スナップショット スナ プシ ト 〇 X ミラーリング 〇 X コンパクションの排除 〇 X オンラインアップグレード 〇 X ©MapR Technologies ‐ Confidential 32
    • Apache HBase の制限事項の排除 MapR M7 Apache HBase Apache HBase テーブル数 数十億 100 ノード数 10,000 数百 64 3 カラムファミリ数 ©MapR Technologies ‐ Confidential 33
    • M7 vs. CDH: 50-50 load (read latency) CDH MapR p ©MapR Technologies ‐ Confidential 35
    • M7 vs. CDH: 50-50 Mix (Reads) MapR:スループット CDH:レイテンシ CDH:スループット MapR:レイテンシ イテ シ ©MapR Technologies ‐ Confidential 36
    • M7 vs. CDH: 50‐50 Mix (Updates) MapR:スループット CDH:レイテンシ CDH:スループット MapR:レイテンシ ©MapR Technologies ‐ Confidential 37
    • ベンチマ ク結果 ベンチマーク結果 ©MapR Technologies ‐ Confidential 38
    • ベンチマーク結果 ©MapR Technologies ‐ Confidential 39
    • Apache Drill  Drill 概要 – – –  オープンソース – – – – –  ⾼速かつインタラクティブなクエリーの実⾏ ⾼速かつインタラクティブなクエリ の実⾏ 標準ANSI SQLのサポート Google Dremelをベースの開発 ⽶国、ヨーロッパから数百⼈が開発に参加 コミュニティーの中で開発する機能、APIについて確認済み ⼀部のコンポーネントは既に開発済み Simba Technologies – ODBC 開発元がDrill⽤のODBCドライバーを開発 OpenDremel チームがコードをApache Drillに統合 スケジュール(予定) スケジュ ル(予定) – – 2013年9⽉ 2013年12⽉ ©MapR Technologies ‐ Confidential α版リリース β 40
    • MapR: Apache Hadoop ディストリビューション  Ecoシステムも含めたHadoop完全パッケージ  EcoシステムについてもMapR内で検証の上、製品パッケ ジとして提供 EcoシステムについてもMapR内で検証の上、製品パッケージとして提供  EcoシステムのパッチもMapRから提供  100%標準Hadoopインターフェイス  エンタープライズ向け⾼信頼性  柔軟なファイルシステム  ⾼パフォーマンス ⾼パフォ マンス ©MapR Technologies ‐ Confidential 41
    • ご静聴ありがとうございました。 お問い合わせは sales‐jp@maprtech.com までお願い致します。 ©MapR Technologies ‐ Confidential 42