More Related Content
PPT
PDF
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート PDF
20221117_クラウドネイティブ向けYugabyteDB活用シナリオ PDF
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料) PDF
PDF
PPTX
PDF
What's hot
PPT
PPTX
トランザクションをSerializableにする4つの方法 PDF
PostgreSQLレプリケーション10周年!徹底紹介!(PostgreSQL Conference Japan 2019講演資料) PDF
MHA for MySQLとDeNAのオープンソースの話 PDF
PPTX
PDF
PDF
AWS で Presto を徹底的に使いこなすワザ PPTX
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best... PDF
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019) PPTX
Db2をAWS上に構築する際のヒント&TIPS 2019年7月版 PDF
IoT時代におけるストリームデータ処理と急成長の Apache Flink PPTX
監査要件を有するシステムに対する PostgreSQL 導入の課題と可能性 PDF
バッチ処理にバインド変数はもうやめません? ~|バッチ処理の突発遅延を題材にして考えてみる~ PPTX
PDF
PDF
Cassandra導入事例と現場視点での苦労したポイント cassandra summit2014jpn PDF
PPTX
PostgreSQLのfull_page_writesについて(第24回PostgreSQLアンカンファレンス@オンライン 発表資料) PDF
性能問題を起こしにくい 強いDBシステムの作り方(Ver. 2018.9) Viewers also liked
PPTX
PDF
Cassandraとh baseの比較して入門するno sql PDF
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料) PDF
PPTX
Cassandra Operations at Netflix PDF
cassandra 100 node cluster admin operation PDF
How you can contribute to Apache Cassandra PDF
PDF
Cassandra 3.0 - JSON at scale - StampedeCon 2015 PDF
深層ニューラルネットワークによる知識の自動獲得・推論 PPTX
PDF
Guide to Cassandra for Production Deployments PPTX
PDF
PPTX
RDBとNoSQLの上手な付き合い方(勉強会@LIG 2013/11/11) PDF
Similar to Cassandraのバックアップと運用を考える
PDF
PDF
SQLアンチパターン - 開発者を待ち受ける25の落とし穴 (拡大版) PDF
PostgreSQLアーキテクチャ入門(PostgreSQL Conference 2012) PPTX
PDF
Datastax Enterpriseをはじめよう PDF
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ... PPTX
Hadoopソースコードリーディング8/MapRを使ってみた PDF
FOSE2010 ミニチュートリアル 「データマイニング技術を応用したソフトウェア構築・保守支援」 DOC
PDF
InfoTalk springbreak_2012 PDF
20110517 okuyama ソーシャルメディアが育てた技術勉強会 PDF
Flume cassandra real time log processing (日本語) PPTX
Cassandra Summit 2016 注目セッション報告 PDF
PDF
[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会... PDF
PDF
Hadoop - OSC2010 Tokyo/Spring PDF
PDF
Osc2012 spring HBase Report PPT
More from Kazutaka Tomita
PPTX
PPTX
Apache sparkとapache cassandraで行うテキスト解析 PPTX
PPTX
PPTX
Apache cassandraと apache sparkで作るデータ解析プラットフォーム PDF
PPTX
PPT
PDF
PPTX
PPTX
PPTX
PPTX
PPTX
PPTX
What is row level isolation on cassandra Cassandraのバックアップと運用を考える
- 1.
- 2.
自己紹介
冨田 和孝 (@railute)
肩書き:株式会社INTHEFOREST 代表取締役社長
Cassandra商用サポート、Cassandraコンサルティング他
Cassandra勉強会主宰
2か月に一度程度開催。現在、第24回まで開催。
職種:本職はDB・インフラ系エンジニア
以前、某レストランサーチのDBA
高負荷・大容量・大規模のOracleRACとPostgreSQLと
MySQLに苦しめられ続けた経験あり。
NLPおよびテキストマイニング始め〼た。
(実はもともと言語学(日本語)専攻。)
- 3.
Cassandraサポートサービス
サービス プラチナ ゴールド スタンダード
サポート※1 無制限 月間80時間迄 月間40時間迄
サポート時間 24 x 365 平日9時-5時 平日9時-5時
Apache Cassandraへの不
○ ○ ○
具合報告
重大インシデント対応
○ × ×
の緊急パッチ提供
障害切分け ○ × ×
環境構築支援 ○ ○ ×
運用支援 ○ ○ ×
※1メール中心のサポートとなります。対応時間には問い合わせ対応、構築・運用支援に関する情報
提供などが含まれます。
- 4.
Cassandra トレーニング
Cassandra 概要
対象者 Cassandraをこれから使用する方
期間 1日間(9:00-17:30)
バージョン 1.1,1.0(0.8等も可)
•Cassandraの歴史
•Cassandraのアーキテクチャ
内容 •Cassandraのインストールと起動停止方法
•Cassandraの利用(設定ファイル、ログの種類)
•Cassandra CLI
- 5.
Agenda
Cassandraの前提
監視をするということ
バックアップをするということ
- 6.
- 7.
Cassandraの前提
SSTableは Write Once
通常時 不整合時
データの更新は
Memtableへ
Memtable Memtable
※SSTableは常に作
BloomFilter BloomFilter 不整合発生
成時以外の更新処 更新
理は行われない。
SSTable
SSTable
SSTable
SSTable
SSTable
SSTable
再構築
Memtable JVMのGC Memtable
BloomFilter BloomFilter
不要SSTable削除
SSTable
SSTable
SSTable
SSTable
SSTable
SSTable
SSTableMerg
e
Compaction時 SSTable削除時
- 8.
- 9.
- 10.
- 11.
- 12.
監視をするということ
メモリ使用量
Cassandraはメモリ喰い
GCが適切に行われているか
Compactionが適切に行われているか
Flushが適切に行われているか
上記すべての要因が正常に行われていない
とメモリとディスクを圧迫する
- 13.
- 14.
監視をするということ
Write HeavyはCPUバンド
Writeの処理はbloomfilterの演算・Flush・
Compactionなどが入るためCPUを使いまくります。
書
FlushWriter
Commitlog
MemTable
込
み
命
令
Compaction
bloomfilter
Manager
SSTable
- 15.
監視をするということ
Read heavy はIO・メモリバンド
読
込 MemTable
み Cache
命
令
bloomfilter
SSTable
- 16.
監視をするということ
Jconsole
• JMXの情報取得の基本
• JDKに付属している
• 目視監視であれば使いやすい
- 17.
- 18.
監視をするということ
OPSCenter
DataStax社謹製
Cassandraのみを扱う限りはとて
も使いやすい
- 19.
監視をするということ
Zabbix
2.0系からJMXをネイティブサポート
Cassandra以外も一括管理ができるた
め運用方法としてはよいかも。
※Nagios+RRDtoolもまだまだ使えると
思います。(好きなようにgraphを作
れるという意味ではRRDToolは捨てが
たい。)
- 20.
- 21.
- 22.
バックアップをするということ
データの整合性に関する考え方
データはこのノードに保存される
ハッシュ化:場所確
定
データ
{KEY:VALUE}
Timestamp:世代確
定
逆説的にデータはこの各ノー
ドのデータがどれか一つあれ
ば取得できる。
- 23.
- 24.
- 25.
- 26.
- 27.
バックアップをするということ
オペレーションリカバリ
1. 指定のキーで指定のバージョンが格納
されているバックアップSSTableを取得
2. 他のクラスターにリカバリ
3. 希望データを取得
指定のキーが入っ 期待のバージョン
ているノードを特 が入っている
定 SSTableのバック リストア
Memtable
BloomFilter アップを取得
SSTable
SSTable
SSTable
SSTable
- 28.
バックアップをするということ
サーバー移行
1. 最新バックアップSSTableを取得
2. 他のHWにリカバリ
3. IPを差し替え
4. repair
サーバー移行
最新SSTableのバッ
対象ノード
Memtable
クアップを取得 リストア
BloomFilter
SSTable
SSTable
SSTable
SSTable
- 29.
バックアップをするということ
監査
1. バックアップSSTableを取得
2. S3あたりに流し込みましょう
最新SSTableのバッ
Memtable
クアップを取得
BloomFilter
S3
SSTable
SSTable
SSTable
SSTable
- 30.
まとめ
バックアップ
データのある場所を抑える
ノード間でバックアップタイミングをずらしデータの確保を行う
必要なところだけ取得することも可能