More Related Content
PDF
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc PDF
Python 3.9からの新定番zoneinfoを使いこなそう PPT
PPTX
PDF
PDF
Apache Arrow - データ処理ツールの次世代プラットフォーム PPTX
Apache Avro vs Protocol Buffers PPTX
What's hot
PDF
PPTX
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理 PDF
PDF
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021 PDF
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2 PPTX
スケールアウトするPostgreSQLを目指して!その第一歩!(NTTデータ テクノロジーカンファレンス 2020 発表資料) PPTX
PPT
PDF
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 PDF
3種類のTEE比較(Intel SGX, ARM TrustZone, RISC-V Keystone) PDF
分散トレーシング技術について(Open tracingやjaeger) PDF
PDF
PPTX
PDF
PHP-FPM の子プロセス制御方法と設定をおさらいしよう PDF
SolrとElasticsearchを比べてみよう PDF
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp PDF
20180729 Preferred Networksの機械学習クラスタを支える技術 PDF
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~ PDF
これがCassandra
- 1.
- 2.
- 3.
システム構成
• Node数:97台
• サーバスペック
機器:DellR410、R420
メモリ:64GB
CPU:16コア、24コア
HDD:600GBx4 (RAID-10)
600GBx2(RAID-1)+SSD 512GB(RAID-0)
• クラスタ数:1
• Cassandraのバージョン:1.1.5-2(独自バージョン)
• KeySpace数:8
• ColumnFamily数:156
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
- 12.
- 13.
- 14.
- 15.
- 16.
- 17.
- 18.
4月
04/20
→ 1:03 88号機メモリリークで障害
→7:57 88号機メモリリークで障害
→ 11:43 88号機メモリリークで障害
全部87号機のrepairがトリガー。。。
ヒープを 12GBにして回避する
→ 23:14 88号機障害(SSD死亡)→ HDDに変更
04/23
→ 89号機メモリリークで障害
メジャーCompactionでふっとぶ。。。
4/24
→ 87号機メモリリークで障害
メジャーCompactionでふっとぶ。。。
- 19.
- 20.
- 21.
- 22.
- 23.
- 24.
- 25.