Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Yahoo!デベロッパーネットワーク
PDF, PPTX
2,464 views
リペア時間短縮にむけた取り組み@Yahoo! JAPAN #casstudy
第37回Cassandra勉強会 https://casstudy.connpass.com/event/57701/ で発表した資料です。
Technology
◦
Read more
2
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 33
2
/ 33
3
/ 33
4
/ 33
5
/ 33
6
/ 33
7
/ 33
8
/ 33
9
/ 33
10
/ 33
11
/ 33
12
/ 33
13
/ 33
14
/ 33
15
/ 33
16
/ 33
17
/ 33
18
/ 33
19
/ 33
20
/ 33
21
/ 33
22
/ 33
23
/ 33
24
/ 33
25
/ 33
26
/ 33
27
/ 33
28
/ 33
29
/ 33
30
/ 33
31
/ 33
32
/ 33
33
/ 33
More Related Content
PPT
Cassandraのしくみ データの読み書き編
by
Yuki Morishita
PDF
SparkとCassandraの美味しい関係
by
datastaxjp
PDF
Scalar DB: Universal Transaction Manager
by
Scalar, Inc.
PPT
インフラエンジニアのためのcassandra入門
by
Akihiro Kuwano
PDF
Yahoo! JAPANにおけるApache Cassandraへの取り組み
by
Yahoo!デベロッパーネットワーク
PDF
MySQL Replication Performance Tuning for Fun and Profit!
by
Vitor Oliveira
PPTX
Kafka Tutorial - Introduction to Apache Kafka (Part 1)
by
Jean-Paul Azar
PDF
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
by
NTT DATA OSS Professional Services
Cassandraのしくみ データの読み書き編
by
Yuki Morishita
SparkとCassandraの美味しい関係
by
datastaxjp
Scalar DB: Universal Transaction Manager
by
Scalar, Inc.
インフラエンジニアのためのcassandra入門
by
Akihiro Kuwano
Yahoo! JAPANにおけるApache Cassandraへの取り組み
by
Yahoo!デベロッパーネットワーク
MySQL Replication Performance Tuning for Fun and Profit!
by
Vitor Oliveira
Kafka Tutorial - Introduction to Apache Kafka (Part 1)
by
Jean-Paul Azar
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
by
NTT DATA OSS Professional Services
What's hot
PPTX
Apache Spark 2.4 and 3.0 What's Next?
by
NTT DATA Technology & Innovation
PDF
コンテナとimmutableとわたし。あとセキュリティ。(Kubernetes Novice Tokyo #15 発表資料)
by
NTT DATA Technology & Innovation
PDF
MHA for MySQLとDeNAのオープンソースの話
by
Yoshinori Matsunobu
PDF
Real-Life Use Cases & Architectures for Event Streaming with Apache Kafka
by
Kai Wähner
PDF
Db2 v11.5.4 高可用性構成 & HADR 構成パターンご紹介
by
IBM Analytics Japan
PPTX
RDB開発者のためのApache Cassandra データモデリング入門
by
Yuki Morishita
PDF
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
by
Amazon Web Services Japan
PDF
Dynamically Scaling Data Streams across Multiple Kafka Clusters with Zero Fli...
by
Flink Forward
PDF
[AWS EXpert Online for JAWS-UG 18] 見せてやるよ、Step Functions の本気ってやつをな
by
Amazon Web Services Japan
PDF
Infrastructure as Code (IaC) 談義 2022
by
Amazon Web Services Japan
PPTX
Envoy and Kafka
by
Adam Kotwasinski
PDF
2023年はTiDBの時代!
by
Tomotaka6
PDF
MySQL 5.7にやられないためにおぼえておいてほしいこと
by
yoku0825
PPTX
Apache Kafka Best Practices
by
DataWorks Summit/Hadoop Summit
PDF
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
by
Amazon Web Services Japan
PDF
アーキテクチャから理解するPostgreSQLのレプリケーション
by
Masahiko Sawada
PPTX
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
by
NTT DATA Technology & Innovation
PPTX
MongoDBが遅いときの切り分け方法
by
Tetsutaro Watanabe
PDF
ksqlDB로 실시간 데이터 변환 및 스트림 처리
by
confluent
PDF
20200811 AWS Black Belt Online Seminar CloudEndure
by
Amazon Web Services Japan
Apache Spark 2.4 and 3.0 What's Next?
by
NTT DATA Technology & Innovation
コンテナとimmutableとわたし。あとセキュリティ。(Kubernetes Novice Tokyo #15 発表資料)
by
NTT DATA Technology & Innovation
MHA for MySQLとDeNAのオープンソースの話
by
Yoshinori Matsunobu
Real-Life Use Cases & Architectures for Event Streaming with Apache Kafka
by
Kai Wähner
Db2 v11.5.4 高可用性構成 & HADR 構成パターンご紹介
by
IBM Analytics Japan
RDB開発者のためのApache Cassandra データモデリング入門
by
Yuki Morishita
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
by
Amazon Web Services Japan
Dynamically Scaling Data Streams across Multiple Kafka Clusters with Zero Fli...
by
Flink Forward
[AWS EXpert Online for JAWS-UG 18] 見せてやるよ、Step Functions の本気ってやつをな
by
Amazon Web Services Japan
Infrastructure as Code (IaC) 談義 2022
by
Amazon Web Services Japan
Envoy and Kafka
by
Adam Kotwasinski
2023年はTiDBの時代!
by
Tomotaka6
MySQL 5.7にやられないためにおぼえておいてほしいこと
by
yoku0825
Apache Kafka Best Practices
by
DataWorks Summit/Hadoop Summit
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
by
Amazon Web Services Japan
アーキテクチャから理解するPostgreSQLのレプリケーション
by
Masahiko Sawada
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
by
NTT DATA Technology & Innovation
MongoDBが遅いときの切り分け方法
by
Tetsutaro Watanabe
ksqlDB로 실시간 데이터 변환 및 스트림 처리
by
confluent
20200811 AWS Black Belt Online Seminar CloudEndure
by
Amazon Web Services Japan
More from Yahoo!デベロッパーネットワーク
PDF
ゼロから始める転移学習
by
Yahoo!デベロッパーネットワーク
PDF
継続的なモデルモニタリングを実現するKubernetes Operator
by
Yahoo!デベロッパーネットワーク
PDF
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
by
Yahoo!デベロッパーネットワーク
PDF
オンプレML基盤on Kubernetes パネルディスカッション
by
Yahoo!デベロッパーネットワーク
PDF
LakeTahoe
by
Yahoo!デベロッパーネットワーク
PDF
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
by
Yahoo!デベロッパーネットワーク
PDF
Persistent-memory-native Database High-availability Feature
by
Yahoo!デベロッパーネットワーク
PDF
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
by
Yahoo!デベロッパーネットワーク
PDF
eコマースと実店舗の相互利益を目指したデザイン #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
ビッグデータから人々のムードを捉える #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
サイエンス領域におけるMLOpsの取り組み #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
「新しいおうち探し」のためのAIアシスト検索 #yjtc
by
Yahoo!デベロッパーネットワーク
PDF
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
by
Yahoo!デベロッパーネットワーク
ゼロから始める転移学習
by
Yahoo!デベロッパーネットワーク
継続的なモデルモニタリングを実現するKubernetes Operator
by
Yahoo!デベロッパーネットワーク
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
by
Yahoo!デベロッパーネットワーク
オンプレML基盤on Kubernetes パネルディスカッション
by
Yahoo!デベロッパーネットワーク
LakeTahoe
by
Yahoo!デベロッパーネットワーク
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
by
Yahoo!デベロッパーネットワーク
Persistent-memory-native Database High-availability Feature
by
Yahoo!デベロッパーネットワーク
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
by
Yahoo!デベロッパーネットワーク
eコマースと実店舗の相互利益を目指したデザイン #yjtc
by
Yahoo!デベロッパーネットワーク
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
by
Yahoo!デベロッパーネットワーク
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
by
Yahoo!デベロッパーネットワーク
ビッグデータから人々のムードを捉える #yjtc
by
Yahoo!デベロッパーネットワーク
サイエンス領域におけるMLOpsの取り組み #yjtc
by
Yahoo!デベロッパーネットワーク
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
by
Yahoo!デベロッパーネットワーク
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
by
Yahoo!デベロッパーネットワーク
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
by
Yahoo!デベロッパーネットワーク
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
by
Yahoo!デベロッパーネットワーク
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
by
Yahoo!デベロッパーネットワーク
「新しいおうち探し」のためのAIアシスト検索 #yjtc
by
Yahoo!デベロッパーネットワーク
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
by
Yahoo!デベロッパーネットワーク
Recently uploaded
PDF
2025→2026宙畑ゆく年くる年レポート_100社を超える企業アンケート総まとめ!!_企業まとめ_1229_3版
by
sorabatake
PDF
100年後の知財業界-生成AIスライドアドリブプレゼン イーパテントYouTube配信
by
e-Patent Co., Ltd.
PDF
Team Topology Adaptive Organizational Design for Rapid Delivery of Valuable S...
by
akipii ogaoga
PDF
自転車ユーザ参加型路面画像センシングによる点字ブロック検出における性能向上方法の模索 (20260123 SeMI研)
by
Yuto Matsuda
PDF
Reiwa 7 IT Strategist Afternoon I Question-1 Ansoff's Growth Vector
by
akipii ogaoga
PDF
PMBOK 7th Edition Project Management Process Scrum
by
akipii ogaoga
PDF
PMBOK 7th Edition_Project Management Process_WF Type Development
by
akipii ogaoga
PDF
Reiwa 7 IT Strategist Afternoon I Question-1 3C Analysis
by
akipii ogaoga
PDF
FY2025 IT Strategist Afternoon I Question-1 Balanced Scorecard
by
akipii ogaoga
PDF
ST2024_PM1_2_Case_study_of_local_newspaper_company.pdf
by
akipii ogaoga
PDF
Starlink Direct-to-Cell (D2C) 技術の概要と将来の展望
by
CRI Japan, Inc.
PDF
PMBOK 7th Edition_Project Management Context Diagram
by
akipii ogaoga
PDF
第21回 Gen AI 勉強会「NotebookLMで60ページ超の スライドを作成してみた」
by
嶋 是一 (Yoshikazu SHIMA)
2025→2026宙畑ゆく年くる年レポート_100社を超える企業アンケート総まとめ!!_企業まとめ_1229_3版
by
sorabatake
100年後の知財業界-生成AIスライドアドリブプレゼン イーパテントYouTube配信
by
e-Patent Co., Ltd.
Team Topology Adaptive Organizational Design for Rapid Delivery of Valuable S...
by
akipii ogaoga
自転車ユーザ参加型路面画像センシングによる点字ブロック検出における性能向上方法の模索 (20260123 SeMI研)
by
Yuto Matsuda
Reiwa 7 IT Strategist Afternoon I Question-1 Ansoff's Growth Vector
by
akipii ogaoga
PMBOK 7th Edition Project Management Process Scrum
by
akipii ogaoga
PMBOK 7th Edition_Project Management Process_WF Type Development
by
akipii ogaoga
Reiwa 7 IT Strategist Afternoon I Question-1 3C Analysis
by
akipii ogaoga
FY2025 IT Strategist Afternoon I Question-1 Balanced Scorecard
by
akipii ogaoga
ST2024_PM1_2_Case_study_of_local_newspaper_company.pdf
by
akipii ogaoga
Starlink Direct-to-Cell (D2C) 技術の概要と将来の展望
by
CRI Japan, Inc.
PMBOK 7th Edition_Project Management Context Diagram
by
akipii ogaoga
第21回 Gen AI 勉強会「NotebookLMで60ページ超の スライドを作成してみた」
by
嶋 是一 (Yoshikazu SHIMA)
リペア時間短縮にむけた取り組み@Yahoo! JAPAN #casstudy
1.
1 ヤフー株式会社 データ&サイエンスソリューション統括本部 データプラットフォーム本部 小島 夏海 リペア時間短縮にむけた取り組み @Yahoo! JAPAN
2.
お前誰? • 小島 夏海 •
Cassandra 歴 9ヶ月 • 社内向けプラットフォームの開発・運用 • 学生時代の専門はHCI(主にVR) 2
3.
発表について • 何か素晴らしいことをしてリペアがめっちゃ 速くなった!という内容の発表ではないです • とりあえずなんとかなったけど、 もっといい方法がないか知りたいので みなさんのご意見を聞きたいと思ってます 3
4.
アジェンダ • モチベーション • 何をして速くしたか •
リペアのオプション • Subrange Repair 4
5.
参考資料 • Real World
Repairs • https://www.slideshare.net/DataStax/real-world- repairs-vinay-chella-netflix-cassandra-summit- 2016 • nodetool repair • http://docs.datastax.com/en/cassandra/3.0/cass andra/tools/toolsRepair.html 5
6.
モチベーション 6
7.
SLAが満たせない… • 2DC 全36台のクラスタでリペアが7時間ほど •
1台 約12分 (420 ÷ 36 ≒ 12) • 深夜の内に終わらせたいので7時間は長すぎる 7 素早くリペアを回したい
8.
環境 • CPU :
2CPU 1.80GHz • メモリ : 128GB • DISK : SSD 400GB x2発 RAID0*1vol • Cassandra 3.0.9 • 2DC 3RF • LeveledCompaction • データのディスク専有率 : 約30% 8
9.
どうやって速くしていったか 9
10.
どうやって速くするか • streaming 周りの設定 •
compaction 周りの設定 • nodetool repairのオプション 10
11.
どうやって速くするか • streaming 周りの設定 •
速度を出しすぎると他サービスに 影響があるので 400MB/s に設定 • compaction 周りの設定 • 大きな値にした状態ではピーク時の リクエストが処理仕切れない • nodetool repairのオプション 11
12.
どうやって速くするか • streaming 周りの設定 •
compaction 周りの設定 • nodetool repairのオプション 12
13.
リペアで設定できるもの • リペアのアルゴリズム :
インクリメンタル • シーケンシャル or パラレル : パラレル • プライマリレンジかどうか : false • ジョブスレッド数 : 1 • リペアするDCの範囲 : 全体 • データセンタを並列でリペアするか : false 11 ref : http://docs.datastax.com/en/cassandra/3.0/cassandra/tools/toolsRepair.html
14.
• 2.1系までのリペアはフル・リペアで シーケンシャルがデフォルト • 弊社ではこれにプライマリオプションを つけて運用 2.1系までのリペア DC1
DC2 12
15.
3.0系の設定 • インクリメンタル、パラレルがデフォルト • 今回のクラスタも3.0系なので、この設定 15 DC1
DC2
16.
: ノード DC1 なぜprオプションを外したか 16 インクリメンタルリペアに プライマリオプションをつけて実行 incremental
primary ○ ○ 3系ではプライマリオプションをつけて 並列でリペアを実行すると失敗する
17.
リペア動作確認 : 条件1 17 DC2 マルチDC環境にて1DCの 1台のみ
nodetool repair -full : ノード DC2DC1 このrackだけ nodetool repair実行{ name : nkojima age : 26} incremental parallels primary ✕ ○ ✕ RF : 3 { name : nkojima age : 25}
18.
DC1 リペア動作確認 : 条件1 18 結果
: nodetool repair -full を実行していない ノードのデータも修正された { name : nkojima age : 26} : ノード DC2 { name : nkojima age : 26} incremental parallels primary ✕ ○ ✕ RF : 3
19.
リペア動作確認 : 条件2 19 マルチDC環境にて1DCでのみ nodetool
repair -full -pr : ノード DC1 DC2 こちらのDCだけ nodetool repair実行 { name : nkojima age : 25} { name : nkojima age : 26} incremental parallels primary ✕ ○ ○ RF : 3
20.
リペア動作確認 : 条件2 20 結果
: リペアを実行していないノードの データは修正されず : ノード DC1 DC2{ name : nkojima age : 26} { name : nkojima age : 25} incremental parallels primary ✕ ○ ○ RF : 3
21.
ここまでのまとめ • pr オプションをつけておらず、RF3で3rackの場合は 1rackでだけnodetool
repairすればいい • 弊社の場合 • 2.1系までは pr オプションで運用していたので、全 体でリペアをしていく必要があった • 3系では pr オプションをやめたので、 全台で nodetool repair コマンドを実行する 必要はなかった 21
22.
22 before : nodetool
repair リペアを実行するノード数の変化 after : nodetool repair DC1 DC2 DC2 DC1 rack1 rack1 rack1 rack1 rack2 rack2 rack2 rack2 rack3 rack3 rack3 rack3 rack1 rack3 rack1 rack2 rack3 rack1 rack2 rack3 rack1 rack2 rack3 rack2 無駄に実行していたリペアを削減
23.
Subrange Repair 23
24.
Subrange Repair • 通常のリペアと同じようにリペアをする •
リペアする範囲を実行時に指定する 24
25.
Subrange Repair • 通常のリペアと同じようにリペアをする •
リペアする範囲を実行時に指定する 25 例 : 赤い箇所をnode1が担当している場合 • 通常のリペアの場合 : 赤い箇所すべてが一つの nodetool repair の対象になり、順番にリペアが実行 される • Subrange Repairの場合 : nodetool repair を実行す る時に、リペアする箇所の範囲を指定することで一つ づつリペアを実行するトークンレンジ図
26.
リペアの並列実行 • 通常のリペアでは最大で job
threads は最大で4 • Subrange Repair を並列で実行すれば job threads は 1 range に対して最大で4 26 Normal Repair Subrange Repair All Range job threads : 4 Range1 job threads : 4 Range2 job threads : 4 Range3 job threads : 4 Range4 job threads : 4
27.
トークンレンジ取得 Repair 管理プロセス Subrange Repair
プロセス Subrange Repair プロセス Subrange Repair プロセス Subrange Repair プロセス どうやっているか • nodetool repairコマンドを実行している ノードの概要 27
28.
実行結果 28 • 取り組み前 → 7時間 •
取り組み後 → 2時間35分
29.
実施したことまとめ • 無駄に実行していたリペアを削除 • nodetool
repairを実行する台数が36 → 6 • リペアの並列数を上げることで処理時間を短縮 • Subrange Repair を4並列で実行 29
30.
現状の問題点 • Subrange Repair
の管理をしている ノードの負荷が高い 31
31.
• スレッド管理で負荷がかかっている どうして負荷が高くなっているのか トークンレンジ取得 Repair 管理プロセス Subrange
Repair プロセス Subrange Repair プロセス Subrange Repair プロセス Subrange Repair プロセス 32
32.
複数台でリペアを動かして負荷を分散させる 32 node2 トークンレンジ取得 Repair 管理プロセス Subrange Repair
プロセス Subrange Repair プロセス Subrange Repair プロセス Subrange Repair プロセス トークンレンジ取得 node1
33.
まとめ • リペア時間の短縮を実施 • 7時間
→ 2時間半 • 無駄に実行していたリペアを削除 • リペアの並列数を上げることで 処理時間を短縮 33
Download