CloudNative Days Tokyo 2021
Track C 2021/11/05 15:20-15:40
中級者 Operation / Monitoring / Logging
CyberAgentではプライベートクラウド上で多数のKubernetesクラスタが稼働しており、ノードの自動修復機能を実装することで運用コストを削減しました。本発表では、似たような自動修復を実現したいオンプレミスKubernetesの運用者にむけて、KubernetesにおけるノードのNotReadyの定義から、OverlayFSで実現した再起動でディスクの変更が揮発する仕組みまで紹介します。
CloudNative Days Tokyo 2021
Track C 2021/11/05 15:20-15:40
中級者 Operation / Monitoring / Logging
CyberAgentではプライベートクラウド上で多数のKubernetesクラスタが稼働しており、ノードの自動修復機能を実装することで運用コストを削減しました。本発表では、似たような自動修復を実現したいオンプレミスKubernetesの運用者にむけて、KubernetesにおけるノードのNotReadyの定義から、OverlayFSで実現した再起動でディスクの変更が揮発する仕組みまで紹介します。
[Japan Container Days v18.04 Keynote (Production User Stories)]
CyberAgentではプライベートクラウド上にGKEライクなコンテナ基盤を展開するサービスを提供しています。最近では様々な利便性からコンテナでの開発が増えており、オンプレ環境でも Kubernetes as a Serviceの需要があります。サーバ上にKubernetesを展開するだけでは利用できないLoadBalancerやIngressを実現する方法やOpenStackとの連携方法について説明しながら、アドテク領域での利用に耐えうるコンテナ基盤の事例を紹介します。
by Masaya Aoyama (@amsy810)
18. Copyright (C) 2021 Yahoo Japan Corporation. All Rights Reserved.
現在の構成
18
namespace: A namespace: B
…
vSphere
OpenStack
Charts
helm upgrade
deploy
コントローラ
コンテナ
コントローラ
コンテナ
vSphere
value value
A B
構築
スクリプト
19. Copyright (C) 2021 Yahoo Japan Corporation. All Rights Reserved.
VMware環境の構築の流れ
19
1. vSphereの構築
2. (Optional) Under Cloud (K8s)構築/増強
3. OpenStack Controllerのデプロイ
20. Copyright (C) 2021 Yahoo Japan Corporation. All Rights Reserved.
vSphere構築
20
1. vCenter⽤ESXiの設定(⼿動)
2. vCenterデプロイ(vcsa-deploy)、NTP設定など(⼿動)
3. データセンター、クラスター作成/ホスト追加(スクリプト)
4. vDS作成(⼿動)
5. クラスタ毎にESXi1台設定し、ホストプロファイル抽出(⼿動)
6. ホストプロファイルの全台適⽤(スクリプト)
7. 全ESXiのコンプライアンスチェック(スクリプト)
ESXi
vSphere
vCenter
21. Copyright (C) 2021 Yahoo Japan Corporation. All Rights Reserved.
Under Cloud / OpenStack Controller構築
21
• Under Cloud (k8sクラスタ)
• 都度構築が必要なわけではないので今回は省略
• クラスタが増えるとNodeを追加し対応
• Chefにより構築、増強の⾃動化
• OpenStack Controller Container構築
1. 新規構築⽤のHelmのValues(yamlファイル)を記載
2. GitにValuesをpush、merge
3. Jenkinsで⾃動デプロイ
OpenStack
コントローラコンテナ
Kubernetes
22. Copyright (C) 2021 Yahoo Japan Corporation. All Rights Reserved.
デプロイの所要時間
22
• ⼿元に物が揃っていると規模にもよるが数⽇〜1W程度。
• 概ねvSphere側の構築に時間がかかる
• OpenStack Controller側は早いと数⼗分で完了
• トラブルが発⽣することもあるが、⾃動化の恩恵で構築
のみを⾒ると所要時間はとても短い。
23. Copyright (C) 2021 Yahoo Japan Corporation. All Rights Reserved.
Agenda
23
• Yahoo! JapanのVMware環境について
• VMware環境の構成・構築
• VMware環境の運⽤
24. Copyright (C) 2021 Yahoo Japan Corporation. All Rights Reserved.
VMware環境の監視の構成
24
OpenStack
ESXi
コントローラコンテナ
Kubernetes
vSphere
vCenter
ワークフロー
監視
SmokePing
SNMP
Syslog
snmptrapd
Splunk
25. Copyright (C) 2021 Yahoo Japan Corporation. All Rights Reserved.
VMware環境の運⽤
25
• アラート対応
• 基本的にその⽇のアラート当番の⼈が対応する。
• 既知の事象については対応マニュアルが存在する。
• 多くの場合、このマニュアルで対応可能。
• 運⽤
• 未知のアラートの対応や定常運⽤、関連ツール開発は3⼈。
• VMware環境は安定性が⾼いため問題なく回っている。
• クラスタ数が多いためバージョンアップなどは。。。
26. Copyright (C) 2021 Yahoo Japan Corporation. All Rights Reserved.
まとめ
26
• OpenStack on k8s with VMwareの形で利⽤
• OpenStackのバックエンドとしてVMware
• OpenStack Controllerはk8s上で動作
• 全体として障害に強い作り
• 構築は極⼒⾃動化
• VMware側の構築時間が課題
• 監視はVMware側の内部監視、外部監視+OpenStack
のワークフロー監視
• 概ねのアラートはマニュアルで機械的に対応可能
27. Copyright (C) 2021 Yahoo Japan Corporation. All Rights Reserved.
Copyright (C) 2021 Yahoo Japan Corporation. All Rights Reserved.