Infrakitの話とk8s+GPUの話

1. Docker社にキーノートで褒
められた話
2. kubernetesでGPUクラスタ
管理したい
SIC 大嶋

Docker社にキーノートで
褒められた話

ソロモンに褒められた！

何をしたのか
• Infrakitのメンテナ
• Infrakitのkubernetesプラグインを導入した

Infrakit?
• One of moby project
• Toolkit for Cluster infrastructure orchestration

何をしてくれるのか
• デプロイ後も面倒を見てくれるTerraform
• デーモンとして動き続けて、最初に定義した構成を維持しよう
とする

Infrakit Architecture
Default
Group 2
AWS EC2
GCP GCE
Docker
Swarm
Kubernetes
Instance
FlavorGroup
RPC
RPC
API
Group : Default
Instance : AWS
Flavor : Docker Swarm
master 2
worker 4

Default
Group 2
AWS EC2
GCP GCE
Docker
Swarm
Kubernetes
Instance
FlavorGroup
Group : Default
Instance : AWS
master 2
worker 4

Default
Group 2
AWS EC2
GCP GCE
Docker
Swarm
Kubernetes
Instance
FlavorGroup
RPC
RPC
Group : Default
Instance : AWS
master 2
worker 4
そんなものはない！
いまインスタンス
どんな感じ？

Default
Group 2
AWS EC2
GCP GCE
Docker
Swarm
Kubernetes
Instance
FlavorGroup
RPC
RPC
API
Group : Default
Instance : AWS
master 2
worker 4
Docker swarm,
2マスタ 4ワーカでよろしく

Default
Group 2
AWS EC2
GCP GCE
Docker
Swarm
Kubernetes
Instance
FlavorGroup
RPC
RPC
API
Group : Default
Instance : AWS
master 2
worker 4
どんな感じ？

Default
Group 2
AWS EC2
GCP GCE
Docker
Swarm
Kubernetes
Instance
FlavorGroup
RPC
RPC
API
Group : Default
Instance : AWS
master 2
worker 4
あかんやん！ 2マスタ 3ワーカ

Default
Group 2
AWS EC2
GCP GCE
Docker
Swarm
Kubernetes
Instance
FlavorGroup
RPC
RPC
API
Group : Default
Instance : AWS
master 2
worker 4
1ワーカ追加ね

Infrakitの特徴
• プラグインモデル
• Infrakitの設定（必要なプラグイン、その設定）とクラスタの期
待状態をファイルに記述して再現可能にする
• プラグインを変えれば簡単に別のクラウドに移行することがで
きるようにしたい
• 将来的にはLBの設定とかも管理できるようになりたい

仲のいいプロジェクト

linuxkit?
• ディストリビューション・アズ・ア・コード
• dockerホストとなるサーバに必要なミドルウェア、設定を記述
できる
• isoファイルやAWS, GCPなどのクラウドのイメージ、VMWareの
VMイメージを作れる

つまり何が目的なのか
Dockerfile
-----------
-----------
-----------
DockerはInfrastructure as code！

つまり何が目的なのか
Dockerfile
-----------
-----------
-----------
Docker Daemonのバージョン
Linuxディストリビューション
Linuxカーネルバージョン
ホストのミドルウェア
ネットワーククラスタの構築
DockerはInfrastructure as code？

もっとインフラアズアコードにしたい
• Linuxkitでdockerホストを動かすイメージを作って
• Infrakitでクラウド/オンプレにデプロイ、クラスタの構築・運用
• クラウド間、オンプレ間の移動を簡単に

kubernetes対応とは？
• Linuxkit: kubernetesノードとして必要なコンポーネントを入れら
れるようになった
• Infrakit: kubernetesクラスタを構築、管理できるようにした
ということ

ちなみに
• DockerCon EUではDockerのInfrakitメンテナにkubernetes対応これ
からどうすすめるべきかめっちゃ聞かれました

kubernetesでGPUクラスタ
管理したい

モチベーション
• 分散学習タスクの場合にいちいちノードにログインしたくない
• 複数のタスクを並列で走らせたい
• コンテナ単位で管理できればデプロイも楽

なぜkubernetesなのか
• コンテナオーケストレータの覇者であることがほぼ確定
• スケジューラなどが拡張しやすい
• アルファ版だがGPUサポートが有る
秀逸な資料：
GPU Container as a Serviceを実現するための最新OSS徹底比較
https://www.slideshare.net/td-nttcom/gpu-container-as-a-service-oss

GPUマネージメントのドキュメント
まあ読めばなんとかなる

kubernetesでGPU管理の構成
Node
GPU
DLフレームワーク
Nvidiaライブラリ
Nvidiaドライバ
Nvidia dockerでも基本的には同じ

spec:
template:
metadata:
labels:
app: mxd-worker1
spec:
volumes:
- name: nvidialib
hostPath:
path: /usr/lib/nvidia-375
containers:
- name: mxd-worker1
image: mxnet/python:gpu
volumeMounts:
- mountPath: /usr/local/nvidia
name: nvidialib
readOnly: true
resources:
requests:
alpha.kubernetes.io/nvidia-gpu: 4
limits:
alpha.kubernetes.io/nvidia-gpu: 4
これで大丈夫
ドキュメントにもそう書いてある

Nvidia-dockerなら動いたのに・・・

Nvidia-dockerはどうやってるか
謎の力で必要なライブラリを
/var/lib/nvidia-docker/volumes/nvidia_driver/{バージョン}
に集めてくれる
で、それをマウントしてる

解決策
kubernetesクラスタ構築前にnv-dockerをインストールしてライブラリ
だけ集めた後
/var/lib/nvidia-docker/volumes/nvidia_driver/{バージョン}
をマウント
結果：動いた！
不満点１：マウントパスに各ノードのcudaのバージョンが必要
不満点２：nvdockerが最新のdockerだと動かない
不満点３：自分でライブラリを全部指定するとvolume多すぎ

nvidia-container-runtime
• nvidiaが最近始めたプロジェクト
• OCIランタイムスペックに準拠したGPUを利用するためのコンテ
ナランタイム
• ホスト側のCUDAのバージョンを自動的に認識してなんとかして
くれる
• 最新版のdockerにも対応してる
問題点
何故かdockerのデフォルトランタイムに設定してもk8sからだと
無視された

k8s+containerd+nv-runtime
アルファ版とアルファ版とアルファ版の組み合わせ
ろくなドキュメントはない
Node
GPU
CRI-containerd
nv-runtime

動くけど。。
• 不安定
• 怖すぎる
• nv-runtimeが環境変数でGPUの数の管理などを行うのでk8s側で
制御できなくなる

nv-docker, nv-runtime, k8sの関係
k8sはdocker, cri-containerdに対して
deviceオプションでGPUデバイスを、-vでライブラリを入れる
デバイスオプション
このpodにはGPU 2つ
ライブラリのマウントはユーザの責任

nv-dockerも一緒
デバイスオプション
このコンテナにはGPU 2つ
ライブラリのマウントも自動

nv-runtimeは違う
環境変数でGPU数指定このコンテナにはGPU 2つ
デバイス・ライブラリのマウント

k8sとnv-runtimeの組み合わせだと
このpodにはGPUはない
環境変数でGPU数指定
このコンテナにはGPU 2つ
デバイス・ライブラリのマウント

結論
• しばらくはk8s+docker1.13でnvdockerが作るディレクトリを使っ
ていこう
• もしくは丁寧に必要なライブラリの場所を洗い出そう
• ノードごとのバージョン問題はノードにラベルを貼るしか（今
のところ）解がない
• ちなみにk8sのGPU管理は雑（/devをスキャンしてnvidiaデバイ
スをマウントしてDBに登録するだけ）

Infrakitの話とk8s+GPUの話

More Related Content

What's hot

Similar to Infrakitの話とk8s+GPUの話

More from Yuji Oshima

Recently uploaded

Infrakitの話とk8s+GPUの話

Editor's Notes