Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Milano ops-meetup報告会

308 views

Published on

2017年3月15日と16日にミラノ・イタリアで開催されたopenstack ops-meetupに紹介する資料です.

Published in: Software
  • Be the first to comment

  • Be the first to like this

Milano ops-meetup報告会

  1. 1. © 2017 NTT Software Innovation Center Milano Ops Meetup 報告会 サンパト プリヤンカラ 市原 裕史 室井 雅仁 水野 伸太郎 NTTソフトウェアイノベーションセンタ 2017年3月24日
  2. 2. 2Copyright©2017 NTT corp. All Rights Reserved. OPS meetup 概要 • Operators Meetup Milano • OpenStack のオペレータ (not ユーザ) が集まり、現状の OpenStack の問題点や解決策を議論し、開発者にフィー ドバックする場 • 日程: 2017/3/15, 16 の 2 日間 • 参加人数: 95 人 (チケット 100 枚は売り切れ) • 会場: enter 社 • https://etherpad.openstack.org/p/MIL-ops-meetup
  3. 3. 3Copyright©2017 NTT corp. All Rights Reserved. セッション一覧 1. OpenStack on Containers(2枠) 2. Containers on OpenStack (2枠) 3. Logging and Monitoring (2枠) 4. Ceph and CephFS 5. Bare metal 6. Upgrades, patches, packaging 7. Config Management 8. Keystone and all things auth 9. Inventory and fleet mgmt including hardware 10.Live Migration 11.Security 12.Scaling and tuning 13.Deployment methods 14.RabbitMQ pitfalls, HA, etc 15.DBaas with Trove 16.Do not do ... under any circumstances 17.OSOps 18.Fault injection and Remediation 19.Migration, onboarding, handling end users experience 20.UX - horizon, CLI's inconsitencies etc 21.Cellsv2 22.Neutron pain points 23.Cinder Upgrade tutorial 24.Overview of AUC WGセッション • UC • Ops Telco/NFV 事前投票人気順 24の一般セッション、2つのWGセッションがそれぞれ40分枠で行われた。 ただし、人気投票上位3つは2枠 各セッションのetherpadはこちら https://etherpad.openstack.org/p/MIL-ops-meetup
  4. 4. 4Copyright©2017 NTT corp. All Rights Reserved. Container セッション • コンテナにまつわるセッションは 2 つ開催 1. コンテナ on OpenStack 2. OpenStack on コンテナ • オペレータの集まりという会議の性質上、こちらのセッションの方が活発な議論を実施 • OpenStack on コンテナを商用運用している人は 0 人 • 会場でのアンケート: 商用利用中 0 人、QA 中 2 人 • コンテナを利用したインストーラプロジェクトが、現状では新規構築のみ を対象としている事が一因 • 構築済み(運用中)の OpenStack をコンテナに入れ替える事ができない • Kolla プロジェクト、OpenStack-Helm、OpenStack Ansible など • 各種コンテナ化によるメリット・デメリットやツールに関する情報が出 揃っておらず、各社が見合わせている状況 • 管理系プロセスのみコンテナ化?、実行系も含めてコンテナ化? • 既存プロセスをコンテナに切り替えるだけ?、kubernetes などのオーケストレーショ ンツールを使った方が良い? • Work Items • OSIC による各種コンテナ化の方法の検証とドキュメントのとりまとめ • 各種コンテナ化の方法に対するメリット・デメリットを整理していく • Kolla、OpenStack-helm などのドキュメントの整備
  5. 5. 5Copyright©2017 NTT corp. All Rights Reserved. • Pain point • テナントを超えてVMのconntrackが影響をおよぼすので nf_conntrack_maxをどのように設定すべきか難しい • ネットワークノードをリブートするのはまだリスクが高い • スケール問題 • ML2-OVS(Liberty)のProviderNWのDHCP agentを移動させる と数千ポートに対してsecurity groupの更新がはしり死ぬ • DVRは使い物にならない→理由①: IPv6に対応してない。 理由②: L3 fabricなDCだとDVRが使えない • 実際どれぐらいスケールする? • 250〜500コンピュートノードのどこかで問題が起こり始める • 20000ノード(China)ではrabbitmqがネック。MQの無駄なメッ セージはカットしている。特にFWaaSのMessageが原因と推定 • ベンダーアップデート • NuageとCalicoのコンテナ推し。MidonetはMQ不使用でスケール Neutronセッション コメント: Conntrack周り はバグが色々ある。VM削 除時にゴミが残る問題が Newtonで修正された等 コメント: Server-Agent間のメッセー ジ問題は改善する機能がPikeで入る予定 コメント: これ系のバグはLibertyとMitakaで かなり直ったはずだが、詳細は不明
  6. 6. 6Copyright©2017 NTT corp. All Rights Reserved. Fault Genes Working Groupの取り組み Openstackで故障を発生した際の故障原因と復旧パターンに関する既存データを利 用し機械学習を行うことで, 1.Openstackでのフォルトマネージメントポリシを定義 2.MTTRの短縮 3.故障と復旧方法のナレッジデータベースを作成 故障原因と復旧パターンに関する既存データの収集方法  コミュニティでの調査 <-今回のセッションの目的  データマイニングによってlaunchpad, stackoverflowから 本取り組みの現状: • データ収集 • 故障分類やフォーマット化など集めたデータの前処理 • 機械学習アルゴリズムの開発 関連: Failure Analysis Under a Multi-Components Public Cloud Environment Noriko Yokoyama and Hirotaka Kojima @Barcelona Summit 毎週ミーティング行っている.詳細はopenstack-ops MLに流れています. 例:http://lists.openstack.org/pipermail/openstack-operators/2017-March/012837.html Ops meetup Etherpad: https://etherpad.openstack.org/p/MIL-ops-fault-injection-and-remediation Fault injection and remediationセッション NTT Confidential
  7. 7. 7Copyright©2017 NTT corp. All Rights Reserved. 故障分類やフォーマット化(例) Source: OpenStack Fault Management Framework by Nemat Bidokhti から抜粋 本資料はOps meetupの本セッションに参加した人宛に送られてきたものです. 資料必要な方がsampath.priyankara@lab.ntt.co.jpまでご連絡ください.

×