なぜネットワーク運用自動化が進まないのか Why is it difficult to automate network operation

34,813 views

Published on

2015/4/24に開催された wakamonog x ssmjp x BIGLOBE = wasabi イベントで発表した資料です。http://ssmjp.connpass.com/event/13173/
This is lightning talk presentation for study event in Tokyo.

Published in: Technology
2 Comments
190 Likes
Statistics
Notes
No Downloads
Views
Total views
34,813
On SlideShare
0
From Embeds
0
Number of Embeds
2,608
Actions
Shares
0
Downloads
179
Comments
2
Likes
190
Embeds 0
No embeds

No notes for slide

なぜネットワーク運用自動化が進まないのか Why is it difficult to automate network operation

  1. 1. なぜネットワーク運用自動化が 進まないのか 〜とあるNW屋の泣き言〜 Why  is  it  difficult   to  automate  network  operation Taiji  Tsuchiya 2015/4/24 wakamonog x ssmjp x BIGLOBE = wasabi
  2. 2. Introduction •  土屋 太二(Taiji  Tsuchiya) – 28  years  old – Twitter:@taijijiji •  お仕事  Responsibility – ネットワークエンジニア Network  Engineer – ISPコアネットワークの運用   Network  operation  of  ISP  backbone
  3. 3. ネットワーク運用のお仕事 Work  of  network  operation •  ルータの設定  Configuring  routers •  設定手順書の作成  Creating  operation  manuals •  トラフィック制御  Controlling  traffic •  ネットワーク資源や構成情報の管理 Managing  network  topology  and  resources •  機器の増強、廃止、リプレイスRenovating  equipment •  回線やDCラックの調達  Provisioning  circuits  and  racks
  4. 4. ネットワークの自動化事情 Current  issues  surrounding  network  automation •  サーバインフラと比べて 自動化が進んでない Compare  to  servers,  there  has  not  been  as  much   advancement  in  automation   •  Immutable  Infrastructureや Infrastructure  as  codeとは別世界  Underlying  problems  differ  from  the  above  concepts
  5. 5. Why did this happen?
  6. 6. 理由その1 Reason  1 操作対象OSが多い Many  different  OSs
  7. 7. Manufacturer OS Cisco IOS  (IOS-­‐XE) IOS-­‐XR NX-­‐OS Juniper JUNOS Brocade NetIron Network  OS Arista EOS _人人人人人人人人人_ > メーカー独自のCLI <  ̄Y^Y^Y^Y^Y^Y^Y^Y ̄ Manufacturer-­‐specific  CLI
  8. 8. 理由その2 Reason  2 標準的な外部APIが 確立されていない No  standard  API
  9. 9. Manufacturer OS API Cisco IOS  (IOS-­‐XE) •  OnePK(*)   •  NETCONF IOS-­‐XR •  OnePK(*)   •  NETCONF NX-­‐OS •  OnePK(*)   •  NX-­‐API(*)   •  NETCONF Juniper JUNOS •  JUNOS  XML  Protocol(*)   •  REST  API   •  NETCONF Brocade NetIron   •  NETCONF   •  REST  API Network  OS Arista EOS •  eAPI(REST  API  ) (*) メーカ独自API manufacturer-­‐specific  API ※1 最新OSの対応状況ですが、Versionによって大きく異なります。 ※2 ネットワーク装置の場合「バグの枯れ」を重視するため    最新OS versionを導入するケースはほとんどありません。 Industry prefers low risk vs. improving on old OS versions
  10. 10. さくらインターネット 湯澤 民浩さん資料より引用 Internet Week 2014 ようこそ、ネットワーク運用自動化の世界へ! https://www.nic.ad.jp/ja/materials/iw/2014/proceedings/s4/ 結果的にこうなりがち Ultimately,  need  to  develop  specific  program  per  device.
  11. 11. 理由その3 Reason  3 作業失敗時の 影響が大きい Scope  of  risk
  12. 12. 失敗時の影響 Scope  of  risk •  サーバ :   数サービス 通信断 Server  :  Handful  of  services  may  go  down   •  DC系スイッチ : 数十サービス 通信断 DC  swtichs  :  Limited  numbers  of  services  may  go  down   •  コア系ルータ :    エリア 全断 Core  router  :  ALL  DOWN 5/17/15 _人人人人人人人人人人_ > 失敗したら総務省 <  ̄Y^Y^Y^Y^Y^Y^Y^Y^Y ̄ Must  report  to  government
  13. 13. 理由その4 Reason  4 エンジニアのスキルが 自動化から遠い Lack  of  know-how
  14. 14. エンジニアの得意領域 preferred  fields ネットワーク屋 network  engineer •  ルータCLIマスター router  CLI •  Cisco/Juniper なんでも来い •  パケットに強い packet  analysis •  トラフィック制御が得意 traffic  control •  サーバといえばDNS サーバ屋 server  engineer •  Linux/Unixマスター •  Ubuntu/FreeBSD なんでも来い •  DBやWebサーバに強い •  LL言語が得意 light  weight  language •  ネットワークといえば iptables 自動化開発に必要なスキルはこっち Key for automation
  15. 15. 理由その5 Reason  5 自動化のアイディアが 出づらい文化 Culture  hard  to  break  through
  16. 16. ネットワークエンジニアの文化 Culture  of  network  engineer •  染み付いたCLI文化      Strong  CLI  culture •  インフラの分業化によって、入社時から Ciscoスペシャリストを目指しがち Higher  incentive  for  narrow  specialization   •  技術革新がとても遅く、実装はメーカ次第 Manufacturers  slow  to  innovate  and  adopt  change.   •  開発者  =  メーカの人 Developers  equal  manufacturers
  17. 17. 理由その6 Reason  6 手作業で なんとかなる作業量 Quantity  of  work  less  than  servers
  18. 18. 作業量 Quantity  of  work •  サーバ:      Servers – 数千〜数万台  Several  tens  of  thousands – 1台あたりの作業:  週に1-2回     A  few  times  a  week  per  device •  ネットワーク機器:      Network  devices – コア: 10−100台 Core  devices:  A  several  dozen – データセンタ 数百〜数千台 Data  Center  devices:  A  several  thousands – 1台あたりの作業:  数ヶ月に1回 Once  several  months  per  device ※個人的な感覚で書いてます
  19. 19. 理由その7 Reason  7 インフラ要員 人減らされがち Not  enough  engineers
  20. 20. ネットワーク屋の働く環境 Environment  of  network  engineers •  運用要員は必要最低限 The  number  of  engineers  is  minimum •  開発にまとまった時間がさけない Cannot  keep  enough  time  for  development •  1件の障害で1週間の予定が吹き飛ぶ Time  is  robbed  by  incidents •  学習コストを乗り超えるのに決死の覚悟 Learning  cost  is  large
  21. 21. 泣き言をたくさん言いましたが やれる理由もありまぁす! But  there  are  many  reasons  for  automation!
  22. 22. 自動化をやれる理由 Points  in  favor  of  automation •  ルータの自動操作は厳しいが、 状態取得は比較的容易 –  みんな大好きSNMP      Automating  router  configuration  may  difficult,  but  automating  the   retrieval  of  router  status  is  easy  using  SNMP. •  ルータ操作以外の運用業務もたくさん –  ルータを設定 –  設定を入れるための手順書を作成 –  トラフィック制御 –  ネットワーク資源や構成情報を管理 –  機器の増強、廃止、リプレイス –  回線やDCラックの調達 There are many important things other than router configuration Automating configuration manuals Managing network resources and topology information
  23. 23. 開発の敷居が下がってきた It’s  getting  easier  to  develop  software •  整備されたWeb開発フレームワーク – Python  :  Django,  Flask – Ruby  :  Rails •  構成管理ツール – Chef – Ansible – Fabric Web Frameworks Provisioning Tools
  24. 24. ネットワーク業界の気になる動き •  NETCONF •  Open  Daylight •  Whitebox  Switch 5/17/15 Interesting industry developments
  25. 25. NETCONF(Network  Configuration  Protocol)   •  XMLを利用したルータ管理プロトコル •  RFC6241で標準化 •  業界の標準的なAPIを作る目的 •  現時点ではメーカごとにXML記述が異なる – YANGモデル対応が一つの鍵
  26. 26. Open  Daylight •  Linux  FoundationのOSSプロジェクト •  SDNコントローラプラットフォームを協業開発 •  主要なネットワーク機器メーカや サーバメーカが参加
  27. 27. Whitebox  Swtich •  ODMベンダ製スイッチ – ソフトウェアOSはユーザ自ら選ぶ •  クラウドやコンテンツ屋のニーズから登場 •  実態としては、ネットワーク機能のある Linuxサーバ •  サーバと同様の管理ツールを利用可能
  28. 28. 環境が揃ったら、あとやるしかない Once  the  environment  is  set,  just  get  it  done! •  エンジニアのスキルが試される時代 Network  engineers  need  a  variety  of  skills •  泣きながら一歩ずつ山登るしかない try,  try,  try •  ひと山登れたら、情報共有しましょう! Let’s  share  our  own  findings  and  achievements!
  29. 29. 個人的な成果物は published  on  github/Qiita に公開していきます(これからね。。。) https://github.com/taijiji http://qiita.com/taijijiji まずは自分から恥を晒します My  working  projects... ネットワーク業界にも 開発の輪が拡がると幸せ I  hope  to  widen  the  circle  of   automation  for  network  operations.
  30. 30. まとめ  Summary 自動化が進まない理由 1.  操作対象OSが多い 2.  標準的な外部APIが確立されていない 3.  作業失敗時の影響が大きい 4.  エンジニアのスキルが自動化から遠い 5.  自動化のアイディアが出づらい文化 6.  手作業でなんとかなる作業量 7.  インフラ要員  人減らされがち 自動化がやれそうな理由 1.  ルータの情報取得は比較的容易 2.  開発の敷居が下がってきた 3.  ネットワーク業界の気になる動き NETCONF  /  Open  Daylight  /  ホワイトボックススイッチ ネットワーク業界にも開発の輪を広げたい

×