Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

of

自動運転業界のSRE活動 Slide 1 自動運転業界のSRE活動 Slide 2 自動運転業界のSRE活動 Slide 3 自動運転業界のSRE活動 Slide 4 自動運転業界のSRE活動 Slide 5 自動運転業界のSRE活動 Slide 6 自動運転業界のSRE活動 Slide 7 自動運転業界のSRE活動 Slide 8 自動運転業界のSRE活動 Slide 9 自動運転業界のSRE活動 Slide 10 自動運転業界のSRE活動 Slide 11 自動運転業界のSRE活動 Slide 12 自動運転業界のSRE活動 Slide 13 自動運転業界のSRE活動 Slide 14 自動運転業界のSRE活動 Slide 15 自動運転業界のSRE活動 Slide 16 自動運転業界のSRE活動 Slide 17 自動運転業界のSRE活動 Slide 18
Upcoming SlideShare
What to Upload to SlideShare
Next
Download to read offline and view in fullscreen.

0 Likes

Share

Download to read offline

自動運転業界のSRE活動

Download to read offline

2021/03/31に行われました「自動運転の自動運転以外のこと(Web/SRE/AI教習所)」ミートアップの資料です。
自動運転業界のSREが今後どのような活動を目論んでいるかをご紹介しています。

Related Books

Free with a 30 day trial from Scribd

See all
  • Be the first to like this

自動運転業界のSRE活動

  1. 1. Dai Utsui 自動運転業界のSRE 活動 Mar 31st, 2021 1
  2. 2. Dai Utsui Profile * SRE, Tech Lead * これから息子が生きていく社会をより良いものに…との想い でJoin GitHub: @utsuidai Twitter: @utsuidai 2
  3. 3. CONTENTS Introduction SRE journey 3 Autonomous driving-specific feature Future work Remote Driving Simulation & CI/CD Pipeline Multi-region Ultra-low latency Multi-cloud On-Call & Support
  4. 4. 1. Introduction SRE journey 4
  5. 5. SRE journey (in Tier IV) 2019.0 9 2019.4 Q 2020.first half 2020.second half - Baseline approach risk assessment - SRE strategy planning - (Corporate site renewal) - Security - Monitoring - Log menagement - SRE study group - Reference implementation - Multi tenancy - Reference implementation - Technology selection - Operation verification in Asia - (Office relocation) - (Postmortem) - Security - Fix point observation - SLA - Multi region - Operation verification in EU - Multi cloud - Low latency - (Product strategy) - (Requirement definition) - ... - SLI / SLO study group - Incident management - On-Call - Static code analysis - (Autoware.Online) 5 2021.first half Tech blog: https://tech.tier4.jp/entry/2021/01/20/160000
  6. 6. Issues that should have been resolved Typical Issue Solutions セキュリティ AWSマルチアカウントの 認証/認可が煩雑 AWS Organizations / リスクアセスメン ト / CIS対応 信頼性 バックアップが取れてい るか不明 AWS Backupでタグベースのバックアッ プポリシーを適用 パフォーマンス モニタリング未整備 Datadog / Sentryでシステムを統合監視 コスト最適化 開発者があまり気にかけ ていない SREがコストに責任を持ち、月次定例で 毎月レポート / 技術選定 運用性 正常に動いているのか不 明 SLI/SLOの制定 / Incident Management / On-Call
  7. 7. 2. Autonomous driving-specific feature 7
  8. 8. 8 Media streaming ● 車両のカメラ映像をリアルタイムに監視 ● 本当に映像が配信できているかをどう監視する? ①EC2からDummy映像を配信 ②WebRTCサーバーから少なくとも Dummy映像分の配信トラフィックが出 ているかを監視 Remote driving Autonomous driving-specific feature ① ②
  9. 9. 9 Simulator pipeline ● 数百にのぼるシナリオを自動実行 ● シミュレーター自体も何をシミュレートするかに よって複数存在 ①Autowareの修正がリポジトリにPush ②WebhookをAPI Gatewayで受け取る ③AWS StepFunctionの動作状態を Cloudwatch metricsで監視 - ExecutionsStarted - ExecutionsSucceeded - ExecutionsFailed - ExecutionsAborted Simulation & CI Pipeline Autonomous driving-specific feature Tech blog: https://tech.tier4.jp/entry/2020/09/09/160000
  10. 10. 3. Future work 10
  11. 11. 11 Global展開を視野に ● 各種規制、遅延対応のためインフラを車両の近く に置きたい ● 特定のコンポーネントを複数のリージョンに同時 展開 ● Localizationの他、One-source Multi- regionで実現するためのCI/CD環境の 構築が急務 Multi-region Future work
  12. 12. 12 Multi-region (IaC, Deployment) Future work Cloud Formation Terraform 複製 Stacksets Provider alias / workspace CI/CD Codepipeline Terraform Cloud / GitHub Actions / etc... 3rd party resource CloudFormation レジストリ - Pros 最新機能への追随が早い 元々Multi-Cloudを扱える / 管理対象 リソースを制御可能 Cons 管理対象リソースを操作で きない(importが不十分) 最新機能への追随はコミュニティ頼 り
  13. 13. 13 Kubernetes ● 理論上はマルチクラウド、オンプレミスへの展開 も可能 ● マネージドサービスを放棄することによる運用コ ストの増大、開発スピードの遅延とのバランスが 重要 ● アーキテクチャ検討から実装までの移 行コスト(人月)だけでも3倍以上の 開きを確認 ● 現時点でのk8s化は得策ではないと判 断 Multi-region Future work
  14. 14. 14 Multi-region (BCP Active-Standby) Future work AWSマルチリージョンアプリケーションアーキテクチャ https://aws.amazon.com/jp/solutions/implementations/multi-region-application-architecture/
  15. 15. 15 可用性の追求 ● クラウド側にトラブルがあっても安全に走行(停 止)できる事が最低限 単一のパブリッククラウドに問題が生 じても自動運転が継続できる事 Multi-cloud (BCP Multi-site) Future work
  16. 16. 16 安全な遠隔操縦とは ● 10km/hで走行時100msの遅延が0.28m走行して いる事になる ● 複数方向のカメラ映像を同時配信 ● 映像と制御両面で低遅延が求められる AWS Wavelengthの様なエッジ寄りへの オフロード? Ultra-low latency Future work
  17. 17. 17 Follow the sun ● 必要なタイムゾーンに必要な人材を配置 ● 夜間・変則的勤務の回避 ● 地域によってはネイティブ言語サポートも可能に 内製に限らずあらゆる選択肢を視野に On-Call & Support Future work
  18. 18. © 2021 Tier IV, Inc. 18

2021/03/31に行われました「自動運転の自動運転以外のこと(Web/SRE/AI教習所)」ミートアップの資料です。 自動運転業界のSREが今後どのような活動を目論んでいるかをご紹介しています。

Views

Total views

199

On Slideshare

0

From embeds

0

Number of embeds

57

Actions

Downloads

3

Shares

0

Comments

0

Likes

0

×