Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Tech-on MeetUp#07 LT SREはじめの一歩

534 views

Published on

https://togetter.com/li/1374311
https://techplay.jp/event/734673

Published in: Software
  • Be the first to comment

  • Be the first to like this

Tech-on MeetUp#07 LT SREはじめの一歩

  1. 1. SRE はじめの一歩 株式会社JX通信社 平瀬 達也
  2. 2. 自己紹介 ● 平瀬 達也(ひらせ たつや)/ @TatchNicolas ● 株式会社JX通信社のサーバサイドエンジニア→SREチームへ ● なんちゃってイギリス英語とかわいい中国語を話すエセ関西人 ○ 一年ぶりにTech-onにおじゃまします(一周年おめでとうございます! ) ○ 前回はサーバレスのローカル開発環境のお話をさせていただきました ■ https://techplay.jp/eventreport/678120
  3. 3. JX通信社のプロダクトの特徴 ● FASTALERT ○ SNS上から事件・事故・災害などの一次情報を収集・分析して配信するサービス ● NewsDigest ○ 速報が速いニュースアプリ ○ とにかく速い通知が売り →災害・緊急時ほど意味があるサービス →いざという時ほど、落ちてはならないサービス
  4. 4. JX通信社の開発チーム体制 ● それぞれのプロダクトに各領域のエンジニアがいる ○ サーバサイド ○ クライアントサイド(Webフロント, iOS/Android) ○ 機械学習 ● フロント・機械学習エンジニアもAWSを使いこなす ● 必要なインフラリソースは自分で用意 ○ DB、KVS、DNS設定、ロードバランサなど、セルフサービスできちゃう ○ CI/CDの設定も、そのリポジトリを作った人がやっちゃう ○ 専任のインフラ部隊的な集団が必要ない、開発者が自分でやっちゃう
  5. 5. 開発チームがインフラに触れて、運用までやる ● Pro ○ 開発スピードの向上 ■ マネージドサービスを活かした設計を最初から考えられる ○ 障害対応スピードの向上 ■ 開発者=インフラ構築者なので勘所がわかっている ● Con ○ ノウハウがチーム内に閉じてしまう ○ サービス構成の知識の属人化 ■ 作った人が主にメンテ・運用する=その人に負担が偏りがち
  6. 6. JX通信社のプロダクトの特徴 ● FASTALERT ○ SNS上から事件・事故・災害などの一次情報を収集・分析して配信するサービス ● NewsDigest ○ 速報が速いニュースアプリ ○ とにかく速い通知が売り →災害・緊急時ほど意味があるサービス →いざという時ほど、落ちてはならないサービス
  7. 7. SREチームつくるってよ
  8. 8. (平瀬が考えた)JX通信社におけるSREチームの責務 ● 「同じ問題を二度解かない」 ○ プロダクト単位でなく社内横断でチームを作った意味 ○ 特に速報の安定性とスピードはプロダクト (≒ビジネス)の生命線 ● ドキュメント化・標準化・自動化 ○ 監視、アラートのガイドライン定義 ○ OSSやAWSの機能でカバーできない部分を補うツールの開発 ○ サービス/リポジトリの担当者でなくとも、 適切な障害の一次対応ができるように ● サービスの社会的意義を達成するため、より強固で柔軟な基盤をつくる ○ いざというときこそ、人々に最新情報を届けなければならないという使命 ○ 「収集・分析/加工・配信」をそれぞれ統一していく土台作り ○ 最初の課題としての負荷試験
  9. 9. 負荷試験環境をCloudFormationで構築 ● ECSクラスタ、ALBなど必要なサービスをCloudFormationで再定義 ○ ECSサービスの作り方も統一していく ○ どのサービスがどの AWSリソースに紐づいているかもリポジトリ単位で見えるように ● パラメータを変更して何度でも試せる ○ クラスタのインスタンス数、タスク数、タスクの CPU/Memory Unit ○ ボトルネックの洗い出し ● 試験が終わったらすぐCfnスタックごと削除できる ● Production, Staging環境もCfn化するかどうかは議論中 ○ 開発者が気軽にリソースを作ったり変更するメリットを今は重視している ○ 懇親タイムで色々と聞かせてほしいです
  10. 10. 参考資料 ● https://landing.google.com/sre/books/ ● https://www.nic.ad.jp/ja/materials/iw/2017/proceedings/s15/s15-fujisaki.pdf ● https://cloud.google.com/blog/products/devops-sre/how-sre-teams-are-organized-and-how-to-get-started ● https://cloud.google.com/blog/products/devops-sre/how-to-start-and-assess-your-sre-journey

×