Submit Search
Upload
CTO of the year 2018によるLean開発話【データレイク編】 ~とにかくデータレイクにすべてのデータを投げ込もう! とりあえずs3に置けばなんとかなるから!
•
Download as PPTX, PDF
•
0 likes
•
9,625 views
T
Takanori Kawahara
Follow
AWS summit 2019にて発表しました。
Read less
Read more
Technology
Report
Share
Report
Share
1 of 19
Download now
Recommended
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Takanori Kawahara
[CTO of the year 2018] Lean AI開発により、3ヶ月でプロダクトマーケットフィット、1年で大手塾の2割に導入するまで至った話
[CTO of the year 2018] Lean AI開発により、3ヶ月でプロダクトマーケットフィット、1年で大手塾の2割に導入するまで至った話
Takanori Kawahara
リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方
Recruit Lifestyle Co., Ltd.
楽天のデータサイエンス/AIによるビッグデータ活用
楽天のデータサイエンス/AIによるビッグデータ活用
Rakuten Group, Inc.
データプランナーによるデータ系施策について
データプランナーによるデータ系施策について
Recruit Lifestyle Co., Ltd.
利益を生み出すAnalytics Teamのあり方
利益を生み出すAnalytics Teamのあり方
Recruit Lifestyle Co., Ltd.
売上に効くデータ組織~データから売上や利益を作るために何をしているか~
売上に効くデータ組織~データから売上や利益を作るために何をしているか~
Recruit Lifestyle Co., Ltd.
大規模案件でデータサイエンスチームを活躍させる取り組み
大規模案件でデータサイエンスチームを活躍させる取り組み
Recruit Lifestyle Co., Ltd.
Recommended
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Takanori Kawahara
[CTO of the year 2018] Lean AI開発により、3ヶ月でプロダクトマーケットフィット、1年で大手塾の2割に導入するまで至った話
[CTO of the year 2018] Lean AI開発により、3ヶ月でプロダクトマーケットフィット、1年で大手塾の2割に導入するまで至った話
Takanori Kawahara
リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方
Recruit Lifestyle Co., Ltd.
楽天のデータサイエンス/AIによるビッグデータ活用
楽天のデータサイエンス/AIによるビッグデータ活用
Rakuten Group, Inc.
データプランナーによるデータ系施策について
データプランナーによるデータ系施策について
Recruit Lifestyle Co., Ltd.
利益を生み出すAnalytics Teamのあり方
利益を生み出すAnalytics Teamのあり方
Recruit Lifestyle Co., Ltd.
売上に効くデータ組織~データから売上や利益を作るために何をしているか~
売上に効くデータ組織~データから売上や利益を作るために何をしているか~
Recruit Lifestyle Co., Ltd.
大規模案件でデータサイエンスチームを活躍させる取り組み
大規模案件でデータサイエンスチームを活躍させる取り組み
Recruit Lifestyle Co., Ltd.
データ活用する人のための論点整理トレーニング
データ活用する人のための論点整理トレーニング
Sho Maekawa
RLS Meetup#7 会社紹介
RLS Meetup#7 会社紹介
Recruit Lifestyle Co., Ltd.
Glue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみよう
takeshi suto
マルチクラウドで実演するカスタマーセントリックな分析基盤
マルチクラウドで実演するカスタマーセントリックな分析基盤
Recruit Lifestyle Co., Ltd.
大規模システムリプレイスへの道
大規模システムリプレイスへの道
Recruit Lifestyle Co., Ltd.
既存Redshift/ETLからSpectrum/Glueへの移行を徹底解明!
既存Redshift/ETLからSpectrum/Glueへの移行を徹底解明!
Recruit Lifestyle Co., Ltd.
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
shakezo
Step functionsとaws batchでオーケストレートするイベントドリブンな機械学習基盤
Step functionsとaws batchでオーケストレートするイベントドリブンな機械学習基盤
Recruit Lifestyle Co., Ltd.
【Zeal】azure + power biで始めるbigdata分析の第一歩 20171115版 公開用
【Zeal】azure + power biで始めるbigdata分析の第一歩 20171115版 公開用
yuuki takizawa
Nuxt.jsとExpressでSPA×SSR×API Aggregationを実現した話
Nuxt.jsとExpressでSPA×SSR×API Aggregationを実現した話
Recruit Lifestyle Co., Ltd.
プロダクト中心のデータ駆動を推進していくために必要なこと
プロダクト中心のデータ駆動を推進していくために必要なこと
Kazuhito Osabe
企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル
Rakuten Group, Inc.
一人三役!一気通貫でデータ活用するエンジニアリング
一人三役!一気通貫でデータ活用するエンジニアリング
Recruit Lifestyle Co., Ltd.
攻めるアクセス解析〜メンテナンス屋から事業利益貢献者への変革
攻めるアクセス解析〜メンテナンス屋から事業利益貢献者への変革
Recruit Lifestyle Co., Ltd.
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡
Recruit Lifestyle Co., Ltd.
楽天のデータサイエンティスト@SAS Forum 2019
楽天のデータサイエンティスト@SAS Forum 2019
Rakuten Group, Inc.
データ分析基盤を支えるエンジニアリング
データ分析基盤を支えるエンジニアリング
Recruit Lifestyle Co., Ltd.
国内最大級のお笑いWebサービス「ボケて」におけるTableau活用事例
国内最大級のお笑いWebサービス「ボケて」におけるTableau活用事例
淳也 和田
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
Yu Yamada
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Ryusuke Ashiya
2023.06.14_DomoBuddiesDay_Murata_3ステップでわかる!Domo民主化までの道のり.pdf
2023.06.14_DomoBuddiesDay_Murata_3ステップでわかる!Domo民主化までの道のり.pdf
NaoMurata
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
BrainPad Inc.
More Related Content
What's hot
データ活用する人のための論点整理トレーニング
データ活用する人のための論点整理トレーニング
Sho Maekawa
RLS Meetup#7 会社紹介
RLS Meetup#7 会社紹介
Recruit Lifestyle Co., Ltd.
Glue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみよう
takeshi suto
マルチクラウドで実演するカスタマーセントリックな分析基盤
マルチクラウドで実演するカスタマーセントリックな分析基盤
Recruit Lifestyle Co., Ltd.
大規模システムリプレイスへの道
大規模システムリプレイスへの道
Recruit Lifestyle Co., Ltd.
既存Redshift/ETLからSpectrum/Glueへの移行を徹底解明!
既存Redshift/ETLからSpectrum/Glueへの移行を徹底解明!
Recruit Lifestyle Co., Ltd.
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
shakezo
Step functionsとaws batchでオーケストレートするイベントドリブンな機械学習基盤
Step functionsとaws batchでオーケストレートするイベントドリブンな機械学習基盤
Recruit Lifestyle Co., Ltd.
【Zeal】azure + power biで始めるbigdata分析の第一歩 20171115版 公開用
【Zeal】azure + power biで始めるbigdata分析の第一歩 20171115版 公開用
yuuki takizawa
Nuxt.jsとExpressでSPA×SSR×API Aggregationを実現した話
Nuxt.jsとExpressでSPA×SSR×API Aggregationを実現した話
Recruit Lifestyle Co., Ltd.
プロダクト中心のデータ駆動を推進していくために必要なこと
プロダクト中心のデータ駆動を推進していくために必要なこと
Kazuhito Osabe
企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル
Rakuten Group, Inc.
一人三役!一気通貫でデータ活用するエンジニアリング
一人三役!一気通貫でデータ活用するエンジニアリング
Recruit Lifestyle Co., Ltd.
攻めるアクセス解析〜メンテナンス屋から事業利益貢献者への変革
攻めるアクセス解析〜メンテナンス屋から事業利益貢献者への変革
Recruit Lifestyle Co., Ltd.
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡
Recruit Lifestyle Co., Ltd.
楽天のデータサイエンティスト@SAS Forum 2019
楽天のデータサイエンティスト@SAS Forum 2019
Rakuten Group, Inc.
データ分析基盤を支えるエンジニアリング
データ分析基盤を支えるエンジニアリング
Recruit Lifestyle Co., Ltd.
国内最大級のお笑いWebサービス「ボケて」におけるTableau活用事例
国内最大級のお笑いWebサービス「ボケて」におけるTableau活用事例
淳也 和田
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
Yu Yamada
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Ryusuke Ashiya
What's hot
(20)
データ活用する人のための論点整理トレーニング
データ活用する人のための論点整理トレーニング
RLS Meetup#7 会社紹介
RLS Meetup#7 会社紹介
Glue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみよう
マルチクラウドで実演するカスタマーセントリックな分析基盤
マルチクラウドで実演するカスタマーセントリックな分析基盤
大規模システムリプレイスへの道
大規模システムリプレイスへの道
既存Redshift/ETLからSpectrum/Glueへの移行を徹底解明!
既存Redshift/ETLからSpectrum/Glueへの移行を徹底解明!
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
Step functionsとaws batchでオーケストレートするイベントドリブンな機械学習基盤
Step functionsとaws batchでオーケストレートするイベントドリブンな機械学習基盤
【Zeal】azure + power biで始めるbigdata分析の第一歩 20171115版 公開用
【Zeal】azure + power biで始めるbigdata分析の第一歩 20171115版 公開用
Nuxt.jsとExpressでSPA×SSR×API Aggregationを実現した話
Nuxt.jsとExpressでSPA×SSR×API Aggregationを実現した話
プロダクト中心のデータ駆動を推進していくために必要なこと
プロダクト中心のデータ駆動を推進していくために必要なこと
企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル
一人三役!一気通貫でデータ活用するエンジニアリング
一人三役!一気通貫でデータ活用するエンジニアリング
攻めるアクセス解析〜メンテナンス屋から事業利益貢献者への変革
攻めるアクセス解析〜メンテナンス屋から事業利益貢献者への変革
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡
楽天のデータサイエンティスト@SAS Forum 2019
楽天のデータサイエンティスト@SAS Forum 2019
データ分析基盤を支えるエンジニアリング
データ分析基盤を支えるエンジニアリング
国内最大級のお笑いWebサービス「ボケて」におけるTableau活用事例
国内最大級のお笑いWebサービス「ボケて」におけるTableau活用事例
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Similar to CTO of the year 2018によるLean開発話【データレイク編】 ~とにかくデータレイクにすべてのデータを投げ込もう! とりあえずs3に置けばなんとかなるから!
2023.06.14_DomoBuddiesDay_Murata_3ステップでわかる!Domo民主化までの道のり.pdf
2023.06.14_DomoBuddiesDay_Murata_3ステップでわかる!Domo民主化までの道のり.pdf
NaoMurata
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
BrainPad Inc.
Skeleton Cart for All Web Designer
Skeleton Cart for All Web Designer
Yasufumi Nishiyama
アジャイル開発をよりアジャイルに
アジャイル開発をよりアジャイルに
ESM SEC
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
Hisahiko Shiraishi
PlusAIでRPAによる業務の自動化範囲を拡大
PlusAIでRPAによる業務の自動化範囲を拡大
Akimitsu Takagi
【ODC2021online】100人100通りの働き方を支えるサイボウズ流情報システム部門の取り組み
【ODC2021online】100人100通りの働き方を支えるサイボウズ流情報システム部門の取り組み
ao Tetsu
【freee】プロダクトマネージャーの仕事と魅力
【freee】プロダクトマネージャーの仕事と魅力
dcubeio
100人100通りの働き方を支えるサイボウズ流情報システム部門の在り方
100人100通りの働き方を支えるサイボウズ流情報システム部門の在り方
ao Tetsu
データ集計業務を半年で300案件捌いて見えてきた勘所 #データ解析 #willgate
データ集計業務を半年で300案件捌いて見えてきた勘所 #データ解析 #willgate
@yuzutas0 Yokoyama
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史
Hideto Masuoka
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
株式会社MonotaRO Tech Team
Keikubo fluxflex meetup_in_tokyo_1006
Keikubo fluxflex meetup_in_tokyo_1006
keikubo
Naite20 cmmi
Naite20 cmmi
Asako Yanuki
杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2
junji kumooka
データ分析チームを組成して3ヶ月で学んだこと
データ分析チームを組成して3ヶ月で学んだこと
Koki Shibata
Tableauが魅せる Data Visualization の世界
Tableauが魅せる Data Visualization の世界
Takahiro Inoue
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門
陽一 滝川
RDFのチェックツール「rdflint」とコミュニティによるオープンデータの作成
RDFのチェックツール「rdflint」とコミュニティによるオープンデータの作成
Takeshi Mikami
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
Satoru Ishikawa
Similar to CTO of the year 2018によるLean開発話【データレイク編】 ~とにかくデータレイクにすべてのデータを投げ込もう! とりあえずs3に置けばなんとかなるから!
(20)
2023.06.14_DomoBuddiesDay_Murata_3ステップでわかる!Domo民主化までの道のり.pdf
2023.06.14_DomoBuddiesDay_Murata_3ステップでわかる!Domo民主化までの道のり.pdf
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
Skeleton Cart for All Web Designer
Skeleton Cart for All Web Designer
アジャイル開発をよりアジャイルに
アジャイル開発をよりアジャイルに
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
PlusAIでRPAによる業務の自動化範囲を拡大
PlusAIでRPAによる業務の自動化範囲を拡大
【ODC2021online】100人100通りの働き方を支えるサイボウズ流情報システム部門の取り組み
【ODC2021online】100人100通りの働き方を支えるサイボウズ流情報システム部門の取り組み
【freee】プロダクトマネージャーの仕事と魅力
【freee】プロダクトマネージャーの仕事と魅力
100人100通りの働き方を支えるサイボウズ流情報システム部門の在り方
100人100通りの働き方を支えるサイボウズ流情報システム部門の在り方
データ集計業務を半年で300案件捌いて見えてきた勘所 #データ解析 #willgate
データ集計業務を半年で300案件捌いて見えてきた勘所 #データ解析 #willgate
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
datatech-jp Casual Talks #5_データ基盤の立ち位置を考えるのに チームトポロジーの概念を活用した話
Keikubo fluxflex meetup_in_tokyo_1006
Keikubo fluxflex meetup_in_tokyo_1006
Naite20 cmmi
Naite20 cmmi
杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2
データ分析チームを組成して3ヶ月で学んだこと
データ分析チームを組成して3ヶ月で学んだこと
Tableauが魅せる Data Visualization の世界
Tableauが魅せる Data Visualization の世界
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門
RDFのチェックツール「rdflint」とコミュニティによるオープンデータの作成
RDFのチェックツール「rdflint」とコミュニティによるオープンデータの作成
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
CTO of the year 2018によるLean開発話【データレイク編】 ~とにかくデータレイクにすべてのデータを投げ込もう! とりあえずs3に置けばなんとかなるから!
1.
CTO of the
year 2018によるLean開発話【データレイク編】 ~とにかくデータレイクにすべてのデータを投げ込もう! とりあえずs3に置けばなんとかなるから!~ atama plus株式会社 川原尊徳
2.
対象となる聞き手 • atama plus株式会社がどうやってleanにデータレイクを構 築し、価値のあるデータを引き出しているかを知りたい方 •
とりあえずデータレイクというものをお手軽に始めたいと 思っている方 • データ収集に対する向き合い方に迷いがある方 • どこに、どんな形式で、どれを保管したらいいの? ※以下は対象外 • データレイクについての手法の体系的な整理を知りたい方 • データレイクの高度な活用法を知りたい方 2
3.
名称: atama plus株式会社 設立:
2017年4月3日 所在地: 東京都中央区日本橋堀留町1-8-12 さくら堀留ビル7F 株主: 創業メンバー、DCM Ventures、ジャフコ 資金調達: 計20億円 AIで、一人ひとりに最適な教材を 作成しています。 アタマ先生 会社紹介 3
4.
(9歳からプログラミング開始) 2000年 東京大学入学 2004年 東京大学工学部卒業 2006年
東京大学大学院情報理工学系研究科修了 2006年 Microsoft入社 Hotmail開発 データサイエンティスト等歴任 2017年 atama plus株式会社共同創業 2018年 CTO of the year 2018受賞 川原 尊徳 38歳 取締役 自己紹介 4
5.
学習時間を最短にします。 一人ひとりの「得意」「苦手」「伸び」「つまずき」「集中状態」、 すべてをAIが分析し、「自分専用レッスン」をつくります。 5
6.
数I【正弦定理】が苦手! こんな時どうしますか? 6
7.
従来の学習方法 ・・・ 説明 例題 演習 「正弦定理」を何度も繰り返し学習・・・ 7
8.
atama+の学習方法 つまずきの原因を特定し、必要な箇所を必要な教材で学習 数I 数A中学範囲 演習 診断 講義
講義 8
9.
目標 忘却度 習熟度 回答時間 集中度 学習履歴 診断 単元 A 演習 単元
C 講義 単元 B 学校進度 etc. 1問解く毎に update AIが生徒の数だけ「自分専用レッスン」を作成 自分専用レッスン 復習 単元 D 9
10.
みなさんデータはちゃんと収集していますか? 10 バグを調査している人 開発者 新機能作ってる人 システムの挙動を調査 している人 影響を受けているユーザーの人数どのぐらい? どのくらい急いだらいいのか判断したいんだけど。 エラーの数はわかるけど人数はわからないです。。。 ブラウザとアプリ両方使ってる有料課金ユーザーって、 この画面でどんな行動とってるかわかる? 開発者 行動ログはとってるんですが、ユーザーのタイプ別に はとっていないのでわからないです。。。 ユーザーがオススメされたアイテムではないアイテム をクリックしたときに、他に何がおススメされていた かわかる? 開発者 クリックされたアイテムはとっているんですが、その 時他に何が表示されていたかはとっていないのでわか らないです。。。
11.
全部事前に想定してデータ取るなんて無理だ よ・・・とお嘆きのあなた。 そう。データレイクならすべてを解決してくれ る・・・! 11
12.
データレイクとは • データレイクは、規模にかかわらず、すべての構造化データ と非構造化データを保存できる一元化されたリポジトリです。 • データをそのままの形で保存できるため、データを構造化し ておく必要がありません。 •
また、ダッシュボードや可視化、ビッグデータ処理、リアル タイム分析、機械学習など、さまざまなタイプの分析を実行 し、的確な意思決定に役立てることができます。 (AWSの”データレイクとは”のページより https://aws.amazon.com/jp/big-data/datalakes-and-analytics/what-is-a-data-lake/) →めっちゃ便利そう!! 12
13.
データレイクの登場によるデータ保存ポリシーの変化 従来の手法 • どこに? • データベースに •
どうやって? • 読み込み時の都合に合わせたフォー マットで • どれを? • アクションにつながるデータのみを データレイク前提での手法 (程度問題はあると思いますが・・・) • どこに? • ログに • どうやって? • 書き込み時の都合に合わせたフォー マットで • どれを? • 必要となる可能性のあるもの全てを 13
14.
14 ・・・でもお高いんでしょう・・・? 構築も大変そう・・・
15.
atama plusのデータレイク構築は超簡単/超安価だった! 15 Amazon Simple Storage
Service (S3) Amazon Athena Step 2: herokuからログをs3に流 し込む設定をする。 (papertrailのGUIで完結) →保管部分構築完了! Step 1: S3にbucketを作る Step 3: Athenaでテーブルを作成 する(数十行のコード) →クエリ部分構築完了!
16.
実際にエラーによって影響を受けたユーザーを抽出したケース WITH dataset AS (SELECT
id, source_name, program, dt, Reverse(Substr(Reverse(Substr(message, Strpos(message, '{'))), Strpos (Reverse(Substr(message, Strpos(message, '{'))), '}')) ) AS json FROM herokulog WHERE dt >= '2019-03-15' AND dt < '2019-03-20' AND message LIKE '%OpenStudySessionView%status_code%400,%homework% ') SELECT Json_extract_scalar(json, '$.requesting_user_id') AS user_id, dt FROM dataset 16 JSONの中から簡単に値を取っ てこれる Jun 09 02:29:50 atamaplus-api-rc app/web.1: [INFO] [94c9c57d-00d3-4c47-9928-0d262d97b752] asctime:2019-06-09 18:29:49,825 logger:atamaplus_api_v3.views.progress.Progr essView func:_log_request_parameters messages:{"subject_group_id": "english", "organization_user_id": "me", "client_build_info": {"name": "student-app", "version": "2.56.1", "version_code": "2019042501", "deploy_info": {}}, "requesting_user_id": 21620, "requesting_app_type": "student", "requesting_session": "13f127e26b3fa8b4", "requesting_session_segment": "16b3b84394d5e13", "requesting_device_id": 4398} process:96 thread:140363046371840 ログの一部にJSONが書かれてい る。 スキーマを決めてから書いている のではなく、単にdictionaryの値を ダンプしてるだけ。 実際のログ 実際のクエリ Plain textからJSON部分を抜き出 す エラーが出た時に出 るログをテキスト検 索により抽出
17.
つまり・・・ 1. 後から使うかも、、、と思ったらとりあえずログ にJSONで吐いておく 2. ログはs3にためておく 3.
必要になったらAthenaでクエリする 以上で「あとから何とでもなるデータレイク」の完成! (とりあえず、ですが…) 17
18.
まとめ とりあえずs3にすべてのデータを放り込んでおけば 後から何とでもなる! オマケ: • 実はatama plusにはAWS
activateというstart up向け優遇プログラムが適用され ており実質0円でAWSを利用させてもらっている。 • VCから資金調達するとこれのお誘いが来るらしい 18
19.
We are hiring! 19 ・Webエンジニア ・フロントエンドエンジニア ・データエンジニア ・アルゴリズム開発エンジニア ・インフラエンジニア etc. atama
plus 採用
Download now