SlideShare a Scribd company logo
1 of 13
Copyright(C) Nowcast, Inc. All rights reserved.
Nowcast
Jupyter Notebook Ops
2021年02月26日
株式会社 Nowcast
隅田 敦
Copyright(C) Nowcast, Inc. All rights reserved. 2
自己紹介
@yummydum
Copyright(C) Nowcast, Inc. All rights reserved. 3
株式会社ナウキャストの紹介
資料はこちら→
Copyright(C) Nowcast, Inc. All rights reserved. 4
Parametrization by Papermill
ノートブックをパラメタ化し使い回せるようにする
Communication by Commuter
ノートブックを素早く手軽に共有する
Jupyter Notebookによる分析や実験を効率よく運用・管理したい
Copyright(C) Nowcast, Inc. All rights reserved. 5
 ナウキャストではPOSデータやクレジットカードデータを用いて企業の売上予測をしています
 証券コード毎に詳細な分析(企業,事業,商品,イベント…)
 対象とする証券コードが200個,1つのノートブックの実行に15分なら50時間かかってしまう
 データセットはどんどん新しくなるので定期的に再実行する必要がある
Parametrization by Papermill
パラメタを一つのセル
にまとめparameters
タグをつけておく
Papermillが
挿入したセル
ノートブックをパラメタ化して並列分散処理しよう!
Papermill: ノートブックにパラメタを設定し実行してくれるライブラリ
Copyright(C) Nowcast, Inc. All rights reserved. 6
Parametrization by Papermill
Copyright(C) Nowcast, Inc. All rights reserved. 7
 ノートブックの共有は地味に面倒くさい
 誰もが.ipynbを開けるとは限らない
 ノートブックを開くたびにファイルの差分が生じるのでGitと相性が悪い
 Githubに上げるにはファイルサイズが大きい
 数百のノートブックを手渡しするのは…
 Commuter
 ローカル・S3からノートブックを読み込みhtmlに変換してくれるwebサーバー
 誰でもブラウザからノートブックを閲覧出来る!
Communication by Commuter
Copyright(C) Nowcast, Inc. All rights reserved. 8
Demo: diamond EDA for different colors
Copyright(C) Nowcast, Inc. All rights reserved. 9
https://github.com/yummydum/automate_reports
手元で動かしてみよう!
サンプルコード
Copyright(C) Nowcast, Inc. All rights reserved. 10
Notebook infrastructure example
ブラウザから最新の
ノートブック一覧を
いつでも見れる!
データの更新に
合わせてノートブック
を定期的に更新
ワークステーションで
アドホック分析
(EFSをマウント)
パラメタ化+
並列分散処理
Copyright(C) Nowcast, Inc. All rights reserved. 11
参考: Netflixのノートブックインフラ
https://netflixtechblog.com/notebook-innovation-591ee3221233?gi=19cdf66a04b4
Copyright(C) Nowcast, Inc. All rights reserved. 12
We are hiring!
資料はこちら(大事なことなので以下略)→
Jupyter Notebook Ops

More Related Content

What's hot

Azure Databricksで始めるSpark 構築から活用までの第一歩
Azure Databricksで始めるSpark 構築から活用までの第一歩Azure Databricksで始めるSpark 構築から活用までの第一歩
Azure Databricksで始めるSpark 構築から活用までの第一歩Ryuichi Tokugami
 
GPU クラウド コンピューティング
GPU クラウド コンピューティングGPU クラウド コンピューティング
GPU クラウド コンピューティングNVIDIA Japan
 
Sparkを活用したレコメンドエンジンのパフォーマンスチューニング&自動化
Sparkを活用したレコメンドエンジンのパフォーマンスチューニング&自動化Sparkを活用したレコメンドエンジンのパフォーマンスチューニング&自動化
Sparkを活用したレコメンドエンジンのパフォーマンスチューニング&自動化Nagato Kasaki
 
1000: 基調講演
1000: 基調講演1000: 基調講演
1000: 基調講演NVIDIA Japan
 
これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本Tomohiro Shinden
 
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語るSnowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語るRyota Shibuya
 
AI for Business - Microsoft AI Business summit 2018
AI for Business - Microsoft AI Business summit 2018AI for Business - Microsoft AI Business summit 2018
AI for Business - Microsoft AI Business summit 2018Daiyu Hatakeyama
 
データサイエンティスト向け性能問題対応の基礎
データサイエンティスト向け性能問題対応の基礎データサイエンティスト向け性能問題対応の基礎
データサイエンティスト向け性能問題対応の基礎Tetsutaro Watanabe
 
Azure Discovery Day - SQL Server 2019 + Azure Data Services
Azure Discovery Day - SQL Server 2019 + Azure Data ServicesAzure Discovery Day - SQL Server 2019 + Azure Data Services
Azure Discovery Day - SQL Server 2019 + Azure Data ServicesDaiyu Hatakeyama
 
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けRecruit Technologies
 
Microsoft AI Solution Update / DLL community Update
Microsoft AI Solution Update / DLL community UpdateMicrosoft AI Solution Update / DLL community Update
Microsoft AI Solution Update / DLL community UpdateHirono Jumpei
 
[Cloud OnAir] ビジネスを変革する!クラウドを活用したデータ分析基盤の第一歩 (LIVE) 2018年4月12日 放送
[Cloud OnAir] ビジネスを変革する!クラウドを活用したデータ分析基盤の第一歩 (LIVE) 2018年4月12日 放送[Cloud OnAir] ビジネスを変革する!クラウドを活用したデータ分析基盤の第一歩 (LIVE) 2018年4月12日 放送
[Cloud OnAir] ビジネスを変革する!クラウドを活用したデータ分析基盤の第一歩 (LIVE) 2018年4月12日 放送Google Cloud Platform - Japan
 
Hackathon 161010 pressen
Hackathon 161010 pressenHackathon 161010 pressen
Hackathon 161010 pressenWEBFARMER. ltd.
 
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介cyberagent
 
自然空冷の概要と、今後のビジネス・トレンドWeb.pdf
自然空冷の概要と、今後のビジネス・トレンドWeb.pdf自然空冷の概要と、今後のビジネス・トレンドWeb.pdf
自然空冷の概要と、今後のビジネス・トレンドWeb.pdfTadashi Sugita
 
第三回 関西放送機器展 - Microsoft セッション - 放送・映像業界へのAI(Artificial Intelligence)の現実的な活用
第三回 関西放送機器展 - Microsoft セッション - 放送・映像業界へのAI(Artificial Intelligence)の現実的な活用 第三回 関西放送機器展 - Microsoft セッション - 放送・映像業界へのAI(Artificial Intelligence)の現実的な活用
第三回 関西放送機器展 - Microsoft セッション - 放送・映像業界へのAI(Artificial Intelligence)の現実的な活用 Daiyu Hatakeyama
 
世界征服を目指す Jubatus だからこそ期待する 5 つのポイント
世界征服を目指す Jubatus だからこそ期待する 5 つのポイント世界征服を目指す Jubatus だからこそ期待する 5 つのポイント
世界征服を目指す Jubatus だからこそ期待する 5 つのポイントToru Shimogaki
 
遂に登場! GridDBからデータベースサービス GridDB Cloud ~その設計思想と運用の原則
遂に登場! GridDBからデータベースサービス GridDB Cloud ~その設計思想と運用の原則遂に登場! GridDBからデータベースサービス GridDB Cloud ~その設計思想と運用の原則
遂に登場! GridDBからデータベースサービス GridDB Cloud ~その設計思想と運用の原則griddb
 

What's hot (20)

Azure Databricksで始めるSpark 構築から活用までの第一歩
Azure Databricksで始めるSpark 構築から活用までの第一歩Azure Databricksで始めるSpark 構築から活用までの第一歩
Azure Databricksで始めるSpark 構築から活用までの第一歩
 
GPU クラウド コンピューティング
GPU クラウド コンピューティングGPU クラウド コンピューティング
GPU クラウド コンピューティング
 
Sparkを活用したレコメンドエンジンのパフォーマンスチューニング&自動化
Sparkを活用したレコメンドエンジンのパフォーマンスチューニング&自動化Sparkを活用したレコメンドエンジンのパフォーマンスチューニング&自動化
Sparkを活用したレコメンドエンジンのパフォーマンスチューニング&自動化
 
1000: 基調講演
1000: 基調講演1000: 基調講演
1000: 基調講演
 
これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本
 
Cmc cmd slim
Cmc cmd slimCmc cmd slim
Cmc cmd slim
 
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語るSnowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
 
AI for Business - Microsoft AI Business summit 2018
AI for Business - Microsoft AI Business summit 2018AI for Business - Microsoft AI Business summit 2018
AI for Business - Microsoft AI Business summit 2018
 
Big Data Architecture 全体概要
Big Data Architecture 全体概要Big Data Architecture 全体概要
Big Data Architecture 全体概要
 
データサイエンティスト向け性能問題対応の基礎
データサイエンティスト向け性能問題対応の基礎データサイエンティスト向け性能問題対応の基礎
データサイエンティスト向け性能問題対応の基礎
 
Azure Discovery Day - SQL Server 2019 + Azure Data Services
Azure Discovery Day - SQL Server 2019 + Azure Data ServicesAzure Discovery Day - SQL Server 2019 + Azure Data Services
Azure Discovery Day - SQL Server 2019 + Azure Data Services
 
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
 
Microsoft AI Solution Update / DLL community Update
Microsoft AI Solution Update / DLL community UpdateMicrosoft AI Solution Update / DLL community Update
Microsoft AI Solution Update / DLL community Update
 
[Cloud OnAir] ビジネスを変革する!クラウドを活用したデータ分析基盤の第一歩 (LIVE) 2018年4月12日 放送
[Cloud OnAir] ビジネスを変革する!クラウドを活用したデータ分析基盤の第一歩 (LIVE) 2018年4月12日 放送[Cloud OnAir] ビジネスを変革する!クラウドを活用したデータ分析基盤の第一歩 (LIVE) 2018年4月12日 放送
[Cloud OnAir] ビジネスを変革する!クラウドを活用したデータ分析基盤の第一歩 (LIVE) 2018年4月12日 放送
 
Hackathon 161010 pressen
Hackathon 161010 pressenHackathon 161010 pressen
Hackathon 161010 pressen
 
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
 
自然空冷の概要と、今後のビジネス・トレンドWeb.pdf
自然空冷の概要と、今後のビジネス・トレンドWeb.pdf自然空冷の概要と、今後のビジネス・トレンドWeb.pdf
自然空冷の概要と、今後のビジネス・トレンドWeb.pdf
 
第三回 関西放送機器展 - Microsoft セッション - 放送・映像業界へのAI(Artificial Intelligence)の現実的な活用
第三回 関西放送機器展 - Microsoft セッション - 放送・映像業界へのAI(Artificial Intelligence)の現実的な活用 第三回 関西放送機器展 - Microsoft セッション - 放送・映像業界へのAI(Artificial Intelligence)の現実的な活用
第三回 関西放送機器展 - Microsoft セッション - 放送・映像業界へのAI(Artificial Intelligence)の現実的な活用
 
世界征服を目指す Jubatus だからこそ期待する 5 つのポイント
世界征服を目指す Jubatus だからこそ期待する 5 つのポイント世界征服を目指す Jubatus だからこそ期待する 5 つのポイント
世界征服を目指す Jubatus だからこそ期待する 5 つのポイント
 
遂に登場! GridDBからデータベースサービス GridDB Cloud ~その設計思想と運用の原則
遂に登場! GridDBからデータベースサービス GridDB Cloud ~その設計思想と運用の原則遂に登場! GridDBからデータベースサービス GridDB Cloud ~その設計思想と運用の原則
遂に登場! GridDBからデータベースサービス GridDB Cloud ~その設計思想と運用の原則
 

Similar to Jupyter Notebook Ops

株式会社カブク システム開発最前線
株式会社カブク システム開発最前線株式会社カブク システム開発最前線
株式会社カブク システム開発最前線Takuro Wada
 
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』The Japan DataScientist Society
 
深層学習インフラ、借りるべきか?買うべきか?
深層学習インフラ、借りるべきか?買うべきか?深層学習インフラ、借りるべきか?買うべきか?
深層学習インフラ、借りるべきか?買うべきか?Keisuke Fukuda
 
20200630 Monotaro Data Platform & EC Platform
20200630 Monotaro Data Platform & EC Platform20200630 Monotaro Data Platform & EC Platform
20200630 Monotaro Data Platform & EC PlatformTaisuke Fukawa
 
郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょう
郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょう郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょう
郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょうDaiyu Hatakeyama
 
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...Insight Technology, Inc.
 
Cloud impact on IT industry (in Japanese)
Cloud impact on IT industry (in Japanese)Cloud impact on IT industry (in Japanese)
Cloud impact on IT industry (in Japanese)shojiro-tanaka
 
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)株式会社MonotaRO Tech Team
 
北海道Io tあるじゃん1 ネクステック
北海道Io tあるじゃん1 ネクステック北海道Io tあるじゃん1 ネクステック
北海道Io tあるじゃん1 ネクステックNorikatsu Oishi
 
Co-Simulation mechatronics and software
Co-Simulation mechatronics and softwareCo-Simulation mechatronics and software
Co-Simulation mechatronics and softwareKeiju Anada
 
Microsoft の深層学習への取り組み
Microsoft の深層学習への取り組みMicrosoft の深層学習への取り組み
Microsoft の深層学習への取り組みHirono Jumpei
 
先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方Cloudera Japan
 
わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料Shinichiro Isago
 
わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料guest628c07
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネスMie Mori
 
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)appliedelectronics
 
Pentahoデータ統合・ETLセミナー 紹介資料
Pentahoデータ統合・ETLセミナー 紹介資料Pentahoデータ統合・ETLセミナー 紹介資料
Pentahoデータ統合・ETLセミナー 紹介資料kimihikoeto
 
製造業のIoTやってみよう
製造業のIoTやってみよう製造業のIoTやってみよう
製造業のIoTやってみようYuki Kikuchi
 
ラズパイでIoTをやってみよう! | なぜ今IoTなのか?
ラズパイでIoTをやってみよう! | なぜ今IoTなのか?ラズパイでIoTをやってみよう! | なぜ今IoTなのか?
ラズパイでIoTをやってみよう! | なぜ今IoTなのか?SORACOM,INC
 

Similar to Jupyter Notebook Ops (20)

株式会社カブク システム開発最前線
株式会社カブク システム開発最前線株式会社カブク システム開発最前線
株式会社カブク システム開発最前線
 
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
 
深層学習インフラ、借りるべきか?買うべきか?
深層学習インフラ、借りるべきか?買うべきか?深層学習インフラ、借りるべきか?買うべきか?
深層学習インフラ、借りるべきか?買うべきか?
 
20200630 Monotaro Data Platform & EC Platform
20200630 Monotaro Data Platform & EC Platform20200630 Monotaro Data Platform & EC Platform
20200630 Monotaro Data Platform & EC Platform
 
郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょう
郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょう郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょう
郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょう
 
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
 
Cloud impact on IT industry (in Japanese)
Cloud impact on IT industry (in Japanese)Cloud impact on IT industry (in Japanese)
Cloud impact on IT industry (in Japanese)
 
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
 
北海道Io tあるじゃん1 ネクステック
北海道Io tあるじゃん1 ネクステック北海道Io tあるじゃん1 ネクステック
北海道Io tあるじゃん1 ネクステック
 
Co-Simulation mechatronics and software
Co-Simulation mechatronics and softwareCo-Simulation mechatronics and software
Co-Simulation mechatronics and software
 
Microsoft の深層学習への取り組み
Microsoft の深層学習への取り組みMicrosoft の深層学習への取り組み
Microsoft の深層学習への取り組み
 
先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方
 
わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料
 
わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料わんくま東京勉強会#46 Azureセッション資料
わんくま東京勉強会#46 Azureセッション資料
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
 
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
 
Pentahoデータ統合・ETLセミナー 紹介資料
Pentahoデータ統合・ETLセミナー 紹介資料Pentahoデータ統合・ETLセミナー 紹介資料
Pentahoデータ統合・ETLセミナー 紹介資料
 
jubatus pressrelease
jubatus pressreleasejubatus pressrelease
jubatus pressrelease
 
製造業のIoTやってみよう
製造業のIoTやってみよう製造業のIoTやってみよう
製造業のIoTやってみよう
 
ラズパイでIoTをやってみよう! | なぜ今IoTなのか?
ラズパイでIoTをやってみよう! | なぜ今IoTなのか?ラズパイでIoTをやってみよう! | なぜ今IoTなのか?
ラズパイでIoTをやってみよう! | なぜ今IoTなのか?
 

Jupyter Notebook Ops

  • 1. Copyright(C) Nowcast, Inc. All rights reserved. Nowcast Jupyter Notebook Ops 2021年02月26日 株式会社 Nowcast 隅田 敦
  • 2. Copyright(C) Nowcast, Inc. All rights reserved. 2 自己紹介 @yummydum
  • 3. Copyright(C) Nowcast, Inc. All rights reserved. 3 株式会社ナウキャストの紹介 資料はこちら→
  • 4. Copyright(C) Nowcast, Inc. All rights reserved. 4 Parametrization by Papermill ノートブックをパラメタ化し使い回せるようにする Communication by Commuter ノートブックを素早く手軽に共有する Jupyter Notebookによる分析や実験を効率よく運用・管理したい
  • 5. Copyright(C) Nowcast, Inc. All rights reserved. 5  ナウキャストではPOSデータやクレジットカードデータを用いて企業の売上予測をしています  証券コード毎に詳細な分析(企業,事業,商品,イベント…)  対象とする証券コードが200個,1つのノートブックの実行に15分なら50時間かかってしまう  データセットはどんどん新しくなるので定期的に再実行する必要がある Parametrization by Papermill パラメタを一つのセル にまとめparameters タグをつけておく Papermillが 挿入したセル ノートブックをパラメタ化して並列分散処理しよう! Papermill: ノートブックにパラメタを設定し実行してくれるライブラリ
  • 6. Copyright(C) Nowcast, Inc. All rights reserved. 6 Parametrization by Papermill
  • 7. Copyright(C) Nowcast, Inc. All rights reserved. 7  ノートブックの共有は地味に面倒くさい  誰もが.ipynbを開けるとは限らない  ノートブックを開くたびにファイルの差分が生じるのでGitと相性が悪い  Githubに上げるにはファイルサイズが大きい  数百のノートブックを手渡しするのは…  Commuter  ローカル・S3からノートブックを読み込みhtmlに変換してくれるwebサーバー  誰でもブラウザからノートブックを閲覧出来る! Communication by Commuter
  • 8. Copyright(C) Nowcast, Inc. All rights reserved. 8 Demo: diamond EDA for different colors
  • 9. Copyright(C) Nowcast, Inc. All rights reserved. 9 https://github.com/yummydum/automate_reports 手元で動かしてみよう! サンプルコード
  • 10. Copyright(C) Nowcast, Inc. All rights reserved. 10 Notebook infrastructure example ブラウザから最新の ノートブック一覧を いつでも見れる! データの更新に 合わせてノートブック を定期的に更新 ワークステーションで アドホック分析 (EFSをマウント) パラメタ化+ 並列分散処理
  • 11. Copyright(C) Nowcast, Inc. All rights reserved. 11 参考: Netflixのノートブックインフラ https://netflixtechblog.com/notebook-innovation-591ee3221233?gi=19cdf66a04b4
  • 12. Copyright(C) Nowcast, Inc. All rights reserved. 12 We are hiring! 資料はこちら(大事なことなので以下略)→