SlideShare a Scribd company logo
1 of 53
© 2019 NTT DATA Corporation
2019/12/4
Japan Taxi / 渡部 徹太郎
株式会社NTTデータ OSSプロフェッショナルサービス/ 土橋 昌
MLOps と Strata Data Conference NY 参加報告
© 2019 NTT DATA Corporation 2
1. 自己紹介
2. カンファレンス概要
3. セッション紹介(土橋)
4. セッション紹介(渡部)
• 本スライドに記載されている会社名、システム名、製
品名は一般に各社の登録商標または商標です。
• 本スライドに記載の内容は必ずしも当社の統一見解を
示すものではありません。
© 2019 NTT DATA Corporation 3
自己紹介
© 2019 NTT DATA Corporation 4
渡部 徹太郎(Japan Taxi)
自己紹介
土橋 昌(NTTデータ)
 経歴
2010年頃に当時国内最大級の
千台超えのHadoopクラスタ開発
に携わって以来、OSSによる
大規模並列分散処理基盤の研究
開発・システム開発に従事。
現在はストリームデータ活用基盤、
機械学習基盤など。
 登壇・採録・執筆など
Strata Data Conference、USENIX OpML、
Kafka Summit、Spark Summit、
翔泳社「Apache Spark入門」、
同「Apache Kafka」、他多数
■ 経歴
NRIにてオンライントレード
システム基盤担当とオープン
ソース技術部隊を経験。
リクルートテクノロジーズでは全社
の横断分析基盤を担当。
また、日本AWSユーザ会ビッグ
データ支部を設立。
現在はJapanTaxiにてデータ
エンジニアを担当。
■登壇・採録・執筆など
Google Cloud Next Tokyo 2018,
Microsoft De:code 2016 他登壇多数
書籍の執筆は→
© 2019 NTT DATA Corporation 5
https://sites.google.com/view/sig-mlse/wg
• プロセス・事例収集WG
• システム基礎WG
• 本番適用のためのインフラと運用WG
宣伝?)機械学習工学研究会 WG
モチベーション:
試行錯誤から本番適用にもっていくにあたり、継続的に改善を続
けていく上で適切な機械学習システムを作るため
- 論文になりづらいLesson Learntを収集し
- アーキテクチャパターンを体系化したい
(鷲崎先生の取り組み [Washizaki 2019]以外、まだ十分に整備されていない)
© 2019 NTT DATA Corporation 6
カンファレンス概要
© 2019 NTT DATA Corporation 7
Hudson Mercantile New York City, 9/24
https://www.mlopsnyc.com/
 印象
• Meetupを大きくした感じ
• 分析者、エンジニアが多め
• ハイアリングを主体としたブースもある
• テックジャイアント、データ分析関連企業
の登壇が目立つ
 スポンサー
MLOps NYC
 主旨
“focus on managing and
automating machine learning pipelines,
to bring data science into real business
applications. “
 会場の様子
© 2019 NTT DATA Corporation 8
Javits Center, 9/23 - 26
https://conferences.oreilly.com/strata/str
ata-ny
 会場の様子
Strata Data Conference New York
 特徴的なトピック
※「data」をストップワードに含めた
© 2019 NTT DATA Corporation 9
Javits Center, 9/23 - 26
https://conferences.oreilly.com/strata/str
ata-ny
 会場の様子
Strata Data Conference New York
 特徴的なトピック
※「data」をストップワードに含めた
• プロダクト固有の話よりもアーキテク
チャや手法
• 機械学習、データサイエンス、モデル
• SparkとKafkaは頻出キーワード内に入っ
ている
© 2019 NTT DATA Corporation 10
セッション紹介
© 2019 NTT DATA Corporation 11
 MLOps NYC
• Using MLOps to Bring ML to Production (Microsoft)
• Nuclio関連
• 1)Real-time Financial Fraud Detection (Payoneer)
• 2)Serverless for ML Pipelines from A to Z (Iguazio)
 Strata Data Conference
• Building a multitenant data processing and model inferencing platform with Kafka
Streams Navinder (Walmart Labs)
• Deep learning on Apache Spark at CERN’s Large Hadron Collider with Analytics
Zoo (Intel)
• Deep learning technologies for giant hogweed eradication (NTTデータ)
セッション紹介
© 2019 NTT DATA Corporation 12
Using MLOps to Bring ML to Production
David Aronchick, Head of Open Source ML Strategy, Microsoft
© 2019 NTT DATA Corporation 13
Using MLOps to Bring ML to Production
David Aronchick, Head of Open Source ML Strategy, Microsoft
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
MS社では多数の提供サービス内でMLが
用いられている。
Office 365
1.8憶
Cortana
180憶
異常・不
正検知
6.5兆/日
© 2019 NTT DATA Corporation 14
Using MLOps to Bring ML to Production
David Aronchick, Head of Open Source ML Strategy, Microsoft
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
KubeCon でも同様の発表あり。
© 2019 NTT DATA Corporation 15
Using MLOps to Bring ML to Production
David Aronchick, Head of Open Source ML Strategy, Microsoft
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
KubeCon でも同様の発表あり。
データ入力~データ分割まで。
前処理関係
© 2019 NTT DATA Corporation 16
Using MLOps to Bring ML to Production
David Aronchick, Head of Open Source ML Strategy, Microsoft
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
KubeCon でも同様の発表あり。
学習と評価
さらに大量(や長時間)の学習
© 2019 NTT DATA Corporation 17
Using MLOps to Bring ML to Production
David Aronchick, Head of Open Source ML Strategy, Microsoft
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
KubeCon でも同様の発表あり。
ロールアウト(本番適用)
モニタリングとロギング含む
© 2019 NTT DATA Corporation 18
Using MLOps to Bring ML to Production
David Aronchick, Head of Open Source ML Strategy, Microsoft
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
KubeCon でも同様の発表あり。
大まかな流れを理解しやすい抽象度合。
あらゆるフローがシーケンシャル。実業務
との乖離はやや大きめの印象。
© 2019 NTT DATA Corporation 19
補足)当チームで検討中のワークフロー
基盤の議論をするときに話の軸を合わせ
るために、以下の参考文献をベースに実
案件での経験、有識者意見を取り入れ検
討開始。
参考情報例
• “Using MLOps to Bring ML to Production”, David
Aronchick - Head of Open Source ML Strategy;
Microsoft, MLOps NYC 19, New York, US.
• “TFX: A TensorFlow-Based Production-Scale Machine
Learning Platform”, Denis Baylor, Eric Breck, Heng-Tze
Cheng, Noah Fiedel, Chuan Yu Foo, Zakaria Haque,
Salem Haykal, Mustafa Ispir, Vihan Jain, Levent Koc,
Chiu Yuen Koo, Lukasz Lew, Clemens Mewald, Akshay
Naresh Modi, Neoklis Polyzotis, Sukriti Ramesh, Sudip
Roy, Steven Euijong Whang, Martin Wicke, Jarek
Wilkiewicz, Xin Zhang, Martin Zinkevich, Proceedings of
the 23rd ACM SIGKDD International Conference on
Knowledge Discovery and Data Mining, KDD '17, 2017.
• Cross-industry standard process for data mining,
https://en.wikipedia.org/wiki/Cross-
industry_standard_process_for_data_mining
• "AI プロダクト品質保証ガイドライン 2019.05 版", AI プ
ロダクト品質保証コンソーシアム(QA4AI コンソーシ
アム)編,
http://www.qa4ai.jp/QA4AI.Guideline.201905.pdf
絶賛編集中につき
ご注意を ぜひ一緒に議論させてください
© 2019 NTT DATA Corporation 20
Using MLOps to Bring ML to Production
David Aronchick, Head of Open Source ML Strategy, Microsoft
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
いくつかのツールを組み合わせ、「MLOps」の
システムを構成
特徴的なのはCI/CDパイプラインを中心に
処理フローを構成していること。CI/CDを通じ、
異なる環境・利用者がつながる。
© 2019 NTT DATA Corporation 21
Using MLOps to Bring ML to Production
David Aronchick, Head of Open Source ML Strategy, Microsoft
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
コンテナで処理やモデルを
パッケージングする。
CI/CDを通じ、一連の処理が
バリデートされ、機械的に
デプロイされる。
© 2019 NTT DATA Corporation 22
Using MLOps to Bring ML to Production
David Aronchick, Head of Open Source ML Strategy, Microsoft
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
あらゆるコンポーネント、アクティビティ
がIDでトラックされ、トレーサビリティが
担保されている。エンドツーエンドで説明
可能性を担保する。
© 2019 NTT DATA Corporation 23
Using MLOps to Bring ML to Production
David Aronchick, Head of Open Source ML Strategy, Microsoft
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
© 2019 NTT DATA Corporation 24
テックジャイアントは各社の文化や方法論に合わせ適した方式を利用・開発
 MS社
CI/CDの仕組みによる資材管理と共有、TensorFlow Extended、Uber Michelangelo
 Netflix社
独自開発のMetaflow:Pythonフレームワーク。デコレーションでフローを表現できる。数十人
~数百人規模の分析者にとっての使いやすさの実現を目指す。
 Twitter社
Scalaフレームワーク。CascadingベースのScaldingを利用。多様な処理に共通の言語、フ
レームワークを利用。
 Uber社
Sparkをパイプライン構成のフレームワークとして使用。コンポーネントをEstimaterとして実装。
他の処理との統合のしやすさ。
考察)各社独特なML Ops支援機能を利用・開発
© 2019 NTT DATA Corporation 25
Nuclio関連
1)Real-time Financial Fraud Detection※1
2)Serverless for ML Pipelines from A to Z※2
※1 Arthur Garmider, Architect, Payoneer
※2 Orit Nissan-Messing, VP of R&D, Iguazio
© 2019 NTT DATA Corporation 26
1)Real-time Financial Fraud Detection
Arthur Garmider, Architect, Payoneer
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
• 不正検知したい
• 存在しないユーザカード
• マネーロンダリング
• ミリ秒単位で検知したい
元々は30分ほどかかって検知していた
30分ごとにコピーされたデータ
を対象にオフラインで不正検知
データベースからDWHにコピー
© 2019 NTT DATA Corporation 27
1)Real-time Financial Fraud Detection
Arthur Garmider, Architect, Payoneer
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
AWSベースの代替アーキテクチャ
LambdaベースのFunction数珠繋ぎ方式
SageMakerを使った簡略化
しかし、Payoneerの
一部のシステムはオ
ンプレミスに残り続
け、オンプレとクラ
ウドの行ったり来た
りで、リアルタイム
での検知に支障が生
じていた
© 2019 NTT DATA Corporation 28
1)Real-time Financial Fraud Detection
Arthur Garmider, Architect, Payoneer
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
CDCとNuclioを使って
「リアルタイム」化
Nuclioベースの代替アーキテクチャ
データの変更をキャプチャ
してキューに流す
トランザクションのテーブルと他の
テーブルをSpark Streamingで結合
Daskを使った分析
Spark等を使って作られた特徴ベクトル
を入力とし、推論する
© 2019 NTT DATA Corporation 29
2)Serverless for ML Pipelines from A to Z
Orit Nissan-Messing, VP of R&D, Iguazio
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
リアルタイムの製品レコメンドにおけるデータフローの例
前処理して学習に用いる
モデルをAPIサーバに連携させる
APIを通じて推論結果を得る
推論
学習
前処理
© 2019 NTT DATA Corporation 30
2)Serverless for ML Pipelines from A to Z
Orit Nissan-Messing, VP of R&D, Iguazio
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
レコメンデーションのフロー
IngestionでNuclioを用いて効率化?
シングルスレッドの
Python?
ノン・ブロッキング
の並列処理
© 2019 NTT DATA Corporation 31
2)Serverless for ML Pipelines from A to Z
Orit Nissan-Messing, VP of R&D, Iguazio
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
レコメンデーションのフロー
モデルサービングにNuclioを利用
性能差異の理由に
関して言及なし
© 2019 NTT DATA Corporation 32
2)Serverless for ML Pipelines from A to Z
Orit Nissan-Messing, VP of R&D, Iguazio
MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
MLパイプラインをFunctionで構成
ステートレス
ステートフル
異なるFunction間を
つなぐ肝となる
© 2019 NTT DATA Corporation 33
定義:
Automate the Data Science Pipeline with Serverless Functions
⇒パッケージ化されたFunctionをデプロイ可能なFunction実行アーキテクチャ
主要開発母体:
iguazio
個人的な考察:
• イベント駆動処理を簡易に実装、
デプロイするのにはよさそう
• 並列分散処理内で集約等の処理を
伴うようなものは載せづらそう。
バックグラウンドで処理させることになる?
(フロー管理がどの程度可能かも気になる)
• イベント駆動で推論するケースでは
便利そう
補足)Nuclioについて
引用)https://github.com/nuclio/nuclio/
アーキテクチャ概要
コンテナ等の形
式でデプロイ
© 2019 NTT DATA Corporation 34
補足)ストリームデータ推論システムの2種類の考え方
メッセージングシステム中心に考えると… 処理エンジン・フロー中心に考えると…
メ
ッ
セ
ー
ジ
ン
グ
シ
ス
テ
ム
処理
処理
処理
e.g. 前処理
処理
e.g.推論
処理
e.g.推論
作られた特徴ベクトルを
入力とし、推論して戻す
推論結果のストリーム
データを外部に書き出す
外部
システム
実際には中間結果をメッ
セージングシステムなど
に書き出すこともある
作られた特徴ベクトルを
入力とし、推論を出力
外部
システム
処理
e.g.前処理
ストリームデータを加工する
© 2019 NTT DATA Corporation 35
Building a multitenant data processing and model inferencing
platform with Kafka Streams Navinder
Pal Singh Brar (Walmart Labs)
© 2019 NTT DATA Corporation 36
Building a multitenant data processing and model inferencing
platform with Kafka Streams Navinder
Pal Singh Brar (Walmart Labs)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
Walmartでは多数MLを用いている。
例えば適切なタイミングでメールを
お送りたい、など。
顧客情報基盤
RocksDB、
Kafka Streams
顧客情報基盤上でデータ
サイエンティストが機械
学習モデルを取りまわす
© 2019 NTT DATA Corporation 37
Building a multitenant data processing and model inferencing
platform with Kafka Streams Navinder
Pal Singh Brar (Walmart Labs)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
参考:CRISP-DM
引用 https://en.wikipedia.org/wiki/Cross-
industry_standard_process_for_data_m
ining
Walmartでのデータサイエンスモデルサイクル
50%超の時間がデータ
収集とクリーニングに
用いられている
© 2019 NTT DATA Corporation 38
Building a multitenant data processing and model inferencing
platform with Kafka Streams Navinder
Pal Singh Brar (Walmart Labs)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
何かしらの
イベントが
入力される
いったん
Kafkaに格納
Kafka Stramsで
推論用のモデル
をラップ
業務の区切り=
パーティション
複数業務シナリオが
Kafka Streams基盤
で動作する
© 2019 NTT DATA Corporation 39
Building a multitenant data processing and model inferencing
platform with Kafka Streams Navinder
Pal Singh Brar (Walmart Labs)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
シリアルな処理フロー パラレルな処理フロー
互いの影響小
互いの影響大
同じイベントを複
数のモデルが使う
Pull型のアーキテクチャを採用
© 2019 NTT DATA Corporation 40
Building a multitenant data processing and model inferencing
platform with Kafka Streams Navinder
Pal Singh Brar (Walmart Labs)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
オフセットはモデ
ルごとに管理
CBBプロセッサがイ
ベントを書き込み
モデルが端からpull
して処理する
店舗情報、顧客情報と合わせて
シーケンス・ストアを用いること
で、イベントの順序を考慮する
© 2019 NTT DATA Corporation 41
Building a multitenant data processing and model inferencing
platform with Kafka Streams Navinder
Pal Singh Brar (Walmart Labs)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
11000店舗、27か国を対象
© 2019 NTT DATA Corporation 42
• Q. 一貫性は?
• バッチ処理で改修。リアルタイム処理は「確率的な」考え方になっている。
• Q. CBBデータは複雑?
• エンティティを管理する別DBが存在。
• Q. 依存関係はどう管理?
• Jarに入れる
Building a multitenant data processing and model inferencing
platform with Kafka Streams Navinder
Pal Singh Brar (Walmart Labs)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
© 2019 NTT DATA Corporation 43
補足)当チームで考えている抽象アーキテクチャイメージ
先に例示したワークフローを動かす基盤
のアブストラクトを整理する営みを脈々
と続けている。
試行錯誤から始まり、最終的に本番で運
用し続けていく流れを踏まえて、一般的
なエンタープライズで用いるアーキテク
チャはどうあるべきか?を議論しつづけ
る。
絶賛編集中につき
ご注意を
絶賛編集中につき
ご注意を
ぜひ一緒に議論させてください
ぜひ一緒に議論させてください
© 2019 NTT DATA Corporation 44
Deep learning on Apache Spark at CERN’s Large Hadron
Collider with Analytics Zoo
Sajan Govindan (Intel)
© 2019 NTT DATA Corporation 45
Deep learning on Apache Spark at CERN’s Large Hadron Collider
with Analytics Zoo
Sajan Govindan (Intel)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
• 分析向けのソフトウェアス
タック
• コンセプト:ラップトップ
からプロダクションまでつ
なげる
ユースケース例
数年前と比べて着実に増えた?
© 2019 NTT DATA Corporation 46
• 0.2.0の時:
• Analytics + AI Platform for Apache Spark and BigDL.
• 2019/12現在:
• A unified analytics + AI platform for distributed TensorFlow, Keras, PyTorch and BigDL on
Apache Spark
補足)Analytics Zooについて
BigDL等をラップし、便利に使えるように仕立てたもの。よ
りハイレベルのAPIを利用できるようになる。(BigDL自体
ハイレベルAPIを提供しているが…)
例えば簡単に画像を扱いやすいように…など。
分散 / 非分散を透過的に使えるようにする工夫など
引用元)https://github.com/intel-analytics/analytics-zoo
© 2019 NTT DATA Corporation 47
Deep learning on Apache Spark at CERN’s Large Hadron Collider
with Analytics Zoo
Sajan Govindan (Intel)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
著名な事例としてのCERN
CERNの過去講演など
• CERN’s Next Generation Data
Analysis Platform with Apache
Spark (Spark Summit EU
2018)
• Hadoop and Spark services at
CERN (Dataworks Summit EU
2018)
• Taming Billions of Metrics and
Logs at Scale: Two Years with
Kafka as a Central Data Hub
for Monitoring @ CERN
(Kafka Summit London
2018)
などなど
大型ハドロン衝突型加速器
(LHC)
CERNは過去にOSS関係のカンファレン
スでよく登壇していた。常連。
© 2019 NTT DATA Corporation 48
Deep learning on Apache Spark at CERN’s Large Hadron Collider
with Analytics Zoo
Sajan Govindan (Intel)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
LHCでは大量のデータが生じる。
分析対象のデータを抽出する必
要がある。
リアルタイムにフィルタしたい。
要は「関心のあるデータ」だけ
を取り出したいのだが、それは
簡単なことではない。
© 2019 NTT DATA Corporation 49
Deep learning on Apache Spark at CERN’s Large Hadron Collider
with Analytics Zoo
Sajan Govindan (Intel)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
フィルタの質を上げるための
深層学習パイプライン
False Positiveを減らす。興味
深い現象だけ残す。
YARNとk8sの両方。過去の講演
から考えて、おそらく古くから
Hadoopを使っており、後から
k8sが入っていたと思われる。
© 2019 NTT DATA Corporation 50
Deep learning on Apache Spark at CERN’s Large Hadron Collider
with Analytics Zoo
Sajan Govindan (Intel)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
EOS Storageを用いてる。
HDFS APIからJNI経由で透
過的に利用。
参考)https://eos.com/eos-storage/
独自のコネクタを開発し、
XRootDプロトコルとつなぐ。
$ spark-shell --master local[*] --conf spark.driver.extraClassPath=<PATH>/hadoop-xrootd-1.0.4-jar-
with-dependencies.jar
scala> val df=spark.read.parquet("root://eosuser/eos/user/..PATH../test1.parquet")
scala> df.coalesce(4).write.parquet("root://eosuser/eos/user/..PATH../test1_COPIED.parquet"))
引用)https://github.com/cerndb/hadoop-xrootd
© 2019 NTT DATA Corporation 51
補足)hadoop-xrootdでEOSストレージを利用するためのAPI例
public FSDataOutputStream create(Path p, FsPermission permission, boolean overwrite, int bufferSize,
short replication, long blockSize, Progressable progress) throws IOException {
initHandle();
String filespec = uri.getScheme() + "://" + uri.getAuthority() + "/" + toFilePath(p);
eosDebugLogger.printDebug("EOSfs create issued for " + filespec);
int writeBufferSize = this.conf.getWriteBufferSize();
return new FSDataOutputStream(
new BufferedOutputStream(
new XRootDOutputStream(filespec, permission, overwrite),
writeBufferSize
),
statistics
);
}
ch/cern/eos/XRootDFileSystem.java:110
private native long writeFile(long handle, long pos, byte buffer[], int off, int len);
ch.cern.eos.XRootDClFile#writeFile
JNIEXPORT jlong JNICALL Java_ch_cern_eos_XRootDClFile_writeFile (JNIEnv *env, jobject This, jlong
handle, jlong filepos, jbyteArray b, jint off, jint len) {
src/main/cpp/ch_cern_eos_XRootDClFile.cpp:140
org.apache.hadoop.fs.FileSystem を
継承したFSDataOutputStream内で
FSDataOutputStreamが用いられて
いる。
FSDataOutputStream#writeFileを経
由してXRootDプロトコルでEOSス
トレージに接続する。
引用)https://github.com/cerndb/hadoop-xrootd
© 2019 NTT DATA Corporation 52
Deep learning technologies for giant hogweed eradication
Naoto Umemori (NTT DATA), Masaru Dobashi (NTT DATA)
© 2019 NTT DATA Corporation 53
Deep learning technologies for giant hogweed eradication
Naoto Umemori (NTT DATA), Masaru Dobashi (NTT DATA)
Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
ドローンから撮影した画像を入力として
危険外来植物を見つけるプロジェクト
当該プロジェクトを題材としつつ、システム基盤のアーキテクチャに
関する考察をいくつか紹介。O’Reilly Safariから講演ビデオ(スライ
ド)も見られるのでよろしければどうぞ。
https://conferences.oreilly.com/strata/strata-
ny/public/schedule/detail/77836

More Related Content

What's hot

Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...
Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...
Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...NTT DATA Technology & Innovation
 
クラウドネイティブ時代の大規模ウォーターフォール開発(CloudNative Days Tokyo 2021 発表資料)
クラウドネイティブ時代の大規模ウォーターフォール開発(CloudNative Days Tokyo 2021 発表資料)クラウドネイティブ時代の大規模ウォーターフォール開発(CloudNative Days Tokyo 2021 発表資料)
クラウドネイティブ時代の大規模ウォーターフォール開発(CloudNative Days Tokyo 2021 発表資料)NTT DATA Technology & Innovation
 
[CTC Forum 2019/10/25] 事例から学ぶ!AWS 移行でデータベースの管理・コストを削減する方法
[CTC Forum 2019/10/25] 事例から学ぶ!AWS 移行でデータベースの管理・コストを削減する方法[CTC Forum 2019/10/25] 事例から学ぶ!AWS 移行でデータベースの管理・コストを削減する方法
[CTC Forum 2019/10/25] 事例から学ぶ!AWS 移行でデータベースの管理・コストを削減する方法Takanori Ohba
 
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)NTT DATA Technology & Innovation
 
Visual StudioやAzureからAzure DevOpsを使う
Visual StudioやAzureからAzure DevOpsを使うVisual StudioやAzureからAzure DevOpsを使う
Visual StudioやAzureからAzure DevOpsを使うTakeshi Fukuhara
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data PlatformNaoki (Neo) SATO
 
PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)
PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)
PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)NTT DATA Technology & Innovation
 
Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力NTT DATA OSS Professional Services
 
平成最後の1月ですし、Databricksでもやってみましょうか
平成最後の1月ですし、Databricksでもやってみましょうか平成最後の1月ですし、Databricksでもやってみましょうか
平成最後の1月ですし、DatabricksでもやってみましょうかRyuichi Tokugami
 
OpenStack Summit 2017 Boston 報告会 サミット全体概要
OpenStack Summit 2017 Boston 報告会 サミット全体概要OpenStack Summit 2017 Boston 報告会 サミット全体概要
OpenStack Summit 2017 Boston 報告会 サミット全体概要Yukinori Sagara
 
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...NTT DATA Technology & Innovation
 
Knative Eventing 入門(Kubernetes Novice Tokyo #11 発表資料)
Knative Eventing 入門(Kubernetes Novice Tokyo #11 発表資料)Knative Eventing 入門(Kubernetes Novice Tokyo #11 発表資料)
Knative Eventing 入門(Kubernetes Novice Tokyo #11 発表資料)NTT DATA Technology & Innovation
 
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)NTT DATA Technology & Innovation
 
インフラCICDの勘所
インフラCICDの勘所インフラCICDの勘所
インフラCICDの勘所Toru Makabe
 
AIOpsで実現する効率化 OSC 2022 Online Spring TIS
AIOpsで実現する効率化 OSC 2022 Online Spring TISAIOpsで実現する効率化 OSC 2022 Online Spring TIS
AIOpsで実現する効率化 OSC 2022 Online Spring TISDaisuke Ikeda
 
de:code 2019 Cloud トラック 総まとめ! 完全版
de:code 2019 Cloud トラック 総まとめ! 完全版de:code 2019 Cloud トラック 総まとめ! 完全版
de:code 2019 Cloud トラック 総まとめ! 完全版Minoru Naito
 
AWS 技術者向け Azure サービス解説 de:code2019版 #CD81
AWS 技術者向け Azure サービス解説 de:code2019版 #CD81AWS 技術者向け Azure サービス解説 de:code2019版 #CD81
AWS 技術者向け Azure サービス解説 de:code2019版 #CD81Minoru Naito
 
ChainerMNが即座に使える環境を提供するXTREME DNA HPC Cloud
ChainerMNが即座に使える環境を提供するXTREME DNA HPC CloudChainerMNが即座に使える環境を提供するXTREME DNA HPC Cloud
ChainerMNが即座に使える環境を提供するXTREME DNA HPC CloudHirono Jumpei
 
Elastic observabilitycansmartlymanagetheappsonkubernetes
Elastic observabilitycansmartlymanagetheappsonkubernetesElastic observabilitycansmartlymanagetheappsonkubernetes
Elastic observabilitycansmartlymanagetheappsonkubernetesShotaro Suzuki
 
Managed Service Provider(MSP)によるマルチOrganizations管理の裏側(Security JAWS 第24回 発表資料)
Managed Service Provider(MSP)によるマルチOrganizations管理の裏側(Security JAWS 第24回 発表資料)Managed Service Provider(MSP)によるマルチOrganizations管理の裏側(Security JAWS 第24回 発表資料)
Managed Service Provider(MSP)によるマルチOrganizations管理の裏側(Security JAWS 第24回 発表資料)NTT DATA Technology & Innovation
 

What's hot (20)

Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...
Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...
Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...
 
クラウドネイティブ時代の大規模ウォーターフォール開発(CloudNative Days Tokyo 2021 発表資料)
クラウドネイティブ時代の大規模ウォーターフォール開発(CloudNative Days Tokyo 2021 発表資料)クラウドネイティブ時代の大規模ウォーターフォール開発(CloudNative Days Tokyo 2021 発表資料)
クラウドネイティブ時代の大規模ウォーターフォール開発(CloudNative Days Tokyo 2021 発表資料)
 
[CTC Forum 2019/10/25] 事例から学ぶ!AWS 移行でデータベースの管理・コストを削減する方法
[CTC Forum 2019/10/25] 事例から学ぶ!AWS 移行でデータベースの管理・コストを削減する方法[CTC Forum 2019/10/25] 事例から学ぶ!AWS 移行でデータベースの管理・コストを削減する方法
[CTC Forum 2019/10/25] 事例から学ぶ!AWS 移行でデータベースの管理・コストを削減する方法
 
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
 
Visual StudioやAzureからAzure DevOpsを使う
Visual StudioやAzureからAzure DevOpsを使うVisual StudioやAzureからAzure DevOpsを使う
Visual StudioやAzureからAzure DevOpsを使う
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
 
PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)
PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)
PostgreSQL開発コミュニティに参加しよう!(PostgreSQL Conference Japan 2021 発表資料)
 
Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力
 
平成最後の1月ですし、Databricksでもやってみましょうか
平成最後の1月ですし、Databricksでもやってみましょうか平成最後の1月ですし、Databricksでもやってみましょうか
平成最後の1月ですし、Databricksでもやってみましょうか
 
OpenStack Summit 2017 Boston 報告会 サミット全体概要
OpenStack Summit 2017 Boston 報告会 サミット全体概要OpenStack Summit 2017 Boston 報告会 サミット全体概要
OpenStack Summit 2017 Boston 報告会 サミット全体概要
 
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
 
Knative Eventing 入門(Kubernetes Novice Tokyo #11 発表資料)
Knative Eventing 入門(Kubernetes Novice Tokyo #11 発表資料)Knative Eventing 入門(Kubernetes Novice Tokyo #11 発表資料)
Knative Eventing 入門(Kubernetes Novice Tokyo #11 発表資料)
 
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
 
インフラCICDの勘所
インフラCICDの勘所インフラCICDの勘所
インフラCICDの勘所
 
AIOpsで実現する効率化 OSC 2022 Online Spring TIS
AIOpsで実現する効率化 OSC 2022 Online Spring TISAIOpsで実現する効率化 OSC 2022 Online Spring TIS
AIOpsで実現する効率化 OSC 2022 Online Spring TIS
 
de:code 2019 Cloud トラック 総まとめ! 完全版
de:code 2019 Cloud トラック 総まとめ! 完全版de:code 2019 Cloud トラック 総まとめ! 完全版
de:code 2019 Cloud トラック 総まとめ! 完全版
 
AWS 技術者向け Azure サービス解説 de:code2019版 #CD81
AWS 技術者向け Azure サービス解説 de:code2019版 #CD81AWS 技術者向け Azure サービス解説 de:code2019版 #CD81
AWS 技術者向け Azure サービス解説 de:code2019版 #CD81
 
ChainerMNが即座に使える環境を提供するXTREME DNA HPC Cloud
ChainerMNが即座に使える環境を提供するXTREME DNA HPC CloudChainerMNが即座に使える環境を提供するXTREME DNA HPC Cloud
ChainerMNが即座に使える環境を提供するXTREME DNA HPC Cloud
 
Elastic observabilitycansmartlymanagetheappsonkubernetes
Elastic observabilitycansmartlymanagetheappsonkubernetesElastic observabilitycansmartlymanagetheappsonkubernetes
Elastic observabilitycansmartlymanagetheappsonkubernetes
 
Managed Service Provider(MSP)によるマルチOrganizations管理の裏側(Security JAWS 第24回 発表資料)
Managed Service Provider(MSP)によるマルチOrganizations管理の裏側(Security JAWS 第24回 発表資料)Managed Service Provider(MSP)によるマルチOrganizations管理の裏側(Security JAWS 第24回 発表資料)
Managed Service Provider(MSP)によるマルチOrganizations管理の裏側(Security JAWS 第24回 発表資料)
 

Similar to MLOps NYC 2019 and Strata Data Conference NY 2019 report nttdata

AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)NTT DATA Technology & Innovation
 
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...オラクルエンジニア通信
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
要求開発アライアンス 9月定例会議
要求開発アライアンス 9月定例会議要求開発アライアンス 9月定例会議
要求開発アライアンス 9月定例会議Atsushi Takayasu
 
「クラウドの変質化」Yako presen 141005
「クラウドの変質化」Yako presen 141005「クラウドの変質化」Yako presen 141005
「クラウドの変質化」Yako presen 141005知礼 八子
 
クラウドEXPO 2011春資料 20110418
クラウドEXPO 2011春資料 20110418クラウドEXPO 2011春資料 20110418
クラウドEXPO 2011春資料 20110418知礼 八子
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean ManifacturingOsaka University
 
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)appliedelectronics
 
hbstudy#88 5G+MEC時代のシステム設計
hbstudy#88 5G+MEC時代のシステム設計hbstudy#88 5G+MEC時代のシステム設計
hbstudy#88 5G+MEC時代のシステム設計VirtualTech Japan Inc.
 
Red Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM sessionRed Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM sessionShinichiro Arai
 
デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~
デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~
デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~Daiyu Hatakeyama
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」Cybozucommunity
 
2021/02/19 Alterbooth 多忙なアーキテクトのためのクラウド導入フレームワーク (CAF) ダイジェスト
2021/02/19 Alterbooth 多忙なアーキテクトのためのクラウド導入フレームワーク (CAF) ダイジェスト2021/02/19 Alterbooth 多忙なアーキテクトのためのクラウド導入フレームワーク (CAF) ダイジェスト
2021/02/19 Alterbooth 多忙なアーキテクトのためのクラウド導入フレームワーク (CAF) ダイジェストIssei Hiraoka
 
de:code2018 登壇資料
de:code2018 登壇資料de:code2018 登壇資料
de:code2018 登壇資料Hiroshi Senga
 
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)NTT DATA Technology & Innovation
 
JAWS-UG 三都物語20140705
JAWS-UG 三都物語20140705JAWS-UG 三都物語20140705
JAWS-UG 三都物語20140705知礼 八子
 
Interop Tokyo 2016 | ソラコムの戦略
Interop Tokyo 2016 | ソラコムの戦略Interop Tokyo 2016 | ソラコムの戦略
Interop Tokyo 2016 | ソラコムの戦略SORACOM,INC
 
はじめてのOracle Cloud Infrastructure(Oracle Cloudウェビナーシリーズ: 2020年8月5日)
はじめてのOracle Cloud Infrastructure(Oracle Cloudウェビナーシリーズ: 2020年8月5日) はじめてのOracle Cloud Infrastructure(Oracle Cloudウェビナーシリーズ: 2020年8月5日)
はじめてのOracle Cloud Infrastructure(Oracle Cloudウェビナーシリーズ: 2020年8月5日) オラクルエンジニア通信
 

Similar to MLOps NYC 2019 and Strata Data Conference NY 2019 report nttdata (20)

AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
 
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
要求開発アライアンス 9月定例会議
要求開発アライアンス 9月定例会議要求開発アライアンス 9月定例会議
要求開発アライアンス 9月定例会議
 
ベンダーロックインフリーのビジネスクラウドの世界
ベンダーロックインフリーのビジネスクラウドの世界ベンダーロックインフリーのビジネスクラウドの世界
ベンダーロックインフリーのビジネスクラウドの世界
 
「クラウドの変質化」Yako presen 141005
「クラウドの変質化」Yako presen 141005「クラウドの変質化」Yako presen 141005
「クラウドの変質化」Yako presen 141005
 
クラウドEXPO 2011春資料 20110418
クラウドEXPO 2011春資料 20110418クラウドEXPO 2011春資料 20110418
クラウドEXPO 2011春資料 20110418
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean Manifacturing
 
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
 
hbstudy#88 5G+MEC時代のシステム設計
hbstudy#88 5G+MEC時代のシステム設計hbstudy#88 5G+MEC時代のシステム設計
hbstudy#88 5G+MEC時代のシステム設計
 
Red Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM sessionRed Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM session
 
デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~
デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~
デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
 
2021/02/19 Alterbooth 多忙なアーキテクトのためのクラウド導入フレームワーク (CAF) ダイジェスト
2021/02/19 Alterbooth 多忙なアーキテクトのためのクラウド導入フレームワーク (CAF) ダイジェスト2021/02/19 Alterbooth 多忙なアーキテクトのためのクラウド導入フレームワーク (CAF) ダイジェスト
2021/02/19 Alterbooth 多忙なアーキテクトのためのクラウド導入フレームワーク (CAF) ダイジェスト
 
de:code2018 登壇資料
de:code2018 登壇資料de:code2018 登壇資料
de:code2018 登壇資料
 
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)
 
JAWS-UG 三都物語20140705
JAWS-UG 三都物語20140705JAWS-UG 三都物語20140705
JAWS-UG 三都物語20140705
 
Interop Tokyo 2016 | ソラコムの戦略
Interop Tokyo 2016 | ソラコムの戦略Interop Tokyo 2016 | ソラコムの戦略
Interop Tokyo 2016 | ソラコムの戦略
 
Aws summit tokyo 2016
Aws summit tokyo 2016Aws summit tokyo 2016
Aws summit tokyo 2016
 
はじめてのOracle Cloud Infrastructure(Oracle Cloudウェビナーシリーズ: 2020年8月5日)
はじめてのOracle Cloud Infrastructure(Oracle Cloudウェビナーシリーズ: 2020年8月5日) はじめてのOracle Cloud Infrastructure(Oracle Cloudウェビナーシリーズ: 2020年8月5日)
はじめてのOracle Cloud Infrastructure(Oracle Cloudウェビナーシリーズ: 2020年8月5日)
 

More from NTT DATA Technology & Innovation

OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)NTT DATA Technology & Innovation
 
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)NTT DATA Technology & Innovation
 
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方NTT DATA Technology & Innovation
 
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...NTT DATA Technology & Innovation
 
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)NTT DATA Technology & Innovation
 
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)NTT DATA Technology & Innovation
 
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...NTT DATA Technology & Innovation
 
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
 
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
 
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
 
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)NTT DATA Technology & Innovation
 
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...NTT DATA Technology & Innovation
 
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)NTT DATA Technology & Innovation
 
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)NTT DATA Technology & Innovation
 
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)NTT DATA Technology & Innovation
 
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...NTT DATA Technology & Innovation
 
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)NTT DATA Technology & Innovation
 
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)NTT DATA Technology & Innovation
 
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)NTT DATA Technology & Innovation
 
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)NTT DATA Technology & Innovation
 

More from NTT DATA Technology & Innovation (20)

OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
 
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
 
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
 
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
 
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
 
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
 
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
 
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
 
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
 
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
 
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
 
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
 
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
 
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
 
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
 
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
 
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
 
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
 
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
 
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
 

Recently uploaded

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 

Recently uploaded (8)

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 

MLOps NYC 2019 and Strata Data Conference NY 2019 report nttdata

  • 1. © 2019 NTT DATA Corporation 2019/12/4 Japan Taxi / 渡部 徹太郎 株式会社NTTデータ OSSプロフェッショナルサービス/ 土橋 昌 MLOps と Strata Data Conference NY 参加報告
  • 2. © 2019 NTT DATA Corporation 2 1. 自己紹介 2. カンファレンス概要 3. セッション紹介(土橋) 4. セッション紹介(渡部) • 本スライドに記載されている会社名、システム名、製 品名は一般に各社の登録商標または商標です。 • 本スライドに記載の内容は必ずしも当社の統一見解を 示すものではありません。
  • 3. © 2019 NTT DATA Corporation 3 自己紹介
  • 4. © 2019 NTT DATA Corporation 4 渡部 徹太郎(Japan Taxi) 自己紹介 土橋 昌(NTTデータ)  経歴 2010年頃に当時国内最大級の 千台超えのHadoopクラスタ開発 に携わって以来、OSSによる 大規模並列分散処理基盤の研究 開発・システム開発に従事。 現在はストリームデータ活用基盤、 機械学習基盤など。  登壇・採録・執筆など Strata Data Conference、USENIX OpML、 Kafka Summit、Spark Summit、 翔泳社「Apache Spark入門」、 同「Apache Kafka」、他多数 ■ 経歴 NRIにてオンライントレード システム基盤担当とオープン ソース技術部隊を経験。 リクルートテクノロジーズでは全社 の横断分析基盤を担当。 また、日本AWSユーザ会ビッグ データ支部を設立。 現在はJapanTaxiにてデータ エンジニアを担当。 ■登壇・採録・執筆など Google Cloud Next Tokyo 2018, Microsoft De:code 2016 他登壇多数 書籍の執筆は→
  • 5. © 2019 NTT DATA Corporation 5 https://sites.google.com/view/sig-mlse/wg • プロセス・事例収集WG • システム基礎WG • 本番適用のためのインフラと運用WG 宣伝?)機械学習工学研究会 WG モチベーション: 試行錯誤から本番適用にもっていくにあたり、継続的に改善を続 けていく上で適切な機械学習システムを作るため - 論文になりづらいLesson Learntを収集し - アーキテクチャパターンを体系化したい (鷲崎先生の取り組み [Washizaki 2019]以外、まだ十分に整備されていない)
  • 6. © 2019 NTT DATA Corporation 6 カンファレンス概要
  • 7. © 2019 NTT DATA Corporation 7 Hudson Mercantile New York City, 9/24 https://www.mlopsnyc.com/  印象 • Meetupを大きくした感じ • 分析者、エンジニアが多め • ハイアリングを主体としたブースもある • テックジャイアント、データ分析関連企業 の登壇が目立つ  スポンサー MLOps NYC  主旨 “focus on managing and automating machine learning pipelines, to bring data science into real business applications. “  会場の様子
  • 8. © 2019 NTT DATA Corporation 8 Javits Center, 9/23 - 26 https://conferences.oreilly.com/strata/str ata-ny  会場の様子 Strata Data Conference New York  特徴的なトピック ※「data」をストップワードに含めた
  • 9. © 2019 NTT DATA Corporation 9 Javits Center, 9/23 - 26 https://conferences.oreilly.com/strata/str ata-ny  会場の様子 Strata Data Conference New York  特徴的なトピック ※「data」をストップワードに含めた • プロダクト固有の話よりもアーキテク チャや手法 • 機械学習、データサイエンス、モデル • SparkとKafkaは頻出キーワード内に入っ ている
  • 10. © 2019 NTT DATA Corporation 10 セッション紹介
  • 11. © 2019 NTT DATA Corporation 11  MLOps NYC • Using MLOps to Bring ML to Production (Microsoft) • Nuclio関連 • 1)Real-time Financial Fraud Detection (Payoneer) • 2)Serverless for ML Pipelines from A to Z (Iguazio)  Strata Data Conference • Building a multitenant data processing and model inferencing platform with Kafka Streams Navinder (Walmart Labs) • Deep learning on Apache Spark at CERN’s Large Hadron Collider with Analytics Zoo (Intel) • Deep learning technologies for giant hogweed eradication (NTTデータ) セッション紹介
  • 12. © 2019 NTT DATA Corporation 12 Using MLOps to Bring ML to Production David Aronchick, Head of Open Source ML Strategy, Microsoft
  • 13. © 2019 NTT DATA Corporation 13 Using MLOps to Bring ML to Production David Aronchick, Head of Open Source ML Strategy, Microsoft MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 MS社では多数の提供サービス内でMLが 用いられている。 Office 365 1.8憶 Cortana 180憶 異常・不 正検知 6.5兆/日
  • 14. © 2019 NTT DATA Corporation 14 Using MLOps to Bring ML to Production David Aronchick, Head of Open Source ML Strategy, Microsoft MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 KubeCon でも同様の発表あり。
  • 15. © 2019 NTT DATA Corporation 15 Using MLOps to Bring ML to Production David Aronchick, Head of Open Source ML Strategy, Microsoft MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 KubeCon でも同様の発表あり。 データ入力~データ分割まで。 前処理関係
  • 16. © 2019 NTT DATA Corporation 16 Using MLOps to Bring ML to Production David Aronchick, Head of Open Source ML Strategy, Microsoft MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 KubeCon でも同様の発表あり。 学習と評価 さらに大量(や長時間)の学習
  • 17. © 2019 NTT DATA Corporation 17 Using MLOps to Bring ML to Production David Aronchick, Head of Open Source ML Strategy, Microsoft MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 KubeCon でも同様の発表あり。 ロールアウト(本番適用) モニタリングとロギング含む
  • 18. © 2019 NTT DATA Corporation 18 Using MLOps to Bring ML to Production David Aronchick, Head of Open Source ML Strategy, Microsoft MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 KubeCon でも同様の発表あり。 大まかな流れを理解しやすい抽象度合。 あらゆるフローがシーケンシャル。実業務 との乖離はやや大きめの印象。
  • 19. © 2019 NTT DATA Corporation 19 補足)当チームで検討中のワークフロー 基盤の議論をするときに話の軸を合わせ るために、以下の参考文献をベースに実 案件での経験、有識者意見を取り入れ検 討開始。 参考情報例 • “Using MLOps to Bring ML to Production”, David Aronchick - Head of Open Source ML Strategy; Microsoft, MLOps NYC 19, New York, US. • “TFX: A TensorFlow-Based Production-Scale Machine Learning Platform”, Denis Baylor, Eric Breck, Heng-Tze Cheng, Noah Fiedel, Chuan Yu Foo, Zakaria Haque, Salem Haykal, Mustafa Ispir, Vihan Jain, Levent Koc, Chiu Yuen Koo, Lukasz Lew, Clemens Mewald, Akshay Naresh Modi, Neoklis Polyzotis, Sukriti Ramesh, Sudip Roy, Steven Euijong Whang, Martin Wicke, Jarek Wilkiewicz, Xin Zhang, Martin Zinkevich, Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD '17, 2017. • Cross-industry standard process for data mining, https://en.wikipedia.org/wiki/Cross- industry_standard_process_for_data_mining • "AI プロダクト品質保証ガイドライン 2019.05 版", AI プ ロダクト品質保証コンソーシアム(QA4AI コンソーシ アム)編, http://www.qa4ai.jp/QA4AI.Guideline.201905.pdf 絶賛編集中につき ご注意を ぜひ一緒に議論させてください
  • 20. © 2019 NTT DATA Corporation 20 Using MLOps to Bring ML to Production David Aronchick, Head of Open Source ML Strategy, Microsoft MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 いくつかのツールを組み合わせ、「MLOps」の システムを構成 特徴的なのはCI/CDパイプラインを中心に 処理フローを構成していること。CI/CDを通じ、 異なる環境・利用者がつながる。
  • 21. © 2019 NTT DATA Corporation 21 Using MLOps to Bring ML to Production David Aronchick, Head of Open Source ML Strategy, Microsoft MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 コンテナで処理やモデルを パッケージングする。 CI/CDを通じ、一連の処理が バリデートされ、機械的に デプロイされる。
  • 22. © 2019 NTT DATA Corporation 22 Using MLOps to Bring ML to Production David Aronchick, Head of Open Source ML Strategy, Microsoft MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 あらゆるコンポーネント、アクティビティ がIDでトラックされ、トレーサビリティが 担保されている。エンドツーエンドで説明 可能性を担保する。
  • 23. © 2019 NTT DATA Corporation 23 Using MLOps to Bring ML to Production David Aronchick, Head of Open Source ML Strategy, Microsoft MLOps NYC(https://www.mlopsnyc.com/agenda)より引用
  • 24. © 2019 NTT DATA Corporation 24 テックジャイアントは各社の文化や方法論に合わせ適した方式を利用・開発  MS社 CI/CDの仕組みによる資材管理と共有、TensorFlow Extended、Uber Michelangelo  Netflix社 独自開発のMetaflow:Pythonフレームワーク。デコレーションでフローを表現できる。数十人 ~数百人規模の分析者にとっての使いやすさの実現を目指す。  Twitter社 Scalaフレームワーク。CascadingベースのScaldingを利用。多様な処理に共通の言語、フ レームワークを利用。  Uber社 Sparkをパイプライン構成のフレームワークとして使用。コンポーネントをEstimaterとして実装。 他の処理との統合のしやすさ。 考察)各社独特なML Ops支援機能を利用・開発
  • 25. © 2019 NTT DATA Corporation 25 Nuclio関連 1)Real-time Financial Fraud Detection※1 2)Serverless for ML Pipelines from A to Z※2 ※1 Arthur Garmider, Architect, Payoneer ※2 Orit Nissan-Messing, VP of R&D, Iguazio
  • 26. © 2019 NTT DATA Corporation 26 1)Real-time Financial Fraud Detection Arthur Garmider, Architect, Payoneer MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 • 不正検知したい • 存在しないユーザカード • マネーロンダリング • ミリ秒単位で検知したい 元々は30分ほどかかって検知していた 30分ごとにコピーされたデータ を対象にオフラインで不正検知 データベースからDWHにコピー
  • 27. © 2019 NTT DATA Corporation 27 1)Real-time Financial Fraud Detection Arthur Garmider, Architect, Payoneer MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 AWSベースの代替アーキテクチャ LambdaベースのFunction数珠繋ぎ方式 SageMakerを使った簡略化 しかし、Payoneerの 一部のシステムはオ ンプレミスに残り続 け、オンプレとクラ ウドの行ったり来た りで、リアルタイム での検知に支障が生 じていた
  • 28. © 2019 NTT DATA Corporation 28 1)Real-time Financial Fraud Detection Arthur Garmider, Architect, Payoneer MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 CDCとNuclioを使って 「リアルタイム」化 Nuclioベースの代替アーキテクチャ データの変更をキャプチャ してキューに流す トランザクションのテーブルと他の テーブルをSpark Streamingで結合 Daskを使った分析 Spark等を使って作られた特徴ベクトル を入力とし、推論する
  • 29. © 2019 NTT DATA Corporation 29 2)Serverless for ML Pipelines from A to Z Orit Nissan-Messing, VP of R&D, Iguazio MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 リアルタイムの製品レコメンドにおけるデータフローの例 前処理して学習に用いる モデルをAPIサーバに連携させる APIを通じて推論結果を得る 推論 学習 前処理
  • 30. © 2019 NTT DATA Corporation 30 2)Serverless for ML Pipelines from A to Z Orit Nissan-Messing, VP of R&D, Iguazio MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 レコメンデーションのフロー IngestionでNuclioを用いて効率化? シングルスレッドの Python? ノン・ブロッキング の並列処理
  • 31. © 2019 NTT DATA Corporation 31 2)Serverless for ML Pipelines from A to Z Orit Nissan-Messing, VP of R&D, Iguazio MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 レコメンデーションのフロー モデルサービングにNuclioを利用 性能差異の理由に 関して言及なし
  • 32. © 2019 NTT DATA Corporation 32 2)Serverless for ML Pipelines from A to Z Orit Nissan-Messing, VP of R&D, Iguazio MLOps NYC(https://www.mlopsnyc.com/agenda)より引用 MLパイプラインをFunctionで構成 ステートレス ステートフル 異なるFunction間を つなぐ肝となる
  • 33. © 2019 NTT DATA Corporation 33 定義: Automate the Data Science Pipeline with Serverless Functions ⇒パッケージ化されたFunctionをデプロイ可能なFunction実行アーキテクチャ 主要開発母体: iguazio 個人的な考察: • イベント駆動処理を簡易に実装、 デプロイするのにはよさそう • 並列分散処理内で集約等の処理を 伴うようなものは載せづらそう。 バックグラウンドで処理させることになる? (フロー管理がどの程度可能かも気になる) • イベント駆動で推論するケースでは 便利そう 補足)Nuclioについて 引用)https://github.com/nuclio/nuclio/ アーキテクチャ概要 コンテナ等の形 式でデプロイ
  • 34. © 2019 NTT DATA Corporation 34 補足)ストリームデータ推論システムの2種類の考え方 メッセージングシステム中心に考えると… 処理エンジン・フロー中心に考えると… メ ッ セ ー ジ ン グ シ ス テ ム 処理 処理 処理 e.g. 前処理 処理 e.g.推論 処理 e.g.推論 作られた特徴ベクトルを 入力とし、推論して戻す 推論結果のストリーム データを外部に書き出す 外部 システム 実際には中間結果をメッ セージングシステムなど に書き出すこともある 作られた特徴ベクトルを 入力とし、推論を出力 外部 システム 処理 e.g.前処理 ストリームデータを加工する
  • 35. © 2019 NTT DATA Corporation 35 Building a multitenant data processing and model inferencing platform with Kafka Streams Navinder Pal Singh Brar (Walmart Labs)
  • 36. © 2019 NTT DATA Corporation 36 Building a multitenant data processing and model inferencing platform with Kafka Streams Navinder Pal Singh Brar (Walmart Labs) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 Walmartでは多数MLを用いている。 例えば適切なタイミングでメールを お送りたい、など。 顧客情報基盤 RocksDB、 Kafka Streams 顧客情報基盤上でデータ サイエンティストが機械 学習モデルを取りまわす
  • 37. © 2019 NTT DATA Corporation 37 Building a multitenant data processing and model inferencing platform with Kafka Streams Navinder Pal Singh Brar (Walmart Labs) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 参考:CRISP-DM 引用 https://en.wikipedia.org/wiki/Cross- industry_standard_process_for_data_m ining Walmartでのデータサイエンスモデルサイクル 50%超の時間がデータ 収集とクリーニングに 用いられている
  • 38. © 2019 NTT DATA Corporation 38 Building a multitenant data processing and model inferencing platform with Kafka Streams Navinder Pal Singh Brar (Walmart Labs) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 何かしらの イベントが 入力される いったん Kafkaに格納 Kafka Stramsで 推論用のモデル をラップ 業務の区切り= パーティション 複数業務シナリオが Kafka Streams基盤 で動作する
  • 39. © 2019 NTT DATA Corporation 39 Building a multitenant data processing and model inferencing platform with Kafka Streams Navinder Pal Singh Brar (Walmart Labs) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 シリアルな処理フロー パラレルな処理フロー 互いの影響小 互いの影響大 同じイベントを複 数のモデルが使う Pull型のアーキテクチャを採用
  • 40. © 2019 NTT DATA Corporation 40 Building a multitenant data processing and model inferencing platform with Kafka Streams Navinder Pal Singh Brar (Walmart Labs) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 オフセットはモデ ルごとに管理 CBBプロセッサがイ ベントを書き込み モデルが端からpull して処理する 店舗情報、顧客情報と合わせて シーケンス・ストアを用いること で、イベントの順序を考慮する
  • 41. © 2019 NTT DATA Corporation 41 Building a multitenant data processing and model inferencing platform with Kafka Streams Navinder Pal Singh Brar (Walmart Labs) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 11000店舗、27か国を対象
  • 42. © 2019 NTT DATA Corporation 42 • Q. 一貫性は? • バッチ処理で改修。リアルタイム処理は「確率的な」考え方になっている。 • Q. CBBデータは複雑? • エンティティを管理する別DBが存在。 • Q. 依存関係はどう管理? • Jarに入れる Building a multitenant data processing and model inferencing platform with Kafka Streams Navinder Pal Singh Brar (Walmart Labs) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用
  • 43. © 2019 NTT DATA Corporation 43 補足)当チームで考えている抽象アーキテクチャイメージ 先に例示したワークフローを動かす基盤 のアブストラクトを整理する営みを脈々 と続けている。 試行錯誤から始まり、最終的に本番で運 用し続けていく流れを踏まえて、一般的 なエンタープライズで用いるアーキテク チャはどうあるべきか?を議論しつづけ る。 絶賛編集中につき ご注意を 絶賛編集中につき ご注意を ぜひ一緒に議論させてください ぜひ一緒に議論させてください
  • 44. © 2019 NTT DATA Corporation 44 Deep learning on Apache Spark at CERN’s Large Hadron Collider with Analytics Zoo Sajan Govindan (Intel)
  • 45. © 2019 NTT DATA Corporation 45 Deep learning on Apache Spark at CERN’s Large Hadron Collider with Analytics Zoo Sajan Govindan (Intel) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 • 分析向けのソフトウェアス タック • コンセプト:ラップトップ からプロダクションまでつ なげる ユースケース例 数年前と比べて着実に増えた?
  • 46. © 2019 NTT DATA Corporation 46 • 0.2.0の時: • Analytics + AI Platform for Apache Spark and BigDL. • 2019/12現在: • A unified analytics + AI platform for distributed TensorFlow, Keras, PyTorch and BigDL on Apache Spark 補足)Analytics Zooについて BigDL等をラップし、便利に使えるように仕立てたもの。よ りハイレベルのAPIを利用できるようになる。(BigDL自体 ハイレベルAPIを提供しているが…) 例えば簡単に画像を扱いやすいように…など。 分散 / 非分散を透過的に使えるようにする工夫など 引用元)https://github.com/intel-analytics/analytics-zoo
  • 47. © 2019 NTT DATA Corporation 47 Deep learning on Apache Spark at CERN’s Large Hadron Collider with Analytics Zoo Sajan Govindan (Intel) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 著名な事例としてのCERN CERNの過去講演など • CERN’s Next Generation Data Analysis Platform with Apache Spark (Spark Summit EU 2018) • Hadoop and Spark services at CERN (Dataworks Summit EU 2018) • Taming Billions of Metrics and Logs at Scale: Two Years with Kafka as a Central Data Hub for Monitoring @ CERN (Kafka Summit London 2018) などなど 大型ハドロン衝突型加速器 (LHC) CERNは過去にOSS関係のカンファレン スでよく登壇していた。常連。
  • 48. © 2019 NTT DATA Corporation 48 Deep learning on Apache Spark at CERN’s Large Hadron Collider with Analytics Zoo Sajan Govindan (Intel) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 LHCでは大量のデータが生じる。 分析対象のデータを抽出する必 要がある。 リアルタイムにフィルタしたい。 要は「関心のあるデータ」だけ を取り出したいのだが、それは 簡単なことではない。
  • 49. © 2019 NTT DATA Corporation 49 Deep learning on Apache Spark at CERN’s Large Hadron Collider with Analytics Zoo Sajan Govindan (Intel) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 フィルタの質を上げるための 深層学習パイプライン False Positiveを減らす。興味 深い現象だけ残す。 YARNとk8sの両方。過去の講演 から考えて、おそらく古くから Hadoopを使っており、後から k8sが入っていたと思われる。
  • 50. © 2019 NTT DATA Corporation 50 Deep learning on Apache Spark at CERN’s Large Hadron Collider with Analytics Zoo Sajan Govindan (Intel) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 EOS Storageを用いてる。 HDFS APIからJNI経由で透 過的に利用。 参考)https://eos.com/eos-storage/ 独自のコネクタを開発し、 XRootDプロトコルとつなぐ。 $ spark-shell --master local[*] --conf spark.driver.extraClassPath=<PATH>/hadoop-xrootd-1.0.4-jar- with-dependencies.jar scala> val df=spark.read.parquet("root://eosuser/eos/user/..PATH../test1.parquet") scala> df.coalesce(4).write.parquet("root://eosuser/eos/user/..PATH../test1_COPIED.parquet")) 引用)https://github.com/cerndb/hadoop-xrootd
  • 51. © 2019 NTT DATA Corporation 51 補足)hadoop-xrootdでEOSストレージを利用するためのAPI例 public FSDataOutputStream create(Path p, FsPermission permission, boolean overwrite, int bufferSize, short replication, long blockSize, Progressable progress) throws IOException { initHandle(); String filespec = uri.getScheme() + "://" + uri.getAuthority() + "/" + toFilePath(p); eosDebugLogger.printDebug("EOSfs create issued for " + filespec); int writeBufferSize = this.conf.getWriteBufferSize(); return new FSDataOutputStream( new BufferedOutputStream( new XRootDOutputStream(filespec, permission, overwrite), writeBufferSize ), statistics ); } ch/cern/eos/XRootDFileSystem.java:110 private native long writeFile(long handle, long pos, byte buffer[], int off, int len); ch.cern.eos.XRootDClFile#writeFile JNIEXPORT jlong JNICALL Java_ch_cern_eos_XRootDClFile_writeFile (JNIEnv *env, jobject This, jlong handle, jlong filepos, jbyteArray b, jint off, jint len) { src/main/cpp/ch_cern_eos_XRootDClFile.cpp:140 org.apache.hadoop.fs.FileSystem を 継承したFSDataOutputStream内で FSDataOutputStreamが用いられて いる。 FSDataOutputStream#writeFileを経 由してXRootDプロトコルでEOSス トレージに接続する。 引用)https://github.com/cerndb/hadoop-xrootd
  • 52. © 2019 NTT DATA Corporation 52 Deep learning technologies for giant hogweed eradication Naoto Umemori (NTT DATA), Masaru Dobashi (NTT DATA)
  • 53. © 2019 NTT DATA Corporation 53 Deep learning technologies for giant hogweed eradication Naoto Umemori (NTT DATA), Masaru Dobashi (NTT DATA) Strata Data Conference New York 2019(https://conferences.oreilly.com/strata/strata-ny)より引用 ドローンから撮影した画像を入力として 危険外来植物を見つけるプロジェクト 当該プロジェクトを題材としつつ、システム基盤のアーキテクチャに 関する考察をいくつか紹介。O’Reilly Safariから講演ビデオ(スライ ド)も見られるのでよろしければどうぞ。 https://conferences.oreilly.com/strata/strata- ny/public/schedule/detail/77836