Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Shinsuke Sugaya
PDF, PPTX
1,165 views
PredictionIOでSparkMLを使った開発方法
PredictionIOを利用して、データ管理から予測API作成までの開発方法を紹介します。
Engineering
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 20
2
/ 20
3
/ 20
4
/ 20
5
/ 20
6
/ 20
7
/ 20
8
/ 20
9
/ 20
10
/ 20
11
/ 20
12
/ 20
13
/ 20
14
/ 20
15
/ 20
16
/ 20
17
/ 20
18
/ 20
19
/ 20
20
/ 20
More Related Content
PPTX
Elasticsearch 変わり種プラグインの作り方
by
Ryoji Kurosawa
PDF
社内ドキュメント検索システム構築のノウハウ
by
Shinsuke Sugaya
PPTX
Jupyter Notebookでscikit-learnを使った機械学習・画像処理の基本
by
Norihiko Nakabayashi
PDF
Fess/Elasticsearchを使った業務で使える?全文検索への道
by
Shinsuke Sugaya
PDF
PredictionIOのPython対応計画
by
Shinsuke Sugaya
PDF
PredictionIO構築入門
by
Shinsuke Sugaya
PDF
Strem処理(Spark Streaming + Kinesis)とOffline処理(Hive)の統合
by
SmartNews, Inc.
PPTX
今更聞けないストリーム処理のあれとかこれ
by
Tatsuro Hisamori
Elasticsearch 変わり種プラグインの作り方
by
Ryoji Kurosawa
社内ドキュメント検索システム構築のノウハウ
by
Shinsuke Sugaya
Jupyter Notebookでscikit-learnを使った機械学習・画像処理の基本
by
Norihiko Nakabayashi
Fess/Elasticsearchを使った業務で使える?全文検索への道
by
Shinsuke Sugaya
PredictionIOのPython対応計画
by
Shinsuke Sugaya
PredictionIO構築入門
by
Shinsuke Sugaya
Strem処理(Spark Streaming + Kinesis)とOffline処理(Hive)の統合
by
SmartNews, Inc.
今更聞けないストリーム処理のあれとかこれ
by
Tatsuro Hisamori
What's hot
PPTX
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
by
Recruit Lifestyle Co., Ltd.
PDF
Elasticsearchで作る形態素解析サーバ
by
Shinsuke Sugaya
PDF
elasticsearchプラグイン入門
by
Shinsuke Sugaya
PDF
ESFluteによるElasticsearchでのO/Rマッパーを用いた開発
by
Shinsuke Sugaya
PDF
MySQLと組み合わせて始める全文検索プロダクト"elasticsearch"
by
Kentaro Yoshida
PPTX
WiredTigerを詳しく説明
by
Tetsutaro Watanabe
PDF
ElasticsearchとTasteプラグインで作るレコメンドシステム
by
Shinsuke Sugaya
PDF
Elasticsearchプラグインの作り方
by
Shinsuke Sugaya
PDF
45分で理解する webクローリング入門 斉藤之雄
by
Yukio Saito
PDF
LastaFluteでKotlinをはじめよう
by
Shinsuke Sugaya
PDF
Elasticsearchベースの全文検索システムFess
by
Shinsuke Sugaya
PDF
Spark Summit 2015 参加報告
by
Katsunori Kanda
ODP
Project GData
by
Hideki Saito
PDF
Machine learning microservice_management
by
yusuke shibui
PDF
Gunosy における AWS 上での自然言語処理・機械学習の活用事例
by
圭輔 大曽根
PDF
業務システムで使える可視化テクニック - Apache HTTP編 -
by
Yasuyuki Sugai
PPTX
巨大なサービスと膨大なデータを支えるプラットフォーム
by
Tetsutaro Watanabe
PPTX
Hadoopことはじめ
by
Katsunori Kanda
PDF
MySQLユーザ視点での小さく始めるElasticsearch
by
Kentaro Yoshida
PDF
Elasticsearch at CrowdWorks
by
佑介 九岡
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
by
Recruit Lifestyle Co., Ltd.
Elasticsearchで作る形態素解析サーバ
by
Shinsuke Sugaya
elasticsearchプラグイン入門
by
Shinsuke Sugaya
ESFluteによるElasticsearchでのO/Rマッパーを用いた開発
by
Shinsuke Sugaya
MySQLと組み合わせて始める全文検索プロダクト"elasticsearch"
by
Kentaro Yoshida
WiredTigerを詳しく説明
by
Tetsutaro Watanabe
ElasticsearchとTasteプラグインで作るレコメンドシステム
by
Shinsuke Sugaya
Elasticsearchプラグインの作り方
by
Shinsuke Sugaya
45分で理解する webクローリング入門 斉藤之雄
by
Yukio Saito
LastaFluteでKotlinをはじめよう
by
Shinsuke Sugaya
Elasticsearchベースの全文検索システムFess
by
Shinsuke Sugaya
Spark Summit 2015 参加報告
by
Katsunori Kanda
Project GData
by
Hideki Saito
Machine learning microservice_management
by
yusuke shibui
Gunosy における AWS 上での自然言語処理・機械学習の活用事例
by
圭輔 大曽根
業務システムで使える可視化テクニック - Apache HTTP編 -
by
Yasuyuki Sugai
巨大なサービスと膨大なデータを支えるプラットフォーム
by
Tetsutaro Watanabe
Hadoopことはじめ
by
Katsunori Kanda
MySQLユーザ視点での小さく始めるElasticsearch
by
Kentaro Yoshida
Elasticsearch at CrowdWorks
by
佑介 九岡
Viewers also liked
PDF
Scala警察のすすめ
by
takezoe
PDF
TensorFlowで逆強化学習
by
Mitsuhisa Ohta
PDF
全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころ
by
Shinsuke Sugaya
PDF
生成モデルの Deep Learning
by
Seiya Tokui
PDF
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
by
Shinsuke Sugaya
PDF
Tensor Decomposition and its Applications
by
Keisuke OTAKI
PPTX
AI社会論研究会
by
Hiroshi Nakagawa
PDF
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
by
Deep Learning JP
Scala警察のすすめ
by
takezoe
TensorFlowで逆強化学習
by
Mitsuhisa Ohta
全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころ
by
Shinsuke Sugaya
生成モデルの Deep Learning
by
Seiya Tokui
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
by
Shinsuke Sugaya
Tensor Decomposition and its Applications
by
Keisuke OTAKI
AI社会論研究会
by
Hiroshi Nakagawa
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
by
Deep Learning JP
Similar to PredictionIOでSparkMLを使った開発方法
PPTX
Azure Machine Learning Services 概要 - 2019年2月版
by
Daiyu Hatakeyama
PDF
Scala製機械学習サーバ「Apache PredictionIO」
by
takezoe
PPTX
Pysparkで始めるデータ分析
by
Tanaka Yuichi
PPTX
Apache Sparkを使った感情極性分析
by
Tanaka Yuichi
PDF
ビズリーチの機械学習基盤
by
Naoto Migita
PDF
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
by
Denodo
PDF
20190517 Spark+AI Summit2019最新レポート
by
Ryoma Nagata
PPTX
Heroku meetup#15 lt
by
Kikuya Takumi
PPTX
Pythonで入門するApache Spark at PyCon2016
by
Tatsuya Atsumi
PPTX
Microsoft AI Solution Update / DLL community Update
by
Hirono Jumpei
PDF
JAWS DAYS 2022
by
陽平 山口
PDF
Gpu accelerates aimodeldevelopmentandanalyticsutilizingelasticsearchandazure ai
by
Shotaro Suzuki
PDF
最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML
by
Junichi Noda
PPTX
SparkとJupyterNotebookを使った分析処理 [Html5 conference]
by
Tanaka Yuichi
PPTX
Japan wrapup reinvent2018
by
Amazon Web Services Japan
PPTX
Japan Wrap Up re:Invent2018
by
Kameda Harunobu
PDF
2016-02-08 Spark MLlib Now and Beyond@Spark Conference Japan 2016
by
Yu Ishikawa
PDF
[Developers Summit 2017] MicrosoftのAI開発機能/サービス
by
Naoki (Neo) SATO
Azure Machine Learning Services 概要 - 2019年2月版
by
Daiyu Hatakeyama
Scala製機械学習サーバ「Apache PredictionIO」
by
takezoe
Pysparkで始めるデータ分析
by
Tanaka Yuichi
Apache Sparkを使った感情極性分析
by
Tanaka Yuichi
ビズリーチの機械学習基盤
by
Naoto Migita
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
by
Denodo
20190517 Spark+AI Summit2019最新レポート
by
Ryoma Nagata
Heroku meetup#15 lt
by
Kikuya Takumi
Pythonで入門するApache Spark at PyCon2016
by
Tatsuya Atsumi
Microsoft AI Solution Update / DLL community Update
by
Hirono Jumpei
JAWS DAYS 2022
by
陽平 山口
Gpu accelerates aimodeldevelopmentandanalyticsutilizingelasticsearchandazure ai
by
Shotaro Suzuki
最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML
by
Junichi Noda
SparkとJupyterNotebookを使った分析処理 [Html5 conference]
by
Tanaka Yuichi
Japan wrapup reinvent2018
by
Amazon Web Services Japan
Japan Wrap Up re:Invent2018
by
Kameda Harunobu
2016-02-08 Spark MLlib Now and Beyond@Spark Conference Japan 2016
by
Yu Ishikawa
[Developers Summit 2017] MicrosoftのAI開発機能/サービス
by
Naoki (Neo) SATO
More from Shinsuke Sugaya
PDF
DBFluteを用いて開発されている全文検索システムFess
by
Shinsuke Sugaya
PDF
SolrとElasticsearchを比べてみよう
by
Shinsuke Sugaya
PDF
DBFlute Mavenプラグインを用いてCRUD作成
by
Shinsuke Sugaya
PDF
Elasticsearch Authプラグインでアクセスコントロール
by
Shinsuke Sugaya
PDF
オフィスに1台!全文検索Fess
by
Shinsuke Sugaya
PDF
Solrベースの全文検索サーバ Fess
by
Shinsuke Sugaya
PDF
Sc2009autumn s2robot
by
Shinsuke Sugaya
DBFluteを用いて開発されている全文検索システムFess
by
Shinsuke Sugaya
SolrとElasticsearchを比べてみよう
by
Shinsuke Sugaya
DBFlute Mavenプラグインを用いてCRUD作成
by
Shinsuke Sugaya
Elasticsearch Authプラグインでアクセスコントロール
by
Shinsuke Sugaya
オフィスに1台!全文検索Fess
by
Shinsuke Sugaya
Solrベースの全文検索サーバ Fess
by
Shinsuke Sugaya
Sc2009autumn s2robot
by
Shinsuke Sugaya
PredictionIOでSparkMLを使った開発方法
1.
Apache BizReach, Inc. Shinsuke SugayaPredictionIO勉強会
第3回 SparkMLを使った開発方法
2.
自己紹介 名前:菅谷 信介 会社:株式会社ビズリーチ AI室 興味があること: ・機械学習やDeep
Learning等で解決方法を考える ・オープンソースのプロダクトを作る
3.
Topics PredictionIOを利用した開発の 一連の流れを考えてみる
4.
第三回目にして ようやく実用的な話が できる気が…
5.
概要
6.
PIOでの開発の前提 ・今回はデータの管理からAPI化まで紹介する ・学習はPython/PySparkで行う ・Spark 2.x以上が必要
7.
PIOでの開発の流れ 1. PredictionIOを構築 2. イベントサーバにデータ投入 3.
Jupyterでデータ分析・モデル構築 4. Pythonファイル化して、PIOでモデル作成 5. PIOで予測API公開
8.
開発の流れ
9.
PIOの導入 まだPython対応がリリースされていない… (PIO-116のIssueで対応中) ・PIO環境の構築方法は第二回の資料を参照 https://www.slideshare.net/shinsuke/predictionio-77450768 ・Python対応ブランチからPIOをcloneして利用 https://github.com/marevol/incubator-predictionio/tree/pyspark
10.
PIOテンプレート作成 ・PIOで学習するにはテンプレートの作成が必要 ・実際に作るにはサンプルをベースにすると便利 ・今回はサンプルテンプレートを利用 https://github.com/jpioug/predictionio-template-iris https://github.com/jpioug/predictionio-template-boston-house-prices $ git clone
https://github.com/jpioug/predictionio-template-iris.git
11.
アプリ登録 ・PIOで利用するにはアプリ登録が必要 ・pio app newを実行 →IrisAppとして登録 →トークンは任意 $
pio app new --access-key IRIS_TOKEN IrisApp
12.
データの投入 ・イベントサーバにデータを入れる https://github.com/jpioug/predictionio-template-iris/blob/master/data/import_eventserver.py ・自前のプロジェクトで利用する場合は同様に入れる →各種SDKがある $ python data/import_eventserver.py
13.
テンプレートのビルド ・テンプレートをビルドする(.scalaが対象) →モデルの保存やAPI化でScalaが利用されるため $ pio build
14.
データの分析など ・Jupyterとかでデータを分析、モデルを検討したい →pio-shellでPySpark&Jupyterを実行する →eda.ipynbを開く →SparkMLでモデルを作れる https://github.com/jpioug/predictionio-template-iris/blob/master/eda.ipynb $ PYSPARK_PYTHON=$PYENV_ROOT/shims/python PYSPARK_DRIVER_PYTHON=$PYENV_ROOT/shims/jupyter
PYSPARK_DRIVER_PYTHON_OPTS="notebook" pio-shell --with-pyspark
15.
学習モデル作成 ・pio trainでPythonファイルを実行 →学習モデルの作成はバッチ処理化したい →Jupyterで作成したものを.pyにするだけ →モデルの保存はrun_pio_workflow(model)を呼ぶ https://github.com/jpioug/predictionio-template-iris/blob/master/train.py $ pio
train --main-py-file train.py
16.
予測APIの調整 ・自前のプロジェクトに適用する場合 →予測APIのリクエストとレスポンスを調整 →Algorithm.scalaを修正 https://github.com/jpioug/predictionio-template-iris/blob/master/src/main/scala/ org/jpioug/template/iris/Algorithm.scala
17.
アプリのデプロイ ・API化するためにはアプリをデプロイする →pio deployを実行する $ pio
deploy
18.
予測APIにアクセス ・localhost:8000/queries.jsonにアクセス →Bodyに予測対象の情報を渡す $ curl -s
-H "Content-Type: application/json" -d '{"attr0":5.1,"attr1":3.5,"attr2":1.4,"attr3":0.2}' http://localhost:8000/queries.json
19.
まとめ ・データの管理からAPI化まで実現 ・SparkMLのアルゴリズムでモデルを作れる
20.
Apache Thank You
Download