Submit Search
Upload
RでKaggleの登竜門に挑戦
•
Download as PPTX, PDF
•
4 likes
•
1,552 views
幹雄 小川
Follow
Kaggleのtitanic問題をRを使って予測するまでの一連の手順
Read less
Read more
Report
Share
Report
Share
1 of 49
Download now
Recommended
クラウドから始めるRのビッグデータ分析- Oracle R Enterprise in Cloud
クラウドから始めるRのビッグデータ分析- Oracle R Enterprise in Cloud
幹雄 小川
普通のRではシングルスレッドだったりメモリネックで大規模分析ができませんが、そんなRをOracle Databaseのパワーフルフルの強力な分析エンジンに進化させるOracle R Enterpriseの紹介です。
機械学習ハンズオン
機械学習ハンズオン
幹雄 小川
Oracle Cloud Developer Meetupにおいてのハンズオン資料。ハンズオン手順の資料はスライド終盤にurlがリンクされています。
Hcm cloudをpaasでカスタマイズ
Hcm cloudをpaasでカスタマイズ
幹雄 小川
HCM CloudをPaaSでカスタマイズするシナリオ
実はDatabase cloudだけで実現できる巷で噂の機械学習とは?
実はDatabase cloudだけで実現できる巷で噂の機械学習とは?
Kazuki Nakajima
Oracle Cloud Developers Meetup 3/15 - 3/17のスライド
Deep Dive into Spark SQL with Advanced Performance Tuning
Deep Dive into Spark SQL with Advanced Performance Tuning
Takuya UESHIN
Hadoop / Spark Conference Japan 2019
hscj2019_ishizaki_public
hscj2019_ishizaki_public
Kazuaki Ishizaki
「DataFrameとDatasetの内部をのぞいてみる」という内容の発表を、Hadoop / Spark Coference Japan 2019で行いました http://hadoop.apache.jp/hcj2019-program/
Oracle Cloud Developers Meetup@東京
Oracle Cloud Developers Meetup@東京
tuchimur
https://oracleclouddevelopers.doorkeeper.jp/events/44992
ゼロから始めるSparkSQL徹底活用!
ゼロから始めるSparkSQL徹底活用!
Nagato Kasaki
2017年3月21日 ヒカラボ登壇資料 【 ヒカ☆ラボ 】ゼロから始めるSparkSQL徹底活用!~Sparkのインストールから、 SparkSQLの概要紹介、実務で活用するためのノウハウまでを紹介します~ https://atnd.org/events/85919
Recommended
クラウドから始めるRのビッグデータ分析- Oracle R Enterprise in Cloud
クラウドから始めるRのビッグデータ分析- Oracle R Enterprise in Cloud
幹雄 小川
普通のRではシングルスレッドだったりメモリネックで大規模分析ができませんが、そんなRをOracle Databaseのパワーフルフルの強力な分析エンジンに進化させるOracle R Enterpriseの紹介です。
機械学習ハンズオン
機械学習ハンズオン
幹雄 小川
Oracle Cloud Developer Meetupにおいてのハンズオン資料。ハンズオン手順の資料はスライド終盤にurlがリンクされています。
Hcm cloudをpaasでカスタマイズ
Hcm cloudをpaasでカスタマイズ
幹雄 小川
HCM CloudをPaaSでカスタマイズするシナリオ
実はDatabase cloudだけで実現できる巷で噂の機械学習とは?
実はDatabase cloudだけで実現できる巷で噂の機械学習とは?
Kazuki Nakajima
Oracle Cloud Developers Meetup 3/15 - 3/17のスライド
Deep Dive into Spark SQL with Advanced Performance Tuning
Deep Dive into Spark SQL with Advanced Performance Tuning
Takuya UESHIN
Hadoop / Spark Conference Japan 2019
hscj2019_ishizaki_public
hscj2019_ishizaki_public
Kazuaki Ishizaki
「DataFrameとDatasetの内部をのぞいてみる」という内容の発表を、Hadoop / Spark Coference Japan 2019で行いました http://hadoop.apache.jp/hcj2019-program/
Oracle Cloud Developers Meetup@東京
Oracle Cloud Developers Meetup@東京
tuchimur
https://oracleclouddevelopers.doorkeeper.jp/events/44992
ゼロから始めるSparkSQL徹底活用!
ゼロから始めるSparkSQL徹底活用!
Nagato Kasaki
2017年3月21日 ヒカラボ登壇資料 【 ヒカ☆ラボ 】ゼロから始めるSparkSQL徹底活用!~Sparkのインストールから、 SparkSQLの概要紹介、実務で活用するためのノウハウまでを紹介します~ https://atnd.org/events/85919
Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証
Recruit Technologies
2015/5/21 Hadoopソースコードリーディング 第19回におけるリクルートテクノロジーズ堀越による発表資料になります
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
Yahoo!デベロッパーネットワーク
http://www.zusaar.com/event/17397003
(LT)Spark and Cassandra
(LT)Spark and Cassandra
datastaxjp
Apache Cassandraがリアルタイム分析でNOSQLのApache Cassandraに出会った。(2016年 Hadoop/Spark Conference Japan)
Java8 Stream APIとApache SparkとAsakusa Frameworkの類似点・相違点
Java8 Stream APIとApache SparkとAsakusa Frameworkの類似点・相違点
hishidama
JJUG CCC 2015 Fall http://www.java-users.jp/?page_id=2056
HBaseとSparkでセンサーデータを有効活用 #hbasejp
HBaseとSparkでセンサーデータを有効活用 #hbasejp
FwardNetwork
HBase Meetup Tokyo Summer 2015 で発表した資料です。
Sparkのクエリ処理系と周辺の話題
Sparkのクエリ処理系と周辺の話題
Takeshi Yamamuro
20161222のBDI研究会での発表資料
Oracle APEX 概要
Oracle APEX 概要
Yosuke Arai
Oracle APEX (Application Express) の概要を紹介します
HiveとImpalaのおいしいとこ取り
HiveとImpalaのおいしいとこ取り
Yukinori Suda
『Hadoop 第3版』『プログラミング Hive』刊行記念 Hadoopセミナー
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
Recruit Technologies
2015/09/09 Spark Meetup 2015での、堀越の講演資料になります
Sparkを用いたビッグデータ解析 〜 前編 〜
Sparkを用いたビッグデータ解析 〜 前編 〜
x1 ichi
QCon Tokyo 2015で発表させて頂きました。
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16
Yifeng Jiang
SparkSQL and Hive on Tez, LLAP Benchmark
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Hadoop / Spark Conference Japan
Hadoop / Spark Conference Japan 2016 キーノート講演資料 『Sparkによる GISデータを題材とした時系列データ処理』 鈴木 由宇 (株式会社IHI) 土橋 昌 (株式会社NTTデータ) ▼イベントページ http://hadoop.apache.jp/hcj2016-program/ http://hcj2016.eventbrite.com/
Struggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit Group
DataWorks Summit/Hadoop Summit
Struggle against crossdomain data complexity in Recruit Group
SASとHadoopとの連携 2015
SASとHadoopとの連携 2015
SAS Institute Japan
2015
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Sho Shimauchi
Tokyo Webmining #25 で発表したときの資料です。メインはデモの方です
Pythonで入門するApache Spark at PyCon2016
Pythonで入門するApache Spark at PyCon2016
Tatsuya Atsumi
Pythonを使ったApache Sparkの解説スライドです。スライドの他、口頭やJupyterコードでの補足があります。
2016-02-08 Spark MLlib Now and Beyond@Spark Conference Japan 2016
2016-02-08 Spark MLlib Now and Beyond@Spark Conference Japan 2016
Yu Ishikawa
An overview of Spark MLlib
基幹業務もHadoop(EMR)で!!のその後
基幹業務もHadoop(EMR)で!!のその後
Keigo Suda
2016/12/12 BigData-JAWS 勉強会第4回目
Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習
Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習
Katsushi Yamashita
Spot Instance + Spark + MLlibで実現する簡単低コスト高速機械学習 AWS Casual Talks#2 LT 2014/4/18
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Future Of Data Japan
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
R超入門機械学習をはじめよう
R超入門機械学習をはじめよう
幹雄 小川
Rのインストールから始める入門資料 2016年7月1日のOracle Cloud Developer Meetupで実施しました。 インストール、変数、ベクトル、データフレームの操作、CSV読込、ggplot2、機械学習(決定木とランダムフォレスト)までを網羅して、これからRで機械学習をしてみる人用のクイックスタート資料です。
CTFはとんでもないものを 盗んでいきました。私の時間です…
CTFはとんでもないものを 盗んでいきました。私の時間です…
Hiromu Yakura
More Related Content
What's hot
Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証
Recruit Technologies
2015/5/21 Hadoopソースコードリーディング 第19回におけるリクルートテクノロジーズ堀越による発表資料になります
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
Yahoo!デベロッパーネットワーク
http://www.zusaar.com/event/17397003
(LT)Spark and Cassandra
(LT)Spark and Cassandra
datastaxjp
Apache Cassandraがリアルタイム分析でNOSQLのApache Cassandraに出会った。(2016年 Hadoop/Spark Conference Japan)
Java8 Stream APIとApache SparkとAsakusa Frameworkの類似点・相違点
Java8 Stream APIとApache SparkとAsakusa Frameworkの類似点・相違点
hishidama
JJUG CCC 2015 Fall http://www.java-users.jp/?page_id=2056
HBaseとSparkでセンサーデータを有効活用 #hbasejp
HBaseとSparkでセンサーデータを有効活用 #hbasejp
FwardNetwork
HBase Meetup Tokyo Summer 2015 で発表した資料です。
Sparkのクエリ処理系と周辺の話題
Sparkのクエリ処理系と周辺の話題
Takeshi Yamamuro
20161222のBDI研究会での発表資料
Oracle APEX 概要
Oracle APEX 概要
Yosuke Arai
Oracle APEX (Application Express) の概要を紹介します
HiveとImpalaのおいしいとこ取り
HiveとImpalaのおいしいとこ取り
Yukinori Suda
『Hadoop 第3版』『プログラミング Hive』刊行記念 Hadoopセミナー
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
Recruit Technologies
2015/09/09 Spark Meetup 2015での、堀越の講演資料になります
Sparkを用いたビッグデータ解析 〜 前編 〜
Sparkを用いたビッグデータ解析 〜 前編 〜
x1 ichi
QCon Tokyo 2015で発表させて頂きました。
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16
Yifeng Jiang
SparkSQL and Hive on Tez, LLAP Benchmark
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Hadoop / Spark Conference Japan
Hadoop / Spark Conference Japan 2016 キーノート講演資料 『Sparkによる GISデータを題材とした時系列データ処理』 鈴木 由宇 (株式会社IHI) 土橋 昌 (株式会社NTTデータ) ▼イベントページ http://hadoop.apache.jp/hcj2016-program/ http://hcj2016.eventbrite.com/
Struggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit Group
DataWorks Summit/Hadoop Summit
Struggle against crossdomain data complexity in Recruit Group
SASとHadoopとの連携 2015
SASとHadoopとの連携 2015
SAS Institute Japan
2015
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Sho Shimauchi
Tokyo Webmining #25 で発表したときの資料です。メインはデモの方です
Pythonで入門するApache Spark at PyCon2016
Pythonで入門するApache Spark at PyCon2016
Tatsuya Atsumi
Pythonを使ったApache Sparkの解説スライドです。スライドの他、口頭やJupyterコードでの補足があります。
2016-02-08 Spark MLlib Now and Beyond@Spark Conference Japan 2016
2016-02-08 Spark MLlib Now and Beyond@Spark Conference Japan 2016
Yu Ishikawa
An overview of Spark MLlib
基幹業務もHadoop(EMR)で!!のその後
基幹業務もHadoop(EMR)で!!のその後
Keigo Suda
2016/12/12 BigData-JAWS 勉強会第4回目
Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習
Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習
Katsushi Yamashita
Spot Instance + Spark + MLlibで実現する簡単低コスト高速機械学習 AWS Casual Talks#2 LT 2014/4/18
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Future Of Data Japan
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
What's hot
(20)
Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
(LT)Spark and Cassandra
(LT)Spark and Cassandra
Java8 Stream APIとApache SparkとAsakusa Frameworkの類似点・相違点
Java8 Stream APIとApache SparkとAsakusa Frameworkの類似点・相違点
HBaseとSparkでセンサーデータを有効活用 #hbasejp
HBaseとSparkでセンサーデータを有効活用 #hbasejp
Sparkのクエリ処理系と周辺の話題
Sparkのクエリ処理系と周辺の話題
Oracle APEX 概要
Oracle APEX 概要
HiveとImpalaのおいしいとこ取り
HiveとImpalaのおいしいとこ取り
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
Sparkを用いたビッグデータ解析 〜 前編 〜
Sparkを用いたビッグデータ解析 〜 前編 〜
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Struggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit Group
SASとHadoopとの連携 2015
SASとHadoopとの連携 2015
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Pythonで入門するApache Spark at PyCon2016
Pythonで入門するApache Spark at PyCon2016
2016-02-08 Spark MLlib Now and Beyond@Spark Conference Japan 2016
2016-02-08 Spark MLlib Now and Beyond@Spark Conference Japan 2016
基幹業務もHadoop(EMR)で!!のその後
基幹業務もHadoop(EMR)で!!のその後
Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習
Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Viewers also liked
R超入門機械学習をはじめよう
R超入門機械学習をはじめよう
幹雄 小川
Rのインストールから始める入門資料 2016年7月1日のOracle Cloud Developer Meetupで実施しました。 インストール、変数、ベクトル、データフレームの操作、CSV読込、ggplot2、機械学習(決定木とランダムフォレスト)までを網羅して、これからRで機械学習をしてみる人用のクイックスタート資料です。
CTFはとんでもないものを 盗んでいきました。私の時間です…
CTFはとんでもないものを 盗んでいきました。私の時間です…
Hiromu Yakura
できない英語を駆使してKaggleに挑戦してみた
できない英語を駆使してKaggleに挑戦してみた
Keisuke Tokuda
TokyoR #57 初心者セッション
TokyoR #57 初心者セッション
kotora_0507
飛び入り初心者セッションです
実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
健一 茂木
超初心者向けのビッグデータをつかった機械学習を実践的に学ぶ入門です。 ブラウザ操作ができればエンジニアではなく一般の人でも学ぶことが出来ます。 この学びの対象者は? →答えが知りたい人。ブラウザが使えればOK!統計の話は出てこないです。 教えないことは? →統計については質問しないでくださいorz 理系ですが専門じゃないです。 この資料は㈱テクノモバイルと共同開発しています。
PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1
Akira Shibata
2015年3月に行われたPyData.Tokyoでのチュートリアル&ハッカソンの説明スライドです。 A deck used in the introductory session of PyData.Tokyo tutorial and hackathon
機械学習 入門
機械学習 入門
Hayato Maki
学部初級生向けの機械学習入門資料
Kaggle bosch presentation material for Kaggle Tokyo Meetup #2
Kaggle bosch presentation material for Kaggle Tokyo Meetup #2
Keisuke Hosaka
kaggle boschコンペに参加し15/1373位に入りました。 Kaggle Tokyo Meetup #2 での発表資料となります。 (http://www.slideshare.net/hskksk/kaggle-bosch の縮小版です)
Kaggle boschコンペ振り返り
Kaggle boschコンペ振り返り
Keisuke Hosaka
kaggle boschコンペに参加し15/1373位に入りました。 その時にやったことのまとめです。 feature engineeringを頑張ったほか、xgboostの機能を使って色々なアイデアを試して見ました(今回のコンペではこちらは精度に貢献しませんでしたが)。
Rstudio事始め
Rstudio事始め
Takashi Yamane
改訂版(2015.11.28)ができました → http://www.slideshare.net/TakashiYamane1/rrstudio
160924 Deep Learning Tuningathon
160924 Deep Learning Tuningathon
Takanori Ogata
Deep Learning Tuningathonの講義資料
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについて
Hiroshi Shimizu
Excelで動くフリーの統計分析プログラム、HADの解説です。 プログラムは、以下のサイトからダウンロードできます。 http://norimune.net/had エクセルで統計分析 HADについて http://slidesha.re/10ARA0k エクセルで統計分析2 HADの使い方 http://slidesha.re/RsVBp7 エクセルで統計分析3 回帰分析のやり方 http://slidesha.re/XVATPV エクセルで統計分析4 因子分析のやり方 http://slidesha.re/YWUGNY
Pythonで動かして学ぶ機械学習入門_予測モデルを作ってみよう
Pythonで動かして学ぶ機械学習入門_予測モデルを作ってみよう
洋資 堅田
Pythonで動かして学ぶ機械学習入門_予測モデルを作ってみよう
Information sharing and Experience consistency at Cookpad mobile application
Information sharing and Experience consistency at Cookpad mobile application
ichiko_revjune
Productivity Meetup #4 3/18/2017
パッケージングの今
パッケージングの今
Atsushi Odagiri
Pythonではじめる競技プログラミング
Pythonではじめる競技プログラミング
cocodrips
PyCon JP 2014のLTで発表した資料です( o・ω・)ノ
2017年3月版データマエショリスト入門
2017年3月版データマエショリスト入門
Yuya Matsumura
Tokyo.R #59での初心者セッションの資料
Viewers also liked
(17)
R超入門機械学習をはじめよう
R超入門機械学習をはじめよう
CTFはとんでもないものを 盗んでいきました。私の時間です…
CTFはとんでもないものを 盗んでいきました。私の時間です…
できない英語を駆使してKaggleに挑戦してみた
できない英語を駆使してKaggleに挑戦してみた
TokyoR #57 初心者セッション
TokyoR #57 初心者セッション
実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1
機械学習 入門
機械学習 入門
Kaggle bosch presentation material for Kaggle Tokyo Meetup #2
Kaggle bosch presentation material for Kaggle Tokyo Meetup #2
Kaggle boschコンペ振り返り
Kaggle boschコンペ振り返り
Rstudio事始め
Rstudio事始め
160924 Deep Learning Tuningathon
160924 Deep Learning Tuningathon
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについて
Pythonで動かして学ぶ機械学習入門_予測モデルを作ってみよう
Pythonで動かして学ぶ機械学習入門_予測モデルを作ってみよう
Information sharing and Experience consistency at Cookpad mobile application
Information sharing and Experience consistency at Cookpad mobile application
パッケージングの今
パッケージングの今
Pythonではじめる競技プログラミング
Pythonではじめる競技プログラミング
2017年3月版データマエショリスト入門
2017年3月版データマエショリスト入門
Similar to RでKaggleの登竜門に挑戦
[Oracle big data jam session #1] Apache Spark ことはじめ
[Oracle big data jam session #1] Apache Spark ことはじめ
Kenichi Sonoda
サンプルコードで学ぶSparkライブラリの使い方
Nashorn in the future (Japanese)
Nashorn in the future (Japanese)
Logico
Presentation on Nashorn at Java Day Tokyo 2015.
Oracle advanced analyticsによる機械学習full version
Oracle advanced analyticsによる機械学習full version
幹雄 小川
機械学習の基礎知識のご紹介からOracleの機械学習関連技術の紹介
20170428_【事前課題あり】ORACLE MASTER Bronze Oracle Database 12c 「12c SQL基礎[12c SQL]...
20170428_【事前課題あり】ORACLE MASTER Bronze Oracle Database 12c 「12c SQL基礎[12c SQL]...
オラクルユニバーシティ
2017/4/28開催の「【事前課題あり】ORACLE MASTER Bronze Oracle Database 12c 「12c SQL基礎[12c SQL] 1Z0-061」 受験前最終チェックセミナー」資料です。
Azure Cosmos DB を使った クラウドネイティブアプリケーションの 設計パターン
Azure Cosmos DB を使った クラウドネイティブアプリケーションの 設計パターン
Kazuyuki Miyake
JAZUG札幌支部(きたあず) 第17回勉強会での発表資料です。
Snowflake on AWSのターゲットエンドポイントとしての利用
Snowflake on AWSのターゲットエンドポイントとしての利用
QlikPresalesJapan
Snowflake on AWSをQlik Replicateのターゲットエンドポイントとして利用するための設定の解説や手順を紹介します。
APEX UG Japan meetup 2018#3 - APEX18.1大特集
APEX UG Japan meetup 2018#3 - APEX18.1大特集
Yosuke Arai
冒頭ごあいさつ+諸々の連絡事項+はじめてのAPEX
20180220 AWS Black Belt Online Seminar - Amazon Container Services
20180220 AWS Black Belt Online Seminar - Amazon Container Services
Amazon Web Services Japan
AWS Black Belt Online Seminar 2018/02/20 配信分
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
Cloudera Japan
Global Knowledge Network社主催、「G-Tech 2015」でのHadoop/Sparkに関する講演資料です。
JAWSDAYS 2014 ACEに聞け! EMR編
JAWSDAYS 2014 ACEに聞け! EMR編
陽平 山口
JAWSDAYS 2014 で発表に使ったスライドです。 EMR や Mahout を使ったことがない初心者向けの内容になっています。とっかかりがなくて、困っている人にはちょうど良いと思います。 パッチ画像を K-Means でクラスタリングするという内容ですので視覚的に面白い結果がでます。画像処理の入門としてもよいかもしれません。 スライドの中で使っているプログラムのソースコードとデータは下記の URL にあります。 http://kurusugawa.jp/2014/03/18/jawsdays2014/
Programming AWS with Perl at YAPC::Asia 2013
Programming AWS with Perl at YAPC::Asia 2013
Yasuhiro Horiuchi
YAPC::Asia 2013での発表資料です。 33ページ目のデモに使ったサンプルスクリプトはこちら。 https://github.com/horiyasu/yapcasia2013/blob/master/create_vpc.pl
Capistrano in practice - WebCareer
Capistrano in practice - WebCareer
Kyosuke MOROHASHI
talked about Capistrano in Rails Summer Festival 2008 by WebCareer
機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介
Cloudera Japan
Cloudera World Tokyo 2018 のセッション資料です。#CWT2018 機械学習のプラットフォームの一つである Apache Spark の概要と、Cloudera Data Science Workbench についての紹介です。
9/16 Tokyo Apache Drill Meetup - drill vs sparksql
9/16 Tokyo Apache Drill Meetup - drill vs sparksql
Mitsutoshi Kiuchi
演題:いきなり道場破り!Drillがなんぼのもんじゃ!SparkSQL最強伝説を証明して見せる!
JapanDreamin24_はじめてのGraphQL×LWC.pptx
JapanDreamin24_はじめてのGraphQL×LWC.pptx
Ryota Tabuse
Saelsforce Japan Dreamin'24での登壇資料です。 GraphQLの概要や、LWCで利用可能な GraphQL wire adapterの利用方法などの入門編資料です。
Let's stady Machine Learning with OCSJ
Let's stady Machine Learning with OCSJ
tuchimur
2018年4月23日のイベントスライド(公開用)です
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
オラクルエンジニア通信
2016/5/11に実施したGoldenGateテクニカルセミナーの資料です。 1「市場のトレンドと最新事例のご紹介」←本資料 2「Oracle GoldenGate 新機能情報」 3「Oracle GoldenGate Technical Deep Dive」 4「テクニカルコンサルタントが語るOracle GoldenGate現場で使える極意」
はじめてのElasticsearchクラスタ
はじめてのElasticsearchクラスタ
Satoyuki Tsukano
The First Elasticsearch Cluster 2018-07-25 JJUG ナイトセミナー「Elasticsearch特集」
Ahead-of-Time Compilation with JDK 9 [Java Day Tokyo 2017 D1-A1]
Ahead-of-Time Compilation with JDK 9 [Java Day Tokyo 2017 D1-A1]
David Buck
Ahead-of-Time Compilation (AOT) というのは、 Javaアプリケーションを実行する前に、Java Bytecodeをマシン語にコンパイルしておくことです。つまり、Just-In-Time (JIT)コンパイル処理を実行時ではなく、実行する前にやっておくことが出来るようになります。実行時にこのJIT処理を避けることで、アプリケーションがより早く立ち上がるケースがあります。まだ実験的ですが、JDK 9でAOTを利用することが出来る場合があります。このセッションでは、デモや例を実施しながら、JDK 9のAOT機能の使い方や注意点などを簡単に紹介します。
[A33] [特濃jpoug statspack on pdb oracle database 12c] 20131115 補足・続報付き
[A33] [特濃jpoug statspack on pdb oracle database 12c] 20131115 補足・続報付き
Insight Technology, Inc.
Similar to RでKaggleの登竜門に挑戦
(20)
[Oracle big data jam session #1] Apache Spark ことはじめ
[Oracle big data jam session #1] Apache Spark ことはじめ
Nashorn in the future (Japanese)
Nashorn in the future (Japanese)
Oracle advanced analyticsによる機械学習full version
Oracle advanced analyticsによる機械学習full version
20170428_【事前課題あり】ORACLE MASTER Bronze Oracle Database 12c 「12c SQL基礎[12c SQL]...
20170428_【事前課題あり】ORACLE MASTER Bronze Oracle Database 12c 「12c SQL基礎[12c SQL]...
Azure Cosmos DB を使った クラウドネイティブアプリケーションの 設計パターン
Azure Cosmos DB を使った クラウドネイティブアプリケーションの 設計パターン
Snowflake on AWSのターゲットエンドポイントとしての利用
Snowflake on AWSのターゲットエンドポイントとしての利用
APEX UG Japan meetup 2018#3 - APEX18.1大特集
APEX UG Japan meetup 2018#3 - APEX18.1大特集
20180220 AWS Black Belt Online Seminar - Amazon Container Services
20180220 AWS Black Belt Online Seminar - Amazon Container Services
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
JAWSDAYS 2014 ACEに聞け! EMR編
JAWSDAYS 2014 ACEに聞け! EMR編
Programming AWS with Perl at YAPC::Asia 2013
Programming AWS with Perl at YAPC::Asia 2013
Capistrano in practice - WebCareer
Capistrano in practice - WebCareer
機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介
9/16 Tokyo Apache Drill Meetup - drill vs sparksql
9/16 Tokyo Apache Drill Meetup - drill vs sparksql
JapanDreamin24_はじめてのGraphQL×LWC.pptx
JapanDreamin24_はじめてのGraphQL×LWC.pptx
Let's stady Machine Learning with OCSJ
Let's stady Machine Learning with OCSJ
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
はじめてのElasticsearchクラスタ
はじめてのElasticsearchクラスタ
Ahead-of-Time Compilation with JDK 9 [Java Day Tokyo 2017 D1-A1]
Ahead-of-Time Compilation with JDK 9 [Java Day Tokyo 2017 D1-A1]
[A33] [特濃jpoug statspack on pdb oracle database 12c] 20131115 補足・続報付き
[A33] [特濃jpoug statspack on pdb oracle database 12c] 20131115 補足・続報付き
RでKaggleの登竜門に挑戦
1.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Oracle Cloud Developers Meetup @東京 「R」中級編 機械学習コンテスト「Kaggle」に挑戦しよう! 日本オラクル株式会社 クラウド・テクノロジー事業統括 Cloud Platform事業推進室 ソリューション・アーキテクト部 クラウドアーキテクト 小川幹雄
2.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 自己紹介 • Qiitaにオラクルクラウド機械学習手順書も上げてます! – アカウント名「ogamiki」 • 「機械学習」を始める前に知っておくこと・検討すべきこと – https://codezine.jp/article/detail/9331 • 「機械学習」サービスの3つの提供形態と正しい選び方 – https://codezine.jp/article/detail/9549 2
3.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 「R」初級編 機械学習コンテスト「Kaggle」に挑戦しよう! 1. RStudioインストール(オプション) 2. 機械学習の手順とは? 3. Kaggleとは? 4. Rでデータをロード 5. Rでデータ整備 6. Rで機械学習を使って予測モデル作成 7. 予測結果をアップロード 8. Oracle R Enterpriseデモンストレーション
4.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | RStudioのインストールもおすすめ • RStudioはRのIDEとしてデファクトスタンダード(無償版から有償版まである) • https://www.rstudio.com/products/rstudio/download3/ 4
5.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | RStudioのインストーラーから簡単にインストール • インストール後に起動すれば、事前インストールしているRが対応 5
6.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 教科書に載っている機械学習手順 モデル構築 学習学習データ 新規データ 予測
7.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | みなさんが直面する現実 7 モデル構築 学習学習データ 新規データ 予測 評価 ビジュアライズ 顧客フィードバックエラー分析モデル解釈 外部データ ラベル付け テストデータ 適用領域 品質検証サンプル 検証データ 生データ 法務レビュー アウトソーシング 検証ガイドライン タスク定義 特徴抽出 モデル選択 能動学習
8.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 今日はこの領域を一通り行います! 8 モデル構築 学習学習データ 新規データ 予測 検証データ 特徴抽出 モデル選択
9.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Kaggleとは? 9
10.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Kaggleの入門問題に挑戦! 10
11.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Kaggle参加への流れ 1. Kaggleへのユーザー登録 2. 開催中のコンテストを閲覧・選択 3. データをダウンロード 4. 予測モデルを作成 5. テストデータに予測値を付与 6. 予測結果をアップロード 7. ランキング表示
12.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Sign Up https://www.kaggle.com 12
13.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Titanic: Machine Learning from Disaster(賞金なし) 13
14.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 列名 列の内容 補足 Survived 生存情報 0 = No, 1 = Yes Pclass 渡航者クラス 1 = 1st, 2 = 2nd, 3 = 3rd Name 名前 Sex 性別 Age 年齢 xx.5は推定値 SibSp 兄弟・配偶者の数 Parch 親・子供の数 Ticket チケット番号 Fare 運賃 Cabin キャビン Embarked 乗船所 C = Cherboug, Q = Queenstown, S = Southampton 14 データのダウンロード
15.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Kaggleコンテストの仕組み 15 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 元データ 分割データ1 分割データ2 アップロードデータ 6 7 8 9 10 学習データ 予測結果 6 7 8 9 10 テストデータ Kaggle User モデル 答え合わせ
16.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Rでデータをロード 16
17.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | RにCSVファイルを読み込む • 作業ディレクトリを確認し、そこにダウンロードしたcsvファイルを置く • デフォルトで区切りはカンマとして扱う • 学習データとテストデータの中身を見てみる 17 > getwd() [1] "C:/Users/miogawa/Documents" > train <- read.csv("train.csv",header = T) > test <- read.csv("test.csv",header = T) > summary(train) > summary(test)
18.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | データの状態を確認 • 学習データとテストデータを結合し確認 • install.packages("dplyr") – データフレームの操作に特化したパッケージ • bind_rowsによって、trainとtestデータフレームを結合 18 > library(dplyr) > full <- bind_rows(train,test) > str(full) > summary(full) > summary(filter(full,Sex == "female")) > summary(filter(full,Sex == "male"))
19.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Rでデータ整備 19
20.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Rで機械学習を使ってモデル作成する前に。。 • モデル作成は泥臭い! • Data Mungingや Data Wranglingと呼ぶ作業が必要 – http://www.rstudio.com/wp-content/uploads/2015/02/data-wrangling-cheatsheet.pdf 20 行列変換 複数列に分解 要約 グルーピング 結合 列追加列抽出 行抽出
21.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 名前データからタイトルを抜き出す • Rでは正規表現が使用できる(grep,sub,gsub,strsplit,etc…) • gsubはパターンにマッチする値を全て置換するコマンド • Name列からMr、Mrs、Missなどの肩書きに該当する単語を発見できる • 肩書きデータをTitleとして新規の列として追加する 21 > library(ggplot2) > full$Title <- gsub('(.*, )|(..*)','',full$Name) > table(full$Sex, full$Title) > base <- ggplot(data=full,aes(Sex,Title)) > point <- base + geom_bin2d() > point
22.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 寄り道コマンド解説 • full$TitleはfullデータフレームのTitle列を表す – 元々Title列はfullにないため、新規にTitle列がfullに作成される • full$Title <- XXXによって、fullのTitle列にXXXを代入 • gsubは一括置換した結果を返すコマンド – 似たものにsubがあるがこちらは単一置換した結果を返すコマンド • gsub(PATTERN, REPLACEMENT, X) – Xの中でPATTERNに当てはまるものをREPLACEMENTに置き換える – Full$Nameの中で(.*, )または(..*)に当てはまるものを消す • ''は空文字に置換して消している 22 > full$Title <- gsub('(.*, )|(..*)','',full$Name)
23.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | タイトルの情報をもう少し整える • MlleとかMmeとか実は他と同じ意味のタイトルを変換 – Mlle(マドモワゼル)はフランス語でのMiss,Mme(マダム)はフランス語でのMrs • レアなタイトルは影響度が小さくなりすぎるため一つにまとめてしまう 23 > rare_title <- c('Dona', 'Major','the Countess', + 'Capt','Col','Don','Lady','Sir','Jonkheer','Ms') > full$Title[full$Title == 'Mlle'] <- 'Miss' > full$Title[full$Title == 'Mme'] <- 'Mrs' > full$Title[full$Title %in% rare_title] <- 'Rare' > table(full$Sex, full$Title)
24.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 家族の人数を表す列を追加する • SibSpは兄弟・配偶者の数でParchは親・子供の数 • 自分自身も含めてSibSpとParchに1を足したものを家族の人数とする • 先ほどのTitleと合わせてSurvivedな人の状況を確認 24 > full$Familysize <- full$SibSp + full$Parch + 1 > base1 <- ggplot(full[1:891,], + aes(x = Familysize, fill = factor(Survived))) > base1 + geom_bar(position='dodge') > base2 <- ggplot(full[1:891,], + aes(x = Title, fill = factor(Survived))) > base2 + geom_bar(position='dodge')
25.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | キャビンの番号から宿泊した場所を想像する • Cabinの値を見ると先頭の一文字がアルファベットのものが多い • Cabinの先頭一文字を新しい変数とする • Survivedな人の状況を確認 25 > head(full$Cabin,30) > full$Deck<-factor(sapply(full$Cabin, + function(x) strsplit(x, NULL)[[1]][1])) > base3 <- ggplot(full[1:891,], + aes(x = Deck, fill = factor(Survived))) > base3 + geom_bar(position='dodge')
26.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 寄り道コマンド解説 • sapplyは複数のデータに対して一括して処理を実施する • sapply(X, FUN, ...) – Xのデータ全てに対して定義したFUN処理を実行する – full$Cabinに対して、strsplit(x, NULL)[[1]][1]を実行する – function(x)は関数を作成するという宣言 • strsplit(x, split) – splitがNULLだと一文字ずつ分割 – strsplit(x, NULL)[[1]][1]から分割した結果の一行一列目を取得 26 sapply(full$Cabin, function(x) strsplit(x, NULL)[[1]][1])
27.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 27 グラフの出力結果の確認 > base3 <- ggplot(full[1:891,], + aes(x = Deck, fill = factor(Survived))) > base3 + geom_bar(position='dodge') > base1 <- ggplot(full[1:891,], + aes(x = Familysize, fill = factor(Survived))) > base1 + geom_bar(position='dodge') > base2 <- ggplot(full[1:891,], + aes(x = Title, fill = factor(Survived))) > base2 + geom_bar(position='dodge')
28.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | データのカテゴリを直す • Pclassは1,2,3と数字で入っているが、客室のClassを表すフラグ – 1等、2等、3等で数字でもいい気もするが、客室に大きな差があった事実がある • これまで作成した変数の中でカテゴリに該当するものを変換 28 > factor_vars <- c('PassengerId','Pclass','Sex', + 'Embarked','Title','Deck') > full[factor_vars] <- lapply(full[factor_vars], + function(x) factor(x))
29.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 欠損値の状態を確認する • Miceパッケージのmd.patternによって、欠損値の状態を確認 • +αでVIMパッケージを使って欠損値の状態を視覚化する • DeckとAgeとFareに欠損値があるのがわかる(Survivedは今回の課題列) 29 > library(mice) > md.pattern(full[,-2]) > install.packages("VIM") > library(VIM) > mice_plot <- aggr(full, + sortVars = TRUE, numbers = TRUE)
30.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 欠損値の状態を確認 30
31.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 欠損値を補完する • Miceパッケージのmiceによって、欠損値を補完する • 指定したすべての列の欠損値を補完するため、Survivedは除く • 補完された値を元のデータフレームの値と置き換えて使用する 31 > imputed <- mice(full[,c("Age","Deck","Fare")]) > head(complete(imputed)) > full$Age <- complete(imputed)$Age > full$Fare <- complete(imputed)$Fare > full$Deck <- complete(imputed)$Deck
32.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Rで機械学習を使って予測モデル作成 32
33.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 予測モデル構築の流れ データの リサンプリング モデルの フィッティング テストデータに 対する予測 33 学習用データとテストデータを事前に作成しておく > train <- full[1:891,] > test <- full[892:1309,]
34.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 決定木 • データの特徴量から簡単なルールで分岐を作り判別や回帰モデルを作る • ジニ係数やエントロピーに基づいて分割 34 𝑃(𝐵) 𝑃(𝐵 𝐶 ) 𝐵 𝐵 𝐶 𝑃 𝐴 𝐵 𝑃 𝐴 𝐶 𝐵 𝐴 ∩ 𝐵 𝐴 𝐶 ∩ 𝐵 性別=男性 男性 女性 40歳以上 40歳未満 男性 40以上 男性 40未満 性別=男性じゃない(女性)
35.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | ランダムフォレスト • 決定木を弱学習器とするアンサンブル学習アルゴリズム • 決定木に比べて負荷は高いが手軽に高精度 35 強学習機(弱学習機の多数決) 弱学習機(決定木) 学習データ リサンプリング リサンプリング リサンプリング
36.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | ランダムフォレスト予測モデルを作成 • ランダムフォレストを行うためのライブラリrandomForestを活用 • install.packages("randomForest", dep=T) • Out-Of-Bag(OOB)データによって、テストも実施済み 36 > library(randomForest) > rf <- randomForest(factor(Survived)~Pclass+Sex+ + Age+SibSp+Parch+Fare+Embarked+Title+ + Familysize+Deck,data = train, importance = T) > print(rf) > plot(rf) > varImpPlot(rf)
37.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 予測結果を作成する • 予測モデルを作ったデータでないtestに対してpredict関数を実施 • PassengerIdと予測したSurvivedの値のみのデータフレームに変換 • 行番号を排除してcsvファイルに出力 37 > prediction <- predict(rf,test) > solution <- data.frame(PassengerID = + test$PassengerId, Survived = prediction) > write.csv(solution, file = ‘solution.csv’, + row.names = F) > getwd()
38.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 予測結果をアップロード 38
39.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | データをダウンロードしたページから直リンクで飛べます 39
40.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 更なる高みを目指していくために! • とりあえず人気なパッケージはインストールするのもいいかも – Top 20 R Machine Learning and Data Science packages • http://www.kdnuggets.com/2015/06/top-20-r-machine-learning-packages.html 40
41.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | コンペではブースティングとバギングが人気 • ブースティングならxgboostパッケージ • https://github.com/dmlc/xgboost • 先ほどのrandomForestは高速で動くパッケージも登場中 – ranger • http://arxiv.org/abs/1508.04409 – Rborist • https://github.com/suiji/Arborist 41
42.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Rでディープラーニングもできちゃいます • 基礎を捨てていきなりディープラーニングしたい人は – H2O • http://www.h2o.ai/download/h2o/r – MXNet • https://github.com/dmlc/mxnet/tree/master/R-package 42
43.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Oracle R Enterpriseデモンストレーション 43
44.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 【宣伝です!】Oracle R Distribution • https://oss.oracle.com/ORD/ • オラクルがサポートするオープンソースRのディストリビューション • 無料でダウンロード可能 • Intel MKLを動的にロードできる機能拡張がされている • Oracle Advanced Analytics, Oracle Linux, Oracle Big Data Applianceの ユーザーに対してはサポートを提供 44
45.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 45 In-Database Analytics Oracle R Enterprise R> summary(EMP) R> df <- ore.pull(EMP) R> dbt <- ore.push((1:3),(4:6)) ore.frame, pull and push Write R automaticity convert to SQL PMML Predictive Model Markup Language DEPLOY TO 3rd PARTY DEVELOP AND DEPLOY ANYWHERE
46.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Spawned R Engine Spawned R Engine Spawned R Engine Oracle R Enterprise アーキテクチャ 46 Database Server R Engine Other R packages Oracle R Enterprise packages R Client Spawned R Engine Other R packages Oracle R Enterprise packages SQL 結果 結果
47.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Oracle R Enterpriseを簡単トライ • Oracle CloudでOracle R Enterpriseをセットアップ – http://qiita.com/ogamiki/items/71c81f70b766f7bdbd1d • tryit – https://cloud.oracle.com/ja_JP/tryit • tryit進め方手順 – https://faq.oracle.co.jp/app/answers/detail/a_id/2855 47
48.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | Collect and ingest (データを取り込む) Enrich (“質”を上げる) Publish (提供する) ちょっと宣伝Oracle Big Data Preparation Cloud Service データ利用者の準備作業を大幅に削減し、「質」の高いデータ分析/レポーティングに貢献 Runtime Metrics 48
49.
Copyright © 2016,
Oracle and/or its affiliates. All rights reserved. | 49
Editor's Notes
1等船室の船賃は870ポンド、2等船室は13ポンド、 3等船室は3~6ポンド タイタニックの利用客層としては、1等は富豪が漫遊のために乗り、2等は中流の人たちが仕事や所要のために乗り、3等は主に移民が利用 脱出の際、三等船客から上部甲板に通じる階段のゲートは閉じられていました。これは当時のアメリカの移民法に「三等船客を物理的に隔離する」といった規定があった 「家族連れ」と「単身の男性」と「単身の女性」に3ブロックに分けられていた
Nullデータの量によってアラートを設定可能 Oracle Storage Cloud、BI Cloud ServiceまたはHDFSからのデータロードが可能 ファイル同士の結合(inner、left、right)が可能 ファイル形式は、txt、csv、xml、pdf、jsonと幅広く対応 質的データであれば、変換も可能
Download now