SlideShare a Scribd company logo
1 of 56
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. |
データベースで始める機械学習
Oracle Database Connect 2018
2018年4月20日
日本オラクル株式会社
コンサルティングサービス事業統括
クラウド・テクノロジーコンサルティング事業本部
玉越 敬典
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 22
以下の事項は、弊社の一般的な製品の方向性に関する概要を説明するものです。
また、情報提供を唯一の目的とするものであり、いかなる契約にも組み込むことは
できません。以下の事項は、マテリアルやコード、機能を提供することを
コミットメント(確約)するものではないため、購買決定を行う際の判断材料に
なさらないで下さい。オラクル製品に関して記載されている機能の開発、リリース
および時期については、弊社の裁量により決定されます。
OracleとJavaは、Oracle Corporation 及びその子会社、関連会社の米国及びその他の国における登録商標です。
文中の社名、商品名等は各社の商標または登録商標である場合があります。
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 33
• 機械学習の基本(実施フロー、主要アルゴリズム)を理解する
• Oracle Database で機械学習をやることへの興味を持つ
TODAY’S GOAL:
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4
Program Agenda
機械学習の基本
Oracle Data Miner で始める機械学習
まとめ
1
2
3
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 55
1. 機械学習の基本
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 66
Oracle Autonomous Database
1. 機械学習の基本
Autonomous
Database
自動稼働 自動保護 自動修復
“この自律型データベース・クラウドは、
適応型機械学習を組み込み、人の介入を必要としない
自動稼動、自動チューニング、自動修復、
自動スケーリングおよび自動保護管理を提供する”
(引用) https://www.oracle.com/jp/database/autonomous-
database/index.html)
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 77
機械学習の歴史
1. 機械学習の基本
(出典)株式会社野村総合研究所「ICTの進化が雇用と働き方に及ぼす影響に関する調査研究」(平成28年)
http://www.soumu.go.jp/johotsusintokei/linkdata/h28_03_houkoku.pdf 図表 2-1-1-5
コンピュータの演算能力
不足による衰退
Input 情報の形式変換
不足による衰退
機械学習の原始的な
アルゴリズム
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 88
機械学習の歴史: 機械学習の位置づけ
1. 機械学習の基本
人工知能 (AI) を実現するための
一つのアプローチとして機械学習
が研究され始め、現在に至る
最近では、機械学習の発展とて、
深層学習が注目されている
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 99
なぜ今、機械学習?
1. 機械学習の基本
① 技術の進歩
ハードの進歩
• 高速・高性能なコンピューターが安価に入手可能
• 実質的に無限のストレージの登場
ソフトの進歩
• カーネル法 / アンサンブル学習 / ベイズモデル /
転移学習 / 半教師あり学習 等の学習方法の発展
(出典)NTTデータ「ICT新事業創出推進会議」(第3回) イノベーション創出に向けて
http://www.soumu.go.jp/main_content/000277812.pdf スライド5
(bps) (Byte) (Hz)
1P
10T
100G
1G
10M
10P
100T
1T
10G
100M
100G
10G
1G
100M
10M
2000年 2005年 2010年
CPU
ストレージ
ネットワーク
ISDN(64kbps)
ADSL(1.5Mbps)
FTTH(100Mbps) ADSL(24Mbps)
FTTH(200Mbps)
FTTH(1Gbps)
FTTH(1Gbps)
2.1GB
12GB
160GB
1TB 1.5TB 2TB
3TB
4TB
6TB
233MHz
1.4GHz
3.2GHz
4.4GHz
(相当)
9.0GHz
(相当)
13GHz
(相当)
18GHz
(相当)
24.3GHz
(相当)
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1010
なぜ今、機械学習?
1. 機械学習の基本
② 学習材料となるデータの増大
(出典)株式会社情報通信総合研究所「ビッグデータの流通量の推計及びビッグデータの活用実態に関する調査研究」(平成27年)
http://www.soumu.go.jp/johotsusintokei/linkdata/h27_03_houkoku.pdf 図表2-5
1,556,5892,004,730
2,614,878
3,477,480
4,076,772
4,913,064
6,050,339
8,020,140
10,804,988
14,524,752
0
2,000,000
4,000,000
6,000,000
8,000,000
10,000,000
12,000,000
14,000,000
16,000,000
2005 2006 2007 2008 2009 2010 2011 2012 2013 2014
(見込み)
9年間で
約9.3倍
(TB)
(年)
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1111
なぜ今、機械学習?
1. 機械学習の基本
ROI
50%20%
50%
70%
20%
100%
100%
全体の何割にアプローチするか
ターゲット層へヒットする割合
機械学習を使用
顧客をランダム
で選択
商品のターゲット顧客抽出
ランダム
機械学習
③ ビジネスへの有効性
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1212
機械学習ユースケース
1. 機械学習の基本
クレジットカード不正検知 顧客セグメンテーション
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1313
機械学習とは
1. 機械学習の基本
“Machine Learning: field of study that gives computers the ability to learn
without being explicitly programmed” -- Arthur Samuel, 1959
“機械学習: コンピュータに明示的にプログラムされていなくても学習する能力
を与える研究分野”
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1414
機械学習とは - 具体例
1. 機械学習の基本
顧客データ(性別や購入履歴等)から、その顧客が
優良顧客になりうるかを自動判別したい
顧客
ID
性別 年齢 職業 前月請求額 優良顧客
101 男性 31 会社員 10,000円 NO
102 女性 28 主婦 5,000円 YES
103 女性 36 主婦 200円 NO
104 男性 43 会社員 3,000円 NO
105 女性 22 会社員 7,000円 YES
過去顧客データ (学習データ)
ルール:
IF (前月請求額 >= 5000 AND 性別 = “女性”)
THEN
優良顧客 = YES
確率 = 0.77
先月請求額
< 5000 円 >= 5000 円
性別
男性 女性
優良顧客 = YES
優良顧客 = NO
優良顧客 = NO
101 男性 31 会社員 10,000円 NO
102 女性 28 主婦 5,000円 YES
新規顧客データ (未知データ)
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1515
ルールベースモデルと機械学習モデル
問題: 「顧客データ(性別や購入履歴等)から、その顧客が
優良顧客になりうるかを自動判別したい 」
1. 機械学習の基本
学習データ モデル 出力結果
この顧客は
優良顧客になりうるか否か
機械学習モデルをどのように作成するのか?
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1616
ルールベースモデルと機械学習モデル
問題: 「顧客データ(性別や購入履歴等)から、その顧客が
優良顧客になりうるかを自動判別したい 」
ルールベースモデルの場合
1. 機械学習の基本
if “性別”=“男”
and “居住地域”=“xx”
then “aaa”
else if
then “bbb”
else if
then “ccc”
else
then “ddd”
......
...........
データ
データを見て人がこれまでの知見などから
ルールを作成する
未知データ
予測結果
ルールベースモデル
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1717
ルールベースモデルと機械学習モデル
問題: 「顧客データ(性別や購入履歴等)から、その顧客が
優良顧客になりうるかを自動判別したい 」
機械学習モデルの場合
1. 機械学習の基本
アルゴリズム
・ SVM
・ 決定木
・ 相関ルール
...etc
選択されたアルゴリズム + データによって
機械学習モデル(if-thenロジックなど)が
自動生成される
未知データ
学習データ アルゴリズム
人は、最適と思われる
アルゴリズムを選択する
予測結果
機械学習モデル
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1818
機械学習の利点
機械学習の利点
– 高精度
• 大量のデータに対して人間では見つけることが非常に難しい規則や相関性を
アルゴリズムによって発見することが可能
– ルールベースと比較して、メンテナンス性が高い
• 機械学習モデル自体のロジックは記述する必要性がないため、
if文等の条件分岐が多数記述されたルールベースモデルに比べて
メンテンナンス性が非常に高い
– 高スペックマシンがあれば、高速処理可能
1. 機械学習の基本
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1919
一般的な機械学習プロジェクトの流れ (CRISP-DM)
CRISP-DM: データ分析プロジェクトのプロセスモデル
(CRoss-Industry Standard Process for Data Miningの略)
1. 機械学習の基本
機械学習プロジェクトでは、
WaterFall 型のアプローチは
実質不可能
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2020
一般的な機械学習プロジェクトの流れ (CRISP-DM)
①ビジネスの理解: データ分析におけるビジネス視点の必須作業
1. 機械学習の基本
① ビジネス上のゴールの
決定
② 解くべき問題の分析
③ データ分析の上の
ゴールの決定
④ 状況の評価
プロジェクトの策定
•ビジネスの目的を決定する
•ビジネスの成果指標(KPI)を決定する
•解くべき問題を細分化し、どのような
ワークフローで問題を解くことが可能かを
分析する
•プロジェクトのゴールは何か(Output)を
決定する
•社内/社外リソース(人員、マシン)
•制約条件、リスク、コンティンジェンシー
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2121
一般的な機械学習プロジェクトの流れ (CRISP-DM)
②データの理解: 分析対象、及び分析で使用するデータの性質を
調査・確認すること
1. 機械学習の基本
• 知りたいことに対するターゲット(正解)データが存在するかどうか
– 例)顧客が「新規に保険を買うかどうか」を知りたい
⇒ CUSTOMERS 表に保険を購入したかどうかを示す
BUY_INSURANCE 列が存在している
アルゴリズム選択時に重要なポイントとなる
• データの形式がどうなっているか
– 出現分布
– 平均、最大、最小
– 値の種類 ・・・ etc
欠損値が多い項目の排除やデータ正規化等の
前処理をどのように行うか検討する際の参考となる
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2222
一般的な機械学習プロジェクトの流れ (CRISP-DM)
③データの準備: データ分析の対象となるデータを分析可能な形に変換すること
1. 機械学習の基本
0歳
1歳
・・・
34歳
35歳
35
種類
0~13歳 子供
14~19歳 10代
20~24歳 青年
25~35歳 社会人
4
種類
ビニング(離散化)
正規化
一定の範囲でグループ化しデータの個別値を減らす
値の範囲を特定の値に収まるように調整し
桁数や単位の違いの差による影響を減らす
身長(cm) 視力
153 0.8
167 0.7
身長 視力
0.96 1.06
1.04 0.93
平均で
割る
欠損値補完
ID 身長 体重 座高
1 153 58 85
2 155 86
3 148 46 79
ID 身長 体重 座高
1 153 58 85
2 155 52 86
3 148 46 79
外れ値の処理
外れ値として
除外
列内の他の値から
大幅に外れている
値の影響を減らす
存在しない値を
もっともらしい値で
補完する
★ 機械学習プロジェクトで通常、最も工数と時間のかかるプロセス
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2323
一般的な機械学習プロジェクトの流れ (CRISP-DM)
④モデリング: 予測を行うモデルを構築・学習させること
1. 機械学習の基本
① アルゴリズムの選択
② モデルの学習
③ モデルのチューニング
•準備したデータやプロジェクトの目的に合った
学習アルゴリズム(決定木、クラスタリングなど)
を選択する
•事前に決めなければならない設定値
(分割するクラスタ数など)を決め機械学習モデルを
学習させる
•機械学習モデルの精度や演算速度を高めるために、
機械学習モデルの設定値を変更し、再度学習させる
評価へ
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2424
一般的な機械学習プロジェクトの流れ (CRISP-DM)
1. 機械学習の基本
教師あり学習
– 教師データをもとにルールを学習する
教師なし学習
– 教師データなしでルールを作る
顧客ID 年収
(万)
家族数
…
訪問回数 優良顧客
1 1000 5 … 32 Yes
… … … … … ……
10001 650 1 … 4 No
10002 550 3 … 19 Yes
10003 400 2 … 99 Yes
10004 400 2 … 3 Yes or NO?
Q:新規顧客が優良顧客かどうか
New!
教師
データ
正解
データ
予測
対象
顧客
ID
年収
(万)
家族
数
…
訪問回数 優良顧客
1 1000 5 … 32 Yes
… … … … …
10001 250 1 … 4 No
10002 550 3 … 19 Yes
10003 300 2 … 99 Yes
• 機械学習は大きく分けて、教師あり学習と教師なし学習に分類される
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2525
一般的な機械学習プロジェクトの流れ (CRISP-DM)
• 学習アルゴリズムは以下のように大別できる
1. 機械学習の基本
良性(1)
クラスタリング
分類 回帰分析
相関分析異常検出
どこに属するかを予測する 数字(連続値)を予測する
グループに分割する 異常を検知する 関係性が強いものを見つける
悪性(0)
患者A
年収
保
険
料
Q.発見された癌が
悪性かどうか
Q.年収から
保険料を
予測する
Q. 優等生を
見つける
Q.カードの
不正利用を
みつける
カード利用場所
通常の
使用範囲
Q.年収に一番影響するものは何か
部活の成績
成
績
教師あり学習
教師なし学習
凡例)
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2626
一般的な機械学習プロジェクトの流れ (CRISP-DM)
• 以下のようなチャート(あくまで一例)を使用してアルゴリズムを決定する
1. 機械学習の基本
分類
結果がカテゴリ
分けできるか
データの中に
正解データがあるか
異常検出
相関関係
クラスタリング
教師あり
学習
例1:顧客が常連になるか
知りたい場合の
「今ある顧客データに
常連フラグがあるかどうか」
例2:住宅価格を予測したい場合の
「今ある住宅データに
住宅価格が含まれるかどうか」
グループに分けたい
おかしなものを見つけたい
関係性の強いものを見つけたい
Yes
No
Yes
No
例:新規顧客対して
・「常連になり得る」「ならない」に分けるなら「分類」
・見込み利益を数字で予測するなら「回帰分析」
回帰分析
例:決定木、SVM
ナイーブベイズ
例:一般線形モデル
例:K-means
例:One-class SVM
例:Apriori
教師なし
学習
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2727
一般的な機械学習プロジェクトの流れ (CRISP-DM)
⑤評価: モデルがどの程度有用かを検証すること
1. 機械学習の基本
① モデルの評価
② プロセスの見直し
③ 次のアクションを決定
• 機械学習モデルがどれほど優れているかを評価/測定する
• 1 の結果に関わらず、これまでの分析フェーズを見直し、
よりビジネス価値を上げるために改善できる点はないか
を確認する
•1, 2で検証・確認した結果を基に次に何をするのかを
決定する
次のアクションへ
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2828
一般的な機械学習プロジェクトの流れ (CRISP-DM)
• モデルの評価を行う場合、
一般的には「学習用データ」「テストデータ」に分割し、
学習データで作成したモデルをテストデータに適用、精度を評価する
– Oracle Data Minerでは内部的に「学習用データ:テスト用データ=6:4」で分割し、
精度の表示まで行うため、特別な操作は不要
1. 機械学習の基本
顧客
ID
年収
(万)
家族数
…
訪問回数 優良顧客
1 1000 5 … 32 YES
… … … … … …
12001 250 1 … 4 NO
12002 550 3 … 19 YES
12003 300 2 … 99 YES
… … … … … …
20004 400 2 … 3 NO
学習データ
テストデータ
アルゴリズム モデル
適用
精度評価
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2929
一般的な機械学習プロジェクトの流れ (CRISP-DM)
⑥デプロイメント: 作成した機械学習モデルを展開すること
1. 機械学習の基本
① システムの組み込み
•機械学習モデルを実運用するためにシステムに組み込む
既存システムへの組み込み or REST API での提供
② モニタリング
•システムに組み込むだけで終わりではなく、機械学習モデルが
KPIを満たしうるものなのかを継続的に監視する
•改善の余地が見られた場合、前のフェーズに戻り、
機械学習モデルの精度を上げていく
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3030
機械学習の困難さ
1. 機械学習の基本
必ずしも精度が出るとは限らない
データ分析における機械学習の向き不向き
技術的負債のたまりやすさ
プロジェクト観点 個人スキル観点
必要となる知識や能力が多い
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3131
機械学習の困難さ(プロジェクト観点): 機械学習の向き不向き
• 全ての目的が機械学習に向いているわけではない
– 顧客からの「機械学習・AIで何かやれ」は要注意
• 以下のようなケースが機械学習に向いている
1. 機械学習の基本
大量データが存在している
機械的に判定するロジック
を組む必要性がある
(正解を算出可能な場合で)
10 ~ 20% ほどの誤りを
許容できる
正解
誤り
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3232
機械学習の困難さ(個人スキル観点): 必要となるスキル/能力
1. 機械学習の基本
統計学
• 利用すべきアルゴリズムの
選定や最適なデータ整形方法
の提案ができる
• 実装するアルゴリズムの背景
にある理論を理解することで、
結果の解釈や説明ができる
ITスキル
機械学習を最適な方法、基盤で
システムに実装できる
(下記一例)
1. R, Python, Java, SQL などの
コーディングスキル
2. クラウド関連知識(クラウドは
Small Startに最適なため)
...etc
業界知識(ビジネス領域)
分析対象とする業界の知識
(ドメイン知識)を有している、
もしくは、それを有する関係者
に適切にヒアリングできる
機械学習で得られた結果を
ビジネスにどう活かすかを提案
できる
求められるスキル/能力の幅・深さが大きい
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3333
データ分析人材の不足
1. 機械学習の基本
(出典)McKinsey Global Institute「Big data: The next frontier for innovation, competition, and productivity」
http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h26/html/nc134020.html Exhibit 35, 36
データ分析の訓練を受けた大学卒業生の数
(2008年 単位:千人)
データ分析の才能を有する人材の推移
(単位:千人)
24.73
17.41
13.27
12.3
10.09
8.78
8.34
7.77
4.97
4.9
3.4
3.32
1.84
1.25
1.23
0.95
0.92
0.76
0.75
0.71
0.66
0.61
0.5
0.41
0.37
0.37
0.29
0.27
0.21
0.55
United States
China
India
Russia
Brazil
Poland
United Kingdom
France
Romania
Italy
Japan
Germany
Turkey
Netherlands
Spain
Czech Republic
Bulgaria
Switzerland
Portugal
Belgium
Greece
Denmark
Slovakia
Norway
Lithuania
Austria
Sweden
Latvia
Hungary
Other
0
5
10
15
20
25
2004 05 06 07 08
United States 3.9
China 10.4
India
Russia 1.5
Brazil 6.2
Poland 12.8
United Kingdom 2.5
France -14.4
Romania 32.9
Italy 18.9
Japan - 5.3
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3434
機械学習に必要なツール
1. 機械学習の基本
• 必ずしも精度が出るとは限らない
• データ分析における機械学習の
向き不向き
• 技術的負債のたまりやすさ
• 必要となる知識や能力が多い
• 機械学習プロジェクト特有の試行錯誤
を容易にするために、
各工程の工数を少なくすることが
できる
• 高度な専門性を有することなく、
簡単にGUI等で機械学習を実施できる
Problem Solutions
?
プ
ロ
ジ
ェ
ク
ト
観
点
個
人
ス
キ
ル
観
点
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3535
2. Oracle Data Miner で始める機械学習
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3636
Oracle Data Miner とは
Oracle Database 上で機械学習を
実施できる GUI ツール
(SQL Developer の拡張)
2. Oracle Data Miner で始める機械学習
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3737
Oracle Data Miner とは
2. Oracle Data Miner で始める機械学習
Oracle Data Miner
• 必ずしも精度が出るとは限らない
• データ分析における機械学習の
向き不向き
• 技術的負債のたまりやすさ
• 必要となる知識や能力が多い
Problem
プ
ロ
ジ
ェ
ク
ト
観
点
個
人
ス
キ
ル
観
点
工数削減
以下の工数を削減
・データの移動
・データの加工/パラメータ設定負債
のたまりやすさ
簡易な操作
・ GUI でドラッグ&ドロップで
データの理解/データの準備/
モデル構築/学習/評価 までの
一連のプロセスを実施可能
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3838
Oracle Data Miner の特徴 – 工数削減①
2. Oracle Data Miner で始める機械学習
通常の機械学習
データの抽出
データの準備&加工
機械学習モデルの
構築
機械学習モデルの
評価
データの移動
データインポート
Oracle Data Mininer を使った機械学習
機械学習に必要なオペレーションを
Oracle Database 上で実行し、かつ
データの加工やパラメータ設定を自動
で行うため、工数を大きく削減可能
工数削減
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3939
Oracle Data Miner の特徴 – 工数削減②
2. Oracle Data Miner で始める機械学習
Client Server
①アルゴリズムの移動
①データの移動
② アルゴリズムの実行
①データの移動
② アルゴリズムの実行
Data Miner
従来のツール
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4040
Oracle Data Miner の特徴 – 工数削減③
2. Oracle Data Miner で始める機械学習
デフォルトで
複数のアルゴリズムの
モデルを自動で用意
データの加工を
自動的に設定
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4141
Oracle Data Miner の特徴 – 簡易な操作
各工程ごとにアイコンを
ドラッグ & ドロップ で配置し
それを線で結ぶだけで
機械学習の一連のプロセスを実行可能
2. Oracle Data Miner で始める機械学習
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4242
Oracle Data Miner の特徴 – その他
• GUI でワークフローを設計し、そのワークフローを複数のユーザーで共有可能
• PL/SQL APIやSQLから実行可能なため、データベースに接続できれば、
SQL Developer以外からでもマイニング機能を利用可能
2. Oracle Data Miner で始める機械学習
アプリケーションの開発/組み込みが容易
データベースの機能が使える
• クライアントツールでの操作、処理はデータベース側で実行されるため、
データベースサーバーのパワーを使った大規模な分析が可能
• Partitioning や Parallel Query、DB In-Memory などの
Oracle の検索高速化機能をそのまま利用可能
• データベースの機能による高いセキュリティ
データベース
サーバー
クライアントPC
分析
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4343
実装済アルゴリズム
2. Oracle Data Miner で始める機械学習
アルゴリズム 応用範囲
分類
ロジスティクス回帰 (GLM)
決定木
ナイーブベイズ
サポートベクターマシン(SVM)
伝統的な統計テクニック
幅広い用途に利用可能
回帰
一般線形モデル (GLM)
サポートベクターマシン (SVM)
伝統的な統計テクニック
幅広い用途に利用可能
異常検出 One Class サポートベクターマシン 不正検知や異常値の検出
属性重要度
Minimum Description Length (因子分析の一種)
主成分分析(PCA)
属性の絞り込み、ノイズの低減
相関ルール Apriori(相関ルールマイニング) バスケット分析、事前の提案分析
クラスタリング
非階層クラスター分析(K平均法等)
階層クラスター分析(Hierarchical O-Cluster という
Oracle独自のクラスタリング・アルゴリズム)
非階層クラスター分析(EMアルゴリズム)
製品のグルーピング/ テキストマイニング
遺伝子-タンパク質分析
特徴抽出
非負値行列因子分解
特異値分解
テキスト分析 / 因子分析
A1 A2 A3 A4 A5 A6 A7
F1 F2 F3 F4
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4444
【Demo】Oracle Data Miner
2. Oracle Data Miner で始める機械学習
シナリオ:保険会社の顧客データをもとに、保険を購入する/しないを自動的に分類する
分類
機械学習モデル
保険を購入する
購入しない家族情報、
クレジット情報、
顧客年数、
保険購入有無 等
保険会社の
顧客データ
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4545
【Demo】Oracle Data Miner
2. Oracle Data Miner で始める機械学習
• サンプルとしてOracleが提供している保険データを使用する
列名 概要
CUSTOMER_ID 顧客ID
TIME_AS_CUSTOMER 顧客年数
LTV Life Time Value
LTV_BIN Life Time Valueのカテゴリ
BUY_INSURANCE 保険を購入したかどうか
CUSTOMER_ID 顧客ID
LAST 名
FIRST 姓
STATE 住んでいる州
REGION 地域
SEX 性別
PROFESSION 職業
AGE 年齢
HAS_CHILDREN 子供がいるかどうか
SALARY 給料
N_OF_DEPENDENTS 扶養家族の数
CAR_OWNERSHIP 車の所有者かどうか
HOUSE_OWNERSHIP 所有する家の数
INSUR_CUST_LTV_SAMPLE
列名 概要
MARITAL_STATUS 結婚暦
CREDIT_BALANCE 預金残高
BANK_FUNDS 銀行資金
CHECKING_AMOUNT 当座預金口座
MONEY_MONTLY_OVERDRAWN 月単位の超過借り金額
T_AMOUNT_AUTOM_PAYMENTS 自動引落金額
MONTHLY_CHECKS_WRITTEN 月単位のチェック
MORTGAGE_AMOUNT ローン額
N_TRANS_ATM ATMでの取引回数
N_MORTGAGES ローン回数
N_TRANS_TELLER 窓口での取引回数
CREDIT_CARD_LIMITS クレジットカードの限度額
N_TRANS_KIOSK KIOSKでの取引回数
N_TRANS_WEB_BANK WEBバンクでの取引回数
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4646
【Demo】Oracle Data Miner
2. Oracle Data Miner で始める機械学習
• どのアルゴリズムを使うか?
– 「BUY_INSURANCE」という正解(ラベル)データが存在しており、
結果は、保険を「購入する」or「購入しない」の2カテゴリに分けられるため、
学習アルゴリズムとして「分類」を使用する
分類
結果がカテゴリ
分けできるか
データの中に
ターゲットがあるか
異常検出
相関関係
クラスタリング
教師あり
学習
グループに分けたい
おかしなものを見つけたい
関係性の強いものを見つけたい
Yes
No
Yes
No
回帰分析
例:決定木、SVM、
ナイーブベイズ
例:一般線形モデル
例:K-means
例:One-class SVM
例:Apriori
教師なし
学習
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4747
DEMO
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4848
Oracle Data Miner チュートリアル
• Slideshare
– Oracle Data Miner Tutorial 01 「Data Minerのセットアップ」
• http://www.slideshare.net/oracle4engineer/data-miner-tutorial-01
– Oracle Data Miner Tutorial 02「分類モデルによる予測」
• http://www.slideshare.net/oracle4engineer/data-miner-tutorial-02
– Oracle Data Miner Tutorial 03 「表データの加工とモデル構築」
• http://www.slideshare.net/oracle4engineer/data-miner-tutorial-03
• Github
– https://github.com/oracle4engineer/advanced-analytics/wiki
2. Oracle Data Miner で始める機械学習
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4949
Oracleと機械学習:Oracle IoT/Big Data & Analytics 全体像
2. Oracle Data Miner で始める機械学習
Data Factory
データの取得・処理
Data Management
データの蓄積
Data Analytics
データの分析・判定
Action
アクション
IoT
GoldenGate
Big Data
Preparation
Big Data Database
Marketing Sites
ApplicationNoSQL
Storage
ERP
ストリー
ミング
R
on Hadoop
Big Data
Discovery Spark
Spatial & Graph
on Hadoop
BI Data Visualization
Spatial
& Graph
SQL
Big Data SQL
and other Paas,SaaS
Big Data
試行錯誤と検証
Data Integration
on JCS
R
in Database
IoT Analytics
バッチ/セミストリーミング
Data
Miner
Advanced
Analytics
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5050
Oracleと機械学習:Oracle Advanced Analytics
• Oracle では機械学習を行うための「Oracle Advanced Analytics オプション」が用意されている
– 以下の2つコンポーネントからなるOracle Database Enterprise Edition のオプション
– 高度な分析をデータベース内で実現することを目的とする
2. Oracle Data Miner で始める機械学習
Oracle Data Mining Oracle R Enterprise
• オープンソースの統計言語
• 一部の処理をデータベースにオフロード
することで大規模なデータを分析可能
• 広範で高度な統計解析のための関数を提供
• Rの機能をアプリケーションやOBIEEに統合
• 対話的なデータ分析と優れたグラフ描画機能
• オープンソースRパッケージ (CRAN) の利用
• データベース内部でマイニング処理
• 12個のマイニング・アルゴリズム
• 予測分析のためのアプリケーションの開発
• Oracle Data Miner (SQL Developer) を
用いたGUIによる解析ワークフローの構築
• PL/SQL API の提供
簡易な分析向け
一部の前処理など基本的な作業は事前定義済のため、
GUIでお手軽にデータ分析を行える
本格的な分析向け
統計分析に特化したR言語で、
細かい処理まで自分で定義してデータ分析を行える
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5151
【参考】Oracle R Enterprise (ORE)
2. Oracle Data Miner で始める機械学習
• R言語の処理を透過的にOracle Database内の処理に変換することで、大規模、かつ複雑な分析を
実現します。DB内処理に変換できない部分もDBサーバ上でRプロセスを実行します。
• Advanced Analytics Option 導入環境で利用可能です(DBCS High Performance 以上)
R EngineR EngineR Engine Other R
packages
Rの処理をDB内の処理に変換・オフロードします。
Oracle R Enterprise
packages
R Engine
Oracle R Enterprise
packages
SQL / R R
結果 結果
DBサーバ内で外部プロセスとしてRを実行することも可能です
Other R
packages
Rクライアント
• RスクリプトをOracle Databaseで
実行するようにスクリプトを発行します。
• グラフの描画や処理フローの制御は、
通常のRの機能を利用し、クライアント側で
実行します。
Oracle Database内部での実行
• Rの関数をSQLに変換して実行します。
• Oracle Databaseの並列実行の仕組みを
活用し、大量のデータに対応します。
• Oracle Databaseの持つ統計関数、データ
マイニング機能を内部的に活用します。
Oracle DatabaseサーバでのR実行
• データベースが複数のRのプロセスをデー
タベースサーバ上に外部プロセスとして
起動します。
• SQLやPL/SQLからRのスクリプトを
呼び出し可能です。
分析者
DB
Oracle DB サーバ
外部
プロセス
R言語を使用した機械学習の経験者向け機能 ※ Data Minerは万人向け
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5252
3. まとめ
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5353
機械学習と Oracle Data Miner
• 機械学習は非常に魅力的だが、難しい
– プロジェクトの失敗リスク/求められる個人スキル・能力の高さ
• Oracle Data Miner は機械学習の難しさを緩和して、簡単かつ高速に Oracle Database 上で
機械学習を実施できる
– 工数削減/容易な操作
3. まとめ
Oracle Data Miner で機械学習を始めよう!
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5454
無料トライアル
実施中
*Autonomous Data Warehouse Cloudをお試し頂けます
https://cloud.oracle.com/ja_JP/tryit
Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5555
データベースで始める機械学習

More Related Content

What's hot

ナレッジグラフとオントロジー
ナレッジグラフとオントロジーナレッジグラフとオントロジー
ナレッジグラフとオントロジーUniversity of Tsukuba
 
Kubernetesによる機械学習基盤への挑戦
Kubernetesによる機械学習基盤への挑戦Kubernetesによる機械学習基盤への挑戦
Kubernetesによる機械学習基盤への挑戦Preferred Networks
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Yusuke Uchida
 
ROS を用いた自律移動ロボットのシステム構築
ROS を用いた自律移動ロボットのシステム構築ROS を用いた自律移動ロボットのシステム構築
ROS を用いた自律移動ロボットのシステム構築Yoshitaka HARA
 
エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織Takafumi ONAKA
 
マイクロサービス 4つの分割アプローチ
マイクロサービス 4つの分割アプローチマイクロサービス 4つの分割アプローチ
マイクロサービス 4つの分割アプローチ増田 亨
 
DockerコンテナでGitを使う
DockerコンテナでGitを使うDockerコンテナでGitを使う
DockerコンテナでGitを使うKazuhiro Suga
 
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)NTT DATA Technology & Innovation
 
Pythonによる黒魔術入門
Pythonによる黒魔術入門Pythonによる黒魔術入門
Pythonによる黒魔術入門大樹 小倉
 
ソーシャルゲームのためのデータベース設計
ソーシャルゲームのためのデータベース設計ソーシャルゲームのためのデータベース設計
ソーシャルゲームのためのデータベース設計Yoshinori Matsunobu
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)RyuichiKanoh
 
[part 2]ナレッジグラフ推論チャレンジ・Tech Live!
[part 2]ナレッジグラフ推論チャレンジ・Tech Live![part 2]ナレッジグラフ推論チャレンジ・Tech Live!
[part 2]ナレッジグラフ推論チャレンジ・Tech Live!KnowledgeGraph
 
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)NTT DATA Technology & Innovation
 
GitLab CI/CD パイプライン
GitLab CI/CD パイプラインGitLab CI/CD パイプライン
GitLab CI/CD パイプラインTetsurou Yano
 
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜SSII
 
StyleGAN解説 CVPR2019読み会@DeNA
StyleGAN解説 CVPR2019読み会@DeNAStyleGAN解説 CVPR2019読み会@DeNA
StyleGAN解説 CVPR2019読み会@DeNAKento Doi
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic DatasetsDeep Learning JP
 
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State SpacesDeep Learning JP
 

What's hot (20)

ナレッジグラフとオントロジー
ナレッジグラフとオントロジーナレッジグラフとオントロジー
ナレッジグラフとオントロジー
 
Kubernetesによる機械学習基盤への挑戦
Kubernetesによる機械学習基盤への挑戦Kubernetesによる機械学習基盤への挑戦
Kubernetesによる機械学習基盤への挑戦
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
 
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp
At least onceってぶっちゃけ問題の先送りだったよね #kafkajpAt least onceってぶっちゃけ問題の先送りだったよね #kafkajp
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp
 
ROS を用いた自律移動ロボットのシステム構築
ROS を用いた自律移動ロボットのシステム構築ROS を用いた自律移動ロボットのシステム構築
ROS を用いた自律移動ロボットのシステム構築
 
エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織
 
マイクロサービス 4つの分割アプローチ
マイクロサービス 4つの分割アプローチマイクロサービス 4つの分割アプローチ
マイクロサービス 4つの分割アプローチ
 
DockerコンテナでGitを使う
DockerコンテナでGitを使うDockerコンテナでGitを使う
DockerコンテナでGitを使う
 
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
 
Pythonによる黒魔術入門
Pythonによる黒魔術入門Pythonによる黒魔術入門
Pythonによる黒魔術入門
 
ソーシャルゲームのためのデータベース設計
ソーシャルゲームのためのデータベース設計ソーシャルゲームのためのデータベース設計
ソーシャルゲームのためのデータベース設計
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
 
[part 2]ナレッジグラフ推論チャレンジ・Tech Live!
[part 2]ナレッジグラフ推論チャレンジ・Tech Live![part 2]ナレッジグラフ推論チャレンジ・Tech Live!
[part 2]ナレッジグラフ推論チャレンジ・Tech Live!
 
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
 
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
 
GitLab CI/CD パイプライン
GitLab CI/CD パイプラインGitLab CI/CD パイプライン
GitLab CI/CD パイプライン
 
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
 
StyleGAN解説 CVPR2019読み会@DeNA
StyleGAN解説 CVPR2019読み会@DeNAStyleGAN解説 CVPR2019読み会@DeNA
StyleGAN解説 CVPR2019読み会@DeNA
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
 
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
 

Similar to データベースで始める機械学習

Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習Tamakoshi Hironori
 
Oracle advanced analyticsによる機械学習full version
Oracle advanced analyticsによる機械学習full versionOracle advanced analyticsによる機械学習full version
Oracle advanced analyticsによる機械学習full version幹雄 小川
 
20151209 Oracle DDD オラクルで実現するクラウド・マシン・ラーニング
20151209 Oracle DDD オラクルで実現するクラウド・マシン・ラーニング20151209 Oracle DDD オラクルで実現するクラウド・マシン・ラーニング
20151209 Oracle DDD オラクルで実現するクラウド・マシン・ラーニングオラクルエンジニア通信
 
20160916 ビッグデータシンポジウム オラクル公開資料
20160916 ビッグデータシンポジウム オラクル公開資料20160916 ビッグデータシンポジウム オラクル公開資料
20160916 ビッグデータシンポジウム オラクル公開資料オラクルエンジニア通信
 
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016Cloudera Japan
 
[Modern Cloud Day Tokyo 2019] 【ビジネスをさらに加速させる!!】Oracle Cloud を活用したデータドリブン ユースケ...
[Modern Cloud Day Tokyo 2019] 【ビジネスをさらに加速させる!!】Oracle Cloud を活用したデータドリブン ユースケ...[Modern Cloud Day Tokyo 2019] 【ビジネスをさらに加速させる!!】Oracle Cloud を活用したデータドリブン ユースケ...
[Modern Cloud Day Tokyo 2019] 【ビジネスをさらに加速させる!!】Oracle Cloud を活用したデータドリブン ユースケ...オラクルエンジニア通信
 
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例オラクルエンジニア通信
 
How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)Yasuyuki Kataoka
 
Supervised Machine Learning of Elastic Stack
Supervised Machine Learning of Elastic StackSupervised Machine Learning of Elastic Stack
Supervised Machine Learning of Elastic StackHiroshi Yoshioka
 
Oracle Cloud Infrastructure Data Science 技術資料(20200402)
Oracle Cloud Infrastructure Data Science 技術資料(20200402)Oracle Cloud Infrastructure Data Science 技術資料(20200402)
Oracle Cloud Infrastructure Data Science 技術資料(20200402)オラクルエンジニア通信
 
MySQLで学ぶ機械学習ことはじめ.pdf
MySQLで学ぶ機械学習ことはじめ.pdfMySQLで学ぶ機械学習ことはじめ.pdf
MySQLで学ぶ機械学習ことはじめ.pdfMachiko Ikoma
 
[RIT]MLmodeling service
[RIT]MLmodeling service[RIT]MLmodeling service
[RIT]MLmodeling serviceRIT
 
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップDaiyu Hatakeyama
 
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要オラクルエンジニア通信
 
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成Trainocate Japan, Ltd.
 
【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介
【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介
【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介オラクルエンジニア通信
 

Similar to データベースで始める機械学習 (20)

Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習
 
Oracle advanced analyticsによる機械学習full version
Oracle advanced analyticsによる機械学習full versionOracle advanced analyticsによる機械学習full version
Oracle advanced analyticsによる機械学習full version
 
Oracle Advanced Analytics 概要
Oracle Advanced Analytics 概要Oracle Advanced Analytics 概要
Oracle Advanced Analytics 概要
 
超高速な機械学習を Oracle Database で実現!
超高速な機械学習を Oracle Database で実現!超高速な機械学習を Oracle Database で実現!
超高速な機械学習を Oracle Database で実現!
 
20151209 Oracle DDD オラクルで実現するクラウド・マシン・ラーニング
20151209 Oracle DDD オラクルで実現するクラウド・マシン・ラーニング20151209 Oracle DDD オラクルで実現するクラウド・マシン・ラーニング
20151209 Oracle DDD オラクルで実現するクラウド・マシン・ラーニング
 
20160916 ビッグデータシンポジウム オラクル公開資料
20160916 ビッグデータシンポジウム オラクル公開資料20160916 ビッグデータシンポジウム オラクル公開資料
20160916 ビッグデータシンポジウム オラクル公開資料
 
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016
 
[Modern Cloud Day Tokyo 2019] 【ビジネスをさらに加速させる!!】Oracle Cloud を活用したデータドリブン ユースケ...
[Modern Cloud Day Tokyo 2019] 【ビジネスをさらに加速させる!!】Oracle Cloud を活用したデータドリブン ユースケ...[Modern Cloud Day Tokyo 2019] 【ビジネスをさらに加速させる!!】Oracle Cloud を活用したデータドリブン ユースケ...
[Modern Cloud Day Tokyo 2019] 【ビジネスをさらに加速させる!!】Oracle Cloud を活用したデータドリブン ユースケ...
 
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
 
20200527 oracle cloud infrastructure data science
20200527 oracle cloud infrastructure data science20200527 oracle cloud infrastructure data science
20200527 oracle cloud infrastructure data science
 
How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)
 
Supervised Machine Learning of Elastic Stack
Supervised Machine Learning of Elastic StackSupervised Machine Learning of Elastic Stack
Supervised Machine Learning of Elastic Stack
 
Oracle Analytics Cloud のご紹介【2021年3月版】
Oracle Analytics Cloud のご紹介【2021年3月版】Oracle Analytics Cloud のご紹介【2021年3月版】
Oracle Analytics Cloud のご紹介【2021年3月版】
 
Oracle Cloud Infrastructure Data Science 技術資料(20200402)
Oracle Cloud Infrastructure Data Science 技術資料(20200402)Oracle Cloud Infrastructure Data Science 技術資料(20200402)
Oracle Cloud Infrastructure Data Science 技術資料(20200402)
 
MySQLで学ぶ機械学習ことはじめ.pdf
MySQLで学ぶ機械学習ことはじめ.pdfMySQLで学ぶ機械学習ことはじめ.pdf
MySQLで学ぶ機械学習ことはじめ.pdf
 
[RIT]MLmodeling service
[RIT]MLmodeling service[RIT]MLmodeling service
[RIT]MLmodeling service
 
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ
 
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
 
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
 
【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介
【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介
【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介
 

More from オラクルエンジニア通信

Oracle Cloud Infrastructure:2023年5月度サービス・アップデート
Oracle Cloud Infrastructure:2023年5月度サービス・アップデートOracle Cloud Infrastructure:2023年5月度サービス・アップデート
Oracle Cloud Infrastructure:2023年5月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2023年4月度サービス・アップデート
Oracle Cloud Infrastructure:2023年4月度サービス・アップデートOracle Cloud Infrastructure:2023年4月度サービス・アップデート
Oracle Cloud Infrastructure:2023年4月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2023年3月度サービス・アップデート
Oracle Cloud Infrastructure:2023年3月度サービス・アップデートOracle Cloud Infrastructure:2023年3月度サービス・アップデート
Oracle Cloud Infrastructure:2023年3月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2023年2月度サービス・アップデート
Oracle Cloud Infrastructure:2023年2月度サービス・アップデートOracle Cloud Infrastructure:2023年2月度サービス・アップデート
Oracle Cloud Infrastructure:2023年2月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2023年1月度サービス・アップデート
Oracle Cloud Infrastructure:2023年1月度サービス・アップデートOracle Cloud Infrastructure:2023年1月度サービス・アップデート
Oracle Cloud Infrastructure:2023年1月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年12月度サービス・アップデート
Oracle Cloud Infrastructure:2022年12月度サービス・アップデートOracle Cloud Infrastructure:2022年12月度サービス・アップデート
Oracle Cloud Infrastructure:2022年12月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年11月度サービス・アップデート
Oracle Cloud Infrastructure:2022年11月度サービス・アップデートOracle Cloud Infrastructure:2022年11月度サービス・アップデート
Oracle Cloud Infrastructure:2022年11月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年10月度サービス・アップデート
Oracle Cloud Infrastructure:2022年10月度サービス・アップデートOracle Cloud Infrastructure:2022年10月度サービス・アップデート
Oracle Cloud Infrastructure:2022年10月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年9月度サービス・アップデート
Oracle Cloud Infrastructure:2022年9月度サービス・アップデートOracle Cloud Infrastructure:2022年9月度サービス・アップデート
Oracle Cloud Infrastructure:2022年9月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年8月度サービス・アップデート
Oracle Cloud Infrastructure:2022年8月度サービス・アップデートOracle Cloud Infrastructure:2022年8月度サービス・アップデート
Oracle Cloud Infrastructure:2022年8月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年7月度サービス・アップデート
Oracle Cloud Infrastructure:2022年7月度サービス・アップデートOracle Cloud Infrastructure:2022年7月度サービス・アップデート
Oracle Cloud Infrastructure:2022年7月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年6月度サービス・アップデート
Oracle Cloud Infrastructure:2022年6月度サービス・アップデートOracle Cloud Infrastructure:2022年6月度サービス・アップデート
Oracle Cloud Infrastructure:2022年6月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年5月度サービス・アップデート
Oracle Cloud Infrastructure:2022年5月度サービス・アップデートOracle Cloud Infrastructure:2022年5月度サービス・アップデート
Oracle Cloud Infrastructure:2022年5月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年4月度サービス・アップデート
Oracle Cloud Infrastructure:2022年4月度サービス・アップデートOracle Cloud Infrastructure:2022年4月度サービス・アップデート
Oracle Cloud Infrastructure:2022年4月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure データベース・クラウド:各バージョンのサポート期間 (2022年4月版)
Oracle Cloud Infrastructureデータベース・クラウド:各バージョンのサポート期間 (2022年4月版)Oracle Cloud Infrastructureデータベース・クラウド:各バージョンのサポート期間 (2022年4月版)
Oracle Cloud Infrastructure データベース・クラウド:各バージョンのサポート期間 (2022年4月版)オラクルエンジニア通信
 
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会オラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年3月度サービス・アップデート
Oracle Cloud Infrastructure:2022年3月度サービス・アップデートOracle Cloud Infrastructure:2022年3月度サービス・アップデート
Oracle Cloud Infrastructure:2022年3月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年2月度サービス・アップデート
Oracle Cloud Infrastructure:2022年2月度サービス・アップデートOracle Cloud Infrastructure:2022年2月度サービス・アップデート
Oracle Cloud Infrastructure:2022年2月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年1月度サービス・アップデート
Oracle Cloud Infrastructure:2022年1月度サービス・アップデートOracle Cloud Infrastructure:2022年1月度サービス・アップデート
Oracle Cloud Infrastructure:2022年1月度サービス・アップデートオラクルエンジニア通信
 
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)オラクルエンジニア通信
 

More from オラクルエンジニア通信 (20)

Oracle Cloud Infrastructure:2023年5月度サービス・アップデート
Oracle Cloud Infrastructure:2023年5月度サービス・アップデートOracle Cloud Infrastructure:2023年5月度サービス・アップデート
Oracle Cloud Infrastructure:2023年5月度サービス・アップデート
 
Oracle Cloud Infrastructure:2023年4月度サービス・アップデート
Oracle Cloud Infrastructure:2023年4月度サービス・アップデートOracle Cloud Infrastructure:2023年4月度サービス・アップデート
Oracle Cloud Infrastructure:2023年4月度サービス・アップデート
 
Oracle Cloud Infrastructure:2023年3月度サービス・アップデート
Oracle Cloud Infrastructure:2023年3月度サービス・アップデートOracle Cloud Infrastructure:2023年3月度サービス・アップデート
Oracle Cloud Infrastructure:2023年3月度サービス・アップデート
 
Oracle Cloud Infrastructure:2023年2月度サービス・アップデート
Oracle Cloud Infrastructure:2023年2月度サービス・アップデートOracle Cloud Infrastructure:2023年2月度サービス・アップデート
Oracle Cloud Infrastructure:2023年2月度サービス・アップデート
 
Oracle Cloud Infrastructure:2023年1月度サービス・アップデート
Oracle Cloud Infrastructure:2023年1月度サービス・アップデートOracle Cloud Infrastructure:2023年1月度サービス・アップデート
Oracle Cloud Infrastructure:2023年1月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年12月度サービス・アップデート
Oracle Cloud Infrastructure:2022年12月度サービス・アップデートOracle Cloud Infrastructure:2022年12月度サービス・アップデート
Oracle Cloud Infrastructure:2022年12月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年11月度サービス・アップデート
Oracle Cloud Infrastructure:2022年11月度サービス・アップデートOracle Cloud Infrastructure:2022年11月度サービス・アップデート
Oracle Cloud Infrastructure:2022年11月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年10月度サービス・アップデート
Oracle Cloud Infrastructure:2022年10月度サービス・アップデートOracle Cloud Infrastructure:2022年10月度サービス・アップデート
Oracle Cloud Infrastructure:2022年10月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年9月度サービス・アップデート
Oracle Cloud Infrastructure:2022年9月度サービス・アップデートOracle Cloud Infrastructure:2022年9月度サービス・アップデート
Oracle Cloud Infrastructure:2022年9月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年8月度サービス・アップデート
Oracle Cloud Infrastructure:2022年8月度サービス・アップデートOracle Cloud Infrastructure:2022年8月度サービス・アップデート
Oracle Cloud Infrastructure:2022年8月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年7月度サービス・アップデート
Oracle Cloud Infrastructure:2022年7月度サービス・アップデートOracle Cloud Infrastructure:2022年7月度サービス・アップデート
Oracle Cloud Infrastructure:2022年7月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年6月度サービス・アップデート
Oracle Cloud Infrastructure:2022年6月度サービス・アップデートOracle Cloud Infrastructure:2022年6月度サービス・アップデート
Oracle Cloud Infrastructure:2022年6月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年5月度サービス・アップデート
Oracle Cloud Infrastructure:2022年5月度サービス・アップデートOracle Cloud Infrastructure:2022年5月度サービス・アップデート
Oracle Cloud Infrastructure:2022年5月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年4月度サービス・アップデート
Oracle Cloud Infrastructure:2022年4月度サービス・アップデートOracle Cloud Infrastructure:2022年4月度サービス・アップデート
Oracle Cloud Infrastructure:2022年4月度サービス・アップデート
 
Oracle Cloud Infrastructure データベース・クラウド:各バージョンのサポート期間 (2022年4月版)
Oracle Cloud Infrastructureデータベース・クラウド:各バージョンのサポート期間 (2022年4月版)Oracle Cloud Infrastructureデータベース・クラウド:各バージョンのサポート期間 (2022年4月版)
Oracle Cloud Infrastructure データベース・クラウド:各バージョンのサポート期間 (2022年4月版)
 
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
 
Oracle Cloud Infrastructure:2022年3月度サービス・アップデート
Oracle Cloud Infrastructure:2022年3月度サービス・アップデートOracle Cloud Infrastructure:2022年3月度サービス・アップデート
Oracle Cloud Infrastructure:2022年3月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年2月度サービス・アップデート
Oracle Cloud Infrastructure:2022年2月度サービス・アップデートOracle Cloud Infrastructure:2022年2月度サービス・アップデート
Oracle Cloud Infrastructure:2022年2月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年1月度サービス・アップデート
Oracle Cloud Infrastructure:2022年1月度サービス・アップデートOracle Cloud Infrastructure:2022年1月度サービス・アップデート
Oracle Cloud Infrastructure:2022年1月度サービス・アップデート
 
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)
 

Recently uploaded

論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 

Recently uploaded (14)

論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 

データベースで始める機械学習

  • 1. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | データベースで始める機械学習 Oracle Database Connect 2018 2018年4月20日 日本オラクル株式会社 コンサルティングサービス事業統括 クラウド・テクノロジーコンサルティング事業本部 玉越 敬典
  • 2. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 22 以下の事項は、弊社の一般的な製品の方向性に関する概要を説明するものです。 また、情報提供を唯一の目的とするものであり、いかなる契約にも組み込むことは できません。以下の事項は、マテリアルやコード、機能を提供することを コミットメント(確約)するものではないため、購買決定を行う際の判断材料に なさらないで下さい。オラクル製品に関して記載されている機能の開発、リリース および時期については、弊社の裁量により決定されます。 OracleとJavaは、Oracle Corporation 及びその子会社、関連会社の米国及びその他の国における登録商標です。 文中の社名、商品名等は各社の商標または登録商標である場合があります。
  • 3. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 33 • 機械学習の基本(実施フロー、主要アルゴリズム)を理解する • Oracle Database で機械学習をやることへの興味を持つ TODAY’S GOAL:
  • 4. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4 Program Agenda 機械学習の基本 Oracle Data Miner で始める機械学習 まとめ 1 2 3
  • 5. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 55 1. 機械学習の基本
  • 6. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 66 Oracle Autonomous Database 1. 機械学習の基本 Autonomous Database 自動稼働 自動保護 自動修復 “この自律型データベース・クラウドは、 適応型機械学習を組み込み、人の介入を必要としない 自動稼動、自動チューニング、自動修復、 自動スケーリングおよび自動保護管理を提供する” (引用) https://www.oracle.com/jp/database/autonomous- database/index.html)
  • 7. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 77 機械学習の歴史 1. 機械学習の基本 (出典)株式会社野村総合研究所「ICTの進化が雇用と働き方に及ぼす影響に関する調査研究」(平成28年) http://www.soumu.go.jp/johotsusintokei/linkdata/h28_03_houkoku.pdf 図表 2-1-1-5 コンピュータの演算能力 不足による衰退 Input 情報の形式変換 不足による衰退 機械学習の原始的な アルゴリズム
  • 8. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 88 機械学習の歴史: 機械学習の位置づけ 1. 機械学習の基本 人工知能 (AI) を実現するための 一つのアプローチとして機械学習 が研究され始め、現在に至る 最近では、機械学習の発展とて、 深層学習が注目されている
  • 9. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 99 なぜ今、機械学習? 1. 機械学習の基本 ① 技術の進歩 ハードの進歩 • 高速・高性能なコンピューターが安価に入手可能 • 実質的に無限のストレージの登場 ソフトの進歩 • カーネル法 / アンサンブル学習 / ベイズモデル / 転移学習 / 半教師あり学習 等の学習方法の発展 (出典)NTTデータ「ICT新事業創出推進会議」(第3回) イノベーション創出に向けて http://www.soumu.go.jp/main_content/000277812.pdf スライド5 (bps) (Byte) (Hz) 1P 10T 100G 1G 10M 10P 100T 1T 10G 100M 100G 10G 1G 100M 10M 2000年 2005年 2010年 CPU ストレージ ネットワーク ISDN(64kbps) ADSL(1.5Mbps) FTTH(100Mbps) ADSL(24Mbps) FTTH(200Mbps) FTTH(1Gbps) FTTH(1Gbps) 2.1GB 12GB 160GB 1TB 1.5TB 2TB 3TB 4TB 6TB 233MHz 1.4GHz 3.2GHz 4.4GHz (相当) 9.0GHz (相当) 13GHz (相当) 18GHz (相当) 24.3GHz (相当)
  • 10. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1010 なぜ今、機械学習? 1. 機械学習の基本 ② 学習材料となるデータの増大 (出典)株式会社情報通信総合研究所「ビッグデータの流通量の推計及びビッグデータの活用実態に関する調査研究」(平成27年) http://www.soumu.go.jp/johotsusintokei/linkdata/h27_03_houkoku.pdf 図表2-5 1,556,5892,004,730 2,614,878 3,477,480 4,076,772 4,913,064 6,050,339 8,020,140 10,804,988 14,524,752 0 2,000,000 4,000,000 6,000,000 8,000,000 10,000,000 12,000,000 14,000,000 16,000,000 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 (見込み) 9年間で 約9.3倍 (TB) (年)
  • 11. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1111 なぜ今、機械学習? 1. 機械学習の基本 ROI 50%20% 50% 70% 20% 100% 100% 全体の何割にアプローチするか ターゲット層へヒットする割合 機械学習を使用 顧客をランダム で選択 商品のターゲット顧客抽出 ランダム 機械学習 ③ ビジネスへの有効性
  • 12. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1212 機械学習ユースケース 1. 機械学習の基本 クレジットカード不正検知 顧客セグメンテーション
  • 13. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1313 機械学習とは 1. 機械学習の基本 “Machine Learning: field of study that gives computers the ability to learn without being explicitly programmed” -- Arthur Samuel, 1959 “機械学習: コンピュータに明示的にプログラムされていなくても学習する能力 を与える研究分野”
  • 14. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1414 機械学習とは - 具体例 1. 機械学習の基本 顧客データ(性別や購入履歴等)から、その顧客が 優良顧客になりうるかを自動判別したい 顧客 ID 性別 年齢 職業 前月請求額 優良顧客 101 男性 31 会社員 10,000円 NO 102 女性 28 主婦 5,000円 YES 103 女性 36 主婦 200円 NO 104 男性 43 会社員 3,000円 NO 105 女性 22 会社員 7,000円 YES 過去顧客データ (学習データ) ルール: IF (前月請求額 >= 5000 AND 性別 = “女性”) THEN 優良顧客 = YES 確率 = 0.77 先月請求額 < 5000 円 >= 5000 円 性別 男性 女性 優良顧客 = YES 優良顧客 = NO 優良顧客 = NO 101 男性 31 会社員 10,000円 NO 102 女性 28 主婦 5,000円 YES 新規顧客データ (未知データ)
  • 15. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1515 ルールベースモデルと機械学習モデル 問題: 「顧客データ(性別や購入履歴等)から、その顧客が 優良顧客になりうるかを自動判別したい 」 1. 機械学習の基本 学習データ モデル 出力結果 この顧客は 優良顧客になりうるか否か 機械学習モデルをどのように作成するのか?
  • 16. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1616 ルールベースモデルと機械学習モデル 問題: 「顧客データ(性別や購入履歴等)から、その顧客が 優良顧客になりうるかを自動判別したい 」 ルールベースモデルの場合 1. 機械学習の基本 if “性別”=“男” and “居住地域”=“xx” then “aaa” else if then “bbb” else if then “ccc” else then “ddd” ...... ........... データ データを見て人がこれまでの知見などから ルールを作成する 未知データ 予測結果 ルールベースモデル
  • 17. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1717 ルールベースモデルと機械学習モデル 問題: 「顧客データ(性別や購入履歴等)から、その顧客が 優良顧客になりうるかを自動判別したい 」 機械学習モデルの場合 1. 機械学習の基本 アルゴリズム ・ SVM ・ 決定木 ・ 相関ルール ...etc 選択されたアルゴリズム + データによって 機械学習モデル(if-thenロジックなど)が 自動生成される 未知データ 学習データ アルゴリズム 人は、最適と思われる アルゴリズムを選択する 予測結果 機械学習モデル
  • 18. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1818 機械学習の利点 機械学習の利点 – 高精度 • 大量のデータに対して人間では見つけることが非常に難しい規則や相関性を アルゴリズムによって発見することが可能 – ルールベースと比較して、メンテナンス性が高い • 機械学習モデル自体のロジックは記述する必要性がないため、 if文等の条件分岐が多数記述されたルールベースモデルに比べて メンテンナンス性が非常に高い – 高スペックマシンがあれば、高速処理可能 1. 機械学習の基本
  • 19. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 1919 一般的な機械学習プロジェクトの流れ (CRISP-DM) CRISP-DM: データ分析プロジェクトのプロセスモデル (CRoss-Industry Standard Process for Data Miningの略) 1. 機械学習の基本 機械学習プロジェクトでは、 WaterFall 型のアプローチは 実質不可能
  • 20. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2020 一般的な機械学習プロジェクトの流れ (CRISP-DM) ①ビジネスの理解: データ分析におけるビジネス視点の必須作業 1. 機械学習の基本 ① ビジネス上のゴールの 決定 ② 解くべき問題の分析 ③ データ分析の上の ゴールの決定 ④ 状況の評価 プロジェクトの策定 •ビジネスの目的を決定する •ビジネスの成果指標(KPI)を決定する •解くべき問題を細分化し、どのような ワークフローで問題を解くことが可能かを 分析する •プロジェクトのゴールは何か(Output)を 決定する •社内/社外リソース(人員、マシン) •制約条件、リスク、コンティンジェンシー
  • 21. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2121 一般的な機械学習プロジェクトの流れ (CRISP-DM) ②データの理解: 分析対象、及び分析で使用するデータの性質を 調査・確認すること 1. 機械学習の基本 • 知りたいことに対するターゲット(正解)データが存在するかどうか – 例)顧客が「新規に保険を買うかどうか」を知りたい ⇒ CUSTOMERS 表に保険を購入したかどうかを示す BUY_INSURANCE 列が存在している アルゴリズム選択時に重要なポイントとなる • データの形式がどうなっているか – 出現分布 – 平均、最大、最小 – 値の種類 ・・・ etc 欠損値が多い項目の排除やデータ正規化等の 前処理をどのように行うか検討する際の参考となる
  • 22. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2222 一般的な機械学習プロジェクトの流れ (CRISP-DM) ③データの準備: データ分析の対象となるデータを分析可能な形に変換すること 1. 機械学習の基本 0歳 1歳 ・・・ 34歳 35歳 35 種類 0~13歳 子供 14~19歳 10代 20~24歳 青年 25~35歳 社会人 4 種類 ビニング(離散化) 正規化 一定の範囲でグループ化しデータの個別値を減らす 値の範囲を特定の値に収まるように調整し 桁数や単位の違いの差による影響を減らす 身長(cm) 視力 153 0.8 167 0.7 身長 視力 0.96 1.06 1.04 0.93 平均で 割る 欠損値補完 ID 身長 体重 座高 1 153 58 85 2 155 86 3 148 46 79 ID 身長 体重 座高 1 153 58 85 2 155 52 86 3 148 46 79 外れ値の処理 外れ値として 除外 列内の他の値から 大幅に外れている 値の影響を減らす 存在しない値を もっともらしい値で 補完する ★ 機械学習プロジェクトで通常、最も工数と時間のかかるプロセス
  • 23. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2323 一般的な機械学習プロジェクトの流れ (CRISP-DM) ④モデリング: 予測を行うモデルを構築・学習させること 1. 機械学習の基本 ① アルゴリズムの選択 ② モデルの学習 ③ モデルのチューニング •準備したデータやプロジェクトの目的に合った 学習アルゴリズム(決定木、クラスタリングなど) を選択する •事前に決めなければならない設定値 (分割するクラスタ数など)を決め機械学習モデルを 学習させる •機械学習モデルの精度や演算速度を高めるために、 機械学習モデルの設定値を変更し、再度学習させる 評価へ
  • 24. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2424 一般的な機械学習プロジェクトの流れ (CRISP-DM) 1. 機械学習の基本 教師あり学習 – 教師データをもとにルールを学習する 教師なし学習 – 教師データなしでルールを作る 顧客ID 年収 (万) 家族数 … 訪問回数 優良顧客 1 1000 5 … 32 Yes … … … … … …… 10001 650 1 … 4 No 10002 550 3 … 19 Yes 10003 400 2 … 99 Yes 10004 400 2 … 3 Yes or NO? Q:新規顧客が優良顧客かどうか New! 教師 データ 正解 データ 予測 対象 顧客 ID 年収 (万) 家族 数 … 訪問回数 優良顧客 1 1000 5 … 32 Yes … … … … … 10001 250 1 … 4 No 10002 550 3 … 19 Yes 10003 300 2 … 99 Yes • 機械学習は大きく分けて、教師あり学習と教師なし学習に分類される
  • 25. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2525 一般的な機械学習プロジェクトの流れ (CRISP-DM) • 学習アルゴリズムは以下のように大別できる 1. 機械学習の基本 良性(1) クラスタリング 分類 回帰分析 相関分析異常検出 どこに属するかを予測する 数字(連続値)を予測する グループに分割する 異常を検知する 関係性が強いものを見つける 悪性(0) 患者A 年収 保 険 料 Q.発見された癌が 悪性かどうか Q.年収から 保険料を 予測する Q. 優等生を 見つける Q.カードの 不正利用を みつける カード利用場所 通常の 使用範囲 Q.年収に一番影響するものは何か 部活の成績 成 績 教師あり学習 教師なし学習 凡例)
  • 26. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2626 一般的な機械学習プロジェクトの流れ (CRISP-DM) • 以下のようなチャート(あくまで一例)を使用してアルゴリズムを決定する 1. 機械学習の基本 分類 結果がカテゴリ 分けできるか データの中に 正解データがあるか 異常検出 相関関係 クラスタリング 教師あり 学習 例1:顧客が常連になるか 知りたい場合の 「今ある顧客データに 常連フラグがあるかどうか」 例2:住宅価格を予測したい場合の 「今ある住宅データに 住宅価格が含まれるかどうか」 グループに分けたい おかしなものを見つけたい 関係性の強いものを見つけたい Yes No Yes No 例:新規顧客対して ・「常連になり得る」「ならない」に分けるなら「分類」 ・見込み利益を数字で予測するなら「回帰分析」 回帰分析 例:決定木、SVM ナイーブベイズ 例:一般線形モデル 例:K-means 例:One-class SVM 例:Apriori 教師なし 学習
  • 27. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2727 一般的な機械学習プロジェクトの流れ (CRISP-DM) ⑤評価: モデルがどの程度有用かを検証すること 1. 機械学習の基本 ① モデルの評価 ② プロセスの見直し ③ 次のアクションを決定 • 機械学習モデルがどれほど優れているかを評価/測定する • 1 の結果に関わらず、これまでの分析フェーズを見直し、 よりビジネス価値を上げるために改善できる点はないか を確認する •1, 2で検証・確認した結果を基に次に何をするのかを 決定する 次のアクションへ
  • 28. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2828 一般的な機械学習プロジェクトの流れ (CRISP-DM) • モデルの評価を行う場合、 一般的には「学習用データ」「テストデータ」に分割し、 学習データで作成したモデルをテストデータに適用、精度を評価する – Oracle Data Minerでは内部的に「学習用データ:テスト用データ=6:4」で分割し、 精度の表示まで行うため、特別な操作は不要 1. 機械学習の基本 顧客 ID 年収 (万) 家族数 … 訪問回数 優良顧客 1 1000 5 … 32 YES … … … … … … 12001 250 1 … 4 NO 12002 550 3 … 19 YES 12003 300 2 … 99 YES … … … … … … 20004 400 2 … 3 NO 学習データ テストデータ アルゴリズム モデル 適用 精度評価
  • 29. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 2929 一般的な機械学習プロジェクトの流れ (CRISP-DM) ⑥デプロイメント: 作成した機械学習モデルを展開すること 1. 機械学習の基本 ① システムの組み込み •機械学習モデルを実運用するためにシステムに組み込む 既存システムへの組み込み or REST API での提供 ② モニタリング •システムに組み込むだけで終わりではなく、機械学習モデルが KPIを満たしうるものなのかを継続的に監視する •改善の余地が見られた場合、前のフェーズに戻り、 機械学習モデルの精度を上げていく
  • 30. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3030 機械学習の困難さ 1. 機械学習の基本 必ずしも精度が出るとは限らない データ分析における機械学習の向き不向き 技術的負債のたまりやすさ プロジェクト観点 個人スキル観点 必要となる知識や能力が多い
  • 31. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3131 機械学習の困難さ(プロジェクト観点): 機械学習の向き不向き • 全ての目的が機械学習に向いているわけではない – 顧客からの「機械学習・AIで何かやれ」は要注意 • 以下のようなケースが機械学習に向いている 1. 機械学習の基本 大量データが存在している 機械的に判定するロジック を組む必要性がある (正解を算出可能な場合で) 10 ~ 20% ほどの誤りを 許容できる 正解 誤り
  • 32. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3232 機械学習の困難さ(個人スキル観点): 必要となるスキル/能力 1. 機械学習の基本 統計学 • 利用すべきアルゴリズムの 選定や最適なデータ整形方法 の提案ができる • 実装するアルゴリズムの背景 にある理論を理解することで、 結果の解釈や説明ができる ITスキル 機械学習を最適な方法、基盤で システムに実装できる (下記一例) 1. R, Python, Java, SQL などの コーディングスキル 2. クラウド関連知識(クラウドは Small Startに最適なため) ...etc 業界知識(ビジネス領域) 分析対象とする業界の知識 (ドメイン知識)を有している、 もしくは、それを有する関係者 に適切にヒアリングできる 機械学習で得られた結果を ビジネスにどう活かすかを提案 できる 求められるスキル/能力の幅・深さが大きい
  • 33. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3333 データ分析人材の不足 1. 機械学習の基本 (出典)McKinsey Global Institute「Big data: The next frontier for innovation, competition, and productivity」 http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h26/html/nc134020.html Exhibit 35, 36 データ分析の訓練を受けた大学卒業生の数 (2008年 単位:千人) データ分析の才能を有する人材の推移 (単位:千人) 24.73 17.41 13.27 12.3 10.09 8.78 8.34 7.77 4.97 4.9 3.4 3.32 1.84 1.25 1.23 0.95 0.92 0.76 0.75 0.71 0.66 0.61 0.5 0.41 0.37 0.37 0.29 0.27 0.21 0.55 United States China India Russia Brazil Poland United Kingdom France Romania Italy Japan Germany Turkey Netherlands Spain Czech Republic Bulgaria Switzerland Portugal Belgium Greece Denmark Slovakia Norway Lithuania Austria Sweden Latvia Hungary Other 0 5 10 15 20 25 2004 05 06 07 08 United States 3.9 China 10.4 India Russia 1.5 Brazil 6.2 Poland 12.8 United Kingdom 2.5 France -14.4 Romania 32.9 Italy 18.9 Japan - 5.3
  • 34. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3434 機械学習に必要なツール 1. 機械学習の基本 • 必ずしも精度が出るとは限らない • データ分析における機械学習の 向き不向き • 技術的負債のたまりやすさ • 必要となる知識や能力が多い • 機械学習プロジェクト特有の試行錯誤 を容易にするために、 各工程の工数を少なくすることが できる • 高度な専門性を有することなく、 簡単にGUI等で機械学習を実施できる Problem Solutions ? プ ロ ジ ェ ク ト 観 点 個 人 ス キ ル 観 点
  • 35. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3535 2. Oracle Data Miner で始める機械学習
  • 36. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3636 Oracle Data Miner とは Oracle Database 上で機械学習を 実施できる GUI ツール (SQL Developer の拡張) 2. Oracle Data Miner で始める機械学習
  • 37. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3737 Oracle Data Miner とは 2. Oracle Data Miner で始める機械学習 Oracle Data Miner • 必ずしも精度が出るとは限らない • データ分析における機械学習の 向き不向き • 技術的負債のたまりやすさ • 必要となる知識や能力が多い Problem プ ロ ジ ェ ク ト 観 点 個 人 ス キ ル 観 点 工数削減 以下の工数を削減 ・データの移動 ・データの加工/パラメータ設定負債 のたまりやすさ 簡易な操作 ・ GUI でドラッグ&ドロップで データの理解/データの準備/ モデル構築/学習/評価 までの 一連のプロセスを実施可能
  • 38. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3838 Oracle Data Miner の特徴 – 工数削減① 2. Oracle Data Miner で始める機械学習 通常の機械学習 データの抽出 データの準備&加工 機械学習モデルの 構築 機械学習モデルの 評価 データの移動 データインポート Oracle Data Mininer を使った機械学習 機械学習に必要なオペレーションを Oracle Database 上で実行し、かつ データの加工やパラメータ設定を自動 で行うため、工数を大きく削減可能 工数削減
  • 39. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 3939 Oracle Data Miner の特徴 – 工数削減② 2. Oracle Data Miner で始める機械学習 Client Server ①アルゴリズムの移動 ①データの移動 ② アルゴリズムの実行 ①データの移動 ② アルゴリズムの実行 Data Miner 従来のツール
  • 40. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4040 Oracle Data Miner の特徴 – 工数削減③ 2. Oracle Data Miner で始める機械学習 デフォルトで 複数のアルゴリズムの モデルを自動で用意 データの加工を 自動的に設定
  • 41. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4141 Oracle Data Miner の特徴 – 簡易な操作 各工程ごとにアイコンを ドラッグ & ドロップ で配置し それを線で結ぶだけで 機械学習の一連のプロセスを実行可能 2. Oracle Data Miner で始める機械学習
  • 42. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4242 Oracle Data Miner の特徴 – その他 • GUI でワークフローを設計し、そのワークフローを複数のユーザーで共有可能 • PL/SQL APIやSQLから実行可能なため、データベースに接続できれば、 SQL Developer以外からでもマイニング機能を利用可能 2. Oracle Data Miner で始める機械学習 アプリケーションの開発/組み込みが容易 データベースの機能が使える • クライアントツールでの操作、処理はデータベース側で実行されるため、 データベースサーバーのパワーを使った大規模な分析が可能 • Partitioning や Parallel Query、DB In-Memory などの Oracle の検索高速化機能をそのまま利用可能 • データベースの機能による高いセキュリティ データベース サーバー クライアントPC 分析
  • 43. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4343 実装済アルゴリズム 2. Oracle Data Miner で始める機械学習 アルゴリズム 応用範囲 分類 ロジスティクス回帰 (GLM) 決定木 ナイーブベイズ サポートベクターマシン(SVM) 伝統的な統計テクニック 幅広い用途に利用可能 回帰 一般線形モデル (GLM) サポートベクターマシン (SVM) 伝統的な統計テクニック 幅広い用途に利用可能 異常検出 One Class サポートベクターマシン 不正検知や異常値の検出 属性重要度 Minimum Description Length (因子分析の一種) 主成分分析(PCA) 属性の絞り込み、ノイズの低減 相関ルール Apriori(相関ルールマイニング) バスケット分析、事前の提案分析 クラスタリング 非階層クラスター分析(K平均法等) 階層クラスター分析(Hierarchical O-Cluster という Oracle独自のクラスタリング・アルゴリズム) 非階層クラスター分析(EMアルゴリズム) 製品のグルーピング/ テキストマイニング 遺伝子-タンパク質分析 特徴抽出 非負値行列因子分解 特異値分解 テキスト分析 / 因子分析 A1 A2 A3 A4 A5 A6 A7 F1 F2 F3 F4
  • 44. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4444 【Demo】Oracle Data Miner 2. Oracle Data Miner で始める機械学習 シナリオ:保険会社の顧客データをもとに、保険を購入する/しないを自動的に分類する 分類 機械学習モデル 保険を購入する 購入しない家族情報、 クレジット情報、 顧客年数、 保険購入有無 等 保険会社の 顧客データ
  • 45. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4545 【Demo】Oracle Data Miner 2. Oracle Data Miner で始める機械学習 • サンプルとしてOracleが提供している保険データを使用する 列名 概要 CUSTOMER_ID 顧客ID TIME_AS_CUSTOMER 顧客年数 LTV Life Time Value LTV_BIN Life Time Valueのカテゴリ BUY_INSURANCE 保険を購入したかどうか CUSTOMER_ID 顧客ID LAST 名 FIRST 姓 STATE 住んでいる州 REGION 地域 SEX 性別 PROFESSION 職業 AGE 年齢 HAS_CHILDREN 子供がいるかどうか SALARY 給料 N_OF_DEPENDENTS 扶養家族の数 CAR_OWNERSHIP 車の所有者かどうか HOUSE_OWNERSHIP 所有する家の数 INSUR_CUST_LTV_SAMPLE 列名 概要 MARITAL_STATUS 結婚暦 CREDIT_BALANCE 預金残高 BANK_FUNDS 銀行資金 CHECKING_AMOUNT 当座預金口座 MONEY_MONTLY_OVERDRAWN 月単位の超過借り金額 T_AMOUNT_AUTOM_PAYMENTS 自動引落金額 MONTHLY_CHECKS_WRITTEN 月単位のチェック MORTGAGE_AMOUNT ローン額 N_TRANS_ATM ATMでの取引回数 N_MORTGAGES ローン回数 N_TRANS_TELLER 窓口での取引回数 CREDIT_CARD_LIMITS クレジットカードの限度額 N_TRANS_KIOSK KIOSKでの取引回数 N_TRANS_WEB_BANK WEBバンクでの取引回数
  • 46. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4646 【Demo】Oracle Data Miner 2. Oracle Data Miner で始める機械学習 • どのアルゴリズムを使うか? – 「BUY_INSURANCE」という正解(ラベル)データが存在しており、 結果は、保険を「購入する」or「購入しない」の2カテゴリに分けられるため、 学習アルゴリズムとして「分類」を使用する 分類 結果がカテゴリ 分けできるか データの中に ターゲットがあるか 異常検出 相関関係 クラスタリング 教師あり 学習 グループに分けたい おかしなものを見つけたい 関係性の強いものを見つけたい Yes No Yes No 回帰分析 例:決定木、SVM、 ナイーブベイズ 例:一般線形モデル 例:K-means 例:One-class SVM 例:Apriori 教師なし 学習
  • 47. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4747 DEMO
  • 48. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4848 Oracle Data Miner チュートリアル • Slideshare – Oracle Data Miner Tutorial 01 「Data Minerのセットアップ」 • http://www.slideshare.net/oracle4engineer/data-miner-tutorial-01 – Oracle Data Miner Tutorial 02「分類モデルによる予測」 • http://www.slideshare.net/oracle4engineer/data-miner-tutorial-02 – Oracle Data Miner Tutorial 03 「表データの加工とモデル構築」 • http://www.slideshare.net/oracle4engineer/data-miner-tutorial-03 • Github – https://github.com/oracle4engineer/advanced-analytics/wiki 2. Oracle Data Miner で始める機械学習
  • 49. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 4949 Oracleと機械学習:Oracle IoT/Big Data & Analytics 全体像 2. Oracle Data Miner で始める機械学習 Data Factory データの取得・処理 Data Management データの蓄積 Data Analytics データの分析・判定 Action アクション IoT GoldenGate Big Data Preparation Big Data Database Marketing Sites ApplicationNoSQL Storage ERP ストリー ミング R on Hadoop Big Data Discovery Spark Spatial & Graph on Hadoop BI Data Visualization Spatial & Graph SQL Big Data SQL and other Paas,SaaS Big Data 試行錯誤と検証 Data Integration on JCS R in Database IoT Analytics バッチ/セミストリーミング Data Miner Advanced Analytics
  • 50. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5050 Oracleと機械学習:Oracle Advanced Analytics • Oracle では機械学習を行うための「Oracle Advanced Analytics オプション」が用意されている – 以下の2つコンポーネントからなるOracle Database Enterprise Edition のオプション – 高度な分析をデータベース内で実現することを目的とする 2. Oracle Data Miner で始める機械学習 Oracle Data Mining Oracle R Enterprise • オープンソースの統計言語 • 一部の処理をデータベースにオフロード することで大規模なデータを分析可能 • 広範で高度な統計解析のための関数を提供 • Rの機能をアプリケーションやOBIEEに統合 • 対話的なデータ分析と優れたグラフ描画機能 • オープンソースRパッケージ (CRAN) の利用 • データベース内部でマイニング処理 • 12個のマイニング・アルゴリズム • 予測分析のためのアプリケーションの開発 • Oracle Data Miner (SQL Developer) を 用いたGUIによる解析ワークフローの構築 • PL/SQL API の提供 簡易な分析向け 一部の前処理など基本的な作業は事前定義済のため、 GUIでお手軽にデータ分析を行える 本格的な分析向け 統計分析に特化したR言語で、 細かい処理まで自分で定義してデータ分析を行える
  • 51. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5151 【参考】Oracle R Enterprise (ORE) 2. Oracle Data Miner で始める機械学習 • R言語の処理を透過的にOracle Database内の処理に変換することで、大規模、かつ複雑な分析を 実現します。DB内処理に変換できない部分もDBサーバ上でRプロセスを実行します。 • Advanced Analytics Option 導入環境で利用可能です(DBCS High Performance 以上) R EngineR EngineR Engine Other R packages Rの処理をDB内の処理に変換・オフロードします。 Oracle R Enterprise packages R Engine Oracle R Enterprise packages SQL / R R 結果 結果 DBサーバ内で外部プロセスとしてRを実行することも可能です Other R packages Rクライアント • RスクリプトをOracle Databaseで 実行するようにスクリプトを発行します。 • グラフの描画や処理フローの制御は、 通常のRの機能を利用し、クライアント側で 実行します。 Oracle Database内部での実行 • Rの関数をSQLに変換して実行します。 • Oracle Databaseの並列実行の仕組みを 活用し、大量のデータに対応します。 • Oracle Databaseの持つ統計関数、データ マイニング機能を内部的に活用します。 Oracle DatabaseサーバでのR実行 • データベースが複数のRのプロセスをデー タベースサーバ上に外部プロセスとして 起動します。 • SQLやPL/SQLからRのスクリプトを 呼び出し可能です。 分析者 DB Oracle DB サーバ 外部 プロセス R言語を使用した機械学習の経験者向け機能 ※ Data Minerは万人向け
  • 52. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5252 3. まとめ
  • 53. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5353 機械学習と Oracle Data Miner • 機械学習は非常に魅力的だが、難しい – プロジェクトの失敗リスク/求められる個人スキル・能力の高さ • Oracle Data Miner は機械学習の難しさを緩和して、簡単かつ高速に Oracle Database 上で 機械学習を実施できる – 工数削減/容易な操作 3. まとめ Oracle Data Miner で機械学習を始めよう!
  • 54. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5454 無料トライアル 実施中 *Autonomous Data Warehouse Cloudをお試し頂けます https://cloud.oracle.com/ja_JP/tryit
  • 55. Copyright © 2018, Oracle and/or its affiliates. All rights reserved. | 5555