Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Insight Technology, Inc.
PDF, PPTX
699 views
[db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
[db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ 日立造船株式会社 足立 悠 氏
Technology
◦
Read more
2
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 40
2
/ 40
3
/ 40
4
/ 40
5
/ 40
6
/ 40
7
/ 40
8
/ 40
9
/ 40
10
/ 40
11
/ 40
12
/ 40
13
/ 40
14
/ 40
15
/ 40
16
/ 40
17
/ 40
18
/ 40
19
/ 40
20
/ 40
21
/ 40
22
/ 40
23
/ 40
24
/ 40
25
/ 40
26
/ 40
27
/ 40
28
/ 40
29
/ 40
30
/ 40
31
/ 40
32
/ 40
33
/ 40
34
/ 40
35
/ 40
36
/ 40
37
/ 40
38
/ 40
39
/ 40
40
/ 40
More Related Content
PPTX
PoCで終わらせない!データ分析・AI活用
by
__john_smith__
PDF
Jubatusにおける大規模分散オンライン機械学習
by
Preferred Networks
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V7
by
Shunsuke Nakamura
PDF
東京都市大学 データ解析入門 8 クラスタリングと分類分析 1
by
hirokazutanaka
PDF
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V k-1
by
Shunsuke Nakamura
PDF
20180807_全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
PDF
Machine&data
by
ssuserf94232
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V6
by
Shunsuke Nakamura
PoCで終わらせない!データ分析・AI活用
by
__john_smith__
Jubatusにおける大規模分散オンライン機械学習
by
Preferred Networks
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V7
by
Shunsuke Nakamura
東京都市大学 データ解析入門 8 クラスタリングと分類分析 1
by
hirokazutanaka
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V k-1
by
Shunsuke Nakamura
20180807_全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
Machine&data
by
ssuserf94232
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V6
by
Shunsuke Nakamura
Similar to [db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
PDF
20180730 ds womens
by
Rio Kurihara
PDF
全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
PDF
tut_pfi_2012
by
Preferred Networks
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
by
Shunsuke Nakamura
PPTX
人と機械の協働によりデータ分析作業の効率化を目指す協働型機械学習技術(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
PDF
機械学習とその理論 (情報オリンピック2015春合宿講義資料)
by
irrrrr
PDF
データマイニング勉強会3
by
Yohei Sato
PDF
東大計数特別講義20130528
by
Yoichi Motomura
PDF
機械学習 入門
by
Hayato Maki
PDF
Anomaly detection survey
by
ぱんいち すみもと
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
by
Shunsuke Nakamura
PPT
Big data解析ビジネス
by
Mie Mori
PPTX
20181219_全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
PDF
AI/DeepLearningに必要なデータ準備〜そのデータ本当ですか?~
by
ReNom User Group
PPTX
de:code 2019 振り返り Night! Sponsored by Qiita - AI Track 振り返り
by
Daiyu Hatakeyama
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V8
by
Shunsuke Nakamura
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで
by
Shunsuke Nakamura
PDF
パート2 可視化されるデータ編
by
s tanaka
PDF
データ・テキストマイニング
by
Hiroshi Ono
PDF
機械学習の全般について
by
Masato Nakai
20180730 ds womens
by
Rio Kurihara
全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
tut_pfi_2012
by
Preferred Networks
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
by
Shunsuke Nakamura
人と機械の協働によりデータ分析作業の効率化を目指す協働型機械学習技術(NTTデータ テクノロジーカンファレンス 2020 発表資料)
by
NTT DATA Technology & Innovation
機械学習とその理論 (情報オリンピック2015春合宿講義資料)
by
irrrrr
データマイニング勉強会3
by
Yohei Sato
東大計数特別講義20130528
by
Yoichi Motomura
機械学習 入門
by
Hayato Maki
Anomaly detection survey
by
ぱんいち すみもと
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
by
Shunsuke Nakamura
Big data解析ビジネス
by
Mie Mori
20181219_全部見せます、データサイエンティストの仕事
by
Shunsuke Nakamura
AI/DeepLearningに必要なデータ準備〜そのデータ本当ですか?~
by
ReNom User Group
de:code 2019 振り返り Night! Sponsored by Qiita - AI Track 振り返り
by
Daiyu Hatakeyama
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V8
by
Shunsuke Nakamura
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで
by
Shunsuke Nakamura
パート2 可視化されるデータ編
by
s tanaka
データ・テキストマイニング
by
Hiroshi Ono
機械学習の全般について
by
Masato Nakai
More from Insight Technology, Inc.
PDF
DBREから始めるデータベースプラットフォーム
by
Insight Technology, Inc.
PDF
MBAAで覚えるDBREの大事なおしごと
by
Insight Technology, Inc.
PDF
グラフデータベースは如何に自然言語を理解するか?
by
Insight Technology, Inc.
PPTX
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
by
Insight Technology, Inc.
PDF
グラフデータベースは如何に自然言語を理解するか?
by
Insight Technology, Inc.
PDF
SQL Server エンジニアのためのコンテナ入門
by
Insight Technology, Inc.
PDF
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
by
Insight Technology, Inc.
PDF
Docker and the Oracle Database
by
Insight Technology, Inc.
PPTX
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
by
Insight Technology, Inc.
PDF
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
by
Insight Technology, Inc.
PPTX
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
by
Insight Technology, Inc.
PPTX
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
by
Insight Technology, Inc.
PPTX
難しいアプリケーション移行、手軽に試してみませんか?
by
Insight Technology, Inc.
PDF
db tech showcase2019 オープニングセッション @ 石川 雅也
by
Insight Technology, Inc.
PDF
事例を通じて機械学習とは何かを説明する
by
Insight Technology, Inc.
PPTX
そのデータベース、クラウドで使ってみませんか?
by
Insight Technology, Inc.
PDF
db tech showcase2019オープニングセッション @ 森田 俊哉
by
Insight Technology, Inc.
PDF
Lunch & Learn, AWS NoSQL Services
by
Insight Technology, Inc.
PDF
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
by
Insight Technology, Inc.
PDF
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
by
Insight Technology, Inc.
DBREから始めるデータベースプラットフォーム
by
Insight Technology, Inc.
MBAAで覚えるDBREの大事なおしごと
by
Insight Technology, Inc.
グラフデータベースは如何に自然言語を理解するか?
by
Insight Technology, Inc.
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
by
Insight Technology, Inc.
グラフデータベースは如何に自然言語を理解するか?
by
Insight Technology, Inc.
SQL Server エンジニアのためのコンテナ入門
by
Insight Technology, Inc.
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
by
Insight Technology, Inc.
Docker and the Oracle Database
by
Insight Technology, Inc.
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
by
Insight Technology, Inc.
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
by
Insight Technology, Inc.
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
by
Insight Technology, Inc.
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
by
Insight Technology, Inc.
難しいアプリケーション移行、手軽に試してみませんか?
by
Insight Technology, Inc.
db tech showcase2019 オープニングセッション @ 石川 雅也
by
Insight Technology, Inc.
事例を通じて機械学習とは何かを説明する
by
Insight Technology, Inc.
そのデータベース、クラウドで使ってみませんか?
by
Insight Technology, Inc.
db tech showcase2019オープニングセッション @ 森田 俊哉
by
Insight Technology, Inc.
Lunch & Learn, AWS NoSQL Services
by
Insight Technology, Inc.
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
by
Insight Technology, Inc.
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
by
Insight Technology, Inc.
[db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
1.
無いなら作ろう! 教師データ作成のあれこれ @db analytics showcase
Sapporo 2018 足立 悠 1
2.
料理とデータ分析は似ている 2
3.
3 料理のフロー 材料 下ごしらえ・調理 おかず
4.
4 分析のフロー データ 前処理・解析 モデル
5.
5 レシピ教師データ
6.
スマートものづくり 6https://meti-journal.jp/p/2 故障や異常の兆候を検出したい
7.
故障や異常の兆候を検出したい 故障や異常(教師データ)は滅多に起こらない 7
8.
教師データを作るしかない! 8
9.
自己紹介 足立 悠(あだち はるか) 日立造船株式会社 データサイエンティスト 主な業務は自社のAI・IoT技術の活用推進、実務者への技術指 導やリテラシー教育。 9
10.
目次 1.教師データを作成するには? 2.機械学習のおさらい 3.機械学習を使った教師データ作成 - データ間の距離をみる - データの変化量をみる -
データ自身を振り返る - データの構造をみる 10
11.
目次 1.教師データを作成するには? 2.機械学習のおさらい 3.機械学習を使った教師データ作成 - データ間の距離をみる - データの変化量をみる -
データ自身を振り返る - データの構造をみる 11
12.
12 わざと異常な挙動を させてデータを収集 2通りの方法がある
13.
13 わざと異常な挙動をさせて データを収集 破壊してデータを収集
14.
AI(機械学習・深層学習)を利用 14 常時の挙動 攻撃を受けた時の挙動 学習 常時から逸脱する挙動(データ)を収集
15.
目次 1.教師データを作成するには? 2.機械学習のおさらい 3.機械学習を使った教師データ作成 - データ間の距離をみる - データの変化量をみる -
データ自身を振り返る - データの構造をみる 15
16.
学習と推論のフロー http://blogs.itmedia.co.jp/itsolutionjuku/2015/07/post_106.html 16
17.
機械学習の種類 17 ・教師あり学習 結果(目的変数)と状態(説明変数)から未来を予測する。 ・教師なし学習 説明変数のみのデータから新たな知見を発見する。 ・強化学習 施行を積み重ね「よいやり方」と「悪いやり方」を学ぶ。成功したら報 酬を得られ、失敗したらペナルティを受ける。
18.
教師なし学習のイメージ 18 普段と違う動きを発見 例)センサの外れ値検出 グループの発見 例)顧客セグメンテーション ・異常値の発見 ・クラスタリング
19.
目次 1.教師データを作成するには? 2.機械学習のおさらい 3.機械学習を使った教師データ作成 - データ間の距離をみる - データの変化量をみる -
データ自身を振り返る - データの構造をみる 19
20.
異常部位を検出したい 他の箇所と違う 20
21.
部分時系列へ変換 21 スライド t (0) t
(1) t (2) ・・・ t(99) 窓の幅N t (1) t (2) t (3) ・・・ t(100) ・・・ t(N-3) t(N-2) t(N-1) 部分時系列 ・・・
22.
k近傍法を使って距離を計算 22 ・過去データのカテゴリ( と )を参照し、新規データ ( )のカテゴリを予測する。 ・新規データのk個の近傍データの多数決で決まる。 ・k=3のとき 赤:2、青:1 → ・k=7のとき 赤:3、青:4 → ・k=10のとき
赤:4、青:6 →
23.
Demo 23
24.
目次 1.教師データを作成するには? 2.機械学習のおさらい 3.機械学習を使った教師データ作成 - データ間の距離をみる - データの変化量をみる -
データ自身を振り返る - データの構造をみる 24
25.
異常点を検出したい 他の箇所と違う 25
26.
部分時系列へ変換 26 幅Nの窓でスライド 部分時系列1 部分時系列2 両者の違い・・・ ・・・
27.
特異値分解を使って差分を計算 27 ・特異値分解は次元圧縮の手法の一つ。 ・任意のm×n行列Aを、A=UΣVと表現する。 ・U:m×mの直行行列 ・∑:Aの特異値を対角要素として持つm×nの行列 ・V:n×nの直行行列 例: 特異値 右特異値ベクトル左特異値ベクトル
28.
Demo 28
29.
バースト検知 29急激な変化が見られる
30.
NYSOL 30http://www.nysol.jp/ ・データ前処理と分析のためのコマンド ・Linux、Macで使用できる。WindowsはVirtualBoxやWSL(Win10以降) を介して使用できる。 バースト検知コマンド
31.
目次 1.教師データを作成するには? 2.機械学習のおさらい 3.機械学習を使った教師データ作成 - データ間の距離をみる - データの変化量をみる -
データ自身を振り返る - データの構造をみる 31
32.
部分時系列へ変換 32 スライド t (0) t
(1) t (2) ・・・ t(99) 窓の幅N t (1) t (2) t (3) ・・・ t(100) 部分時系列 ・・・ ・・・ t(N-3) t(N-2) t(N-1)
33.
オートエンコーダを使って差分を計算 33 ・出力を入力に近付けるよう中間層を学習する。 入力層 出力層中間層 入力 出力
34.
Demo 34
35.
目次 1.教師データを作成するには? 2.機械学習のおさらい 3.機械学習を使った教師データ作成 - データ間の距離をみる - データの変化量をみる -
データ自身を振り返る - データの構造をみる 35
36.
ネットワークへ変換 36 幅Nの窓でスライド
37.
ネットワークの表現 37 1 23 4 5 = 0.0 0.5
0.8 0.0 0.0 0.5 0.0 0.7 0.0 0.0 0.8 0.7 0.0 0.5 0.0 0.0 0.0 0.5 0.0 0.6 0.0 0.0 0.0 0.6 0.0 1 2 3 4 5 12345 ・ネットワーク構造は隣接行列で表現できる。
38.
次数を使って構造の差を計算 38 区間Aの次数分布 区間Bの次数分布 分布の傾きに違いが見られる
39.
Demo 39
40.
ご清聴ありがとうございました! 40
Download