SlideShare a Scribd company logo
1 of 21
Download to read offline
秘密
Confidential
機械学習の勉強で出会った
印象的なワード
機械学習名古屋 第24回勉強会
2020-06-29
AKIHIRO HORIKAWA
1
秘密
Confidential
自己紹介
名前: AKIHIRO HORIKAWA
所属: 総合エネルギー企業の技術研究所
仕事: データ分析(主にアセスメントとマネージメント)
資格: JDLA G検定(2018#2)、他
コミュニティ: 機械学習名古屋、
中部Tableauユーザ会、
JAWS-UG名古屋、 他
趣味: 子供、データサイエンス勉強、ゲーム
課題: SNS
2
秘密
Confidential
はじめに
3
⚫ 機械学習を勉強しはじめて、かれこれ2年半くらいにな
ります
⚫ その中で出会った印象的な言葉(用語? 格言?
スラング?)を振り返ってみました
⚫ 技術的な話は他の方達がやってくれると思うのでので、
息抜きでお付き合いください
秘密
Confidential
4
『 前処理が8割 』
秘密
Confidential
『前処理が8割』
⚫ 意味
分析やモデリング以前に、生データをまともに分析できるようにす
るまでが大変だよね。
⚫ 出会い
忘れた(そこらじゅうで聞く)
⚫ 感想
• うなずくしかない
• 後ろに「でもなかなかわかってもらえないんだよね」が付く
• 「前処理」の指す範囲がはっきりしない
データ確認、結合・整形、クリーニング、正規化・標準化、各種加工、
ホールドアウト、アノテーション、オーギュメンテーション、・・・。
EDA、特徴量設計は前処理に入るのかなぁ?
5
秘密
Confidential
6
『 ラングリング 』
秘密
Confidential
『ラングリング』
⚫ 意味
「ラングリング」(wrangling)は、馬などを飼いならす、の意。
カウボーイ(wrangler)が暴れ馬を乗りこなすように、データを
自在に操るための収集・処理・分析・利用の総合テクニック。
参考:オライリー “Pythonではじめるデータラングリング”
https://www.oreilly.co.jp/books/9784873117942/
⚫ 出会い
某AIベンチャーさんが使っていた
⚫ 感想
• 最初は、クレンジング・クリーニングのことかと思っていたたけど、
意味するところはもっと広く深い感じ
• なんかカッコいい!
7
秘密
Confidential
8
『 次元の呪い 』
秘密
Confidential
『次元の呪い』
⚫ 意味
• 特徴量の次元が大きいと、データ同士の超平面上の距離が同
じくらいに遠くなって、高精度のモデルが作れなくなること(?)
• 次元が増えるほど、高い精度のモデルを作るために必要な訓練
データの量が爆発的に増えてしまうこと
⚫ 出会い
渋谷駅前で働くデータサイエンティストさんのブログ
https://tjo.hatenablog.com/entry/2013/10/22/193004
⚫ 感想
• すみません、まだ腹に落とせてません・・・
• なんかカッコいい!(またか)
9
秘密
Confidential
10
『 GIGO 』
秘密
Confidential
『GIGO』
⚫ 意味
“Garbage in, garbage out”の略。
意訳:ゴミデータからは、ゴミモデルしかできない。
⚫ 出会い
MLSE経由でたどり着いた「仕事で始める機械学習」の有賀さん
のスライド “機械学習プロジェクトアンチパータン?集”
https://docs.google.com/presentation/d/192wLLgNzkbwuJ
8gLwu_SJMigwxg_EZrYeaK8vBoz3_I/edit#slide=id.p
⚫ 感想
• “データでプログラミングする”というMLの特性を顕した言葉1
• もらったデータから始めるしかないんで、いつも頭をよぎる
11
秘密
Confidential
12
『 ノーフリーランチ 定理』
秘密
Confidential
『ノーフリーランチ定理』
⚫ 意味
「あらゆる問題を効率的に解決する解法」は理論上不可能で、
汎用的な最適解法というのは存在しない。
⇒ DLがどんな問題にも正しいアプローチとは限らない
⚫ 出会い
AINOWの記事 “ディープラーニングはすでに限界に達している
のではないか?【後編】”
https://ainow.ai/2019/02/19/162019/
⚫ 感想
• 「タダ飯みたいなうまい話は無い」という例えが面白い
• 元ネタがハインラインの『月は無慈悲な夜の女王』というのもイ
カす(格言自体はもっと古くからあるらしい)
13
秘密
Confidential
14
『 CACE 』
秘密
Confidential
『CACE』
⚫ 意味
“ChangeAnything ChangeEverything”の略。
何かが変わると全てが変わる、の意。
⚫ 出会い
前出の有賀さんのスライド。
参考:Qiita“機械学習システムにおける「技術的負債」とその回避策”
https://qiita.com/fujit33/items/f58055667493ae79e2dd
⚫ 感想
• “データでプログラミングする”というMLの特性を顕した言葉その2
• いろいろ解釈できるけど、「学習データが少し変わっただけで~」、
「母集団の傾向が変わってしまい~」と理解
15
秘密
Confidential
16
『 KISS 』
秘密
Confidential
『KISS』
⚫ 意味
愚直なまでにシンプルにせよ!
「Keep it simple stupid(単純かつ愚直であれ)」
「Keep it simple, stupid(単純にしろ、この間抜け!)」
「Keep it short and simple(簡潔かつ単純であれ)」
⚫ 出会い
AINOWの記事 “データサイエンスはつまらない”
https://ainow.ai/2019/10/14/179437/
⚫ 感想
• いろいろ解釈できるけど、「複雑なアルゴリズム使えばいいわけ
でない」、「特徴量加工もやりすぎはいけない」と理解
• 「設計思想のシンプルさ」みたいなのはすごく大事で、MLに限
らず真実だと思う
17
秘密
Confidential
18
『 Human In The Loop 』
秘密
Confidential
『Human In The Loop』
⚫ 意味
MLなどによって自動化・自律化したシステムにおいて、一部の判
断や制御を人間が担うこと。
参考: https://japan.zdnet.com/article/35119800/
⚫ 出会い
1年くらい前、来栖川の偉い人にお聞きしたのが初耳。
⚫ 感想
• 「人が入ることで、MLの不完全さ・不安定さを補う」、「データ蓄
積&アノテーションの壁を乗り越える道筋」と理解
• CDLE第2回勉強会で、ABEJA岡田社長も言及してた
• 言葉としては、この後ちょっと流行して、わりとすぐ廃れちゃうん
じゃないかという気がする
19
秘密
Confidential
おわりに
⚫ このスライド書くために、evernoteに書き留めたものを
読み返していて、「ML勉強し始めて、わからないなりに
いろいろ読み漁っていた頃」を思い出した
⚫ 最近そういうの薄くなってる気がするので、初心に帰って
AINOWとかLeage.aiとかまた巡回しようと思った
20
秘密
Confidential
21
ご清聴ありがとうございました。

More Related Content

Similar to 機械学習の勉強で出会った印象的なワード

なぜ、外の勉強会やイベントに行くのか? 第6回 学生エンジニア限定LT大会!!! in 大阪 - 2017.11.25
なぜ、外の勉強会やイベントに行くのか? 第6回 学生エンジニア限定LT大会!!! in 大阪 - 2017.11.25なぜ、外の勉強会やイベントに行くのか? 第6回 学生エンジニア限定LT大会!!! in 大阪 - 2017.11.25
なぜ、外の勉強会やイベントに行くのか? 第6回 学生エンジニア限定LT大会!!! in 大阪 - 2017.11.25Masashi Maruya
 
McEdu2016 ゲームとプログラミング学習のカタチ 鷲崎
McEdu2016 ゲームとプログラミング学習のカタチ 鷲崎McEdu2016 ゲームとプログラミング学習のカタチ 鷲崎
McEdu2016 ゲームとプログラミング学習のカタチ 鷲崎Hironori Washizaki
 
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方Hisahiko Shiraishi
 
ソフトウェアジャパン2018 ITフォーラムセッション(4)
ソフトウェアジャパン2018 ITフォーラムセッション(4)ソフトウェアジャパン2018 ITフォーラムセッション(4)
ソフトウェアジャパン2018 ITフォーラムセッション(4)aitc_jp
 
JTF2016 The strategy and Sun Tzu
JTF2016 The strategy and Sun TzuJTF2016 The strategy and Sun Tzu
JTF2016 The strategy and Sun Tzuirix_jp
 
河野ゼミ研究紹介20221019
河野ゼミ研究紹介20221019河野ゼミ研究紹介20221019
河野ゼミ研究紹介20221019義広 河野
 

Similar to 機械学習の勉強で出会った印象的なワード (6)

なぜ、外の勉強会やイベントに行くのか? 第6回 学生エンジニア限定LT大会!!! in 大阪 - 2017.11.25
なぜ、外の勉強会やイベントに行くのか? 第6回 学生エンジニア限定LT大会!!! in 大阪 - 2017.11.25なぜ、外の勉強会やイベントに行くのか? 第6回 学生エンジニア限定LT大会!!! in 大阪 - 2017.11.25
なぜ、外の勉強会やイベントに行くのか? 第6回 学生エンジニア限定LT大会!!! in 大阪 - 2017.11.25
 
McEdu2016 ゲームとプログラミング学習のカタチ 鷲崎
McEdu2016 ゲームとプログラミング学習のカタチ 鷲崎McEdu2016 ゲームとプログラミング学習のカタチ 鷲崎
McEdu2016 ゲームとプログラミング学習のカタチ 鷲崎
 
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
 
ソフトウェアジャパン2018 ITフォーラムセッション(4)
ソフトウェアジャパン2018 ITフォーラムセッション(4)ソフトウェアジャパン2018 ITフォーラムセッション(4)
ソフトウェアジャパン2018 ITフォーラムセッション(4)
 
JTF2016 The strategy and Sun Tzu
JTF2016 The strategy and Sun TzuJTF2016 The strategy and Sun Tzu
JTF2016 The strategy and Sun Tzu
 
河野ゼミ研究紹介20221019
河野ゼミ研究紹介20221019河野ゼミ研究紹介20221019
河野ゼミ研究紹介20221019
 

機械学習の勉強で出会った印象的なワード