SlideShare a Scribd company logo
1 of 19
Download to read offline
Study Meeting Presentation:



信頼できないラベルで学習するには?

Author: Morgan LEFRANC



Date: 2021/07/28 

信頼できないラベル
で学習するには?
Morgan Lefranc - Ridge-i
2
このプレゼンテーションは何ではない
● 網羅的な
● 確定的な
● 詳細
● 完全に正確
● 美しい
● 準備がきちんとできている
3
目次
1. 不完全な監督
a. アクティブラーニング
b. 半教師あり学習
2. 不厳密な監督
a. Class-Activation Map
b. Multiple Instance learning
3. 不正確な監督
a. クラウドソーシングの手法
b. Confident learning
4
不完全な監督
データの小さなサブセットにはラベルが含まれているが、データがラベルなしの場合
は残りの大部分が含まれる。
5
監督が不完全な場合の対処法は?
人間の監督が可能
アクティブラーニング
● 特定のサンプルのアノテーションを要求
するために、人間のオラクルを照会する
ことができる
● 最小限のデータ量で良いパフォーマンス
が得られるように、良いサンプルを見つけ
る必要がある
人間の監督は利用できない
セミ・スーパーバイズド・ラーニング
● ラベルのないものを説明するために部分
的なラベルを利用する
6
アクティブラーニング:サンプルの選び方は?
不確実性のサンプリング 委員会による問い合わせ
7
半教師付き学習の例
低密度ベース 不一致に基づく方法(例:コ・トレーニング
8
不厳密な監督
各データサンプルにはラベルが付いているが、監督はタスクに必要なほど細かくは
ない。
9
Class Activation Map (CAM)
10
プレゼンターによる画像
CAM for Object Detection
画像にオブジェクトが含まれていることがわかれば,このクラスの
CAMを使ってバウ
ンディングボックスを提案することができる。
11
プレゼンターによる画像
Multiple Instance Learning (MIL)
● インスタンスの各バッグには注釈が付けられている。目標は、個々のインスタ
ンスを予測することです。
● バッグ内の個々のインスタンス予測が集約され、バッグラベルと比較されま
す。エラーはバックプロパゲーションされます 12
BBラベルからのセマンティックセグメンテー
ションのためのMILの例
13
MILCut: A Sweeping Line Multiple Instance Learning Paradigm for Interactive Image Segmentation, Jiajun Wu, Yibiao Zhao, Jun-Yan
Zhu, Siwei Luo, and Zhuowen Tu
不正確な監督
監修情報は必ずしも地に足のついた真実とは限らない
14
クラウドソーシングの手法
● 低品質なラベルをたくさん提供できるそれらをどうするか?
● 最も一般的な手法:複数の作業員に同じアノテーションタスクを実行してもらい、結果を平均化
する。
● より高度な技術:各ワーカーのパフォーマンスを追跡し、ベイズ推論技術を使用して信頼性を推
定し、信頼性の高いワーカーに決定の重みを与える。
→ アクティブラーニング/半教師付き学習
ワークフローに似ている。
15
Confident learning - cleanlab
目的. データセットからノイズの多いラベルを見つけて削
除します。
1. ノイズの多いラベル付けされたデータセットでモデ
ルを訓練する
2. 根拠のあるラベルでモデルを実行して,予測の信
頼度を求める
3. 不正確なクラスの信頼度がある閾値よりも高い回
数を数える
4. この回数を用いてラベルのノイズを推定し,信頼
性の低いものをランク付けし,それらを刈り取る
16
CleanLab出力:ImageNetからのノイズの多いラベル(合計
10万件以上)
青: マルチラベル画像, 緑: 存在論的問題, 赤: ラベルエラー.
17
参考文献
1. A brief introduction to weakly supervised learning
2. How to Use Inaccurate Data for Machine Learning with Weakly Supervised Learning
3. Confident Learning: Estimating Uncertainty in Dataset Labels
18
Appendix: Confident learning equations
19

More Related Content

Recently uploaded

Recently uploaded (8)

2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用
2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用
2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用
 
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。
 
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdf
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdfネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdf
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdf
 
情報を表現するときのポイント
情報を表現するときのポイント情報を表現するときのポイント
情報を表現するときのポイント
 
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアルLoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
 
Keywordmap overview material/CINC.co.ltd
Keywordmap overview material/CINC.co.ltdKeywordmap overview material/CINC.co.ltd
Keywordmap overview material/CINC.co.ltd
 
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイルLoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
 
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介
 

Featured

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

How to learn with non-reliable labels? (Japanese version)