SlideShare a Scribd company logo
Machine Learning Design Patterns
Design Pattern 9 : Neutral Class
210420
yumaru
Neutral Class 概要 1
 概要
 問題を正しく設定することが大切
 データ収集の段階で適切なラベルが付けられるようにしておく
 問題
 2値分類などでランダムな要素が入ってくる場合に、2値分類をすると識別精度が低下する
 解決方法
 Neutral Classを導入して、”どちらでもいい”などのクラスとする
 メリット
 推論精度の向上
Problem 2
 2値分類で、ランダムな要素が入ってくる場合に無理に2値化をすると識別精度が低下する。
 事例 )
鎮痛剤のアセトアミノフェンとイブプロフェンのどちらを患者に処方するか推論するモデル。
 {アセトアミノフェン、イブプロフェン}
 アセトアミノフェン:胃腸が悪い人の処方
イブプロフェン:肝臓が悪い人に処方
しかし医師によっては基本アセトアミノフェンを処方、またはイブプロフェンを処方するといっ
たランダムな傾向がある。
2値分類で学習
{ アセトアミノフェン、イブプロフェン }
56%
Solution 3
 Neutral Classを追加する
 問題を正しく設計することが大事
 データ収集を適切に設計する必要がある
 事例のような場合は、データ収集時に代替の鎮痛剤の処方が可能かどうかについての質問も答え
られるようにしておく。
2値分類で学習
{ アセトアミノフェン、イブプロフェン }
56%
Why It Works Synthetic data 4
 モデル
 患者にどちらの鎮痛剤を処方するか出力
 データセット
 10%は黄疸(肝臓が悪い)
 10%は胃潰瘍(胃腸が悪い)
 残り80%はランダム
Neutral Classを加えて学習
{ アセトアミノフェン、イブプロフェン、どちらでも }
100%
2値分類で学習
{ 10,9:健康、8以下:要注意 }
56%
Neutral Classを加えて学習
{ 10:健康、8,9:中立、7以下:要注意 }
79%
Why It Works In the real world 5
 モデル
 新生児のアプガー指数(出産直後の新生児の健康状態を表す指数)を出力し、閾値で分類
 データセット
 新生児のアプガー指数1~10が付与
Trade-Offs and Alternatives 6
 そもそもデータ収集の段階でうまく集めていれば回避できる問題
 ラベルの付けのコストが高くなる
 中立クラスをもっておくことが役立つような状況として以下
 エキスパートの中で意見の相違がある場合
 顧客満足度
 embeddingの改善方法として
 Neutral classのリフレーミング
エキスパートの中で意見の相違がある場合 7
 エキスパートの中で意見に相違がある場合、Neutral Classを用いるべき
 以下二つの問題
 誤った信頼度は人がモデルを受け入れるかに影響を与える。
誤った信頼度を出すモデルよりも、中立的な判断ができているモデルの方が好まれる。
 モデルのカスケードをトレーニングしている場合、下流のモデルは中立クラスに非常に敏感にな
る。
 他の代替案
 ラベラー間の結果をまとめる
 5人が3対2に分かれた場合は重みを0.6とする
 ※モデルの出力が0.5の場合、”学習データ不足” か “ラベラー間で結果が異なる” のか区別がで
きない
Neutral Class 概要 8
 概要
 問題を正しく設定することが大切
 データ収集の段階で適切なラベルが付けられるようにしておく
 問題
 2値分類などでランダムな要素が入ってくる場合に、2値分類をすると識別精度が低下する
 解決方法
 Neutral Classを導入して、”どちらでもいい”などのクラスとする
 メリット
 推論精度の向上
Machine Learning Design Patterns
Design Pattern 9 : Neutral Class
210420
yumaru
2値分類で学習
{ 6以上:満足、5以下:不満足 }
Neutral Classを加えて学習
{ 8~10:満足、5~7:どちらでもない、1~4:不満足 }
顧客満足度 10
 モデル
 顧客満足度を予測
 データセット
 顧客のアンケート回答
 モデル
 フライトの価格決定するモデルを作成し、フライトの価格に対して顧客が購入するかしないかを予測
 データセット
 フライトチケットの取引記録
 問題
 フライトチケットの取引記録の中には旅行代理店やコンソリデーターなどの取引なども含まれている。しか
し、旅行代理店などは運賃を契約しているため、表示されている価格を支払っていない。
 解決策
 中立クラスを導入して学習
 旅行代理店などの取引記録を除いて学習(旅行代理店などが気になっていた目的地などの情報がなくなってし
まい、価格決定に影響を与える)
2値分類で学習
{ 購入する、購入しない }
Neutral Classを加えて学習
{ 購入する、購入しない、旅行代理店など }
embeddingの改善方法として 11
Neutral classのリフレーミング 12
 モデル
 ある証券が値上がりするか、値下がりするかを予測
 データセット
 株式市場のチャート
 問題
 株式市場の変動が激しいため現在から値下がりする、値上がりするだけでは予測が困難。
 解決策
 “6か月”という幅を持たせて、5%以上上昇、下降、Neutralの3クラスで学習
2値分類で学習
{ 値上がりする、値下がりする }
Neutral Classを加えて学習
6か月後に
{ 5%以上上昇する、5%以上下降する、Neutral }

More Related Content

Recently uploaded

キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援しますキンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
Takayuki Nakayama
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
Toru Tamaki
 
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさJSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
0207sukipio
 
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
 
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
Matsushita Laboratory
 
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
Toru Tamaki
 
This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
chiefujita1
 
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
t m
 

Recently uploaded (9)

キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援しますキンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
 
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさJSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
 
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
 
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
 
This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
 
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
 

Featured

Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
Christy Abraham Joy
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
Vit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
MindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
Alireza Esmikhani
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
DevGAMM Conference
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
Erica Santiago
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Saba Software
 

Featured (20)

Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
 

Machine learning design_pattern_neutral_class

  • 1. Machine Learning Design Patterns Design Pattern 9 : Neutral Class 210420 yumaru
  • 2. Neutral Class 概要 1  概要  問題を正しく設定することが大切  データ収集の段階で適切なラベルが付けられるようにしておく  問題  2値分類などでランダムな要素が入ってくる場合に、2値分類をすると識別精度が低下する  解決方法  Neutral Classを導入して、”どちらでもいい”などのクラスとする  メリット  推論精度の向上
  • 3. Problem 2  2値分類で、ランダムな要素が入ってくる場合に無理に2値化をすると識別精度が低下する。  事例 ) 鎮痛剤のアセトアミノフェンとイブプロフェンのどちらを患者に処方するか推論するモデル。  {アセトアミノフェン、イブプロフェン}  アセトアミノフェン:胃腸が悪い人の処方 イブプロフェン:肝臓が悪い人に処方 しかし医師によっては基本アセトアミノフェンを処方、またはイブプロフェンを処方するといっ たランダムな傾向がある。 2値分類で学習 { アセトアミノフェン、イブプロフェン } 56%
  • 4. Solution 3  Neutral Classを追加する  問題を正しく設計することが大事  データ収集を適切に設計する必要がある  事例のような場合は、データ収集時に代替の鎮痛剤の処方が可能かどうかについての質問も答え られるようにしておく。
  • 5. 2値分類で学習 { アセトアミノフェン、イブプロフェン } 56% Why It Works Synthetic data 4  モデル  患者にどちらの鎮痛剤を処方するか出力  データセット  10%は黄疸(肝臓が悪い)  10%は胃潰瘍(胃腸が悪い)  残り80%はランダム Neutral Classを加えて学習 { アセトアミノフェン、イブプロフェン、どちらでも } 100%
  • 6. 2値分類で学習 { 10,9:健康、8以下:要注意 } 56% Neutral Classを加えて学習 { 10:健康、8,9:中立、7以下:要注意 } 79% Why It Works In the real world 5  モデル  新生児のアプガー指数(出産直後の新生児の健康状態を表す指数)を出力し、閾値で分類  データセット  新生児のアプガー指数1~10が付与
  • 7. Trade-Offs and Alternatives 6  そもそもデータ収集の段階でうまく集めていれば回避できる問題  ラベルの付けのコストが高くなる  中立クラスをもっておくことが役立つような状況として以下  エキスパートの中で意見の相違がある場合  顧客満足度  embeddingの改善方法として  Neutral classのリフレーミング
  • 8. エキスパートの中で意見の相違がある場合 7  エキスパートの中で意見に相違がある場合、Neutral Classを用いるべき  以下二つの問題  誤った信頼度は人がモデルを受け入れるかに影響を与える。 誤った信頼度を出すモデルよりも、中立的な判断ができているモデルの方が好まれる。  モデルのカスケードをトレーニングしている場合、下流のモデルは中立クラスに非常に敏感にな る。  他の代替案  ラベラー間の結果をまとめる  5人が3対2に分かれた場合は重みを0.6とする  ※モデルの出力が0.5の場合、”学習データ不足” か “ラベラー間で結果が異なる” のか区別がで きない
  • 9. Neutral Class 概要 8  概要  問題を正しく設定することが大切  データ収集の段階で適切なラベルが付けられるようにしておく  問題  2値分類などでランダムな要素が入ってくる場合に、2値分類をすると識別精度が低下する  解決方法  Neutral Classを導入して、”どちらでもいい”などのクラスとする  メリット  推論精度の向上
  • 10. Machine Learning Design Patterns Design Pattern 9 : Neutral Class 210420 yumaru
  • 11. 2値分類で学習 { 6以上:満足、5以下:不満足 } Neutral Classを加えて学習 { 8~10:満足、5~7:どちらでもない、1~4:不満足 } 顧客満足度 10  モデル  顧客満足度を予測  データセット  顧客のアンケート回答
  • 12.  モデル  フライトの価格決定するモデルを作成し、フライトの価格に対して顧客が購入するかしないかを予測  データセット  フライトチケットの取引記録  問題  フライトチケットの取引記録の中には旅行代理店やコンソリデーターなどの取引なども含まれている。しか し、旅行代理店などは運賃を契約しているため、表示されている価格を支払っていない。  解決策  中立クラスを導入して学習  旅行代理店などの取引記録を除いて学習(旅行代理店などが気になっていた目的地などの情報がなくなってし まい、価格決定に影響を与える) 2値分類で学習 { 購入する、購入しない } Neutral Classを加えて学習 { 購入する、購入しない、旅行代理店など } embeddingの改善方法として 11
  • 13. Neutral classのリフレーミング 12  モデル  ある証券が値上がりするか、値下がりするかを予測  データセット  株式市場のチャート  問題  株式市場の変動が激しいため現在から値下がりする、値上がりするだけでは予測が困難。  解決策  “6か月”という幅を持たせて、5%以上上昇、下降、Neutralの3クラスで学習 2値分類で学習 { 値上がりする、値下がりする } Neutral Classを加えて学習 6か月後に { 5%以上上昇する、5%以上下降する、Neutral }