SlideShare a Scribd company logo
1 of 13
ビジネスアイディアを考えるときに
押さえておきたい機械学習4種類
回帰・分類・クラスタリング・強化学習
自己紹介
● 名前: 西岡 賢一郎
● 経歴:
○ 鹿児島出身
○ ラ・サール → 東京大学
○ 東京大学大学院在籍中に研究者仲間とトライディアを創業
○ トライディアを6年ほど経営したのち売却し、別会社のCTOとして現在働く
● その他
○ 博士 (学術)
○ 趣味は筋トレや旅行
今回の内容
● 対象者
○ ビジネスに機械学習を活かしたいと考えている人
○ 機械学習ができることの概要を知りたい人
● 内容
○ ビジネスでよく使われる4つの種類の機械学習について簡単に説明
○ 網羅的アルゴリズムを紹介するものではありません
機械学習手法の分類
Supervised Learning
(教師あり学習)
Unsupervised Learning
(教師なし学習)
Reinforcement Learning
(強化学習)
● 正解を与えて学習
○ Regression (回帰) : 連続値を予測
○ Classification (分類) : クラスラベルを予測
● 正解を与えず学習
○ Clustering : 入力データの構造や特徴をつかむ
● 目的とする報酬 (スコア) を最大化するための行動を
学習
1. Regression (回帰)
● 連続値の目的変数を予測
(例) 線形回帰
● その他の手法
○ Ridge回帰, 回帰木, ...
x1
y
y = w0 + w1*x1
→ 回帰式
x1
y
x
予測値
回帰式を用いて、
未知のデータに対する
予測値を算出
Regressionを使った例
● 投資タイミングのサポートサービス (SMBC日興証券)
○ https://www.smbcnikko.co.jp/products/stock/aimonitoring/index.html
○ 株価、市況データを学習し、国内上場企業の1週間先の株価(トレンド)を予測
○ 銘柄ごとに自動でモデルを作成
○ 高度な知識と分析がAIによって標準化
● 需要予測自動発注システムを全店舗に導入 (ライフコーポレーション)
○ https://ledge.ai/lifecorp-unisys/
○ 販売実績、気象情報、企画情報などを用いて各店舗の日々の商品発注数を予測
○ これにより発注業務を年間約15万時間削減
2. Classification (分類)
● 離散の目的変数 (クラスラベル) を予測
(例) SVM (サポートベクターマシン)
● その他の手法
○ ロジスティック回帰, 決定木, ...
x1
x2
y=0
y=1
分類境界 (判別関数)
を定める
x1
x2
y=0
y=1
判別関数を用いて
未知のデータの
クラスを決定
Classificationを使った例
● 健康診断データから6年先の生活習慣病のリスクを予測 (東芝デジタルソリュ
ーションズ株式会社)
○ https://robotstart.info/2020/07/13/ai-disease-risk-prediction.html
○ 1年分の健康診断データから生活習慣病リスクを予測
○ モデル: ランダムフォレスト
■ 複数の決定木の結果を元に多数決をとる手法
○ 検査異常値となる確率を出力
○ 3年以内の糖尿病発症リスクの予測精度96%を達成
● 入力データにある構造や特徴をつかむ (教師なし)
(例) k-means法
● その他の手法
○ ウォード法, 群平均法, ...
3. Clustering
x1
x2
x1
x2
3つのクラスタに分けたい
(事前にクラスタ数を指定) 類似データを
グループ化
Clusteringを使った例
● 大量テキストデータの自動仕分け (Studio Ousia)
○ https://ledge.ai/2020-04-28-9387369535ea7e096ca449/
○ AIの学習データ作成にかかる手間を大幅に削減
○ テキストデータのアノテーション(感情や内容など)を自動化
○ 自然言語処理を用いたAIモデルのためのデータセット作成時間を削減できる
○ アンケートの仕分けにも利用可能
4. 強化学習
● 行動を学習する仕組み
● ある環境下で、目的とする報酬 (スコア) を最大化したい
(例) 迷路の探索
環境
エージェン
ト
状態 + 報酬
行動
環境: 迷路の構造
エージェント: プレイヤー
行動: 上下左右どちらに動くか
状態: 今いるマス
報酬: ゴールすると+1, 壁に当たると-1
ゴールまでの最短経路を見つけたい
→ 得られる報酬の期待値の最大化
強化学習
● バンディットアルゴリズムによるサービスの最適化 (楽天)
○ https://www.slideshare.net/rakutentech/ai-82497123
○ クーポン配信、Webページレイアウト、パーソナライズされた広告を最適化
○ CVR、成約率の向上
○ 機会損失を減らし、早期利益実現につなげた
● A/Bテストとの違い
○ A/Bテストは最適な選択肢を見つけることが目的
○ バンディットアルゴリズムは特定の期間での利益を最大化する
ECサイト ユーザー
方針 + 利益
購買行動
まとめ
● ビジネスアイディアを考えるときに押さえておきたい機械学習4種類
○ Regression: 価格の予測など数値データを予測するときに使います。
○ Classification: ユーザ属性などラベルを予測するときに使います。
○ Clustering: データを似たものに分けるときに使います。
○ 強化学習: 自動的に報酬を最大化するときに使います。
● 今回紹介した内容は、機械学習の使用例の一部です。しかし、ビジネスで機
械学習を活用を検討するための第一歩として使える知識となっていると思い
ます。

More Related Content

More from 西岡 賢一郎

Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用するAmazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する西岡 賢一郎
 
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化するAmazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する西岡 賢一郎
 
Amazon SageMakerのNotebookからJobを作成する
Amazon SageMakerのNotebookからJobを作成するAmazon SageMakerのNotebookからJobを作成する
Amazon SageMakerのNotebookからJobを作成する西岡 賢一郎
 
リモートワークで知っておきたい コミュニケーション時の過大な期待
リモートワークで知っておきたい コミュニケーション時の過大な期待リモートワークで知っておきたい コミュニケーション時の過大な期待
リモートワークで知っておきたい コミュニケーション時の過大な期待西岡 賢一郎
 
リモートワークで意識すべき7つのこと
リモートワークで意識すべき7つのことリモートワークで意識すべき7つのこと
リモートワークで意識すべき7つのこと西岡 賢一郎
 
Amazon SageMaker ML Governance 3つの機能紹介
Amazon SageMaker ML Governance 3つの機能紹介Amazon SageMaker ML Governance 3つの機能紹介
Amazon SageMaker ML Governance 3つの機能紹介西岡 賢一郎
 
Feature StoreのOnline StoreとOffline Storeの違いについて理解する
Feature StoreのOnline StoreとOffline Storeの違いについて理解するFeature StoreのOnline StoreとOffline Storeの違いについて理解する
Feature StoreのOnline StoreとOffline Storeの違いについて理解する西岡 賢一郎
 
機械学習の特徴量を管理するAmazon SageMaker Feature Store
機械学習の特徴量を管理するAmazon SageMaker Feature Store機械学習の特徴量を管理するAmazon SageMaker Feature Store
機械学習の特徴量を管理するAmazon SageMaker Feature Store西岡 賢一郎
 
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで西岡 賢一郎
 
Amazon SageMakerでカスタムコンテナを使った学習
Amazon SageMakerでカスタムコンテナを使った学習Amazon SageMakerでカスタムコンテナを使った学習
Amazon SageMakerでカスタムコンテナを使った学習西岡 賢一郎
 
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成西岡 賢一郎
 
Amazon AthenaでSageMakerを使った推論
Amazon AthenaでSageMakerを使った推論Amazon AthenaでSageMakerを使った推論
Amazon AthenaでSageMakerを使った推論西岡 賢一郎
 
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析西岡 賢一郎
 
TorchDataチュートリアル解説
TorchDataチュートリアル解説TorchDataチュートリアル解説
TorchDataチュートリアル解説西岡 賢一郎
 
Amazon SageMaker JumpStart
Amazon SageMaker JumpStartAmazon SageMaker JumpStart
Amazon SageMaker JumpStart西岡 賢一郎
 
Amazon SageMaker Studio Lab紹介
Amazon SageMaker Studio Lab紹介Amazon SageMaker Studio Lab紹介
Amazon SageMaker Studio Lab紹介西岡 賢一郎
 
Amazon SageMaker Canvasを使ったノーコード機械学習
Amazon SageMaker Canvasを使ったノーコード機械学習Amazon SageMaker Canvasを使ったノーコード機械学習
Amazon SageMaker Canvasを使ったノーコード機械学習西岡 賢一郎
 
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきことPMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと西岡 賢一郎
 
H2O Waveを使ったAIアプリケーション作成入門
H2O Waveを使ったAIアプリケーション作成入門H2O Waveを使ったAIアプリケーション作成入門
H2O Waveを使ったAIアプリケーション作成入門西岡 賢一郎
 

More from 西岡 賢一郎 (20)

Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用するAmazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
 
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化するAmazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
 
Amazon SageMakerのNotebookからJobを作成する
Amazon SageMakerのNotebookからJobを作成するAmazon SageMakerのNotebookからJobを作成する
Amazon SageMakerのNotebookからJobを作成する
 
リモートワークで知っておきたい コミュニケーション時の過大な期待
リモートワークで知っておきたい コミュニケーション時の過大な期待リモートワークで知っておきたい コミュニケーション時の過大な期待
リモートワークで知っておきたい コミュニケーション時の過大な期待
 
リモートワークで意識すべき7つのこと
リモートワークで意識すべき7つのことリモートワークで意識すべき7つのこと
リモートワークで意識すべき7つのこと
 
Amazon SageMaker ML Governance 3つの機能紹介
Amazon SageMaker ML Governance 3つの機能紹介Amazon SageMaker ML Governance 3つの機能紹介
Amazon SageMaker ML Governance 3つの機能紹介
 
Feature StoreのOnline StoreとOffline Storeの違いについて理解する
Feature StoreのOnline StoreとOffline Storeの違いについて理解するFeature StoreのOnline StoreとOffline Storeの違いについて理解する
Feature StoreのOnline StoreとOffline Storeの違いについて理解する
 
機械学習の特徴量を管理するAmazon SageMaker Feature Store
機械学習の特徴量を管理するAmazon SageMaker Feature Store機械学習の特徴量を管理するAmazon SageMaker Feature Store
機械学習の特徴量を管理するAmazon SageMaker Feature Store
 
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
 
Amazon SageMakerでカスタムコンテナを使った学習
Amazon SageMakerでカスタムコンテナを使った学習Amazon SageMakerでカスタムコンテナを使った学習
Amazon SageMakerでカスタムコンテナを使った学習
 
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
 
Amazon AthenaでSageMakerを使った推論
Amazon AthenaでSageMakerを使った推論Amazon AthenaでSageMakerを使った推論
Amazon AthenaでSageMakerを使った推論
 
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
 
未来のカタチ x AI
未来のカタチ x AI未来のカタチ x AI
未来のカタチ x AI
 
TorchDataチュートリアル解説
TorchDataチュートリアル解説TorchDataチュートリアル解説
TorchDataチュートリアル解説
 
Amazon SageMaker JumpStart
Amazon SageMaker JumpStartAmazon SageMaker JumpStart
Amazon SageMaker JumpStart
 
Amazon SageMaker Studio Lab紹介
Amazon SageMaker Studio Lab紹介Amazon SageMaker Studio Lab紹介
Amazon SageMaker Studio Lab紹介
 
Amazon SageMaker Canvasを使ったノーコード機械学習
Amazon SageMaker Canvasを使ったノーコード機械学習Amazon SageMaker Canvasを使ったノーコード機械学習
Amazon SageMaker Canvasを使ったノーコード機械学習
 
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきことPMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
 
H2O Waveを使ったAIアプリケーション作成入門
H2O Waveを使ったAIアプリケーション作成入門H2O Waveを使ったAIアプリケーション作成入門
H2O Waveを使ったAIアプリケーション作成入門
 

Recently uploaded

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 

Recently uploaded (8)

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 

ビジネスアイディアを考えるときに 押さえておきたい機械学習4種類

Editor's Notes

  1. 今回はビジネスアイディアを考えるときに押さえておきたい機械学習4種類というテーマでお話しします。
  2. これが簡単な僕のプロフィールです。 このチャンネルではスタートアップや開発や解析の話をしていきます。 興味がありましたらチャンネル登録をよろしくお願いします。
  3. それでは、今回の内容です。 今回は、機械学習やAIの専門家ではない人向けに、機械学習やAIというものがビジネスにどのようにいかせるかを簡単に解説します。 機械学習ができることをざっくりと知りたい人にも役立つ内容となっていると思います。 機械学習4種類の手法について解説をするのですが、概要だけで詳細については解説しません。 要望があれば今後の動画でそれぞれの詳細について解説していきます。 あくまでもざっくりと知ることを目的としているので、専門知識がない方でも分かるようできる限り簡単に解説していこうと思います。 それでは、本題に入っていきましょう。
  4. 機械学習でまずおさえておきたいのは、教師あり学習と教師なし学習と強化学習という3つの分類です。 専門家でなければ、大きく3種類に分けられるんだぐらいを知っておけば十分です。 正確には半教師あり学習などもありますが、今回はビジネス活用第一歩の知識の紹介がメインとなるため割愛します。 教師あり学習は正解データを与える機械学習で、RegressionとClassificationがあります。 Regressionでは具体的な数値を予測し、Classificationでは、ラベルを予測していきます。 教師なし学習は、正解データを与えない機械学習です。 Clusteringがよく使われていて、似た特徴のものをクラスターとして分けます。 強化学習は、特定の報酬を最大化するための学習となっています。 強化学習は、ビジネスへの活用というよりもコンピューター囲碁などゲームの世界などでよく使われています。 この動画では、教師あり学習からRegressionとClustering, 教師なし学習からClustering, 最後に強化学習は強化学習自体の概要についてお話しします。 1個1個の説明は1分もかからないぐらい圧縮して解説するつもりです。 まずは概要を知るという意識で、気軽に見てください。 それでは、一つ一つの説明に入っていきます。
  5. まずはRegressionの説明をします。 日本語では回帰とか回帰分析とか呼ばれたりもします。 主に連続値の目的変数を予測していくもので、データの大小を予測したい場合に使っていきます。 明日の株価であったりとか、来月の売上であったりとか、数値を予測するものだと覚えておきましょう。
  6. Regressionを活用した例としては、SMBC日興証券で国内上場企業の一週間先の株価を予測するサービスが有るようです。 株価予測などは典型的なRegressionの例ではあるのですが、予測がかなり難しいと言われているものではあるので、どの程度の予測ができるのか気になるところですね。 Regressionの別の活用事例として、ライフコーポレーションでは、需要を予測し自動的に発注するシステムを使用しているようです。 発注業務を1年間で15万時間も削減したようですね。 株価見守りサービス https://www.smbcnikko.co.jp/products/stock/aimonitoring/index.html ライフ https://ledge.ai/lifecorp-unisys/
  7. 次にClassificationについて説明します。Classificationは日本語では分類と呼んだりもします。 Classificationでは、離散の目的変数を予測します。 離散の目的変数と聞いて何のことやらと思う人も多いと思うのですが、データに対してラベルがついているのを考えてもらうといいと思います。 例えば、男と女であったりとか、スパムメールかどうかなどもラベルになります。 また、画像認識で写っているものが何であるかを判別するのも、ラベルを予測していると言えます。 AIが何かを判別してくれるというような話はClassificationを指していることが多いです。
  8. Classificationを使った例として、東芝デジタルソリューションズが健康診断データから生活習慣病のリスクを予測したものがありました。 医療系の予測などでClassificationで見かけることが多いですね。 この予測では糖尿病発症リスクの予測精度96%を達成したということです。 https://www.toshiba.co.jp/tech/ai/catalog004.htm https://robotstart.info/2020/07/13/ai-disease-risk-prediction.html
  9. 次は、教師なし学習のClusteringについて説明します。 Clusteringは正解データなどがなく、データから構造や特徴を抽出していきます。 特定のルールに基づいて似たようなデータを集めてクラスターに分けていくイメージですね。 Clusteringには正解がないため、正しく分けられているかどうかの定義が難しいです。 分けられたクラスタを見て、どんなクラスタなのかを人間が解釈していく必要があったりします。 ビジネスにおいては、クラスタを厳密な定義でわけるというよりも、人間が解釈できることを目的として分けることも多いです。 特に、傾向を見たいときに、クラスタで分ける前のデータの統計値見るだけではなく、クラスタに分けた後のデータの統計値を見ることで知見を得やすくなったりします。
  10. Clusteringの例としては、Studio Ousiaがテキストデータを自動で仕分けしてくれるサービスを提供しているようです。 AIの学習データ作成にかかる手間を大幅に削減できるようですね。 人手がかかる部分を機械学習を使って簡略化するというのも、よく見かける機械学習の応用です。 データセットが玉石混交となっている場合などには、Clusteringでデータを分けることを検討してみるといいと思います。 https://ledge.ai/2020-04-28-9387369535ea7e096ca449/
  11. 最後に強化学習について説明します。 強化学習は報酬を最大化するための学習をします。 抽象的な話でわかりにくいと思うのですが、自ら最適な行動を探し出すために、機械が賢くなっていくイメージです。 次の行動として複数の選択肢があるときに、どの行動を取ればよい結果が得られるかというような問題に対応していくために使われています。 迷路の探索や、将棋や囲碁などで強いAIを作るときなどに利用されています。
  12. 強化学習の例としては、楽天がバンディットアルゴリズムによるサービスの最適化をやっているようです。 クーポン配信やWebページレイアウトやパーソナライズされた広告をバンディットアルゴリズムで最適化し、Conversion Rateの向上をしたようです。 A/Bテストと比べて早期利益を可能にできるところがバンディットアルゴリズムの利点のようですね。 強化学習をやっていくためには、トライして学習することが必要となります。 そのため、実際のサービスで大量のトライをすることができる環境が必要となってきます。 囲碁や将棋のように機械同士で戦わせてるのと違い、実サービスでトライできる回数はそこまで多くないため、その点で使いにくい部分かもしれません。 しかし、多くのトライをできるサービスを運用しているのであれば、機械による最適化を期待することができます。 https://www.slideshare.net/rakutentech/ai-82497123
  13. それでは、今回のまとめです。 ビジネスアイディアを考えるときに押さえておきたい機械学習4種類を紹介しました。 Regressionは、価格の予測など数値データを予測するときなどに使えます。 Classificationは、ユーザ属性などラベルを予測するときなどに使えます。 Clusteringはデータをにたものに分けるときなどに使えます。 強化学習は、自動的に報酬を最大化する仕組みを作るときに使えます。 今回紹介した内容は機械学習の全てではありません。 しかし、ビジネスにおいて機械学習の活用を検討するときに必要となるスキルとなっています。 機械学習をビジネス活用したい人と考えている人のお役に立てれば幸いです。 このチャンネルでは、開発や解析の基本的な話やスタートアップの話をしていきます。 今回の動画がもしためになりましたら、高評価とチャンネル登録をよろしくお願いいたします。