Submit Search
Upload
Feature engineering for predictive modeling using reinforcement learning
•
Download as PPTX, PDF
•
0 likes
•
5,621 views
H
harmonylab
Follow
2018年11月1日の論文紹介ゼミの発表です。
Read less
Read more
Technology
Report
Share
Report
Share
1 of 23
Download now
Recommended
Variational Template Machine for Data-to-Text Generation
Variational Template Machine for Data-to-Text Generation
harmonylab
Globally and Locally Consistent Image Completion
Globally and Locally Consistent Image Completion
harmonylab
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
harmonylab
Towards Knowledge-Based Personalized Product Description Generation in E-comm...
Towards Knowledge-Based Personalized Product Description Generation in E-comm...
harmonylab
Can increasing input dimensionality improve deep reinforcement learning?
Can increasing input dimensionality improve deep reinforcement learning?
harmonylab
Trainable Calibration Measures for Neural Networks from Kernel Mean Embeddings
Trainable Calibration Measures for Neural Networks from Kernel Mean Embeddings
harmonylab
Statistical machine learning forecasting methods concerns and ways forward
Statistical machine learning forecasting methods concerns and ways forward
harmonylab
Top-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender System
harmonylab
Recommended
Variational Template Machine for Data-to-Text Generation
Variational Template Machine for Data-to-Text Generation
harmonylab
Globally and Locally Consistent Image Completion
Globally and Locally Consistent Image Completion
harmonylab
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
harmonylab
Towards Knowledge-Based Personalized Product Description Generation in E-comm...
Towards Knowledge-Based Personalized Product Description Generation in E-comm...
harmonylab
Can increasing input dimensionality improve deep reinforcement learning?
Can increasing input dimensionality improve deep reinforcement learning?
harmonylab
Trainable Calibration Measures for Neural Networks from Kernel Mean Embeddings
Trainable Calibration Measures for Neural Networks from Kernel Mean Embeddings
harmonylab
Statistical machine learning forecasting methods concerns and ways forward
Statistical machine learning forecasting methods concerns and ways forward
harmonylab
Top-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender System
harmonylab
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
harmonylab
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
Preferred Networks
2021 09 29_dl_hirata
2021 09 29_dl_hirata
harmonylab
A PID Controller Approach for Stochastic Optimization of Deep Networks
A PID Controller Approach for Stochastic Optimization of Deep Networks
harmonylab
Mutual Mean-Teaching:Pseudo Label Refinery for Unsupervised Domain Adaption o...
Mutual Mean-Teaching:Pseudo Label Refinery for Unsupervised Domain Adaption o...
harmonylab
PredCNN: Predictive Learning with Cascade Convolutions
PredCNN: Predictive Learning with Cascade Convolutions
harmonylab
2019 08 20_dl
2019 08 20_dl
harmonylab
Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...
Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...
harmonylab
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
harmonylab
【DL輪読会】Responsive Safety in Reinforcement Learning by PID Lagrangian Methods...
【DL輪読会】Responsive Safety in Reinforcement Learning by PID Lagrangian Methods...
Deep Learning JP
MultiRec: A Multi-Relational Approach for Unique Item Recommendation in Aucti...
MultiRec: A Multi-Relational Approach for Unique Item Recommendation in Aucti...
harmonylab
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝
Preferred Networks
Real-Time Semantic Stereo Matching
Real-Time Semantic Stereo Matching
harmonylab
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
harmonylab
You Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasks
harmonylab
2020 08 05_dl_DETR
2020 08 05_dl_DETR
harmonylab
Predictron
Predictron
harmonylab
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
harmonylab
Playing Atari with Six Neurons
Playing Atari with Six Neurons
harmonylab
[DL輪読会]マテリアルズインフォマティクスにおける深層学習の応用
[DL輪読会]マテリアルズインフォマティクスにおける深層学習の応用
Deep Learning JP
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
Deep Learning JP
LCCC2010:Learning on Cores, Clusters and Cloudsの解説
LCCC2010:Learning on Cores, Clusters and Cloudsの解説
Preferred Networks
More Related Content
What's hot
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
harmonylab
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
Preferred Networks
2021 09 29_dl_hirata
2021 09 29_dl_hirata
harmonylab
A PID Controller Approach for Stochastic Optimization of Deep Networks
A PID Controller Approach for Stochastic Optimization of Deep Networks
harmonylab
Mutual Mean-Teaching:Pseudo Label Refinery for Unsupervised Domain Adaption o...
Mutual Mean-Teaching:Pseudo Label Refinery for Unsupervised Domain Adaption o...
harmonylab
PredCNN: Predictive Learning with Cascade Convolutions
PredCNN: Predictive Learning with Cascade Convolutions
harmonylab
2019 08 20_dl
2019 08 20_dl
harmonylab
Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...
Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...
harmonylab
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
harmonylab
【DL輪読会】Responsive Safety in Reinforcement Learning by PID Lagrangian Methods...
【DL輪読会】Responsive Safety in Reinforcement Learning by PID Lagrangian Methods...
Deep Learning JP
MultiRec: A Multi-Relational Approach for Unique Item Recommendation in Aucti...
MultiRec: A Multi-Relational Approach for Unique Item Recommendation in Aucti...
harmonylab
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝
Preferred Networks
Real-Time Semantic Stereo Matching
Real-Time Semantic Stereo Matching
harmonylab
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
harmonylab
You Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasks
harmonylab
2020 08 05_dl_DETR
2020 08 05_dl_DETR
harmonylab
Predictron
Predictron
harmonylab
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
harmonylab
Playing Atari with Six Neurons
Playing Atari with Six Neurons
harmonylab
[DL輪読会]マテリアルズインフォマティクスにおける深層学習の応用
[DL輪読会]マテリアルズインフォマティクスにおける深層学習の応用
Deep Learning JP
What's hot
(20)
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
2021 09 29_dl_hirata
2021 09 29_dl_hirata
A PID Controller Approach for Stochastic Optimization of Deep Networks
A PID Controller Approach for Stochastic Optimization of Deep Networks
Mutual Mean-Teaching:Pseudo Label Refinery for Unsupervised Domain Adaption o...
Mutual Mean-Teaching:Pseudo Label Refinery for Unsupervised Domain Adaption o...
PredCNN: Predictive Learning with Cascade Convolutions
PredCNN: Predictive Learning with Cascade Convolutions
2019 08 20_dl
2019 08 20_dl
Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...
Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
【DL輪読会】Responsive Safety in Reinforcement Learning by PID Lagrangian Methods...
【DL輪読会】Responsive Safety in Reinforcement Learning by PID Lagrangian Methods...
MultiRec: A Multi-Relational Approach for Unique Item Recommendation in Aucti...
MultiRec: A Multi-Relational Approach for Unique Item Recommendation in Aucti...
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝
日本ソフトウェア科学会第36回大会発表資料「帰納的プログラミングの初等教育の試み」西澤勇輝
Real-Time Semantic Stereo Matching
Real-Time Semantic Stereo Matching
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
You Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasks
2020 08 05_dl_DETR
2020 08 05_dl_DETR
Predictron
Predictron
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Playing Atari with Six Neurons
Playing Atari with Six Neurons
[DL輪読会]マテリアルズインフォマティクスにおける深層学習の応用
[DL輪読会]マテリアルズインフォマティクスにおける深層学習の応用
Similar to Feature engineering for predictive modeling using reinforcement learning
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
Deep Learning JP
LCCC2010:Learning on Cores, Clusters and Cloudsの解説
LCCC2010:Learning on Cores, Clusters and Cloudsの解説
Preferred Networks
強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習
Eiji Uchibe
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Satoshi Kato
Rainbow: Combining Improvements in Deep Reinforcement Learning (AAAI2018 unde...
Rainbow: Combining Improvements in Deep Reinforcement Learning (AAAI2018 unde...
Toru Fujino
Deep learning勉強会20121214ochi
Deep learning勉強会20121214ochi
Ohsawa Goodfellow
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
Hajime Sasaki
Connecting embedding for knowledge graph entity typing
Connecting embedding for knowledge graph entity typing
禎晃 山崎
分散型強化学習手法の最近の動向と分散計算フレームワークRayによる実装の試み
分散型強化学習手法の最近の動向と分散計算フレームワークRayによる実装の試み
SusumuOTA
LET2011: Rによる教育データ分析入門
LET2011: Rによる教育データ分析入門
Yuichiro Kobayashi
Automated ML (Azure) で始める機械学習の民主化
Automated ML (Azure) で始める機械学習の民主化
Atsushi Yokohama (BEACHSIDE)
Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習
Preferred Networks
Decision Transformer: Reinforcement Learning via Sequence Modeling
Decision Transformer: Reinforcement Learning via Sequence Modeling
Tomoya Oda
ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題
Kenta Oono
Proof summit 2017 for slideshare
Proof summit 2017 for slideshare
Keisuke Yahata
コンピューターの整列処理におけるデータ操作の時間的共起分析
コンピューターの整列処理におけるデータ操作の時間的共起分析
yamahige
iOS_Consortium_20170120
iOS_Consortium_20170120
陽平 山口
北大調和系 DLゼミ A3C
北大調和系 DLゼミ A3C
Tomoya Oda
NIPS KANSAI Reading Group #7: 逆強化学習の行動解析への応用
NIPS KANSAI Reading Group #7: 逆強化学習の行動解析への応用
Eiji Uchibe
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
Deep Learning JP
Similar to Feature engineering for predictive modeling using reinforcement learning
(20)
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
LCCC2010:Learning on Cores, Clusters and Cloudsの解説
LCCC2010:Learning on Cores, Clusters and Cloudsの解説
強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Rainbow: Combining Improvements in Deep Reinforcement Learning (AAAI2018 unde...
Rainbow: Combining Improvements in Deep Reinforcement Learning (AAAI2018 unde...
Deep learning勉強会20121214ochi
Deep learning勉強会20121214ochi
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
Connecting embedding for knowledge graph entity typing
Connecting embedding for knowledge graph entity typing
分散型強化学習手法の最近の動向と分散計算フレームワークRayによる実装の試み
分散型強化学習手法の最近の動向と分散計算フレームワークRayによる実装の試み
LET2011: Rによる教育データ分析入門
LET2011: Rによる教育データ分析入門
Automated ML (Azure) で始める機械学習の民主化
Automated ML (Azure) で始める機械学習の民主化
Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習
Decision Transformer: Reinforcement Learning via Sequence Modeling
Decision Transformer: Reinforcement Learning via Sequence Modeling
ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題
Proof summit 2017 for slideshare
Proof summit 2017 for slideshare
コンピューターの整列処理におけるデータ操作の時間的共起分析
コンピューターの整列処理におけるデータ操作の時間的共起分析
iOS_Consortium_20170120
iOS_Consortium_20170120
北大調和系 DLゼミ A3C
北大調和系 DLゼミ A3C
NIPS KANSAI Reading Group #7: 逆強化学習の行動解析への応用
NIPS KANSAI Reading Group #7: 逆強化学習の行動解析への応用
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
More from harmonylab
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
harmonylab
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
harmonylab
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
harmonylab
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
harmonylab
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
harmonylab
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
harmonylab
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
harmonylab
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
harmonylab
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
harmonylab
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
harmonylab
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
harmonylab
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
harmonylab
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
harmonylab
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
harmonylab
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
harmonylab
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
harmonylab
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
harmonylab
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
harmonylab
More from harmonylab
(20)
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究 千坂知也
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
Recently uploaded
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
Recently uploaded
(8)
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Feature engineering for predictive modeling using reinforcement learning
1.
Feature Engineering for
Predictive Modeling Using Reinforcement Learning Udayan Khurana, Horst Samulowitz, Deepak Turaga 北海道大学大学院情報科学研究科 調和系工学研究室 修士1年 吉田 2018年11月2日 論文紹介ゼミ
2.
紹介する論文 • タイトル – Feature
Engineering for Predictive Modeling Using Reinforcement Learning • 著者 – Udayan Khurana*, Horst Samulowitz*, Deepak Turaga* – *IBM Research AI • 学会 – AAAI2018 • 概要 – 強化学習によるFeature Engineering – 多数のデータセットで既存手法を超える精度 1
3.
Feature Engineering(FE) • 予測分析は様々な分野で意思決定のサポートに用いられる •
データの表現方法(特徴量)は予測モデルの性能向上に重要 – 大抵の場合、モデル構築前に適切なデータ変換が必要(Feature Engneering) 2 縦軸:x 縦軸:sin(0.32x)
4.
Feature Engineering(FE) • 勘、直感、試行錯誤によって人力で行われる –
時間がかかる – FEの自動化は計算コスト的にも難しい • 変換の合成によって考え得る特徴の数は無限 • 新しい特徴の効果を確認するには、新しいモデルの学習検証が必要 • 既存の自動FE – 計算コストが高い – 複雑な特徴を発見する能力が不足 • 強化学習による自動FEアプローチを提案 3
5.
提案手法 • 特定の予算内で有用なFEを探索 • 探索はtransformation-graphで実行 •
探索の方策を強化学習(Q学習)によって学習 4 Transformation-graph
6.
Transformation-graph • 有向非循環グラフ 5 ルートノード𝐷0 (元データ FE無し)
7.
Transformation-graph • 有向非循環グラフ 6 各エッジは変換を表す 各ノードはデータセットを表す 𝐷0 ⊆
𝐷3
8.
探索アルゴリズム 7
9.
探索アルゴリズム 8 𝐷:データセット 𝐺:グラフ 𝑛:ノード 𝑡:変換 𝜃(𝐺):グラフ𝐺の全ノード 𝜆 𝐷𝑖, 𝐷𝑗
:𝐷𝑗 → 𝐷𝑖の変換𝑡
10.
探索アルゴリズム 9 推定報酬𝑅が最大となる𝑛, 𝑡を選択 𝑅 𝐺𝑖,
𝑛, 𝑡, 𝑏 𝑟𝑎𝑡𝑖𝑜 行動(どのノード𝑛にどの変換𝑡を適用 するか)の相対的重要度を定義
11.
探索アルゴリズム • 推定報酬𝑅の設定によって探索の戦略を決定 – Q学習によって𝑅を学習 •
シンプルな探索戦略は人手で作れる – 深さ優先探索 – 幅優先探索 – Cognito (同じ著者の先行研究、実験で比較) • Khurana, U.; Turaga, D.; Samulowitz, H.; and Parthasarathy, S. 2016b. Cognito: Automated feature engineering for supervised learning. In Proceedings of the IEEE 16th International Conference on Data Mining Workshops 1304–1307. – シンプルな探索戦略は特定の状況では適切に機能するが、 様々な状況下で機能する統一戦略を人手で行うのは困難 10
12.
𝑅を決定する要素 1. ノード𝑛の精度 – ノードの精度が高いほどそのノードからの探索が促進される 2.
変換𝑡の𝐺𝑖までの平均即時報酬 3. 変換𝑡がルートノードからノード𝑛までに適用された回数 4. ノード𝑛とその親の精度の利得 5. ノードの深さ – 変換シーケンスの相対的な複雑さにペナルティをかけるために使用 6. 𝐺𝑖までに使った予算の割合(𝑏 𝑟𝑎𝑡𝑖𝑜 = 𝑖 𝐵 𝑚𝑎𝑥 ) 7. ノード𝑛の特徴数の元のデータセットに対する比 – どれだけ増えたか 8. 変換が特徴選択かどうか 9. データセットに数値特徴、日時特徴、文字列特徴、などが含まれているか どうか 11
13.
Q-Learning with Function
Approximation • ステップ𝑖 – 行動(ノードに変換を適用)により新しいノード𝑛𝑖が生成される – モデルの訓練テスト • 精度𝐴(𝑛𝑖)となる新しいデータセットが得られる • 各ステップでの即時報酬 – 𝑟𝑖 = max 𝑛′∈𝜃(𝐺 𝑖+1) 𝐴 𝑛′ − max 𝑛∈𝜃(𝐺 𝑖) 𝐴(𝑛) • 𝑟0 = 0 • 状態𝑠𝑖からの累積報酬 – 𝑅 𝑠𝑖 = 𝑗=0 𝐵 𝑚𝑎𝑥 𝛾 𝑖 𝑟𝑖+𝑗 • 𝑠𝑖:グラフ𝐺𝑖と残り予算𝑏 𝑟𝑎𝑡𝑖𝑜 • 𝛾 ∈ [0,1):割引率 • 目的 – 累積報酬𝑅 𝑠𝑖 を最大にする方策Π∗ を見つける 12
14.
Q-Learning with Function
Approximation • Q学習 – 方策Πの𝑄関数 • 𝑄 𝑠, 𝑐 = 𝑟 𝑠, 𝑐 + 𝛾𝑅Π (𝛿 𝑠, 𝑐 ) – 𝛿: 𝑆 × 𝐶 → 𝑆 仮想遷移関数 – 最適方策 Π∗(𝑠) = argmax 𝑐 |𝑄(𝑠, 𝑐)| • 𝑆のサイズを考えると𝑄関数を直接学習することは不可能 • 線型結合による近似 – 𝑄 𝑠, 𝑐 = 𝑤 𝑐 𝑓(𝑠) • 𝑤 𝑐:行動𝑐の重みベクトル • 𝑓 𝑠 = 𝑓(𝑔, 𝑛, 𝑡, 𝑏) – 状態と残りの予算比率のベクトル 13
15.
Q-Learning with Function
Approximation • Q関数の線型結合による近似 – 𝑄 𝑠, 𝑐 = 𝑤 𝑐 𝑓(𝑠) • 𝑤 𝑐の更新ルール – 𝑤 𝑐 𝑗 ← 𝑤 𝑐 𝑗 + 𝛼 𝑟𝑗 + 𝛾 max 𝑛′,𝑡′ 𝑄 𝑔′, 𝑐′ − 𝑄 𝑔, 𝑐 𝑓(𝑔, 𝑏) • 𝑔′:ステップ𝑗 + 1のグラフ • 𝛼:学習率 – この証明 • Irodova, M., and Sloan, R. H. 2005. Reinforcement learning and function approximation. In FLAIRS Conference, 455–460. 14
16.
実験(学習:方策) • 48のデータセットを使用(テストデータセットとの重複無し) • 予算 –
異なる予算を各データセットにランダムな順番で使用 • 𝐵 𝑚𝑎𝑥 ∈ {25, 50, 75,100,150,200,300,500} • 割引率 – 𝛾 = 0.99 • 学習率 – 𝛼 = 0.05 • 重みベクトル𝑤 𝑐 – 12次元 – 1で初期化 • 𝜀-greedy法 – 𝜀 = 0.15 15 • 変換
17.
実験 • 48のデータセットに対してテスト – 5つFEを比較 •
Base dataset – 元データ(FE無し) • 提案手法(𝑅𝐿1) – 𝐵 𝑚𝑎𝑥 = 100 • Expansion-reduction – 全ての変換を別々に適用 → 特徴選択 • Random – ランダムな特徴にランダムに変換関数を適用 ×100 • Tree-Heur – Khurana, U.; Turaga, D.; Samulowitz, H.; and Parthasarathy, S. 2016b. Cognito: Automated feature engineering for supervised learning. In Proceedings of the IEEE 16th International Conference on Data Mining Workshops 1304–1307. – 学習アルゴリズム • Random Forestを使用 – ハイパーパラメータはBase datasetをもとに決定したものを使用 16
18.
実験結果 17 スペースがないため、48の内24表示
19.
実験結果 18 分類問題(C) • 1 -
Relative Absolute Error 回帰問題(R) • F-Score どちらも高い方が良い
20.
実験結果 19 提案手法は殆どのデータセットに対して優れた性能を示した
21.
実験結果 • 誤差 – 48のデータセットに対して提案手法は誤差を24.6%(中央値)削減した •
実行時間 – 提案手法(100node)はBikeshare DCで4分40秒 • BikeshareDC – Row:10886 – Features:11 • Single thread on a 2.8GHz processor – 提案手法とRandam,Tree-Heurは大体同じ時間(全データセット) – Expand-reduceは提案手法の0.1倍~0.9倍 20
22.
高さ制約の比較 • 𝐵 𝑚𝑎𝑥
= 100 21 ℎ 𝑚𝑎𝑥 = 4で最大精度のノードを発見 ℎ 𝑚𝑎𝑥 = 6で精度が劣化(Openml_620) → 予算𝐵 𝑚𝑎𝑥が不足 グラフの高さℎ • ルートノードとの距離
23.
まとめ • Feature Engineeringを効率的に行うための新しい手法を提 案 –
要点 • 特徴空間を列挙するtransformation graph • 強化学習ベースの探索 – 様々なデータセットでエラー率を大幅に削減(中央値で25%) • 今後の展望 – 状態変数の非線形モデリング – 欠損値の補間、モデル選択への応用 – 最適な特徴は学習アルゴリズムに依存するので、FEと学習アルゴリズ ム選択の共同最適化 22
Download now