Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
立命館大学情報理工学部知能情報学科 准教授 谷口忠大@tanichu2012年3月22日 電子情報通信学会総合大会パネルディスカッション
立命館大学 情報理工学部知能情報学科 創発システム研究室自律分散型スマートグリッド・マルチエージェント・強化学習 など
AGENDA1. はじめに2. 電力取引市場への強化学習応用3. 自律分散型スマートグリッドの動態分析4. おわりに
AGENDA1. はじめに2. 電力取引市場への強化学習応用3. 自律分散型スマートグリッドの動態分析4. おわりに
化石燃料から再生可能エネルギーへ~再生可能エネルギーの特徴~• 再生可能エネルギーの特徴(特に太陽光)▫ 地球上に遍在している. 消費する場所のすぐ側で生産できる(地産地消). 地域で規模の小さな発電が可能. 事業者にとって発電の規模の経...
平成15年度NEDO調査報告書(委託先 財団法人 産業創造研究所)「自律分散型電力システムネットワークの可能性調査」より引用現状電力網に再生可能エネルギーが及ぼす混乱・大電力・長距離・一方向・送電ロス・大型集中発電・化石燃料主体・COP3(地球...
平成15年度NEDO調査報告書(委託先 財団法人 産業創造研究所)「自律分散型電力システムネットワークの可能性調査」 より引用ECOnet の提案 [松本 ‘03]Electric Cluster Oriented Network とは? 自...
自律分散型スマートグリッドi-Rene (Inter Intelligent Renewable Energy Network) 系統から基本的には独立し地域のローカル・グリッドを構築する. 再生可能エネルギーによる多様な電源に繋がれる....
地産地消型の電力取引構想 多くの家庭に太陽電池,燃料電池,風力発電などが備え付けられ,各家庭は電力の「消費者」から「発電者」に変わっていく. i-Rene では,「地域で生まれた余剰電力は,地域で売買して,無駄なく相互融通して使いましょう」...
• 地域市場での地産地消の電力取引をリアルタイムで行うことを考える.(株式市場,証券市場のような)• 一般家庭への普及を考えた際には,取引の担い手が居ない.電力の地産地消に向けた地域電力市場と自動取引エージェント(人工知能)の導入自動取引エージ...
自動取引エージェントへの学習機能の追加• 各世帯では住人のニーズや生活パターン,及び備わっている発電,蓄電システムが異なる.• また,何時どれだけの電力を幾らで購入する事が期待できるかは地域毎に異なる.各エージェントが自らの環境・クラスターに適...
AGENDA1. はじめに2. 電力取引市場への強化学習応用3. 自律分散型スマートグリッドの動態分析4. おわりに
電力取引市場への強化学習応用[‘09 谷口]1. 自律分散型スマートグリッドの実現・普及に向け,その電力融通を実現する為の地域電力取引市場についてモデル化2. 上記モデルを強化学習が適用可能な形(MDP)に定式化3. 複数クラスタ間で強化学習に...
自動化地域電力取引市場 地域のローカルグリッドが市場を持つとする. 各世帯の電力ルータから取引条件が個別需要供給曲線の形で出力される. 電力ルータからどのようにして取引条件を出力するかが問題となる.取引条件決済情報強化学習による獲得
Agent(Power routerof minimal cluster)Generation / ConsumptionBatteryWalletMarket(Powerrouterof local cluster)1+t)(hDiAiA1A...
入札曲線の例:Bidding ui 縦軸Pは単位あたりの価格を表す. 個別需要曲線と個別供給曲線を一体的に表現する. 最大売り切る時の価格Pisellと最大買い切る時の価格Pibuyとを決定し線型補完することで個別需要供給曲線を決定できる...
ローカル・クラスターでの電力売買の決済プロセス
 複数の学習主体がいる環境では現在主流となっている単一エージェントの強化学習の前提であるマルコフ決定過程(Markov Decision Process,MDP)の仮定が崩れ、学習が不安定となる. 不完全知覚問題環境の全てを観測できないので...
Natural Actor-Critic [Peters ‘03] 自然方策勾配法の一種であり,Peters et al.によってロボットの学習手法として提案された. 本研究でNACを用いる理由1. 方策勾配法は出力を連続値にする事が容易2...
シミュレーション環境発電消費パターンを正弦波で近似各ミニマルクラスターが自己の電力ロスと停電を最小化しながら,収益を最大化するように学習を行う.この中でn体のエージェントが学習する場合の報酬,所持金,電力ロスの変化を見ていく.流入量igiaib...
-500000-400000-300000-200000-10000001000000 10 20 30 40 50A1A2A3A4A5A6-500000-400000-300000-200000-10000001000000 10 20 30...
-100000-500000500001000000 1000 2000 3000 4000A1A2A3A4A5A6実験結果複数のエージェント全てが学習した場合-500000-400000-300000-200000-1000000100000...
本アプローチの問題点1. Single Agent の強化学習法を適用1. 全体の系がどのような挙動になるのか予測不能.2. 自律分散型スマートグリッドとして,個別の自律分散的な学習により作動する,大域的な制御系がどのような挙動をするのか,明確...
AGENDA1. はじめに2. 電力取引市場への強化学習応用3. 自律分散型スマートグリッドの動態分析4. おわりに
蓄電残量の価値と個別需要供給関数(以下,価格曲線) 個別需要供給関数が蓄電残量に対して一次関数で近似されるとする. 送電・蓄電ロスなしの近似pitfit(p)Simaxst-ltp電力ルータetgeneration,ietcomsumpti...
価格決定のシンプルな表現 重み付き調和平均 市場価格 価格は各エージェントの個別最大価格を各エージェントの域内バッテリーシェアで重み付き調和平均をとり,それに係数として地域電力不足率をかけたものとして得られる.1. 地域で電力が不足すれば...
各エージェントの収益最大化 (1) 各エージェントは自らの収益を最大化するように学習をすすめると考える.(ここでt はT 周期であると考える.) 対数個別最大価格: yit【収益の定義】
各エージェントの収益最大化 (2) 勾配法による最適化のための収益の勾配(gradient)の計算.(バインドが生じない場合) 対数個別最大価格: yit の変化は時刻tとt+1の収益にしか影響を与えない. St+1が時刻tの価格p*tの...
各学習エージェントの自律分散的学習の市場への影響 プライステイカーとしてのエージェントの学習も全体として進めば,徐々に系の価格に影響をあたえる. 市場価格は平準化される方向に動く.
数値実験 (条件1) A=1 系全体では常に足りる状況 (条件2) A=2 系全体で時々,過不足がある, Simaxは全て10, 初期値は5とする.a1,a2 夜型t0 = -2a4,a5 朝型t0 = 2-1.5-1-0.500.5...
02468101112131415161718191101111s0s1s2s3s40123456789101815222936435057647178859299106113120s0s1s2s3s4蓄電残量の変化0123451 3 5 7 ...
対数個別最大価格y(学習器のパラメータ)の変化学習初期 学習後期(条件2)の実験結果-2024681 3 5 7 9 11 13 15 17 19 21 23y0y1y2y3y40123451 3 5 7 9 11 13 15 17 19 21...
0123456789191725334149576573818997105113initend-4-3-2-101231112131415161718191101111initendoptimal 市場価格の変化 負:グリッドからの購入量変...
数値計算結果 各エージェントの収益増大 単体の学習では増大した.全体学習では全体の収益の和は増大して,パレート最適状態になる. 価格形成 バインドが無い場合 ある価格に収束.(対数個別最大価格の初期値に依存) バインドが起こる場合(...
消費の価格弾力性の考慮 追加消費量 追加消費効用1. 「今,電気高いから使わんとこう」2. 「今,安いからガンガン使おう」電力ルータetgeneration,ietcomsumption,ietgeneration,ietcomsumpti...
シミュレーション実験結果の一例Fig. 4: Transition of state of charge in condition(top) before learning (middle) without variable con-sumpt...
変動価格による駆動される自動化地域電力市場の二重最適化プロセス余剰電力融通(市場取引) 消費行動最適化(需要応答) 電力の価格を参照しながら自動取引エージェントが余剰電力の融通を行う. 「損をしない」ように自己利益最大化を目的として,売買す...
AGENDA1. はじめに2. 電力取引市場への強化学習応用3. 自律分散型スマートグリッドの動態分析4. おわりに
自律分散型スマートグリッドi-Reneの研究の現状及び課題 動態分析結果 価格の平準化が生じる . 個々のエージェントの利得最適化行動によって融通をすることで,系外部からの買い入れ量が減少する. 系統の価格設定だけでは電力価格が決定しな...
H23年度~ 文科省・地域イノベーション戦略支援プログラム
Thank you for your listeningNTT出版より発売中「コミュニケーションするロボットは創れるか」Contact me!!taniguchi@ci.ritsumei.ac.jpTwitter: @tanichuFacebo...
Publications 谷口忠大、高木圭太、榊原一紀、西川郁子地産地消型電力ネットワークの為のNatural Actor-Critic を用いた自動取引 エージェントの構築知能と情報(日本知能情報ファジィ学会論文誌), Vol.21 (6)...
電子情報通信学会 2012年総合大会 電力問題へのさまざまなアプローチ「人工知能的アプローチ」 講演資料
電子情報通信学会 2012年総合大会 電力問題へのさまざまなアプローチ「人工知能的アプローチ」 講演資料
Upcoming SlideShare
Loading in …5
×

電子情報通信学会 2012年総合大会 電力問題へのさまざまなアプローチ「人工知能的アプローチ」 講演資料

4,961 views

Published on

電子情報通信学会 2012年総合大会 電力問題へのさまざまなアプローチ「人工知能的アプローチ」 講演資料

パネルディスカッション登壇における,発表資料です.

Published in: Technology
  • Be the first to comment

電子情報通信学会 2012年総合大会 電力問題へのさまざまなアプローチ「人工知能的アプローチ」 講演資料

  1. 1. 立命館大学情報理工学部知能情報学科 准教授 谷口忠大@tanichu2012年3月22日 電子情報通信学会総合大会パネルディスカッション
  2. 2. 立命館大学 情報理工学部知能情報学科 創発システム研究室自律分散型スマートグリッド・マルチエージェント・強化学習 など
  3. 3. AGENDA1. はじめに2. 電力取引市場への強化学習応用3. 自律分散型スマートグリッドの動態分析4. おわりに
  4. 4. AGENDA1. はじめに2. 電力取引市場への強化学習応用3. 自律分散型スマートグリッドの動態分析4. おわりに
  5. 5. 化石燃料から再生可能エネルギーへ~再生可能エネルギーの特徴~• 再生可能エネルギーの特徴(特に太陽光)▫ 地球上に遍在している. 消費する場所のすぐ側で生産できる(地産地消). 地域で規模の小さな発電が可能. 事業者にとって発電の規模の経済が弱い. 小さいソーラーでもメガソーラーでも,比例しかしない. 発電の非定常性・制御不能性 生産できる時間,量を自由にコントロールはできない.(天気,風)再生可能エネルギーの特徴に合った仕組みを考える事が重要
  6. 6. 平成15年度NEDO調査報告書(委託先 財団法人 産業創造研究所)「自律分散型電力システムネットワークの可能性調査」より引用現状電力網に再生可能エネルギーが及ぼす混乱・大電力・長距離・一方向・送電ロス・大型集中発電・化石燃料主体・COP3(地球温暖化)・連鎖停電の危機・非定常発電問題・系統安定化問題・電力品質問題・RPS法・逆潮流問題
  7. 7. 平成15年度NEDO調査報告書(委託先 財団法人 産業創造研究所)「自律分散型電力システムネットワークの可能性調査」 より引用ECOnet の提案 [松本 ‘03]Electric Cluster Oriented Network とは? 自律分散型の電力ネットワーク構想 電力クラスタを相互に結合することで,再生可能エネルギーを分かち合いながら地産地消しようという構想 電力エネルギー版のインターネット※広義にはDCマイクログリッドの一種スマートグリッド??
  8. 8. 自律分散型スマートグリッドi-Rene (Inter Intelligent Renewable Energy Network) 系統から基本的には独立し地域のローカル・グリッドを構築する. 再生可能エネルギーによる多様な電源に繋がれる. 商用電力網(グリッド)に逆潮流は起こさない.足りないとき買うだけ.
  9. 9. 地産地消型の電力取引構想 多くの家庭に太陽電池,燃料電池,風力発電などが備え付けられ,各家庭は電力の「消費者」から「発電者」に変わっていく. i-Rene では,「地域で生まれた余剰電力は,地域で売買して,無駄なく相互融通して使いましょう」という地産地消型の電力取引を余剰電力融通の手法として採用する.地域での自由な個人間電力取引を導入し変動価格での自然な価格調整と効率の良い融通の実現を目指すボトムアップなリアルタイムプライシング?
  10. 10. • 地域市場での地産地消の電力取引をリアルタイムで行うことを考える.(株式市場,証券市場のような)• 一般家庭への普及を考えた際には,取引の担い手が居ない.電力の地産地消に向けた地域電力市場と自動取引エージェント(人工知能)の導入自動取引エージェント(人工知能)によって,各世帯の間での自動取引に基づいた電力融通を目指す.powerrouterpowerrouter
  11. 11. 自動取引エージェントへの学習機能の追加• 各世帯では住人のニーズや生活パターン,及び備わっている発電,蓄電システムが異なる.• また,何時どれだけの電力を幾らで購入する事が期待できるかは地域毎に異なる.各エージェントが自らの環境・クラスターに適応しその諸条件に合った売買戦略を採ることが必要maxjSjAjsminjS
  12. 12. AGENDA1. はじめに2. 電力取引市場への強化学習応用3. 自律分散型スマートグリッドの動態分析4. おわりに
  13. 13. 電力取引市場への強化学習応用[‘09 谷口]1. 自律分散型スマートグリッドの実現・普及に向け,その電力融通を実現する為の地域電力取引市場についてモデル化2. 上記モデルを強化学習が適用可能な形(MDP)に定式化3. 複数クラスタ間で強化学習に基づき電力取引を行うというマルチエージェント強化学習系に於いて適用可能な強化学習則を構築(Natural Actor-Critic法の適用)[論文] 谷口忠大、高木圭太、榊原一紀、西川郁子,「地産地消型電力ネットワークの為のNatural Actor-Critic を用いた自動取引 エージェントの構築」知能と情報(日本知能情報ファジィ学会論文誌) Vol.21 (6), pp. 1078-1091 .(2009)/日本知能情報ファジィ学会20周年記念企画査読あり論文セッション優秀論文発表賞[特許] 発明者 谷口忠大,電力取引管理システム、管理装置、電力取引方法、及び電力取引用コンピュー タプログラム,特願2009-168860 .(2009),出願人 立命館大学日刊工業新聞主催 イノベーション創出コンテスト2009 奨励賞受賞 (2010/2/3) /渡辺三彦発明賞 優秀賞受賞
  14. 14. 自動化地域電力取引市場 地域のローカルグリッドが市場を持つとする. 各世帯の電力ルータから取引条件が個別需要供給曲線の形で出力される. 電力ルータからどのようにして取引条件を出力するかが問題となる.取引条件決済情報強化学習による獲得
  15. 15. Agent(Power routerof minimal cluster)Generation / ConsumptionBatteryWalletMarket(Powerrouterof local cluster)1+t)(hDiAiA1AnuiBiddingmirpirihEi Cisi(Pã)Si(t)電力ルータの意思決定プロセスBattery maxjSjS本研究では ・天候,週単位の行動変化,・送電・蓄電ロス は考慮していない.controllermotorsensorenvironmenttxtutr1+txReinforcement Learning
  16. 16. 入札曲線の例:Bidding ui 縦軸Pは単位あたりの価格を表す. 個別需要曲線と個別供給曲線を一体的に表現する. 最大売り切る時の価格Pisellと最大買い切る時の価格Pibuyとを決定し線型補完することで個別需要供給曲線を決定できる. ベクトルui=(Pisell,Pibuy)の出力で入札曲線の出力に替える事が出来る.
  17. 17. ローカル・クラスターでの電力売買の決済プロセス
  18. 18.  複数の学習主体がいる環境では現在主流となっている単一エージェントの強化学習の前提であるマルコフ決定過程(Markov Decision Process,MDP)の仮定が崩れ、学習が不安定となる. 不完全知覚問題環境の全てを観測できないので状態変数を正しく知覚できない 同時学習問題他の行動主体が学習することで状態遷移確率が時変となる 本研究では強化学習の手法としてこれらの問題に対し強い方策勾配法の一つであるNatural Actor-Critic [Peters‘03]を用いエージェントを構築したマルチエージェント強化学習の問題点
  19. 19. Natural Actor-Critic [Peters ‘03] 自然方策勾配法の一種であり,Peters et al.によってロボットの学習手法として提案された. 本研究でNACを用いる理由1. 方策勾配法は出力を連続値にする事が容易2. 方策勾配法は方策を陽に表現するためにPOMDP環境に強いと言われる3. 方策勾配法に自然勾配を適用した自然方策勾配法の一種であり,より効率がよいと考えられる.4. 自然方策勾配方向を決定する為に計算するアドバンテージ関数をLSTD法により求め安定的に推定可能5. 更新がバッチ的に行われる為,マルチエージェント環境で更新が非同期化され,学習スケジューリングの手法に近い効果が自動的に得られる
  20. 20. シミュレーション環境発電消費パターンを正弦波で近似各ミニマルクラスターが自己の電力ロスと停電を最小化しながら,収益を最大化するように学習を行う.この中でn体のエージェントが学習する場合の報酬,所持金,電力ロスの変化を見ていく.流入量igiaibin:最大振幅:周期ずれ(生活パターンのずれ):発電よりか消費よりかを示す:ある一定の割合(実験では最大振幅の5%)で与えるランダムな値報酬値電力超過、または不足を起こしたときのペナルティこの和が報酬となる2uPselli =1uPbuyi =)(minhSS ii − )(maxhSS ii −0入札曲線PB),( 11 θxf),( 22 θxf
  21. 21. -500000-400000-300000-200000-10000001000000 10 20 30 40 50A1A2A3A4A5A6-500000-400000-300000-200000-10000001000000 10 20 30 40 50A1A2A3A4A5A6実験結果1agent のみ学習する場合一週毎の獲得報酬量の変化上:学習エージェントが存在しない下:A1のみが学習各ミニマルクラスターの所持金変化2550751000 10 20 30 40 50 60 70 80initial2550751000 10 20 30 40 50 60 70 80learned上:学習初期のバッテリー残量変化下:学習終期でのバッテリー残量変化
  22. 22. -100000-500000500001000000 1000 2000 3000 4000A1A2A3A4A5A6実験結果複数のエージェント全てが学習した場合-500000-400000-300000-200000-10000001000000 10 20 30 40 50A1A2A3A4A5A6全エージェントが学習した際の一週毎の獲得報酬量の変化全エージェントが学習した際の各ミニマルクラスターの所持金の変化01002003004000 1 2 3 4 5 6TotalLossNumber of learning agents学習エージェント数毎のローカル・クラスター全体における学習後の電力ロス(横軸は6エージェント中で学習したエージェントの数.縦軸が一日間の電力ロス)
  23. 23. 本アプローチの問題点1. Single Agent の強化学習法を適用1. 全体の系がどのような挙動になるのか予測不能.2. 自律分散型スマートグリッドとして,個別の自律分散的な学習により作動する,大域的な制御系がどのような挙動をするのか,明確にしなければならない.2. 強化学習由来の学習速度の遅さ,不確実さ.【理論上の課題】• 系全体の挙動をトレース可能なモデルが必要• 系全体の安定性を分析可能なモデル• 高速な学習を可能にする学習法
  24. 24. AGENDA1. はじめに2. 電力取引市場への強化学習応用3. 自律分散型スマートグリッドの動態分析4. おわりに
  25. 25. 蓄電残量の価値と個別需要供給関数(以下,価格曲線) 個別需要供給関数が蓄電残量に対して一次関数で近似されるとする. 送電・蓄電ロスなしの近似pitfit(p)Simaxst-ltp電力ルータetgeneration,ietcomsumption,ietgeneration,ietcomsumption,ietcharge,i etdischarge,i一次関数は逆関数を構成しうるので,価格から蓄電残量への関数f(p) は左のように表される.
  26. 26. 価格決定のシンプルな表現 重み付き調和平均 市場価格 価格は各エージェントの個別最大価格を各エージェントの域内バッテリーシェアで重み付き調和平均をとり,それに係数として地域電力不足率をかけたものとして得られる.1. 地域で電力が不足すればするほど価格が高くなる.2. 大きい蓄電池を持っているエージェントの価格への影響力が大きくなる.
  27. 27. 各エージェントの収益最大化 (1) 各エージェントは自らの収益を最大化するように学習をすすめると考える.(ここでt はT 周期であると考える.) 対数個別最大価格: yit【収益の定義】
  28. 28. 各エージェントの収益最大化 (2) 勾配法による最適化のための収益の勾配(gradient)の計算.(バインドが生じない場合) 対数個別最大価格: yit の変化は時刻tとt+1の収益にしか影響を与えない. St+1が時刻tの価格p*tのみにより一意的に決定するため,記憶が生じないため.このほかに不足時,余剰時のバインド処理が必要になるが,本日は省略
  29. 29. 各学習エージェントの自律分散的学習の市場への影響 プライステイカーとしてのエージェントの学習も全体として進めば,徐々に系の価格に影響をあたえる. 市場価格は平準化される方向に動く.
  30. 30. 数値実験 (条件1) A=1 系全体では常に足りる状況 (条件2) A=2 系全体で時々,過不足がある, Simaxは全て10, 初期値は5とする.a1,a2 夜型t0 = -2a4,a5 朝型t0 = 2-1.5-1-0.500.511.51 3 5 7 9 11 13 15 17 19 21 23l0l1l2l3l4a3 不在t0 = -2
  31. 31. 02468101112131415161718191101111s0s1s2s3s40123456789101815222936435057647178859299106113120s0s1s2s3s4蓄電残量の変化0123451 3 5 7 9 11 13 15 17 19 21 23y0y1y2y3y40123451 3 5 7 9 11 13 15 17 19 21 23y0y1y2y3y4対数個別最大価格y(学習器のパラメータ)の変化学習初期 学習後期(条件1)の実験結果
  32. 32. 対数個別最大価格y(学習器のパラメータ)の変化学習初期 学習後期(条件2)の実験結果-2024681 3 5 7 9 11 13 15 17 19 21 23y0y1y2y3y40123451 3 5 7 9 11 13 15 17 19 21 23y0y1y2y3y40246810121112131415161718191101111s0s1s2s3s4 0246810121112131415161718191101111s0s1s2s3s4蓄電残量の変化
  33. 33. 0123456789191725334149576573818997105113initend-4-3-2-101231112131415161718191101111initendoptimal 市場価格の変化 負:グリッドからの購入量変化(正:系の電力無駄量)(条件1)の実験結果 (条件2)の実験結果051015202517131925313743495561677379859197103109115initend-10.00-5.000.005.0010.0011325374961738597109initendoptimal平準化平準化とBang-Bang
  34. 34. 数値計算結果 各エージェントの収益増大 単体の学習では増大した.全体学習では全体の収益の和は増大して,パレート最適状態になる. 価格形成 バインドが無い場合 ある価格に収束.(対数個別最大価格の初期値に依存) バインドが起こる場合(≒電力不足が起こりえる場合) 完全な余剰時を除いてpGに収束. (理由)下方バインド時に価格がpGに向かい,その後に平準化を通して他の時間帯に波及.変動価格ではなく定額制が実現される.
  35. 35. 消費の価格弾力性の考慮 追加消費量 追加消費効用1. 「今,電気高いから使わんとこう」2. 「今,安いからガンガン使おう」電力ルータetgeneration,ietcomsumption,ietgeneration,ietcomsumption,ietcharge,i etdischarge,i効用関数
  36. 36. シミュレーション実験結果の一例Fig. 4: Transition of state of charge in condition(top) before learning (middle) without variable con-sumption model (bottom) with variable consupmtionmodelFig. 2: Effect of variable consupmtion in condition2 (left) without variable consumption model (right)with variable consumption modelFig. 3: Effect of variable consumption on price in con-dition 2 (left) without variable consumption model(right) with variable consumption model学習前電力ルータ学習後住人学習後電力需要量(消費-発電)の変化電力価格の変化(住人の需要応答前後)
  37. 37. 変動価格による駆動される自動化地域電力市場の二重最適化プロセス余剰電力融通(市場取引) 消費行動最適化(需要応答) 電力の価格を参照しながら自動取引エージェントが余剰電力の融通を行う. 「損をしない」ように自己利益最大化を目的として,売買するために,電力の「無駄が生じない」電力融通を実現する. 電力の価格を参照しながら住人が電力消費行動の最適化を行う. 電力価格の安い時に消費をずらし,また,高い時に消費を手控えることで,自己利益最大化を目的として,マクロには需要の平準化に貢献する.Dual Optimization Process in Human-in-the-Loop System using “Market Mechanism”自律分散型制御装置としての市場メカニズムの積極的利用
  38. 38. AGENDA1. はじめに2. 電力取引市場への強化学習応用3. 自律分散型スマートグリッドの動態分析4. おわりに
  39. 39. 自律分散型スマートグリッドi-Reneの研究の現状及び課題 動態分析結果 価格の平準化が生じる . 個々のエージェントの利得最適化行動によって融通をすることで,系外部からの買い入れ量が減少する. 系統の価格設定だけでは電力価格が決定しなくなる. 需要家の消費弾力性により,より柔軟な資源配分が可能になる. 今後の課題 確率的な消費変動や電力ロス・蓄電ロスを考慮したモデル,取引ルールの導出 実際の系での弾力性の推定や予測について方法論の構築 個別エージェントの最適化行動が全体の最適となることの理論的分析と条件の導出 系への参入,撤退,投資に関わる長期的なダイナミクスの分析経済学,機械学習理論,自律分散システム,電力の学際的領域として
  40. 40. H23年度~ 文科省・地域イノベーション戦略支援プログラム
  41. 41. Thank you for your listeningNTT出版より発売中「コミュニケーションするロボットは創れるか」Contact me!!taniguchi@ci.ritsumei.ac.jpTwitter: @tanichuFacebook,Google は実名で検索Special thanks to• 榊原一紀,西川郁子(立命館大学)• 宮崎洸,谷川潤,高木圭太,大仲浩司 (元 立命館大学)Financially Supported by・経産省,JST,文科省
  42. 42. Publications 谷口忠大、高木圭太、榊原一紀、西川郁子地産地消型電力ネットワークの為のNatural Actor-Critic を用いた自動取引 エージェントの構築知能と情報(日本知能情報ファジィ学会論文誌), Vol.21 (6), pp. 1078-1091 .(2009) 谷衛,宮崎洸,谷口忠大自律分散型スマートグリッドにおける適応的電力取引モデルと価格形成分析第21回インテリジェント・システム・シンポジウム FAN 2011, .(2011) 谷衛,谷川潤,谷口忠大変動消費モデルを用いた自律分散型スマートグリッドの動態分析第21回インテリジェント・システム・シンポジウム FAN 2011, .(2011) 谷口忠大, 榊原一紀, 西川郁子自律分散型スマートグリッド上の電力取引に対する自然方策勾配法によるマルチエージェント強化学習の有効性検証第22回自律分散システム・シンポジウム, .(2010) 榊原一紀,前田忠之,谷口忠大,西川郁子太陽光発電の分散型電力ネットワークにおける電力融通最適化第22回自律分散システム・シンポジウム, .(2010) etc.etc.See http://tanichu.com/ or http://www.i-rene.org/

×