エージェントベースシミュレーションの
 廃棄物処理システムへの適用
Agent-based Simulation of Waste Disposal System


           北海道大学 工学部 情報工学科
           複雑系工学講座 調和系工学研究室
                       吉本 拓矢
背景
    「持続可能な発展(Sustainable Development)※」の実現に向け
         「廃棄物の処理システム」は重要なトピック
•   廃棄物処理システム
    – 処理者の行動や環境・経済活動への影響を含めた廃棄物の処理系

       かつての主目的              現在の要求
         •公衆衛生の向上             •環境負荷の減少
         •廃棄物の体積縮小            •資源消費の減少

     考慮すべき特徴
     • 処理をしてすぐには影響が出ない(時間遅れ)
       – 温室効果ガスなどの発生・対策
     • 処理の影響が非線形に現れる
       – 二酸化炭素を10倍排出した時に,影響が10倍であるとは限らない

    廃棄物処理システムの要素や特徴が,
    系全体の振舞いに対してどのように影響しているか明らかではない
目的
廃棄物処理システムについて,
 – 処理者の行動
 – 時間遅れで影響が現れる
 – 非線形な影響
 といった要素・特徴と全体の振舞いとの関係に
 焦点を当て,モデル化・分析を行う

    具体的には,上記の要素・特徴を踏まえた問題を提案し,
    モデル化・分析を行う
廃棄物処理システムについての問題モデル
   社会的ジレンマを含んだモデルである“The Lake ”を基とした      ※


       N個の工場と1つの湖からなる問題モデル
                                     ※[L.S.Shapley et al. 1969]

            工場が知覚できるのはUP(t)のみ
      取水                                  影響の大きさは
   (浄化して利用                                 LP(t)に比例
   →コスト発生)             取水場所UP(t)
                                         一定確率で影響
(実際はN個)
汚水発生                流れ込み           潜在的な汚染LP(t)
                                       蓄積    自然浄化
          コスト有り・汚染無し
 戦略                    排水場所OP(t)    拡散     LP(t)が上昇すると
   • 浄化排水                                     浄化力低下
   • 非浄化排水
                            LP(t)による影響は
          コスト無し・汚染有り      すぐにはUP(t)に現れない
ABSの適用と検討事項
   行動主体を含んだ問題のモデル化を行うために
    エージェントベースシミュレーション(ABS)
        によるアプローチを考える

            時間遅れ・非線形な事象を全て
            エージェントの行動ルールの記述から
            ボトムアップ的に構築するのは難しい

環境への影響などはトップダウン的なアプローチで
表現した方が効果的
   ⇒システムダイナミックス(SD)を併せて用いる

 SDとABSの結合に関する関連研究
   –エージェントの意思決定のプロセスをSDによってモデル化[Schieritz et al. 2003]
   –Consumerの意思決定プロセスを心理学に基づいてモデル化し,
    その振る舞いを考察する際に環境としてSDを導入[Jager 2001]
システムダイナミックス(SD)とは
   システムが持つ要素や各要素間の構造の記述から
 全体の振舞いを明らかにするモデル化・シミュレーション手法

 ⇒対象が広範囲に渡る非線形なシステムを考えるのに有効
 •   システムの要素は
      – 蓄積(ストック)
      – 蓄積の変化量(フロー)
      – 外部からの影響・補助変数・定数 (コンバータ)
 •   システム内の要素間の相互作用(フィードバック)を定義
     (定義には数式を用いる(固定的))




フィードバックの定義例
  コンバータ1=
       (コンバータ2−ストック)/コンバータ2
問題のモデル化
  • 工場(エージェント)                            α:操業利得(=200)
                                          B:排水時浄化コスト(=100)
                              利得            汚水放出
           浄化排水          α- B - UP(t-1)       0
          非浄化排水            α - UP(t-1)         10


  • 湖(環境:SDによりモデル化)                            t:ステップ数
• OP(t) = OP(t-1) + (工場からの汚水の和) – (拡散量)        (取水・排水で1ステップ)

• LP(t) = LP(t-1) + (拡散量) – (自然浄化)                        影響(5%)
           OP(t-1)                95%                            自然浄化
• UP(t) =                                       取水場所UP(t)
           OP(t-1) + 0.6*LP(t-1) 5%

(自然浄化) =
                max[LP(t-1), 3.5] LP(t-1) ≦100     流れ込み 潜在的汚染LP(t)
                1.75              LP(t-1) > 100
                                                排水場所OP(t)  拡散
(拡散量) = max[OP(t-1), 5.0]
シミュレーションによるモデル分析
• 実験の目的
 – 提案したモデルにおいて,
   実際にシミュレーションを行うことで,
    • エージェントの戦略に対する利得・環境の変化
    • 複数のエージェントが自己の利得を追求して戦
      略を決定した場合,どのような振舞いをするか
   について考察する
• 目的と設定
                               実験1
        – 浄化排水を行う割合(浄化割合)による影響について考察
        – 工場数・・・1つ
        – 戦略選択規則・・・ランダム(浄化割合が100%,90%,60%,50%の4種)
    250000                                                 50%,60%では
                 90%                                      次第に利得が減少
                        100%
利
得                                           10000
                               60%          潜
和                                                              50%
                                              在
                                                的
                                                  な                    60%
       0
                       50%                          汚
                                                      染
                                                              100%   90%

                                            LP
-100000                                           0
             0                       3500             0                    3500
                   ステップ数                                      ステップ数

•ある期間の利得は高いが,次第に利得が低下する戦略選択規則が存在
•適度な非浄化排水により,浄化割合100%より高い利得の戦略選択規則が存在
• 目的と設定
                           実験2
     – 同じ浄化割合での戦略選択規則の違いによる影響を考察
     – 工場数・・・1つ
     – 戦略選択規則1・・・GAにより2000ステップでの利得を最大化
                (自身の過去5ステップの履歴から,次の戦略を一意に決定)
     – 戦略選択規則2・・・ランダム(浄化割合65.15%)
    300000
                                   浄化割合は戦略選択規則1
                                       と同じ
利                戦略選択規則1            潜 2500
得                                   在
和                                   的           戦略選択規則2
                      戦略選択規則2       な
                                    汚
                                    染
        0                                          戦略選択規則1

                                   LP
                                        0
             0              2000            0           2000
                   ステップ数                          ステップ数

                 浄化割合が同じでも戦略選択規則の違いによって
                      利得に差が出る場合がある
• 目的と設定
                       実験3
      – 複数の工場が自己の利得を追求した行動を取った場合,全体として
        どのような振舞いになるか考察
      – 工場数・・・3つ
      – 戦略選択規則・・・GAを用いて共進化          戦略選択規則
        (1世代(2000ステップ)で得た各々の利得が評価値)

     400000


 利                             利得        利得    利得
 得
 和                             利得              利得
                                    ・・    ・・   ・・
                                    ・     ・    ・

-1000000                       利得        利得    利得
           950          1000
                 世代数      利得を適応度として交叉
                  戦略選択規則は収束しない
まとめ
• 実験の結果から,
 – 処理者の行動
 – 時間遅れで影響が現れる
 – 非線形な影響
 という要素・特徴に着目してシステム全体の振舞いを考察すると

 –ある期間の利得は高いが,次第に利得が低下する戦略が存在
   →近視眼的な利得追求戦略と,
    持続可能な発展を目指す利得追求戦略が異なる場合が存在しうる
 –自然浄化力を適度に利用することで,高い利得を得られる
 –同じ浄化割合でも,戦略の違いにより利得に差が出る
 –複数のエージェントが自己の利得を追求すると,戦略は収束しない

                        という特徴が得られた
実験
• 目的と設定
 – 近視眼的な利得追求戦略と,持続可能な発展を目指す利得追求戦略
   が異なる場合が存在することを確認する
 – 工場数・・・1つ
 – 戦略1・・・300ステップでの利得を最大化する戦略をGAで学習
 – 戦略2・・・2000ステップでの利得を最大化する戦略をGAで獲得
 45000                                   300000
  利                                       利
  得               300GA                   得             2000GA
  和                                       和
                      2000GA
                                                                300GA

        0                                       0
      900       ステップ数(上下共通)                          ステップ数(上下共通)
                                              7000
  潜                                       潜
  在                                       在
  的                300GA                  的             300GA
  な                                       な
  汚                                       汚
  染                                       染
                          2000GA                            2000GA
        0                                       00
            0                      300                              2000
廃棄物処理システムについての
            抽象的問題モデル
  社会的ジレンマを含んだモデルである“The Lake”を基とした
  N個の工場(エージェント)と1つの湖(SD)からなる問題モデル
操業利益200
                        すぐには影響が現れない                    OP(t 1)      (95%)
          コスト:UP(t-1)                    UP(t)
                                                 OP(t 1) 0.6 LP(t 1) (5%)
 工場1
                          湖(SDモデル)
  取水時浄化                   取水場所汚染UP(t)   5%の確率で影響
             知覚可能                                   自然浄化
   工場i                     流れ込む         湖の潜在的汚染LP(t)汚水量:3.5
浄化排水 非浄化排水
                          排水場所汚染OP(t)   湖全体に拡散する
                                        汚水量:5.0
                                                          LP>100になると
                                                          分解量は半減
          コスト:100       コスト: 0   環境問題同士の相互作用
 工場N
          汚水量: 0        汚水量:10
                                                    t:時刻(ステップ数)

Ppt yoshimoto

  • 1.
    エージェントベースシミュレーションの 廃棄物処理システムへの適用 Agent-based Simulationof Waste Disposal System 北海道大学 工学部 情報工学科 複雑系工学講座 調和系工学研究室 吉本 拓矢
  • 2.
    背景 「持続可能な発展(Sustainable Development)※」の実現に向け 「廃棄物の処理システム」は重要なトピック • 廃棄物処理システム – 処理者の行動や環境・経済活動への影響を含めた廃棄物の処理系 かつての主目的 現在の要求 •公衆衛生の向上 •環境負荷の減少 •廃棄物の体積縮小 •資源消費の減少 考慮すべき特徴 • 処理をしてすぐには影響が出ない(時間遅れ) – 温室効果ガスなどの発生・対策 • 処理の影響が非線形に現れる – 二酸化炭素を10倍排出した時に,影響が10倍であるとは限らない 廃棄物処理システムの要素や特徴が, 系全体の振舞いに対してどのように影響しているか明らかではない
  • 3.
    目的 廃棄物処理システムについて, – 処理者の行動 – 時間遅れで影響が現れる – 非線形な影響 といった要素・特徴と全体の振舞いとの関係に 焦点を当て,モデル化・分析を行う 具体的には,上記の要素・特徴を踏まえた問題を提案し, モデル化・分析を行う
  • 4.
    廃棄物処理システムについての問題モデル 社会的ジレンマを含んだモデルである“The Lake ”を基とした ※ N個の工場と1つの湖からなる問題モデル ※[L.S.Shapley et al. 1969] 工場が知覚できるのはUP(t)のみ 取水 影響の大きさは (浄化して利用 LP(t)に比例 →コスト発生) 取水場所UP(t) 一定確率で影響 (実際はN個) 汚水発生 流れ込み 潜在的な汚染LP(t) 蓄積 自然浄化 コスト有り・汚染無し 戦略 排水場所OP(t) 拡散 LP(t)が上昇すると • 浄化排水 浄化力低下 • 非浄化排水 LP(t)による影響は コスト無し・汚染有り すぐにはUP(t)に現れない
  • 5.
    ABSの適用と検討事項 行動主体を含んだ問題のモデル化を行うために エージェントベースシミュレーション(ABS) によるアプローチを考える 時間遅れ・非線形な事象を全て エージェントの行動ルールの記述から ボトムアップ的に構築するのは難しい 環境への影響などはトップダウン的なアプローチで 表現した方が効果的 ⇒システムダイナミックス(SD)を併せて用いる SDとABSの結合に関する関連研究 –エージェントの意思決定のプロセスをSDによってモデル化[Schieritz et al. 2003] –Consumerの意思決定プロセスを心理学に基づいてモデル化し, その振る舞いを考察する際に環境としてSDを導入[Jager 2001]
  • 6.
    システムダイナミックス(SD)とは システムが持つ要素や各要素間の構造の記述から 全体の振舞いを明らかにするモデル化・シミュレーション手法 ⇒対象が広範囲に渡る非線形なシステムを考えるのに有効 • システムの要素は – 蓄積(ストック) – 蓄積の変化量(フロー) – 外部からの影響・補助変数・定数 (コンバータ) • システム内の要素間の相互作用(フィードバック)を定義 (定義には数式を用いる(固定的)) フィードバックの定義例 コンバータ1= (コンバータ2−ストック)/コンバータ2
  • 7.
    問題のモデル化 •工場(エージェント) α:操業利得(=200) B:排水時浄化コスト(=100) 利得 汚水放出 浄化排水 α- B - UP(t-1) 0 非浄化排水 α - UP(t-1) 10 • 湖(環境:SDによりモデル化) t:ステップ数 • OP(t) = OP(t-1) + (工場からの汚水の和) – (拡散量) (取水・排水で1ステップ) • LP(t) = LP(t-1) + (拡散量) – (自然浄化) 影響(5%) OP(t-1) 95% 自然浄化 • UP(t) = 取水場所UP(t) OP(t-1) + 0.6*LP(t-1) 5% (自然浄化) = max[LP(t-1), 3.5] LP(t-1) ≦100 流れ込み 潜在的汚染LP(t) 1.75 LP(t-1) > 100 排水場所OP(t) 拡散 (拡散量) = max[OP(t-1), 5.0]
  • 8.
    シミュレーションによるモデル分析 • 実験の目的 –提案したモデルにおいて, 実際にシミュレーションを行うことで, • エージェントの戦略に対する利得・環境の変化 • 複数のエージェントが自己の利得を追求して戦 略を決定した場合,どのような振舞いをするか について考察する
  • 9.
    • 目的と設定 実験1 – 浄化排水を行う割合(浄化割合)による影響について考察 – 工場数・・・1つ – 戦略選択規則・・・ランダム(浄化割合が100%,90%,60%,50%の4種) 250000 50%,60%では 90% 次第に利得が減少 100% 利 得 10000 60% 潜 和 50% 在 的 な 60% 0 50% 汚 染 100% 90% LP -100000 0 0 3500 0 3500 ステップ数 ステップ数 •ある期間の利得は高いが,次第に利得が低下する戦略選択規則が存在 •適度な非浄化排水により,浄化割合100%より高い利得の戦略選択規則が存在
  • 10.
    • 目的と設定 実験2 – 同じ浄化割合での戦略選択規則の違いによる影響を考察 – 工場数・・・1つ – 戦略選択規則1・・・GAにより2000ステップでの利得を最大化 (自身の過去5ステップの履歴から,次の戦略を一意に決定) – 戦略選択規則2・・・ランダム(浄化割合65.15%) 300000 浄化割合は戦略選択規則1 と同じ 利 戦略選択規則1 潜 2500 得 在 和 的 戦略選択規則2 戦略選択規則2 な 汚 染 0 戦略選択規則1 LP 0 0 2000 0 2000 ステップ数 ステップ数 浄化割合が同じでも戦略選択規則の違いによって 利得に差が出る場合がある
  • 11.
    • 目的と設定 実験3 – 複数の工場が自己の利得を追求した行動を取った場合,全体として どのような振舞いになるか考察 – 工場数・・・3つ – 戦略選択規則・・・GAを用いて共進化 戦略選択規則 (1世代(2000ステップ)で得た各々の利得が評価値) 400000 利 利得 利得 利得 得 和 利得 利得 ・・ ・・ ・・ ・ ・ ・ -1000000 利得 利得 利得 950 1000 世代数 利得を適応度として交叉 戦略選択規則は収束しない
  • 12.
    まとめ • 実験の結果から, –処理者の行動 – 時間遅れで影響が現れる – 非線形な影響 という要素・特徴に着目してシステム全体の振舞いを考察すると –ある期間の利得は高いが,次第に利得が低下する戦略が存在 →近視眼的な利得追求戦略と, 持続可能な発展を目指す利得追求戦略が異なる場合が存在しうる –自然浄化力を適度に利用することで,高い利得を得られる –同じ浄化割合でも,戦略の違いにより利得に差が出る –複数のエージェントが自己の利得を追求すると,戦略は収束しない という特徴が得られた
  • 13.
    実験 • 目的と設定 –近視眼的な利得追求戦略と,持続可能な発展を目指す利得追求戦略 が異なる場合が存在することを確認する – 工場数・・・1つ – 戦略1・・・300ステップでの利得を最大化する戦略をGAで学習 – 戦略2・・・2000ステップでの利得を最大化する戦略をGAで獲得 45000 300000 利 利 得 300GA 得 2000GA 和 和 2000GA 300GA 0 0 900 ステップ数(上下共通) ステップ数(上下共通) 7000 潜 潜 在 在 的 300GA 的 300GA な な 汚 汚 染 染 2000GA 2000GA 0 00 0 300 2000
  • 14.
    廃棄物処理システムについての 抽象的問題モデル 社会的ジレンマを含んだモデルである“The Lake”を基とした N個の工場(エージェント)と1つの湖(SD)からなる問題モデル 操業利益200 すぐには影響が現れない OP(t 1) (95%) コスト:UP(t-1) UP(t) OP(t 1) 0.6 LP(t 1) (5%) 工場1 湖(SDモデル) 取水時浄化 取水場所汚染UP(t) 5%の確率で影響 知覚可能 自然浄化 工場i 流れ込む 湖の潜在的汚染LP(t)汚水量:3.5 浄化排水 非浄化排水 排水場所汚染OP(t) 湖全体に拡散する 汚水量:5.0 LP>100になると 分解量は半減 コスト:100 コスト: 0 環境問題同士の相互作用 工場N 汚水量: 0 汚水量:10 t:時刻(ステップ数)