Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Tokyo webmining 43 "化学物質汚染のデータ解析・リスク評価についての私見"

4,115 views

Published on

第43回データマイニング+WEB @東京での発表資料です。

Published in: Environment
  • Be the first to comment

Tokyo webmining 43 "化学物質汚染のデータ解析・リスク評価についての私見"

  1. 1. 化学物質汚染のデータ解析・リスク評価についての私見 @siero5335   2015/2/28   TokyoWebmining  43st  @Ni:y 1/46
  2. 2. おやくそく 今回の発表の内容は個人の見解であり、所属組織・これまで所 属していた組織の公式見解ではありません。 よろしくお願いいたします。 2/46
  3. 3. 3/47 目次 ・汚染物質についての紹介 ・どのような目的の研究が中心なのか 汚染実態の解析(どこにどのくらいどんな物質があるのか) →測定値とその他調査データから汚染源・汚染の広がりを解明 毒性の調査(毒性があるのか・あるならどんな毒性か) →細胞や動物に汚染物質を投与して影響を見るなど 健康・生態系への影響調査(アウトカムとの関係は?) →癌・免疫・アレルギー・知能…etc と曝露の関係解析 環境中・体内での動態・毒性予測(物質の構造・性質から予測) →化学物質の物理化学的性質から毒性・動態を予測 ・上記テーマのこれから
  4. 4. 自己紹介 Twitter ID: @siero5335 仕事: 某大学で    化学物質曝露影響の解析    測定法の開発してます    専門: 環境化学、分析化学 興味: 生理活性物質の一斉分析 4/46
  5. 5. どんなものを分析するのか? ポリ塩化ビフェニル(PCBs)   カネミ油症事件 ポリ臭化ビフェニルエーテル(PBDEs)   難燃剤として電化製品等に添加 ダイオキシン   (枯葉剤の不純物・焼却炉で生成)   鉛(鉛中毒) ヒ素(事件多数) 水銀(水俣病) 5/46
  6. 6. なぜ測定する必要があるのか:金属 Neurobehavioural  effects  of  developmental  toxicity,  2014,  13,  330-­‐8 子供の神経発達に影響しそうな化学物質 Top5 1.  鉛(有鉛ガソリン) 2.  有機水銀(水俣病) 3.  ヒ素(事件いろいろ) 4.  ポリ塩化ビフェニル (PCBs) 5.  トルエン等溶剤(シンナー) Developmental  neurotoxicity  of  industrial  chemicals,  2006,  368,  2167-­‐78 ヒ素及び重金属の高曝露は致死に至る例が多い   (比較的)低濃度であっても曝露が子供の精神発達に影響   6/46
  7. 7. 7/47 なぜ測定する必要があるのか:PCB, Dioxin ポリ塩化ビフェニル(PCBs)   カネミ油症事件 ダイオキシン   (枯葉剤の不純物・焼却炉で生成)   hMp://en.wikipedia.org/wiki/ File:Viktor_Yuschenko.jpg ウクライナの大統領が大統領選の 際に重病で倒れる。 →体内から通常の50000倍の濃度 のダイオキシンが検出 Sorg,  O.,  Zennegg,  M.,  Schmid,  P.,  Fedosyuk,  R.,  Valikhnovskyi,  R.,  Gaide,  O.,  ...  &  Saurat,  J.  H.   (2009).  2,  3,  7,  8-­‐tetrachlorodibenzo-­‐p-­‐dioxin  (TCDD)  poisoning  in  Victor  Yushchenko:   idencficacon  and  measurement  of  TCDD  metabolites.  The  Lancet,  374(9696),  1179-­‐1185.
  8. 8. 8/47 なぜ測定する必要があるのか:PCB, Dioxin ポリ塩化ビフェニル(PCBs)   カネミ油症事件 ダイオキシン   (枯葉剤の不純物・焼却炉で生成)   hMp://en.wikipedia.org/wiki/ File:Viktor_Yuschenko.jpg ウクライナの大統領が大統領選の 際に重病で倒れる。 →体内から通常の50000倍の濃度 のダイオキシンが検出 一般の方に対してはどんな影響が懸念されているのか?  
  9. 9. なぜ測定する必要があるのか:PCB, Dioxin Environmental   exposure   to   polychlorinated   biphenyls   and   quality   of   the   home  environment:  effects  on  psychodevelopment  in  early  childhood Intellectual  Impairment  in  Children  Exposed  to   Polychlorinated  Biphenyls  in  Utero 日本でも環境要因が子供の成長に与える影響の   解明を目的とした大規模疫学調査がスタート   IQ下がる→人類全体の平均知能が落ちて損失   9/46
  10. 10. 環境化学:どんな目的での研究が多い? 汚染実態の解析(どこにどのくらいどんな物質があるのか) →測定値とその他調査データから汚染源・汚染の広がりを解明 毒性の調査(毒性があるのか・あるならどんな毒性か) →細胞や動物に汚染物質を投与して影響を見るなど 健康・生態系への影響調査(アウトカムとの関係は?) →癌・免疫・アレルギー・知能…etc と曝露の関係解析 環境中・体内での動態・毒性予測(物質の構造・性質から予測) →化学物質の物理化学的性質から予測 10/46
  11. 11. 環境化学:どんな目的での研究が多い? 汚染実態の解析(どこにどのくらいどんな物質があるのか) →測定値とその他調査データから汚染源・汚染の広がりを解明 毒性の調査(毒性があるのか・あるならどんな毒性か) →細胞や動物に汚染物質を投与して影響を見るなど 健康・生態系への影響調査(アウトカムとの関係は?) →癌・免疫・アレルギー・知能…etc と曝露の関係解析 環境中・体内での動態・毒性予測(物質の構造・性質から予測) →化学物質の物理化学的性質から予測 11/46
  12. 12. これまでやってた研究 12/46
  13. 13.  背景:中国・インド・東南アジアの汚染の現状 ・急激な経済発展にともなう環境汚染の拡大     ・電気電子機器リサイクルの産業化、屋内でリサイクル作業実施     ・周辺環境からの曝露が懸念 Tue,  N.  M  et  al  .,  (2011)  Environment  Science  &  Technology,  Tue,  N.  M  et  al  .,  (2010)  Science  of  the  Total  Environment   リサイクル作業に従事するヒトを対象にした研究は少ない   汚染物質の曝露経路・曝露リスクを汚染地域で追いかけた例が無い   13/46
  14. 14. 環境化学:どんな目的での研究が多い? 汚染実態の解析(どこにどのくらいどんな物質があるのか) →測定値とその他調査データから汚染源・汚染の広がりを解明 毒性の調査(毒性があるのか・あるならどんな毒性か) →細胞や動物に汚染物質を投与して影響を見るなど 健康・生態系への影響調査(アウトカムとの関係は?) →癌・免疫・アレルギー・知能…etc と曝露の関係解析 環境中・体内での動態・毒性予測(物質の構造・性質から予測) →化学物質の物理化学的性質から毒性・動態を予測 14/46
  15. 15. Eguchi  et  al.  2012.  Environment  Interna6onal,  47,  8  (再解析)   汚染実態の解析 (Orthogonal PLS判別分析) PC1  (71.4  %) 天然化合物+ 食べ物由来の寄与大 生物濃縮由来 人工化合物・代謝物の寄与大 E-wasteリサイクル従事者 沿岸域住民 PC2  (8.99  %) PBDEs 高臭素化OH-­‐PBDEs 低臭素化OH-­‐PBDEs PCBs 15/46
  16. 16. 代謝   活性化 水酸化PCBs 水酸化PBDEs  アジア途上国におけるヒトの汚染実態解析事例 吸入 生成 Pb   lead 不適切なリサイクルに伴う曝露   電子電気機器廃棄物 (e-­‐ waste)のリサイクル従事者 都市ゴミ集積場での   非意図的なゴミの燃焼 ポリ塩化ビフェニル(PCBs) ポリ臭化ビフェニルエーテル(PBDEs) ダイオキシン類 食物から の摂取 海産物等の摂取による曝露 海洋中での自然合成 16/46
  17. 17. 環境化学:どんな目的での研究が多い? 汚染実態の解析(どこにどのくらいどんな物質があるのか) →測定値とその他調査データから汚染源・汚染の広がりを解明 毒性の調査(毒性があるのか・あるならどんな毒性か) →細胞や動物に汚染物質を投与して影響を見るなど 健康・生態系への影響調査(アウトカムとの関係は?) →癌・免疫・アレルギー・知能…etc と曝露の関係解析 環境中・体内での動態・毒性予測(物質の構造・性質から予測) →化学物質の物理化学的性質から毒性・動態を予測 17/46
  18. 18. 甲状腺ホルモン (THs)  濃度の変動に関連する因子 リン脂質   中性脂肪   総コレステロール γ-­‐GTP   血清中ヨウ化物イオン濃度   血清中チオシアネート濃度   汚染物質,  代謝物濃度 身長・体重→BMI値   性別   年齢   食習慣   飲酒習慣   喫煙習慣   THs濃度かく乱因子 アンケート項目 汚染物質の曝露が甲状腺ホルモン濃度の恒常性に関与することを示唆   (一般化線形モデル  +  赤池情報量基準使用 ) Eguchi,  et  al.  2015.  Environmental  research,  137,  44018
  19. 19. 汚染物質の曝露が甲状腺ホルモン濃度の恒常性に関与することを示唆 (一般化線形モデル + 赤池情報量基準使用 ) とは言え因果関係やメカニズムはよくわからないまま Eguchi,  et  al.  2015.  Environmental  research,  137,  440 19 リン脂質   中性脂肪   総コレステロール γ-­‐GTP   血清中ヨウ化物イオン濃度   血清中チオシアネート濃度   汚染物質,  代謝物濃度 身長・体重→BMI値   性別   年齢   食習慣   飲酒習慣   喫煙習慣   THs濃度かく乱因子 アンケート項目 甲状腺ホルモン (THs)  濃度の変動に関連する因子
  20. 20. 今後の方向性 20/46
  21. 21. 環境化学:どんな目的での研究が多い? 汚染実態の解析(どこにどのくらいどんな物質があるのか) →測定値とその他調査データから汚染源・汚染の広がりを解明 毒性の調査(毒性があるのか・あるならどんな毒性か) →細胞や動物に汚染物質を投与して影響を見るなど 健康・生態系への影響調査(アウトカムとの関係は?) →癌・免疫・アレルギー・知能…etc と曝露の関係解析 環境中・体内での動態・毒性予測(物質の構造・性質から予測) →化学物質の物理化学的性質から毒性・動態を予測 21/46
  22. 22. 汚染実態の解析 22/46
  23. 23. 各トピックにおける最近の動向: 汚染実態 汚染実態の解析(どこにどのくらいどんな物質があるのか) →測定値とその他調査データから汚染源・汚染の広がりを解明 地理データ(GISなど)との組み合わせによる可視化 ウェアラブル端末と組み合わせたスクリーニング調査 大気汚染の度合いを端末で取得 GPSと時間でマッチング →可視化  曝露量推定  汚染されてる地域の推定   Hu et al., 2014. Workshop on Machine Learning for Sensory Data Analysis http://dl.acm.org/citation.cfm?id=2689749 http://www2.ee.unsw.edu.au/ vijay/pubs/conf/14mlsda_talk.pdf 23/46
  24. 24. 各トピックにおける最近の動向: 汚染実態 汚染実態の解析(どこにどのくらいどんな物質があるのか) →測定値とその他調査データから汚染源・汚染の広がりを解明 地理データ(GISなど)との組み合わせによる可視化 ウェアラブル端末と組み合わせたスクリーニング調査 大気汚染の度合いを端末で取得 GPSと時間でマッチング →可視化  曝露量推定  汚染されてる地域の推定  オンサイト測定の流れが来る? Hu et al., 2014. Workshop on Machine Learning for Sensory Data Analysis http://dl.acm.org/citation.cfm?id=2689749 http://www2.ee.unsw.edu.au/ vijay/pubs/conf/14mlsda_talk.pdf 24/46
  25. 25. どんなデータが出る? 調査地域の記録 + 濃度の連結データ 濃度データなので非負だが、検出下限値未満 (<LOD) が存在 ID 物質A濃度 物質B濃度 ・・・ 緯度経度 ・・・ 1 XX AA … … … 2 YY BB … … … … … … … … … N ZZ CC … … … 25/46
  26. 26. どんなデータが出る? 調査地域の記録 + 濃度の連結データ 濃度データなので非負だが、検出下限値未満 (<LOD) が存在 検出下限値未満? 測定に使う機器のスペック、分析までの前処理作業に含まれる 不確実性を考慮して、これ以下の値はちゃんと測定できてないよ という値。これも0以上の値だがいつも扱いに困る ID 物質A濃度 物質B濃度 ・・・ 緯度経度 ・・・ 1 XX AA … … … 2 YY BB … … … … … … … … … N ZZ CC … … … 26/46
  27. 27. どんなデータが出る? ID 物質A濃度 物質B濃度 ・・・ 緯度経度 ・・・ 1 XX AA … … … 2 YY BB … … … … … … … … … N ZZ CC … … … 調査地域の記録 + 濃度の連結データ 濃度データなので非負だが、検出下限値未満 (<LOD) が存在 検出下限値未満? 測定に使う機器のスペック、分析までの前処理作業に含まれる 不確実性を考慮して、これ以下の値はちゃんと測定できてないよ という値。これも0以上の値だがいつも扱いに困る (LODの1/2を当てはめる、乱数入れる等人によって色々…闇) 27/46
  28. 28. どんなデータが出る? 塩素のつき方によって   209種類のPCBsが存在 塩素のつき方・構造の違いにより   419種類の異性体が存在   うち毒性が強いものが31種類 類似の構造をもつ化学物質がいっぱい   ID 物質A濃度 物質B濃度 ・・・ 緯度経度 ・・・ 1 XX AA … … … 2 YY BB … … … … … … … … … N ZZ CC … … … 28/46
  29. 29. どんなデータが出る? 塩素のつき方によって   209種類のPCBsが存在 塩素のつき方・構造の違いにより   419種類の異性体が存在   うち毒性が強いものが31種類 構造が似た化学物質は挙動も似ている   ID 物質A濃度 物質B濃度 ・・・ 緯度経度 ・・・ 1 XX AA … … … 2 YY BB … … … … … … … … … N ZZ CC … … … 29/46
  30. 30. どんなデータが出る? 塩素のつき方によって   209種類のPCBsが存在 塩素のつき方・構造の違いにより   419種類の異性体が存在   うち毒性が強いものが31種類 汚染源の推定にはそれぞれの組成の特徴などの背景知識が必要   ID 物質A濃度 物質B濃度 ・・・ 緯度経度 ・・・ 1 XX AA … … … 2 YY BB … … … … … … … … … N ZZ CC … … … 30/46
  31. 31. 毒性・健康影響との関係解析 31/46
  32. 32. 各トピックにおける最近の動向: 毒性・健康 毒性の調査(毒性があるのか・あるならどんな毒性か) →細胞や動物に汚染物質を投与して影響を見るなど 健康・生態系への影響調査(アウトカムとの関係は?) →癌・免疫・アレルギー・知能…etc と曝露の関係解析 これまで: 単一の影響に対する解析(死亡、病気の発生...etc) “Citric  acid  cycle  with  aconitate  2  ja”  by  Source  file:  Narayanese,  WikiUserPedia,  YassineMrabet,  TotoBaggins.  This  file:   Calvero  -­‐  Image:Citric_acid_cycle_with_aconitate_2.svg.  Licensed  under  CC  表示-­‐継承 3.0  via  ウィキメディア・コモンズ 32/46
  33. 33. 各トピックにおける最近の動向: 毒性・健康 毒性の調査(毒性があるのか・あるならどんな毒性か) →細胞や動物に汚染物質を投与して影響を見るなど 健康・生態系への影響調査(アウトカムとの関係は?) →癌・免疫・アレルギー・知能…etc と曝露の関係解析 これまで: 単一の影響に対する解析(死亡、病気の発生...etc) 近年: 生体内ネットワークの変化を一度に解析 ・未知影響の探索    因果推論の導入 毒性系では毒性が出てくる仕組み・疫学系では因果推論   33/46
  34. 34. 毒性: どんなデータが出る? 化学物質濃度+ 生体内物質濃度 + アウトカムの連結データ 化学物質濃度と関連する生体内物質の濃度をまとめて解析 34/46 ID 医学的な 検査の結果 ・・・ 物質A濃 度 物質B濃 度 ・・・ 生体内物 質C濃度 生体内物 質D濃度 ・・・ 1 … … XX AA … AA AA … 2 … … YY BB … BB BB … … … … … … … … … … N … … ZZ CC … CC CC …
  35. 35. 毒性: どんなデータが出る? ID 医学的な 検査の結果 ・・・ 物質A濃 度 物質B濃 度 ・・・ 生体内物 質C濃度 生体内物 質D濃度 ・・・ 1 … … XX AA … AA AA … 2 … … YY BB … BB BB … … … … … … … … … … N … … ZZ CC … CC CC … 化学物質濃度+ 生体内物質濃度 + アウトカムの連結データ 化学物質濃度と関連する生体内物質の濃度をまとめて解析 →アウトカムや生体内の生理活性物質濃度の変化に汚染物質の曝 露が関係しているのか? 35/46
  36. 36. “Citric  acid  cycle  with  aconitate  2  ja”  by  Source  file:  Narayanese,  WikiUserPedia,  YassineMrabet,   TotoBaggins.  This  file:  Calvero  -­‐  Image:Citric_acid_cycle_with_aconitate_2.svg.  Licensed  under   CC  表示-­‐継承 3.0  via  ウィキメディア・コモンズ 生体内パスウェイのどこに関わる物質なのか? 36/46
  37. 37. 毒性: どんなデータが出る? ID 医学的な 検査の結果 ・・・ 物質A濃 度 物質B濃 度 ・・・ 生体内物 質C濃度 生体内物 質D濃度 ・・・ 1 … … XX AA … AA AA … 2 … … YY BB … BB BB … … … … … … … … … … N … … ZZ CC … CC CC … 化学物質濃度+ 生体内物質濃度 + アウトカムの連結データ 化学物質濃度と関連する生体内物質の濃度をまとめて解析 →アウトカムや生体内の生理活性物質濃度の変化に汚染物質の曝 露が関係しているのか? 因果関係の推定は大変そう…。 37/46
  38. 38. 環境中・体内での動態・毒性予測 38/46
  39. 39. 各トピックにおける最近の動向: 動態・毒性予測 環境中・体内での動態・毒性予測(物質の構造・性質から予測) →化学物質の物理化学的性質から予測 物質の数 化学物質名 毒性 反応性 電子の偏り … 分子量 A ある 数値A 数値A' … 数値A" B なし 数値B 数値B' … 数値B" C なし 数値C 数値C' … 数値C" ... ... ... ... ... ... Z あり 数値Z 数値Z' … 数値Z" 計算化学ソフト 39/46
  40. 40. 環境中・体内での動態・毒性予測(物質の構造・性質から予測) →化学物質の物理化学的性質から予測 物質の数 化学物質名 毒性 反応性 電子の偏り … 分子量 A ある 数値A 数値A' … 数値A" B なし 数値B 数値B' … 数値B" C なし 数値C 数値C' … 数値C" ... ... ... ... ... ... Z あり 数値Z 数値Z' … 数値Z" 計算化学ソフト 動物実験なしでも毒性のスクリーニングができる   40/46 各トピックにおける最近の動向: 動態・毒性予測
  41. 41. 汚染物質の母子間移行率予測モデル 胎児は母体から胎盤を通じて栄養素などを得ることで成長 同時に化学物質も母体からもらってしまう 化学物質の物理化学的性質から移行率をどの程度予測できるのか 移行しやすい物質の特徴は? 41/46
  42. 42. 汚染物質の母子間移行率予測モデル 胎児は母体から胎盤を通じて栄養素などを得ることで成長 同時に化学物質も母体からもらってしまう 化学物質の物理化学的性質から移行率をどの程度予測できるのか 移行しやすい物質の特徴は? 臍帯血など、胎児由来の試料を採取することは困難 (今回は測定しているが) 移行しやすく、リスクの大きそうな物質を特定できれば、 限られた試料をその物質の分析に集中できるかも? 胎児に移行しにくそうな薬、化学物質の設計 42/46
  43. 43. 汚染物質の母子間移行率予測モデル データをtraining, testに分割し、training setを10-fold cross validationでチューニング チューニングしたモデルをtest setにあてはめ 今回はrandom forestが良好な結果を示した。 Random  forest ParWal  least  square 重回帰分析 + 変数選択 予測値 実測値 Ext  R2  =  0.809   Ext  RMSE  =  0.465 Ext  R2  =  0.237   Ext  RMSE  =  0.935 Ext  R2  =  0.179   Ext  RMSE  =  0.967 43/46
  44. 44. RF PLS MLR Variable importance Variable importance t-value q- 100 q- 100 LogBAF 7.912 Total dipole 72.48 HOMO 86.221 TEF -6.032 HOMO 65.79 Ehomo- Elumo 49.047 HOMO 5.683 Final heat of formation 56.84 LogBCF 21.192 Molecular weight -3.979 Ehomo- Elumo 53.34 TEF 20.048 q+ 2.027 q+ 48.28 q+ 20.02 LogBAF 42.33 LogBAF 16.196 LogBCF 39.23 Total dipole 15.174 TEF 22.47 Final heat of formation 8.128 Molecular weight 15.32 Molecular weight 5.112 モデル内で重要な変数 電荷の偏り、反応性、ダイオキシンとしての毒性等が重要? 文献では分子量が重要と言われているが… 44/46
  45. 45. この分野にもdeep learningの波が… George E. Dahl: Hinton labのPhD candidate 2012: KaggleのMerck molecular activity challengeで勝利 Ma,  J.,  Sheridan,  R.  P.,  Liaw,  A.,  Dahl,  G.,  &  Svetnik,  V.  (2015).  Deep  Neural  Nets  as  a  Method  for   Quanctacve  Structure-­‐Accvity  Relaconships.  Journal  of  chemical  informacon  and  modeling. Dahl,  G.  E.,  Jaitly,  N.,  &  Salakhutdinov,  R.  (2014).  Mulc-­‐task  Neural  Networks  for  QSAR   Prediccons.  arXiv  preprint  arXiv:1406.1231. 45/46 各トピックにおける最近の動向:動態・毒性予測
  46. 46. まとめ 汚染実態の解析 環境中・体内での動態予測 毒性予測 毒性の調査 健康・生態系への影響調査 データ解析 アプローチは色々あるが、データの解析がより重要に   46/46

×