SlideShare a Scribd company logo
1 of 31
Download to read offline
言語系統樹と
               雑煮の祖先形質復元



                  田村光平
2012年3月3日土曜日
目次


               • 祖先形質復元の簡単な紹介
               • 雑煮の祖先形質復元


2012年3月3日土曜日
祖先形質復元

               • 系統樹の情報から形質の歴史を追跡
                  • 祖先形質が推定できる
                  • 進化のパターンがわかる




2012年3月3日土曜日
牛は母系の敵?


               • Holden and Mace (2003)
               • 家畜(牛)を所持すると母系から父系へ


2012年3月3日土曜日
解析用ソフトウェア

               • 系統樹作成
                  • MrBayes, RAxML, Phylip...
               • 祖先形質復元
                  • Mesquite, BayesTraits...

2012年3月3日土曜日
解析用ソフトウェア

               • 系統樹作成Rでもできる?
                  • MrBayes, RAxML, Phylip...
                         本当は「それRでもできるよ!」って書きたかった...




               • 祖先形質復元
                  • Mesquite, BayesTraits...

2012年3月3日土曜日
雑煮の進化パターンを探る!

               全国お雑煮文化圏地図
               http://tg.tripadvisor.jp/Zouni/




2012年3月3日土曜日
雑煮の起源


               • 丸餅・宗教儀礼からの転用?
               • 角餅・野戦食?


2012年3月3日土曜日
今回やったこと

               • 日本語の言語系統樹をRで作成
               • 雑煮の祖先形質復元
                  • 餅の形(丸・四角)
                  • 餅の調理方法(焼く・煮る)

2012年3月3日土曜日
これからお話しする内容の学問的妥当
   性がまったく保証できないことを最初
               にお断りしておきますm(_ _)m




2012年3月3日土曜日
Rで言語系統樹をかこう



2012年3月3日土曜日
library(ape)


               • 系統・進化解析用パッケージ



2012年3月3日土曜日
言語データ


   • Lee and Hasegawa (2011)から
      • 北海道、沖縄を除いた45都道府県
      • ?を除いた563語


2012年3月3日土曜日
言語データ




2012年3月3日土曜日
言語データ
                 ある単語




2012年3月3日土曜日
library("ape")


    prefecture<-c("Hokkaido","Aomori","Iwate","Miyage","Akita","Yamagata","Fukushima","Ibaraki","Tochigi"
    ,"Gunnma","Saitama","Chiba","Tokyo","Kanagawa","Nigata","Toyama","Ishikawa","Fukui","Yamanashi","Naga
    no","Gifu","Shizuoka","Aichi","Mie","Shiga","Kyoto","Osaka","Hyogo","Nara","Wakayama","Tottori","Shimane",
    "Okayama","Hiroshima","Yamaguchi","Tokushima","Kagawa","Ehime","Kochi","Fukuoka","Saga","Nagasaki","
    Kumamoto","Oita","Miyazaki","Kagoshima")


    dat<-matrix(scan("data.txt",sep=","),nrow=563,ncol=46)
    dat<-t(dat)
    rownames(dat)<-prefecture
    dat.d<-dist.gene(dat)
    dat.nj<-bionj(dat.d)
    plot(dat.nj)




2012年3月3日土曜日
library("ape")


    prefecture<-c("Hokkaido","Aomori","Iwate","Miyage","Akita","Yamagata","Fukushima","Ibaraki","Tochigi"
    ,"Gunnma","Saitama","Chiba","Tokyo","Kanagawa","Nigata","Toyama","Ishikawa","Fukui","Yamanashi","Naga
    no","Gifu","Shizuoka","Aichi","Mie","Shiga","Kyoto","Osaka","Hyogo","Nara","Wakayama","Tottori","Shimane",
    "Okayama","Hiroshima","Yamaguchi","Tokushima","Kagawa","Ehime","Kochi","Fukuoka","Saga","Nagasaki","

                      NJ法で系統樹を作成
    Kumamoto","Oita","Miyazaki","Kagoshima")


    dat<-matrix(scan("data.txt",sep=","),nrow=563,ncol=46)
    dat<-t(dat)
    rownames(dat)<-prefecture
    dat.d<-dist.gene(dat)
    dat.nj<-bionj(dat.d)
    plot(dat.nj)




2012年3月3日土曜日
だいたい九州



                 だいたい中国・四国




                  だいたい関東



                   だいたい東北


                だいたい東海


               だいたい関西

2012年3月3日土曜日
だいたい九州




                 だいたい中国・四国

      だいたい地方ごとにクラスタを
                  だいたい関東

          形成している             …気がする




                   だいたい東北


                だいたい東海


               だいたい関西

2012年3月3日土曜日
祖先形質復元


               ace(character, tree)




2012年3月3日土曜日
うまくいきませんでした


               • 形質が1つだと推定できるのだが…
               • 離散形質だと使えない機能がある


2012年3月3日土曜日
http://mesquiteproject.org/mesquite/mesquite.html

2012年3月3日土曜日
2012年3月3日土曜日
最節約法




               丸餅   煮る
               角餅   焼く
2012年3月3日土曜日
最尤法




               丸餅   煮る
               角餅   焼く
2012年3月3日土曜日
BayesTraits



               http://www.evolution.rdg.ac.uk/BayesTraits.html


2012年3月3日土曜日
角・焼                 角・煮
                           0.021


                           0.003
               0.000   0.018      0.016   0.004

                           0.171


                               0.036
                   丸・焼                 丸・煮

2012年3月3日土曜日
角・焼           角・煮
                     0.021


     「丸・焼」型か「丸・煮」型が
                 0.003
      0.000 0.018    0.016 0.004
      祖先形質である可能性が高い
                     0.171


                     0.036
               丸・焼           丸・煮

2012年3月3日土曜日
まとめ


    • 雑煮の祖先型は丸餅であった可能性
    • 「丸餅・焼」型は「丸餅・煮」型へ移行する傾向?



2012年3月3日土曜日
反省点


               • 系統樹の作成方法
               • 水平伝播の影響


2012年3月3日土曜日
まとめ

               • 系統樹の作成・祖先形質復元がRでもそこ


                そこできる

               • 進化解析を文化に応用すると面白いこ
                とがわかるかもしれない




2012年3月3日土曜日

More Related Content

What's hot

Rによる特徴抽出 第48回R勉強会@東京(#TokyoR)
Rによる特徴抽出 第48回R勉強会@東京(#TokyoR)Rによる特徴抽出 第48回R勉強会@東京(#TokyoR)
Rによる特徴抽出 第48回R勉強会@東京(#TokyoR)
Keiku322
 

What's hot (20)

Kaggleのテクニック
KaggleのテクニックKaggleのテクニック
Kaggleのテクニック
 
ここまで来た!公共交通オープンデータ最新事情
ここまで来た!公共交通オープンデータ最新事情ここまで来た!公共交通オープンデータ最新事情
ここまで来た!公共交通オープンデータ最新事情
 
Rによる特徴抽出 第48回R勉強会@東京(#TokyoR)
Rによる特徴抽出 第48回R勉強会@東京(#TokyoR)Rによる特徴抽出 第48回R勉強会@東京(#TokyoR)
Rによる特徴抽出 第48回R勉強会@東京(#TokyoR)
 
DataRobotによる予測モデルを用いた シミュレーションと最適化(抜粋)
DataRobotによる予測モデルを用いた シミュレーションと最適化(抜粋)DataRobotによる予測モデルを用いた シミュレーションと最適化(抜粋)
DataRobotによる予測モデルを用いた シミュレーションと最適化(抜粋)
 
パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」
パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」
パターン認識と機械学習 (PRML) 第1章-「多項式曲線フィッティング」「確率論」
 
USVSEG:齧歯超音波発声の検出手法
USVSEG:齧歯超音波発声の検出手法USVSEG:齧歯超音波発声の検出手法
USVSEG:齧歯超音波発声の検出手法
 
オントロジーとは?
オントロジーとは?オントロジーとは?
オントロジーとは?
 
学振特別研究員になるために~2024年度申請版
 学振特別研究員になるために~2024年度申請版 学振特別研究員になるために~2024年度申請版
学振特別研究員になるために~2024年度申請版
 
単語の分散表現を用いた俳句における取り合わせの評価に関する研究
単語の分散表現を用いた俳句における取り合わせの評価に関する研究単語の分散表現を用いた俳句における取り合わせの評価に関する研究
単語の分散表現を用いた俳句における取り合わせの評価に関する研究
 
情報検索の基礎 #9適合フィードバックとクエリ拡張
情報検索の基礎 #9適合フィードバックとクエリ拡張情報検索の基礎 #9適合フィードバックとクエリ拡張
情報検索の基礎 #9適合フィードバックとクエリ拡張
 
データ基盤の3分類と進化的データモデリング #DPCT
データ基盤の3分類と進化的データモデリング #DPCTデータ基盤の3分類と進化的データモデリング #DPCT
データ基盤の3分類と進化的データモデリング #DPCT
 
Hessian free
Hessian freeHessian free
Hessian free
 
論理と計算のしくみ 5.3 型付きλ計算 (前半)
論理と計算のしくみ 5.3 型付きλ計算 (前半)論理と計算のしくみ 5.3 型付きλ計算 (前半)
論理と計算のしくみ 5.3 型付きλ計算 (前半)
 
ICLR2020の異常検知論文の紹介 (2019/11/23)
ICLR2020の異常検知論文の紹介 (2019/11/23)ICLR2020の異常検知論文の紹介 (2019/11/23)
ICLR2020の異常検知論文の紹介 (2019/11/23)
 
12 非構造化データ解析
12 非構造化データ解析12 非構造化データ解析
12 非構造化データ解析
 
大森ゼミ新歓
大森ゼミ新歓大森ゼミ新歓
大森ゼミ新歓
 
[Track2-5] CPUだけでAIをやり切った最近のお客様事例 と インテルの先進的な取り組み
[Track2-5] CPUだけでAIをやり切った最近のお客様事例 と インテルの先進的な取り組み[Track2-5] CPUだけでAIをやり切った最近のお客様事例 と インテルの先進的な取り組み
[Track2-5] CPUだけでAIをやり切った最近のお客様事例 と インテルの先進的な取り組み
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
 
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析実践で学ぶネットワーク分析
実践で学ぶネットワーク分析
 
協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築
 

言語系統樹と雑煮の祖先形質復元(Kashiwa.R #2)

  • 1. 言語系統樹と 雑煮の祖先形質復元 田村光平 2012年3月3日土曜日
  • 2. 目次 • 祖先形質復元の簡単な紹介 • 雑煮の祖先形質復元 2012年3月3日土曜日
  • 3. 祖先形質復元 • 系統樹の情報から形質の歴史を追跡 • 祖先形質が推定できる • 進化のパターンがわかる 2012年3月3日土曜日
  • 4. 牛は母系の敵? • Holden and Mace (2003) • 家畜(牛)を所持すると母系から父系へ 2012年3月3日土曜日
  • 5. 解析用ソフトウェア • 系統樹作成 • MrBayes, RAxML, Phylip... • 祖先形質復元 • Mesquite, BayesTraits... 2012年3月3日土曜日
  • 6. 解析用ソフトウェア • 系統樹作成Rでもできる? • MrBayes, RAxML, Phylip... 本当は「それRでもできるよ!」って書きたかった... • 祖先形質復元 • Mesquite, BayesTraits... 2012年3月3日土曜日
  • 7. 雑煮の進化パターンを探る! 全国お雑煮文化圏地図 http://tg.tripadvisor.jp/Zouni/ 2012年3月3日土曜日
  • 8. 雑煮の起源 • 丸餅・宗教儀礼からの転用? • 角餅・野戦食? 2012年3月3日土曜日
  • 9. 今回やったこと • 日本語の言語系統樹をRで作成 • 雑煮の祖先形質復元 • 餅の形(丸・四角) • 餅の調理方法(焼く・煮る) 2012年3月3日土曜日
  • 10. これからお話しする内容の学問的妥当 性がまったく保証できないことを最初 にお断りしておきますm(_ _)m 2012年3月3日土曜日
  • 12. library(ape) • 系統・進化解析用パッケージ 2012年3月3日土曜日
  • 13. 言語データ • Lee and Hasegawa (2011)から • 北海道、沖縄を除いた45都道府県 • ?を除いた563語 2012年3月3日土曜日
  • 15. 言語データ ある単語 2012年3月3日土曜日
  • 16. library("ape") prefecture<-c("Hokkaido","Aomori","Iwate","Miyage","Akita","Yamagata","Fukushima","Ibaraki","Tochigi" ,"Gunnma","Saitama","Chiba","Tokyo","Kanagawa","Nigata","Toyama","Ishikawa","Fukui","Yamanashi","Naga no","Gifu","Shizuoka","Aichi","Mie","Shiga","Kyoto","Osaka","Hyogo","Nara","Wakayama","Tottori","Shimane", "Okayama","Hiroshima","Yamaguchi","Tokushima","Kagawa","Ehime","Kochi","Fukuoka","Saga","Nagasaki"," Kumamoto","Oita","Miyazaki","Kagoshima") dat<-matrix(scan("data.txt",sep=","),nrow=563,ncol=46) dat<-t(dat) rownames(dat)<-prefecture dat.d<-dist.gene(dat) dat.nj<-bionj(dat.d) plot(dat.nj) 2012年3月3日土曜日
  • 17. library("ape") prefecture<-c("Hokkaido","Aomori","Iwate","Miyage","Akita","Yamagata","Fukushima","Ibaraki","Tochigi" ,"Gunnma","Saitama","Chiba","Tokyo","Kanagawa","Nigata","Toyama","Ishikawa","Fukui","Yamanashi","Naga no","Gifu","Shizuoka","Aichi","Mie","Shiga","Kyoto","Osaka","Hyogo","Nara","Wakayama","Tottori","Shimane", "Okayama","Hiroshima","Yamaguchi","Tokushima","Kagawa","Ehime","Kochi","Fukuoka","Saga","Nagasaki"," NJ法で系統樹を作成 Kumamoto","Oita","Miyazaki","Kagoshima") dat<-matrix(scan("data.txt",sep=","),nrow=563,ncol=46) dat<-t(dat) rownames(dat)<-prefecture dat.d<-dist.gene(dat) dat.nj<-bionj(dat.d) plot(dat.nj) 2012年3月3日土曜日
  • 18. だいたい九州 だいたい中国・四国 だいたい関東 だいたい東北 だいたい東海 だいたい関西 2012年3月3日土曜日
  • 19. だいたい九州 だいたい中国・四国 だいたい地方ごとにクラスタを だいたい関東 形成している …気がする だいたい東北 だいたい東海 だいたい関西 2012年3月3日土曜日
  • 20. 祖先形質復元 ace(character, tree) 2012年3月3日土曜日
  • 21. うまくいきませんでした • 形質が1つだと推定できるのだが… • 離散形質だと使えない機能がある 2012年3月3日土曜日
  • 24. 最節約法 丸餅 煮る 角餅 焼く 2012年3月3日土曜日
  • 25. 最尤法 丸餅 煮る 角餅 焼く 2012年3月3日土曜日
  • 26. BayesTraits http://www.evolution.rdg.ac.uk/BayesTraits.html 2012年3月3日土曜日
  • 27. 角・焼 角・煮 0.021 0.003 0.000 0.018 0.016 0.004 0.171 0.036 丸・焼 丸・煮 2012年3月3日土曜日
  • 28. 角・焼 角・煮 0.021 「丸・焼」型か「丸・煮」型が 0.003 0.000 0.018 0.016 0.004 祖先形質である可能性が高い 0.171 0.036 丸・焼 丸・煮 2012年3月3日土曜日
  • 29. まとめ • 雑煮の祖先型は丸餅であった可能性 • 「丸餅・焼」型は「丸餅・煮」型へ移行する傾向? 2012年3月3日土曜日
  • 30. 反省点 • 系統樹の作成方法 • 水平伝播の影響 2012年3月3日土曜日
  • 31. まとめ • 系統樹の作成・祖先形質復元がRでもそこ そこできる • 進化解析を文化に応用すると面白いこ とがわかるかもしれない 2012年3月3日土曜日