美人コンテストの審査員をする話
         ースピアマンの順位相関係数ー




                  『推計学のすすめ』第4章2説
                     2012/07/02 担当:伊藤




12年6月30日土曜日
美人コンテスト
              • A、Bの2名が審査(順位付け)を行う
              • A、Bの結果が全く不一致では審査とし
               て適切ではない

              • A、Bの結果の一致程度を表す測度はあ
               るだろうか?


12年6月30日土曜日
最初の手がかり
              • 2人の審査結果の積和を計算すると…
 2人のつけた順位が全く一緒の場合         2人のつけた順位が全く逆の場合

        審A  審B       積和        審A  審B       積和
    美A   1   1        1    美A   1   3        3
    美B   2   2        4    美B   2   2        4
    美C   3   3        9    美C   3   1        3
      積和の合計V         14      積和の合計V         10


       似ているほど大                 違うほど小
12年6月30日土曜日
普遍化すること
              • 測度Vは美人の数が増えれば大きくなる
               → 最大値1、最小値-1にできないか?
               → 一致している: 1
                 逆順:    -1
                 関係ない:   0

                  順位に対するこの指標を
               (スピアマンの)順位相関係数と呼ぶ
12年6月30日土曜日
順位相関係数を導く

              1. VからVの中点の値を引く
               (中点がゼロになる)

              2. 最大値と最小値の差で割り、2倍する
               (最大値が1、最小値が-1になる)



12年6月30日土曜日
具体的には?
              積和                            中点を引く

                                     2
                         n(n+1)
                   V
                       n(n
                             4
                           2 1)              2
                           6
                       最大値と最小値の差で割って二倍

       ※ 最大値や最小値、中点は自乗和の公式とかいうのを使って求めますが、何か面倒そうなので説明しません。
12年6月30日土曜日
Wikipediaに載ってるやり方

                       6 D      2
                  =1     3
                       n   n
                   ρ: 順位相関係数
                  D: 各ペアの順位の差



12年6月30日土曜日
本来は…
              • 今の2式はタイの順位が無いときにのみ
               使える裏ワザ的な式で、以下の式でも
               計算が面倒なだけで結果は一緒
                        (xi x)(yi y )
                             ¯    ¯
               =      i

                   i (xi x)2 i (yi y )2
                           ¯          ¯


              次節で出てくるピアソンの積率相関係数
12年6月30日土曜日
順位相関係数とは

              • 定義:2つの順位がどれだけ似ているか
               の指標

              • 応用:普通の2変数でも順位に変換すれ
               ば適用できる



12年6月30日土曜日
順位に変換すると…?

              • 「xが増えるとyも増
               える」を見ることが
               できる

              • 関係が直線でなくと
               も良い


              http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient
12年6月30日土曜日
順位に変換すると…?


              • ピアソンの積率相関
               係数よりも外れ値に
               強い




              http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient
12年6月30日土曜日
もう一つの順位相関係数
                                               4P
              • ケンドールの順位相関係数               =
                                             n(n 1)
                                                      1


              • 解説は http://www.tamagaki.com/math/
                Statistics610.html が詳しい

              • 実用上はどちらを使用しても大差ない
                (悩むよりまず散布図を書け!)


12年6月30日土曜日

推計学のすすめ4の2順位相関係数

  • 1.
    美人コンテストの審査員をする話 ースピアマンの順位相関係数ー 『推計学のすすめ』第4章2説 2012/07/02 担当:伊藤 12年6月30日土曜日
  • 2.
    美人コンテスト • A、Bの2名が審査(順位付け)を行う • A、Bの結果が全く不一致では審査とし て適切ではない • A、Bの結果の一致程度を表す測度はあ るだろうか? 12年6月30日土曜日
  • 3.
    最初の手がかり • 2人の審査結果の積和を計算すると… 2人のつけた順位が全く一緒の場合 2人のつけた順位が全く逆の場合 審A 審B 積和 審A 審B 積和 美A 1 1 1 美A 1 3 3 美B 2 2 4 美B 2 2 4 美C 3 3 9 美C 3 1 3 積和の合計V 14 積和の合計V 10 似ているほど大 違うほど小 12年6月30日土曜日
  • 4.
    普遍化すること • 測度Vは美人の数が増えれば大きくなる → 最大値1、最小値-1にできないか? → 一致している: 1   逆順:    -1   関係ない:   0 順位に対するこの指標を (スピアマンの)順位相関係数と呼ぶ 12年6月30日土曜日
  • 5.
    順位相関係数を導く 1. VからVの中点の値を引く (中点がゼロになる) 2. 最大値と最小値の差で割り、2倍する (最大値が1、最小値が-1になる) 12年6月30日土曜日
  • 6.
    具体的には? 積和 中点を引く 2 n(n+1) V n(n 4 2 1) 2 6 最大値と最小値の差で割って二倍 ※ 最大値や最小値、中点は自乗和の公式とかいうのを使って求めますが、何か面倒そうなので説明しません。 12年6月30日土曜日
  • 7.
    Wikipediaに載ってるやり方 6 D 2 =1 3 n n ρ: 順位相関係数 D: 各ペアの順位の差 12年6月30日土曜日
  • 8.
    本来は… • 今の2式はタイの順位が無いときにのみ 使える裏ワザ的な式で、以下の式でも 計算が面倒なだけで結果は一緒 (xi x)(yi y ) ¯ ¯ = i i (xi x)2 i (yi y )2 ¯ ¯ 次節で出てくるピアソンの積率相関係数 12年6月30日土曜日
  • 9.
    順位相関係数とは • 定義:2つの順位がどれだけ似ているか の指標 • 応用:普通の2変数でも順位に変換すれ ば適用できる 12年6月30日土曜日
  • 10.
    順位に変換すると…? • 「xが増えるとyも増 える」を見ることが できる • 関係が直線でなくと も良い http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient 12年6月30日土曜日
  • 11.
    順位に変換すると…? • ピアソンの積率相関 係数よりも外れ値に 強い http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient 12年6月30日土曜日
  • 12.
    もう一つの順位相関係数 4P • ケンドールの順位相関係数 = n(n 1) 1 • 解説は http://www.tamagaki.com/math/ Statistics610.html が詳しい • 実用上はどちらを使用しても大差ない (悩むよりまず散布図を書け!) 12年6月30日土曜日