多次元尺度構成法
その基礎と広がり
小杉考司(専修大学)
MDS,使ってる?――心理学研究における応用可能性――
日本認知心理学会
研究法研究部会/第1回研究会
お品がき
• MDSの基礎
• MDSの特徴と長短所
• あらためて「距離」とは?
• YH定理と計量的(Metric)MDS
• 非軽量的(Non-Metric)MDS
• MDSの応用
• 個人差を表現する方法(INDSCAL)
• 地図に情報を描き加える方法(PREFMAP, Abelson Mappingなど)
• 非対称関係に拡張する方法(HFM, Asymmetric von Mises Scalingなど
)
伴走サイト;https://kosugitti.github.io/JSCP_MDS_2019/
Multi Dimensiona Scaling
その特徴・Pros and Cons
• 特徴;「距離」の情報だけから地図を作ること
• Pros;
• 被験者への負担・介入・仮定が少ないデータからスケールを
作る醍醐味
• 順序尺度水準のデータでOK
• 結果の空間に加筆修正できる自由度の高さ
• Cons;
• (データによるけど)結果の不安定さ
• 推定アルゴリズムを考えるとちょっと面倒なことが多い
具体例;Eurodist
第二軸を
反転させました
地図
MDS
距離の公理
• 2点x とyの距離をd(x,y)とすると,
• の条件を満たせば全て「距離」。
非負性(正定値性)
対称性
三角不等式
dist関数
• にはdist関数が最初から入っている
• データ行列を与えると距離行列にして返す
dist関数
A B C D
1 # # # #
2 # # # #
3 # # # #
… # # # #
A B C
B #
C # #
D # # #下三角行列に変わる
dist関数
• dist関数には様々なオプション・・・
• 6種類の距離!
距離の一般化
を特に
チェビシェフの距離
または
優勢次元距離という
x
y
相関や共分散も
• 相関係数は類似度を表す指標(とも言える)
• 相関係数はベクトルのcosθ
• 1-類似度=距離(と考えることもできる)
心理データとしての距
離
• (非)類似性を距離とみなして用いることが一般的
• (非)類似性の心理データを取る利点
1. 被験者の自然な(総合的な)判断に任せられる;下位の評価次元を
実験者が準備することは研究者があらかじめどの属性が重要かを
決め打ちしているようなもの
2. 上と関連して,人の評価傾向(社会的望ましさバイアスなど)から
自由なデータを入手できる
3. 被験者には何らかの内的一貫性を求めており,データ収集時にそ
の一貫性をチェックすることができる
高根芳雄(1980)多次元尺度法,東京大学出版会
心理データとしての距
離• 尺度評定を用いる方法
• 刺激の混同率
• 代替価/連想価
• 刺激の汎化勾配
• 反応潜時
• ソシオメトリックなデータ
高根芳雄(1980)多次元尺度法,東京大学出版会
Si→Riの条件づけがあるとき,Pr(Ri|Sj)を類似性とする
2つの刺激が「同じ」か「違う」かを判断する課題
への反応潜時を類似性の指標とする
千野直仁「多次元尺度構成法講義ノート」より
根本的なメカニズム
• サイズNの正方行列をM<<Nな2つのN×M行列の積の形に分
解できると,その行列の要素は座標になっているとみなせ
る
• そんな都合の良い行列の分解なんかできるの?→できます
距離行列
D
A
A’=
N
N
N
M
M
N
データから距離へ
v1 v2 v3 v4 … … … … vm
1
2
3
.
.
.
.
.
.
N
ケ
ス
を
分
類
し
た
い
の
?
変数を分類したいの?
ー
m×mの行列
N×Nの行列
行列の
分解へ
距離と分析法
相関行列ならFA
分散共分散行列なら
PCAやSEM
距離行列なら
MDSやクラスター
クロス集計表なら
双対尺度法
関係・関連を表す行列
v1 v2 v3 v4 … … … … vm
1
2
3
.
.
.
.
.
.
N
v1 v2 v3 v4 … … … … vm
1
2
3
.
.
.
.
.
.
N
v1 v2 v3 v4 … … … … vm
1
2
3
.
.
.
.
.
.
N
データの相と元
• 相mode;変数セットの種類
• 元way;変数セットの組合せ回数
v1 v2 v3 v4 … … … … vm
1
2
3
.
.
.
.
.
.
N
変数
個人
変数×個人
二相二元データ
v1 v2 v3 v4 … … … … vm
1
2
3
.
.
.
.
.
.
N
時系列
変数×個人×時間
三相三元データ
Metric MDS
• MDSは各対象を空間内の点として表現する。その表現され
たものを布置configurationと呼ぶ
• YHの定理ではある対象を中心に行列を分解したが,実際の
MDSでは行列の二重中心化(行・列方向両方の平均を抜き取
る)を行うことで原点を中心にする
• 原点は不動だが,先ほどの例のよ
うに反転・回転の可能性はあり
非計量的MDS
• 計量MDSは距離データが比率尺度水準で得られている必
要があるが,人文社会科学系のデータの場合はそこまで
厳密に測定できている場合は少ない
• そこで対象jとkの類似度を ,多次元空間での距離を
としたとき,
• となるように布置をきめる,というルールに弱める。
• 推定には不適合度Stressを目安にする(Kruscalの方法)
ならば
Stressの目安
• 次元数を決める時はStressを目安にする
Kruscalの基準
https://mjin.doshisha.ac.jp/R/Chap_27/27.html
金「Rと多次元尺度構成法」のサイトより
Stressの目安
• Stressをスクリープロットのように並べて判断することもある
岡太・今泉「パソコン多次元尺度構成法」共立出版 より
因子分析と違って
肘のところまで
採択する
具体例
具体例
isoMDS関数はStressを百分率(Stress*100)で出力。
これは0.00013671のことなのでExcellent!
具体例
1〜9次元まで試して
各ストレスを保存
プロット
二次元で十分!
具体例
具体例
テンポ速い
テンポ遅い 動きが大きい
動き小さい
結果より
• 軸は回転するので,提示された軸に意味付けしないこと
• 解釈は多様だが,例えば対象に付与された座標を従属変
数として,他の説明変数で回帰分析を行うなどして「解
釈次元の妥当性」を考えることもできる(#緑の紐本 参照
)
• 元は距離データなので,クラスタ分析と組み合わせるこ
ともできる
• 列変数の地図を描くこともできます
具体例
個人差MDS
• INDSCALという個人差を表現するモデルがあります
• 個人iが対象jとkの類似度を とつけたとします。
• 全ての個人の布置の原型となる共通布置空間では,
• 個人の特徴は次元に対する重みとして考えられて,
INDSCALのイメージ
共通布置
INDSCALのイメージ
共通布置
Aはdim2を潰す
dim1を引き延ばす
INDSCALのイメージ
共通布置
Bはdim1を潰す
dim2を引き延ばす
INDSCALの特徴
• 重みwには推定のため, , などの
制約を課す
• INDSCALは共通次元ができるので,軸の回転などの自由
度はなく,その解釈が可能
• INDSCALの重み行列wは対角行列だけど,対角の制約を
外したIDIOSCALという手法もある
具体例
• 豊田(2018)に提供したデータの一部を抜粋
• 10の観光都市(札幌,飛騨高山,舞鶴,佐世保,志摩,秋
吉台,野沢,道後,由布院,宮古島)についてのイメージ
を聞いた調査で,今回はその一部(5人分)をとりだしたもの
• INDSCALはsmacofパッケージでできる。リストになった
行列を渡すだけなので比較的楽チン。
結果
30代女性
60代男性
50代女性
40代女性
50代男性
地図に書き加える方法
• MDSで書かれた地図は対象の類似度を反映したもの
• 地図に何らかの情報を追記することでよりリッチな可視
化
• 選好の情報を追加するPrefmap
• 場にかかる力の情報を追加するAbelson Map
ここでは2つご紹介
Preference Mapping
• 類似度空間の中に「個人の点」を追加する
• この個人の点は理想点を表す=理想点と対象の点との距
離が選好度を表す
• 個人iの理想点座標を 対象jに対する選好度を とし
このように表す
ただし
回帰分析で解ける
Preference Mapping
• 先ほどの式を展開すると
• MDSで対象の座標( )は元待っているから,回帰分析を
行なって回帰係数を算出し,次の式で理想点を求められ
る。
詳しくは岡太・今泉「パソコン多次元尺度構成法」共立出版を
具体例
• 先ほどのM1の地図に自分の好みを書き込んでみよう
70 80 85
90
70 60
9050 85 70
※個人の感想です
さきほどのMDS布置を使います
二乗和などを付け加える
操作をしています
回帰分析で係数を算出
これを使います
小杉の理想点
結果
90点
85点
70点
多少の誤差はあるが同心円状に選好度が表現されている
Abelson Mapping
• Abelson(1954-55)が提唱したのは「電磁場」のメタファ
• ある点Pに加わる力(Valence)は対象との距離の二乗に反比
例して加算される
• 地図上の任意の点のValenceを計算し,等高線を描くこと
で態度空間を可視化する
(1954−55). A technique and a model for multi-dimensional scaling. Public Opinion Quarterly, W
具体例
• 先ほどのM1の地図に自分の好みを書き込んでみよう
• 強調するために平均75を引いて中心化しています
-5 +5 +10
+15
-5 -15
+15-25 +10 -5
※個人の感想です
小杉の「好き嫌いの境界」
小杉の「好き嫌いの境界」
この両者は(審査員の評定では
)似ているが(小杉の)好き嫌
いは逆=勾配が急なのでこの両
者の評価については心理的葛藤
が強い,と解釈できる
非対称多次元尺度構成法
• 距離は「対称」だが,類似度は非対称なことが結構多い
• 好きな人に嫌われる,いわゆるone way love
• ビールから発砲酒に変えたんです,という人は多くて
もその逆は少ない
• 人口の流入・流出や国際貿易の黒字・赤字
• 非対称情報に意味があるので,その情報を取り込みたい
というニーズからの非対称MDS
非対称多次元尺度構成法
• 距離空間が非対称性を許さない→空間の方をいじればいいじ
ゃない→千野のHFM
• ユークリッド空間に非対称情報を書き加えればいいじゃない
• →岡太・今泉の(楕)円モデル
• →宿久先生のエッジモデル
• →vonMises分布を使って対象に衣をまとわせる
• →Abelson Mapの高さとして非対称性を表現
Hermitian Form Model
• 距離空間を複素空間に拡張すれば内積で距離を表せる
• 行列を対称部と歪対称部に分解し,歪対称部を虚数にし
たエルミート形式の距離行列を作ると,固有値が実数で
得られることが証明できるし,固有ベクトルが布置を表
す
歪対称部
Hermitian Form Model
= +
具体例
対象1
対象2
対象3
対象4
具体例
対象1
対象2
対象3
対象4
読み取りポイント1
布置も複素数なので
これで一次元
(実部が横軸,虚部が縦軸)
読み取りポイント2
空間が方向性を持つ。
固有値が負の空間は反時計回り
固有値が正の空間は時計回り
空間の向きが反時計回
りなので対象3は対象
1,2が順(=好き)方向
に歪んでいるが対象1,2
からは嫌われている
詳しくは千野直仁「非対称多次元尺度構成法」現代数学社を
情報を書き足す系
岡田・今泉モデル
J
K j→kの距離は始点
の外縁から終点
を通って逆の外
縁まで
出典;http://www.rd.dnc.ac.jp/~shojima/ams/jindex.htm
出典;http://www.rd.dnc.ac.jp/~shojima/ams/jindex.htm
vMモデルの出力例
• この分析は荘島先生のサイトにあるアプリを使って実行
することができます。興味がある人は是非!
HFMの出力と比較してください
まとめ
• MDSは距離から地図を作る方法;ロバストな反応から精緻
な(多次元)尺度を作ることができるので,データによっては
面白い分析ができるかも
• MDSは地図なので,地図の上に落書きしたり色を塗ったり
と,モデルの加筆修正が比較的簡単にできる世界
• 非対称MDSは世界の中でも日本が特に抜きん出ている(岡
太・今泉・千野先生といったトップクラスがいる)ので,興
味がある人は行動計量学会の非対称部会をのぞいてみては

Mds20190303