SlideShare a Scribd company logo
1 of 28
Download to read offline
対応分析研究会
第10回
2022/01/08
津⽥塾⼤学 数学・計算機科学研究所
藤本⼀男
kazuo.fujimoto2007@gmail.com
本⽇の報告の概要
• 第18章 多重対応分析(MCA)
• 古典的MCA
• indicator⾏列に対してCAを⾏う
• Burt⾏列に対してCAを⾏う
• 変数が増えることによる慣性の低下。解釈の困難。
• 第19章 同時対応分析(JCA)
• 古典的MCAの問題を解決するアプローチ
• Burt⾏列の対⾓に位置する部分⾏列の影響の除去:JCA
• ただし、軸が⼊れ⼦にならない。
• 事前の策としての「調整されたMCA」Adjusted MCA
• Greenacreの補正
• Benzecriの補正との関係
• いくつかの【付録】
MCAの⼊⼒形式
• 処理対象とするのは、⾏:個体 x 列:変数 の形式
• よくある調査データ
• これを、変形してCAを⾏う
• indicator⾏列
• Burt⾏列
古典的MCA(1)
• indicator⾏列
• これと、index⾏列は異なる。
• 数量化III類でも⽤いるのは、indicator⾏列
• ⼤隅は1994で「完備背反型」という訳をあてた:Complete
disjunctive
• 英語⽂献では、Crisp coding とも呼ばれている。Eric Beh 2021?
• このcodingの特徴から慣性(分散)などがシンプルな形になる。
(LeRoux&Rounanet2010=2021,MCAでの第2章)
• 数量化III類を説明した⽇本語⽂献などでは、そこを無視して、バイナ
リーのデータをfunctionに投げ込んでいるものもある。ご⽤⼼!
indicator⾏列の例 Exhibit18.1
p140
古典的MCA(2)
• Burt⾏列
• Burt⾏列(B)とindicator⾏列(Z)はシンプルな関係にある。
• このBにCAを⾏う。
Burt⾏列の例 Exhibit 18.4
実際の処理
• 分析者が意識する必要があるのは、indicator版でやるのかBurt
版でやるのか、というところだけ。
• ただし、Package ca やGDAtoolsでは、こうしたデータ表変換
のツールも提供されているので、処理の途中過程を確認するこ
とも可能。
• サンプルスクリプトで例をお⾒せします。
Burt版の処理とサプリメンタリ変数
• indicator⾏列を のように処理すると、⾏の情報
(個体)が⾒えなくなる。
• 個体情報を重ね合わせるためには、個体データをBurt⾏列に対
して、サプリメンタイ⾏として追加してCA処理することになる。
第19章 同時対応分析 Joint CA
• Joint は「同時」と訳すお約束なので(Joint probability:同時
確率など)同時対応分析としたが、このJointは、Burt⾏列の各
下位⾏列(変数ごとの各⼆元クロス表)が体現する慣性をJoint
して⼀枚のマップに表現する、という意味。
• p146の訳註に書きました。
• 出所は、Greenacre 1994,”Multiple and Joint Correspondence
Analysis”
おわび(値を追い切れてません)
• Exhibit 18.6からExhibit19.1への展開。
• おなじように、Exhibit19.2の計算
• 表の中の「平均値」の計算は、確認できるのですが、18.6と
19.1のつながりを押さえてません。そのために、以下の説明は、
「そうなる」というはずです、という「信念」のもとに展開し
ます。
Burt版での慣性の「膨張」
• 対⾓位置にある(変数⾃⾝をクロスした)対⾓⾏列が有してい
る慣性。
• この慣性は分析には、不要。
• そこをはずすと、⾮対⾓部分は、もっとよく表現されている。
この4つの平均が、61.2
この4つ
つまり全体の
平均が、64.9
≒65
⾮対⾓部分の平均は、82.12
本⽂の83.2ではない…。
元の表(Exhibit18.6)の慣性から計算すべきのように思います。割合ですから
試⾏中です…
• Exhibit18.6は、下位⾏列が体現する全慣性。
• Exhibit19.1は、⼆元マップが体現する下位⾏列の慣性
• ここから「⼆元マップの体現要素」/全慣性の体現要素
で計算すればいいような…。
それはともかく、対⾓⾏が邪魔!
• で先にいきます。
• そこで提案されたのが、JCA(p146)
• 対⾓ブロックを完全に無視するアルゴリズム。
• この「無視」は、解析的にはえられないので、コンピュータをつかっ
て、繰り返し演算(イテレーション)を⾏う。(収束条件として、差
異:イプシロン、か、試⾏回数を設定。Package caで提供されている。
mjca内部で使っているので、単独で使うことはないと思いますが、ア
アルゴリズムはわかるかも。コード、読んでません。)
• 修正Burt⾏列を更新していきます。最後の収束した修正Burt⾏列は、
mjcaのresultとして取り出せます。
ただし、JCAには「問題」が
そこで提案されたのが、尺度変更
• p148「MCAの結果を⾮対⾓表にあわせて調整する」
• というアプローチ
• ここから、調整⽅法の原理の説明がはじまります。
• またまたお詫び。
• この過程も追い切れてません….。
• なので、こういう補正をするとこんな⾵になりますよ、という説明をします。
⽐べてみます
• 本⽂にはないですが、indicator版、Burt版、JCA、Adjusted版
の慣性分解と累積パーセントを計算してみました。
• データは、18章19章で使われているISSP1994のサブセット
Burt版の慣性は、indicator版の慣性の2乗
(Benzecri)はindicator版と同じ
ベンゼクリの補正との関係
• 以上が、GreenacreによるJCAを経由したAdjusted MCAの仕組
みです。
• このAdjustedは、Greenacreの補正と呼ばれて、Benzecreの補
正と⽐較されます。
• CAiP3では、Greenacreは、Benzecreの補正については触れてません
が、CARME本の”Multiple Correspondence Analysis”所収の”From
Simple to Multiple Correspondence Analysis”p68 で、Benzecre の補
正についても触れていて、
• 「This approach gose to the opposite extreme of giving an overly
optimistic expression of esplained inertia,…」と述べています。
⼤隅先⽣の説明スライド
⼤隅先⽣の説明スライド(2)
CAiP3_jpでの説明との対応は、p149
式19.3〜5 で、MはQに対応。
まとめ
• シンプルCAからMCAへの基本は、indicator⾏列、Burt⾏列へのCA
として展開。
• しかし、慣性が「⼩さく」なる問題がある。
• そこで、Greenacreは、JCAを提案
• Greenacreの補正
• それを加味したMCAが、mjcaのdefault設定になっている。“Adjusted”
• LeRoux&Rouanet
• GDAアプローチでは、indicator⾏列+Benzecreの補正
• FactoMineR+GDAtoolsもこれ
• GreenacreのAdjustedは、ca::mjcaでしか実装されていない?
【付録1】
• 2021年10⽉の⽇本社会学会発表後に⾃覚したこと。
• TukeyのEDAを「可視化」の強調として理解するのは、問題。
• Tukey1977では、BoxplotやStem&leaf といった可視化ツール中⼼に述
べられているが、Tukey1962では、データ解析の新しい展開という視
点から、計算機統計学に⾔及していて、そこから計算機統計学的な推
定(inference)を論じている。
• これは、bootstrapingを提唱したEfronとも共通。
• Efronは、R.A.Fisherのアイデアは(すべて?)計算機統計学的アイデ
アを基礎としている、と主張。「21世紀のFisher」という講演論⽂。
• LeRoux & Rouanet (つまりは、ブルデューでありベネットであり)
は、その流れの中に、帰納的データ解析(IDA)を開発している。
【付録2】
• 遅ればせながら、『ディスタンクシオン』を購⼊しました(普及
版)。
• これが出た時(2020/12)に磯先⽣がぼやいておられましたが、
「対応分析」があいかわらず、照応分析になっています。
• でも、分析⼿法の名称だけなら、まだしも、主軸とすべきところが
「因⼦」になっているし、主軸分析とすべきところが因⼦分析に
なっていたりして、その後(1990)の宮島喬先⽣たちが、ブルデ
ユーの継承?と⾔って⽇本のデータを因⼦分析して展開している
「誤解」にもつながっているように思います。2017の増補改定版で
も、そのまま。
• このあたり、⽇本でのCAの未定着度合いを⽰すものとして、今書い
ている紀要に「注」として書いています。読んでいただけるレベル
になったら(2校あたり)、お送りします。
フランス語と英語版も⽐較してみた
• フランス語版、PDFで読めるのですね。
• 英語版、最初の訳が、1984年(Oxford版)。違う部分があるの
か不明ですが、そのあと、Routrige版。
• 英訳でも、CAは、Correspondence analysis とAnalysis of
Correspondence が混在。
• CAの理論が英語圏に紹介されたのが、1984年のルバールらによ
る”Multivariate Descriptive Statistical Analysis” (⽇本では、⼤隅た
ちが、これを1994に翻訳『記述的多変量解析法』)と、Greenacre
の”Theory and Application of Correspondence Analysis”。
• なので、1984年だと英語圏でも、CA?なんですか、それ、だったと思
われます。
“analyse factorielle” をめぐる理解
• Exploratory multivariate data analysis from its origins to 1980:Nine
contributions.
• LUDOVIC LEBART
• http://www.jehps.net/Decembre2008/Lebart_ang.pdf
• 2 Principal axes methods
• - The principal axes methods, and also principal components analysis,
act by reducing certain "multidimensional" representations, thereby
producing essentially planar or sometimes three dimensional graphical
visualizations of the elements that are to be described. In the French
statistics literature, the “analyse factorielle” includes all the
representation techniques that use "principal axes ": principal
components analysis, simple and multiple correspondences, the
analysis in common and specific factors of Spearman and
Thurstone, used mainly by psychologists and by psychometricians
(factor analysis).
• (強調は引⽤者)
時代的制約…
• ディスタンクシオンの英訳は1984年。やっと英語圏にCAが紹
介され始めた年。
• ディスタンクシオンの邦訳は1990年。まだ、⼤隅先⽣たちの翻
訳「記述的多変量解析」1994はでてません。
• でも、第5章の注にでてくる⽂献は、他ならぬ、このルバール
たちの書籍です。
• 2020/12なのに(分析⼿法について)検討もされてない、とい
うことだと思います。これが、⽇本でのCA、MCAの現状!

More Related Content

More from Tsuda University Institute for Mathematics and Computer Science

More from Tsuda University Institute for Mathematics and Computer Science (15)

第9回20211009第16−17章
第9回20211009第16−17章第9回20211009第16−17章
第9回20211009第16−17章
 
藤本一男発表資料日本社会学会94v1.0
藤本一男発表資料日本社会学会94v1.0藤本一男発表資料日本社会学会94v1.0
藤本一男発表資料日本社会学会94v1.0
 
C ai p3_jp_no1v1.0
C ai p3_jp_no1v1.0C ai p3_jp_no1v1.0
C ai p3_jp_no1v1.0
 
C ai p3_jp_no2
C ai p3_jp_no2C ai p3_jp_no2
C ai p3_jp_no2
 
C ai p3_jp_no3v1.0
C ai p3_jp_no3v1.0C ai p3_jp_no3v1.0
C ai p3_jp_no3v1.0
 
C ai p3_jp_no4v1.20
C ai p3_jp_no4v1.20C ai p3_jp_no4v1.20
C ai p3_jp_no4v1.20
 
C ai p3_jp_no5v1.2
C ai p3_jp_no5v1.2C ai p3_jp_no5v1.2
C ai p3_jp_no5v1.2
 
ggplotのplotエリアで日本語ラベルを使う
ggplotのplotエリアで日本語ラベルを使うggplotのplotエリアで日本語ラベルを使う
ggplotのplotエリアで日本語ラベルを使う
 
Jss20191006 howc aexpressrelationsv1.1
Jss20191006 howc aexpressrelationsv1.1Jss20191006 howc aexpressrelationsv1.1
Jss20191006 howc aexpressrelationsv1.1
 
Jss20191006 ts13 gda_open
Jss20191006 ts13 gda_openJss20191006 ts13 gda_open
Jss20191006 ts13 gda_open
 
Wrapper to use Japanse font with vcd::mosaic and build it as pakcage
Wrapper to use Japanse font with vcd::mosaic and build it as pakcageWrapper to use Japanse font with vcd::mosaic and build it as pakcage
Wrapper to use Japanse font with vcd::mosaic and build it as pakcage
 
vcdで日本語(3) long format が旧世界とのGateway
vcdで日本語(3) long format が旧世界とのGatewayvcdで日本語(3) long format が旧世界とのGateway
vcdで日本語(3) long format が旧世界とのGateway
 
その数量化、大丈夫ですか?
その数量化、大丈夫ですか?その数量化、大丈夫ですか?
その数量化、大丈夫ですか?
 
Use Japanese with vcd/vcdExtra package
Use Japanese with vcd/vcdExtra packageUse Japanese with vcd/vcdExtra package
Use Japanese with vcd/vcdExtra package
 
2つのmosaic plotと日本語表示
2つのmosaic plotと日本語表示2つのmosaic plotと日本語表示
2つのmosaic plotと日本語表示
 

第10回2022−01−08第18−19章a