SlideShare a Scribd company logo
1 of 23
Ubuntu Offline Meeting 15.12
或る卒論生の執筆環境
UbuntuとRとLibreOfficeを使って論文執筆した思い出話
Rakugou
自己紹介
● 名前:Rakugou
● (当時の)専攻:社会心理学(マクロ社会心理学)
● うぶんちゅ まがじん ざっぱ〜ん♪
– (Vol.3 Let's noteの記事の人)
当時の論文について
● ※生データが見当たりませんでしたすいませ
ん。多分削除したんだろうと思います。
● 社会保障について心理学的な立場から見た話
● もともと、学位論文として書いてて、某学会に
投稿することになったものの、あえなくリジェ
クト→お蔵入り
● 使った分析:(分散分析)、(回帰分析)、因子
分析、パス解析
実際論文書いてみて
● 見渡せばこの環境(Ubuntu+LibreOffice+R)は私
だけ
● LibreOfficeの互換性のところでこける
● パス解析とか便利なところは便利
下準備
● RとRで使用するパッケージをインストールし
ます。
● install.packages(“lavaan”, “psych”)
● library(psych, lavaan)
因子分析
因子分析
● 今回は探索的因子分析
● 質問紙などで得られたデータから探索的に似た
ような項目としてまとめられるような因子を求
めようとする因子分析
今回使用するデータ
● 元データがなかったので、サンプルデータを使いま
す。
● Psychパッケージに入っているBIG FIVEのサンプル
データを使用します。
● 読み込む際はdat = bfi
– 今回は、性別、学歴、年齢は必要ないので削除
– dat2 <- dat[, c(-26,-27, -28)]
● 詳細は(英語)
https://cran.r-project.org/web/packages/psych/psych.pdf
因子分析
● fa(dat2, nfactor = 5, rotate=”promax”, fm=”ml”)
– nfactor:分ける因子の数
– rotate:回転方法(今回は「プロマックス回転」)
– fm:因子抽出法(今回は「最尤法」)
データ整形する際に気をつけたいこ
と
● そのままコピペするとえらいこと
になる。
● 一度テキストにペースト→それを
コピーする
● あるいは、ツールバーの「デー
タ」→「テキストから列へ」を選
択し、区切りのオプションを右図
のように設定します。
– スペースに☑
– 空のフィールドを省くに☑
因子分析
結果
● BIG FIVEの名の通り5因子にしてみたけど、悪く
ないまとまり方だった。
● 変数を和訳して名前を決めてる時間がなかった。
– ヽ('ω')ノ三ヽ('ω')ノもうしわけねぇもうしわけねぇ
● 本当はアルファベットの順番に別れるところっぽ
いんだけど、そうでもなさげ。
– 回転法とか因子の数とか因子抽出法とかを変えて何度
も何度もやり直して、因子構造を特定していく
パス解析
パス解析
● 回帰分析のおばけ
● (単/重)回帰分析は(1/2以上)の独立変数から従属
変数への影響を見るが、パス解析は変数間に自
由に因果関係を仮定する。
独立変数 従属変数
因果関係のつながり(=パス)
データの紹介
● ダミーデータ(発表者作成)を使います。
● Ubuntu Offline Meeting開会前に、参加者のうち19名にアン
ケートを取ったもの(と仮定)
● 「何が幸福感につながるか」というものを測定
● 中身(すべて←最大値5、→最大値1)
– 自分は幸せである⇔幸せでない
– Ubuntuを好き⇔嫌い
– からあげが食べたい⇔食べたくない
– 疲れている⇔元気だ
– 旅行が好きだ⇔嫌いだ
パス解析
● pass <- read.csv(“karaagehappy.csv”, header=”TRUE”)
● model <- '
– tired ~ travel
– Karaage ~ tired
– Shiawase ~ tired + travel + karaage + ubuntu
– '
● result <- sem(model, data=pass )
● summary(result, standardized = TRUE, fit.measure = TRUE,
modindices = TRUE)
● fitMeasures(result, c(“gfi”,”agfi”))
パス解析
パス解析
パス解析
● パス図をLibreOffice Drawを使って前のスライド
のように描きます。
● パス解析の出力をうまいことパス図として表現
するためには
http://rakugou.hatenablog.jp/entry/20131219/138746
をご覧ください(手前味噌)
結果(このデータのね)
● 適合度的には嫉妬するくらいよかった。
– モデルがうまくはまっていた。
● 旅行慣れしてるほうが疲れてるっぽい(でも有意ではない)
● 疲れてる人はからあげ食べたいとか思ってるわけではなさげ
(有意ではない)
● 疲れてる人ほど幸せって思ってない(当たり前)
● Ubuntu好きな人ほど幸せって思ってる(ステマ)
● からあげ食べたい人はちょっぴり不幸っぽい(有意ではな
い)
_人人人人人人人人人人人人人人人人人人人人人人_
> からあげ食べたい人はちょっぴり不幸っぽい <
 ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y ̄
からあげ食べて幸せになろうな(´・ω・`)
参考文献
● 小杉孝司・清水裕士(編)(2014). M-PlusとRによ
る構造方程式モデリング入門
● Sunny Side Up!: http://norimune.net/652
● Psychパッケージ(PDF): https://cran.r-
project.org/web/packages/psych/psych.pdf

More Related Content

Viewers also liked

TwoRavens: A Graphical, Browser-Based Statistical Interface for Data Reposito...
TwoRavens: A Graphical, Browser-Based Statistical Interface for Data Reposito...TwoRavens: A Graphical, Browser-Based Statistical Interface for Data Reposito...
TwoRavens: A Graphical, Browser-Based Statistical Interface for Data Reposito...datascienceiqss
 
K-10714 ABHISHEK(TQM )
K-10714 ABHISHEK(TQM )K-10714 ABHISHEK(TQM )
K-10714 ABHISHEK(TQM )shailesh yadav
 
CA World 2010 Wily Impact Awards - Axciom
CA World 2010 Wily Impact Awards - AxciomCA World 2010 Wily Impact Awards - Axciom
CA World 2010 Wily Impact Awards - AxciomDarrell Sandefur
 
Как оценить эффективность рассылки Web push уведомлений
Как оценить эффективность рассылки Web push уведомленийКак оценить эффективность рассылки Web push уведомлений
Как оценить эффективность рассылки Web push уведомленийНикита Поляк
 
Cropp (Coltures Risks Observation and Prevention Platform)
Cropp (Coltures Risks Observation and Prevention Platform)Cropp (Coltures Risks Observation and Prevention Platform)
Cropp (Coltures Risks Observation and Prevention Platform)Mohamed Elhariry
 
BGREVE - Dec 2016 - Base
BGREVE - Dec 2016 - BaseBGREVE - Dec 2016 - Base
BGREVE - Dec 2016 - BaseBill Greve
 
Content based instruction
Content based instructionContent based instruction
Content based instructionYicel Cermeño
 
Double page spread layouts boxes
Double page spread layouts boxesDouble page spread layouts boxes
Double page spread layouts boxesHeatherUnderwood
 
Calidad y sistemas de acreditación universitaria
Calidad y sistemas de acreditación universitariaCalidad y sistemas de acreditación universitaria
Calidad y sistemas de acreditación universitariaAngela Angulo Marimon
 
Case russian venture_industry_-_3_komanda
Case russian venture_industry_-_3_komandaCase russian venture_industry_-_3_komanda
Case russian venture_industry_-_3_komandaEVA
 
My TEDxNYED talk: Connecting the Physical & the Digital: A Key to Getting Any...
My TEDxNYED talk: Connecting the Physical & the Digital: A Key to Getting Any...My TEDxNYED talk: Connecting the Physical & the Digital: A Key to Getting Any...
My TEDxNYED talk: Connecting the Physical & the Digital: A Key to Getting Any...Metropolitan Museum of Art @MetMuseum
 
Huib Schoots - Changing the context - eurostar -
Huib Schoots - Changing the context - eurostar - Huib Schoots - Changing the context - eurostar -
Huib Schoots - Changing the context - eurostar - TEST Huddle
 
Garde d'enfant en anglais
Garde d'enfant en anglaisGarde d'enfant en anglais
Garde d'enfant en anglaisGrande Classe
 

Viewers also liked (16)

TwoRavens: A Graphical, Browser-Based Statistical Interface for Data Reposito...
TwoRavens: A Graphical, Browser-Based Statistical Interface for Data Reposito...TwoRavens: A Graphical, Browser-Based Statistical Interface for Data Reposito...
TwoRavens: A Graphical, Browser-Based Statistical Interface for Data Reposito...
 
K-10714 ABHISHEK(TQM )
K-10714 ABHISHEK(TQM )K-10714 ABHISHEK(TQM )
K-10714 ABHISHEK(TQM )
 
CA World 2010 Wily Impact Awards - Axciom
CA World 2010 Wily Impact Awards - AxciomCA World 2010 Wily Impact Awards - Axciom
CA World 2010 Wily Impact Awards - Axciom
 
леся українка
леся українкалеся українка
леся українка
 
Как оценить эффективность рассылки Web push уведомлений
Как оценить эффективность рассылки Web push уведомленийКак оценить эффективность рассылки Web push уведомлений
Как оценить эффективность рассылки Web push уведомлений
 
Neoliberalismoyeducacin 120104164359 phpapp01
Neoliberalismoyeducacin 120104164359 phpapp01Neoliberalismoyeducacin 120104164359 phpapp01
Neoliberalismoyeducacin 120104164359 phpapp01
 
Cropp (Coltures Risks Observation and Prevention Platform)
Cropp (Coltures Risks Observation and Prevention Platform)Cropp (Coltures Risks Observation and Prevention Platform)
Cropp (Coltures Risks Observation and Prevention Platform)
 
BGREVE - Dec 2016 - Base
BGREVE - Dec 2016 - BaseBGREVE - Dec 2016 - Base
BGREVE - Dec 2016 - Base
 
Content based instruction
Content based instructionContent based instruction
Content based instruction
 
Double page spread layouts boxes
Double page spread layouts boxesDouble page spread layouts boxes
Double page spread layouts boxes
 
Calidad y sistemas de acreditación universitaria
Calidad y sistemas de acreditación universitariaCalidad y sistemas de acreditación universitaria
Calidad y sistemas de acreditación universitaria
 
Case russian venture_industry_-_3_komanda
Case russian venture_industry_-_3_komandaCase russian venture_industry_-_3_komanda
Case russian venture_industry_-_3_komanda
 
My TEDxNYED talk: Connecting the Physical & the Digital: A Key to Getting Any...
My TEDxNYED talk: Connecting the Physical & the Digital: A Key to Getting Any...My TEDxNYED talk: Connecting the Physical & the Digital: A Key to Getting Any...
My TEDxNYED talk: Connecting the Physical & the Digital: A Key to Getting Any...
 
Huib Schoots - Changing the context - eurostar -
Huib Schoots - Changing the context - eurostar - Huib Schoots - Changing the context - eurostar -
Huib Schoots - Changing the context - eurostar -
 
Diapositiva 3
Diapositiva 3Diapositiva 3
Diapositiva 3
 
Garde d'enfant en anglais
Garde d'enfant en anglaisGarde d'enfant en anglais
Garde d'enfant en anglais
 

Uom15.12 sotsuron

Editor's Notes

  1. どうも、はじめましての方が多いと思います。Rakugouです。よろしくお願いいたします。今回のテーマが「Ubuntuのこれから」でありましたが、表題にもあるとおり、「思い出話」となっており、ほんとに真逆の話になってしまいました。
  2. 簡単に自己紹介です。Rakugouといいます。当時の専攻は社会心理学でした。マクロ社会心理学なので、多対多というところで、社会問題から恋愛感情までいろんなことをやってるゼミでした。 一応、うぶんちゅまがじんざっぱーんではLet&amp;apos;s noteであれこれしている記事を書いておりました。 ちなみに、多分誰かがこういう紙を持っているので、そこにQRコードやらURLやら書いてあるので、まだ買ってないよーっていう人はそこから購入していただければありがたいです。
  3. 生データはあったとしても「卒論以外で使用しない」って明記してあったはずなのでレギュレーション違反になりそう。 あまり詳しく公表するとアレですので、そんな感じで。 お蔵入りしてから年数が経過しているので、久しぶりにみたら新鮮というかなんというか。 使った分析は()で囲っているのは卒業論文で(字数が足らなかったので)分析を足しているもの、論文を提出するときは卒業論文をかなりスリムにした形で提出しましたので、分析は()囲ってないものしかやってないです。
  4. 実際に論文を書いてみると、本当にこの環境は私だけですね。Rを使っている先生も当時はほとんどいなかったように思います。模索しながら書いてみるというのも楽しかったですが。 学部生の時は特にデータを見せる機会があまりなかったので、自分でそれっぽく体裁整えて作って出すだけでよかったのですが、いざ学会に投稿する事態となると、相手が当然LibreOfficeで作ってくれているわけもなく、表の体裁が崩れるわ、行間を突っ込まれるわ、いろいろありました。(最終的にChromeのMicrosoft Officeアプリで細かい体裁を直していたのはいい思い出です。) 後述しますが、Microsoft Officeでレポート書くより、LibreOffice使ったほうが便利だったというところもありました。
  5. Rのインストールはソフトウェアセンターで[R sta]って入れると検索しやすい。 というか、Rだけで検索しようとすると、ノイズが入りすぎて見つからない。 Rを起動すると端末が出てくるので、そちらで上記コマンドを入力します。 「lavaan」パッケージを久しぶりに入れてみたら、[ベータ版]とか言われたので「そんなの知るか」と入れておいてください。 libraryで先ほどインストールしたパッケージを使います。
  6. まず因子分析の説明から入ります。
  7. 例えば、「困ってる人を見たら助けてあげたくなる」「お年寄りには進んで席を譲る」「道端に落ちているゴミはきちんとゴミ箱に捨てる」というのは「奉仕心」という一つの因子にまとめられるように、観測した変数をひとつの因子にまとめてあげるのが探索的因子分析 他には、すでに因子構造がわかっているものを分析して、本当にきちんと分かれているかどうかを検証していく確証的因子分析というものがあります。 心理学では主に前者を使うことが大半だと思います。後者を使うのは○○を測定するための質問紙の開発に用いられます。
  8. データがなくなっちゃってるので、今回はサンプルデータ。 BIG FIVEと言ったら、心理学業界では有名な性格検査です。人間の性格が5つに別れると仮定して作られたものです。この検査はかなり長い歴史があって追試とかが多数されているものなのでアレなのですが。 詳細は英語で書かれています。「寡黙である」「子供が好き」「友達がすぐできる」とか25項目あります。かなり疲れているので、英訳できてません。
  9. 今回はこのようなコードを使います。nfactorで因子の数。今回は忠実に5を選択します。今回は試していませんが、4とか6とかでやってみてもまた違った味わい深い結果が出てくるかもしれません。 rotateで回転法をかけます。barimaxやらgeominやらいろいろ回転方法がありますが、今回は一番オーソドックスなプロマックス回転を使います。心理学を学ぶ学生であれば、多分一番使用頻度が高い回転法かと思います。 因子抽出法もこれまたいろいろあります。これもオーソドックスに最尤法を使います。間違って最も犬らしい方法と書く人が後を耐えないらしいですが、犬ではありません。尤です。
  10. データ整形する際には気をつけておかないといけません。私が卒論で書いた時も「空のフィールドを省く」にチェックを入れ忘れたあまり、データをちょこちょこいじらないといけないなんてトラブルが起こりました。結構手間でしたが、あの時こうしておけばよかったなぁなんてことを思い出すものです。 データの整形という意味では、あとから心理学論文用のフォーマット(縦線がいらないとか、わかりやすいように同じ因子でまとまるものは順番買えたり色付けしたり)に書き換えないといけないので、テキストそのままより、Calcで残しておいたほうが後々加工しやすいので便利です。
  11. というわけで先ほどの出力を整理したものがこちらになります。因子の番号順に並び替えて、それぞれを黄色で色を塗っています。橙色で塗っているところは、数値が一番高くなかったものの、最高値とあんまり変わらないものなので、一応印をつけておきました。こういうのがでると、因子構造としてあまりふさわしくないので、前述したとおり、回転法や因子抽出法を変えたりして、安定した構造を見つけるためにやり直すわけです。 横についてるのが相関図で、リーグ表みたいな形になっています。因子Aと因子がどれくらい相関があるかを見ています。ちなみに、他の因子との相関が高いとあまり因子構造としてよろしくないですが、ML1があまりよろしくない以外は概ねよさげな結果になっています。(だいたい0.3以下が望ましいと言われているようです。)
  12. 結果はまぁ、このとおりです。そんなに悪くはなかったです。私の卒論では、因子間相関が0.5超えたりしているものを出したりしているので、結構模範解答に近いかなという感じです。実際自分で質問紙を作って測定してみると思いの外うまく因子構造がでてこなかったりします。 実際はアルファベットの通りに別れるのが理想的というところですが、実際はそうでもなさそうです。私は力尽きてできませんでしたが、この結果を元に、この質問項目は何を表しているというのを考えてみるというのもいいのかもしれませんね。
  13. 続いてパス解析です。 ちなみに、私が卒業論文を書いた時はRでパス解析ができませんでした。結局SPSSとAmosという商用ソフトを使ってやることになりました。もちろん上記はUbuntu非対応です。仮想化してやるには両方共あまりにも重いのでおすすめしません、し、アカデミックライセンスがなければ上のソフトは両方とも2桁万円するので、遊びで使って見るにはリスクが大きすぎますね、、、 あとで参考文献上げますが、これのおかげでパス解析が一応できるようになりました。山口には足を向けて寝ることができない体になってしまいました。
  14. パス解析は要するに「回帰分析のおばけ」これにつきます。 上にも書いてますが、独立変数が原因、従属変数が結果、なので、「○○だから××である」というものを××の部分を一つじゃなくていくつも推定できたり、いろんな方向へこの矢印を飛ばすことができるので、複数の因果関係を捉えたりできます。また、特に心理学とか社会学では、因果関係は一方向に特定できない、他の因果関係が実際は絡んでいる(測定しないものは無視されてしまうのだが)ので、そういったものを考慮できるのも強みです。
  15. データは私が勝手に作りました。こういう体で行きます。データは何かしらの形でアップロードできたらと考えていますが、多分まだ準備出来ていません。 わりかし適当に作っているので、「他にこういう因果関係あるやろ」という意見が多々出てくると思いますが、ご勘弁願いたいですごめんなさい。
  16. 一応私のデータがCSVになっているので、CSVからデータを組み上げる形のコマンドになっております。 2行目からモデルを作っていきますがモデルは〜の左が従属変数、右が独立変数となっています。 ちなみに、Amosはお絵かきするようにパスを組み立てていくことができますが、Rにはそういう機能がないので、予めパスを自分で作っておくか頭の中でイメージしておいて、それをプログラムに起こす形にするのがおすすめです。 sem関数を使って[result]にデータを格納 格納したデータの詳細を見に行く形になります。 standardizedは標準化、単位によってデータがブレブレにならないよう均す役割があります。fit.measureは適合度指標です。一番下のコードで追加の適合度指標を出します。 modindicesで修正指標を出します。モデルを修正する際の参考にするものです。
  17. モデルが出力された時に見るのが赤で囲まれた部分です。上のAICやBICも適合度指標となります。300あればいいらしいという話もありますので、今回の指標は、標準化されたBICだけちょっと下回っているものの、あとは普通にいい値が出ています。 Estimateが実際の影響力の強さになります。1が最強で、数字が大きいほど影響力が強くなります。 p値が帰無仮説が出てくる確率です。例えば、一般人であるということを証明するために、一般人で無い確率がどれくらい低いかということを示す必要があります。一般人でないと判定される確率がごく稀であると認められて初めて一般人認定を受けるということになります。人文科学では5%(0.05)で棄却することが多いです。今回の場合、tiredとUbuntuのところが0.01以下となるので、帰無仮説が棄却されています。下のgfi, agfiも適合度指標で、両方共0.9あれば上出来と言われています。gfiについては0.9超えをしていて、agfiについても、まあまあいい数値を記録しています。実際ここまでいい数字がでることはあまりありません。
  18. 前のスライドでは、因果関係がわかりにくいため、パス図を書いています。実際に論文を書くときにもパス図を書くことが求められるので、こういうフォーマットで記載するのがよいでしょう。
  19. 先程のパス図はWLibreOffice Drawを使うと書きやすいです。Microsoft Officeでは描画専門のソフトがなかったため、Wordで描いたもの、あるいはPowerPointで描いたものをコピーして貼付けするというのが一般的なやり方だそうです。パス図はAmosを使えば近いものができます。あとからせっせと書くよりは楽ですが。 手前味噌ですが、2年前にLibreOffice Advent Calendarのために書いたものにパス図の書き方を詳しく載せていますので、ご参照ください。
  20. 結果はご覧のとおりです。有意ではないというのは、「帰無仮説を棄却できていないので意味のある影響とは言えない」ということを意味します。本当は矢印消したほうがいいんだけど、今回は消すとかなり寂しい図ができてしまうので、そのままにしています。