Submit Search
Upload
KH Coder 2 チュートリアル(スライド版)
Report
Share
khcoder
Follow
•
56 likes
•
265,670 views
1
of
30
KH Coder 2 チュートリアル(スライド版)
•
56 likes
•
265,670 views
Report
Share
Download Now
Download to read offline
Self Improvement
KH Coderを用いて計量テキスト分析を行う方法を、簡易なスライド形式で解説。
Read more
khcoder
Follow
Recommended
KH Coder 3 チュートリアル(スライド版) by
KH Coder 3 チュートリアル(スライド版)
khcoder
90.1K views
•
32 slides
Jaccard係数の計算式と特徴(1) by
Jaccard係数の計算式と特徴(1)
khcoder
109.7K views
•
9 slides
Rファイルの保存と活用1―KH Coderによる対応分析の結果のエクスポートと活用― by
Rファイルの保存と活用1―KH Coderによる対応分析の結果のエクスポートと活用―
khcoder
123K views
•
8 slides
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで by
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
Yahoo!デベロッパーネットワーク
25.7K views
•
91 slides
数式からみるWord2Vec by
数式からみるWord2Vec
Okamoto Laboratory, The University of Electro-Communications
11.9K views
•
37 slides
15分でわかる(範囲の)ベイズ統計学 by
15分でわかる(範囲の)ベイズ統計学
Ken'ichi Matsui
55K views
•
47 slides
More Related Content
What's hot
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」 by
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
Hitomi Yanaka
4.2K views
•
69 slides
不均衡データのクラス分類 by
不均衡データのクラス分類
Shintaro Fukushima
59K views
•
34 slides
単語の分散表現と構成性の計算モデルの発展 by
単語の分散表現と構成性の計算モデルの発展
Naoaki Okazaki
35.5K views
•
42 slides
強化学習その4 by
強化学習その4
nishio
10.6K views
•
51 slides
協調フィルタリングを利用した推薦システム構築 by
協調フィルタリングを利用した推薦システム構築
Masayuki Ota
25.9K views
•
64 slides
Rolling Hashを殺す話 by
Rolling Hashを殺す話
Nagisa Eto
4.1K views
•
26 slides
What's hot
(20)
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」 by Hitomi Yanaka
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
Hitomi Yanaka
•
4.2K views
不均衡データのクラス分類 by Shintaro Fukushima
不均衡データのクラス分類
Shintaro Fukushima
•
59K views
単語の分散表現と構成性の計算モデルの発展 by Naoaki Okazaki
単語の分散表現と構成性の計算モデルの発展
Naoaki Okazaki
•
35.5K views
強化学習その4 by nishio
強化学習その4
nishio
•
10.6K views
協調フィルタリングを利用した推薦システム構築 by Masayuki Ota
協調フィルタリングを利用した推薦システム構築
Masayuki Ota
•
25.9K views
Rolling Hashを殺す話 by Nagisa Eto
Rolling Hashを殺す話
Nagisa Eto
•
4.1K views
幾何を使った統計のはなし by Toru Imai
幾何を使った統計のはなし
Toru Imai
•
29.6K views
Active Learning 入門 by Shuyo Nakatani
Active Learning 入門
Shuyo Nakatani
•
51.8K views
パターン認識と機械学習 §6.2 カーネル関数の構成 by Prunus 1350
パターン認識と機械学習 §6.2 カーネル関数の構成
Prunus 1350
•
14.3K views
ドメイン適応の原理と応用 by Yoshitaka Ushiku
ドメイン適応の原理と応用
Yoshitaka Ushiku
•
5.5K views
ベイズ統計学の概論的紹介 by Naoki Hayashi
ベイズ統計学の概論的紹介
Naoki Hayashi
•
78.9K views
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」 by Takashi J OZAKI
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Takashi J OZAKI
•
154.4K views
目grep入門 +解説 by murachue
目grep入門 +解説
murachue
•
89.4K views
Visual Studio CodeでRを使う by Atsushi Hayakawa
Visual Studio CodeでRを使う
Atsushi Hayakawa
•
9.3K views
暗号技術の実装と数学 by MITSUNARI Shigeo
暗号技術の実装と数学
MITSUNARI Shigeo
•
9.6K views
リクルート式 自然言語処理技術の適応事例紹介 by Recruit Technologies
リクルート式 自然言語処理技術の適応事例紹介
Recruit Technologies
•
39.2K views
グラフニューラルネットワーク入門 by ryosuke-kojima
グラフニューラルネットワーク入門
ryosuke-kojima
•
51.5K views
Jaccard係数の計算式と特徴(2) by khcoder
Jaccard係数の計算式と特徴(2)
khcoder
•
8.8K views
強化学習その3 by nishio
強化学習その3
nishio
•
26.8K views
系列ラベリングの基礎 by Takatomo Isikawa
系列ラベリングの基礎
Takatomo Isikawa
•
5.4K views
Viewers also liked
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41st by
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41st
khcoder
45K views
•
28 slides
サリエンシーマップの視線計測への応用 by
サリエンシーマップの視線計測への応用
Masatoshi Yoshida
8.7K views
•
1 slide
GraphX Advent Calendar Day17 by
GraphX Advent Calendar Day17
鉄平 土佐
9.2K views
•
7 slides
エクセルでテキストマイニング TTM2HADの使い方 by
エクセルでテキストマイニング TTM2HADの使い方
Hiroshi Shimizu
45.9K views
•
53 slides
ようやく分かった!最尤推定とベイズ推定 by
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
96.8K views
•
31 slides
エクセルで統計分析 統計プログラムHADについて by
エクセルで統計分析 統計プログラムHADについて
Hiroshi Shimizu
6.3M views
•
41 slides
Viewers also liked
(6)
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41st by khcoder
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41st
khcoder
•
45K views
サリエンシーマップの視線計測への応用 by Masatoshi Yoshida
サリエンシーマップの視線計測への応用
Masatoshi Yoshida
•
8.7K views
GraphX Advent Calendar Day17 by 鉄平 土佐
GraphX Advent Calendar Day17
鉄平 土佐
•
9.2K views
エクセルでテキストマイニング TTM2HADの使い方 by Hiroshi Shimizu
エクセルでテキストマイニング TTM2HADの使い方
Hiroshi Shimizu
•
45.9K views
ようやく分かった!最尤推定とベイズ推定 by Akira Masuda
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
•
96.8K views
エクセルで統計分析 統計プログラムHADについて by Hiroshi Shimizu
エクセルで統計分析 統計プログラムHADについて
Hiroshi Shimizu
•
6.3M views
Similar to KH Coder 2 チュートリアル(スライド版)
【旧版】KH Coder 3 チュートリアル(スライド版) by
【旧版】KH Coder 3 チュートリアル(スライド版)
khcoder
7.4K views
•
31 slides
Code igniterでテスト駆動開発 資料作成中 by
Code igniterでテスト駆動開発 資料作成中
Takako Miyagawa
4K views
•
35 slides
さわってみよう Firefox OS in 福岡 by
さわってみよう Firefox OS in 福岡
Honma Masashi
813 views
•
21 slides
Cocos2d xでの開発の準備 by
Cocos2d xでの開発の準備
Tomoaki Shimizu
15.4K views
•
9 slides
FreeCAD OpenFOAM Workbenchセットアップ方法と課題 by
FreeCAD OpenFOAM Workbenchセットアップ方法と課題
murai1972
7.8K views
•
18 slides
さわってみよう Firefox OS in 大阪 by
さわってみよう Firefox OS in 大阪
Honma Masashi
1.1K views
•
23 slides
Similar to KH Coder 2 チュートリアル(スライド版)
(13)
【旧版】KH Coder 3 チュートリアル(スライド版) by khcoder
【旧版】KH Coder 3 チュートリアル(スライド版)
khcoder
•
7.4K views
Code igniterでテスト駆動開発 資料作成中 by Takako Miyagawa
Code igniterでテスト駆動開発 資料作成中
Takako Miyagawa
•
4K views
さわってみよう Firefox OS in 福岡 by Honma Masashi
さわってみよう Firefox OS in 福岡
Honma Masashi
•
813 views
Cocos2d xでの開発の準備 by Tomoaki Shimizu
Cocos2d xでの開発の準備
Tomoaki Shimizu
•
15.4K views
FreeCAD OpenFOAM Workbenchセットアップ方法と課題 by murai1972
FreeCAD OpenFOAM Workbenchセットアップ方法と課題
murai1972
•
7.8K views
さわってみよう Firefox OS in 大阪 by Honma Masashi
さわってみよう Firefox OS in 大阪
Honma Masashi
•
1.1K views
KEONとPEAKが無くてもFirefox OS開発出来る by android sola
KEONとPEAKが無くてもFirefox OS開発出来る
android sola
•
12.3K views
Ide env by Shuichi Jinushi
Ide env
Shuichi Jinushi
•
80 views
Composer による依存管理 と Packagist によるライブラリの公開 by Shogo Kawahara
Composer による依存管理 と Packagist によるライブラリの公開
Shogo Kawahara
•
18.8K views
100626 ec cube勉強会初心者向けスライド by kuroki
100626 ec cube勉強会初心者向けスライド
kuroki
•
535 views
Verilog-HDL Tutorial (15) software by Hiroki Nakahara
Verilog-HDL Tutorial (15) software
Hiroki Nakahara
•
1.3K views
Step-Oriented Programming による任意コード実行の可能性 by kozossakai
Step-Oriented Programming による任意コード実行の可能性
kozossakai
•
738 views
Step-Oriented Programming による任意コード実行の可能性 by 坂井 弘亮 by CODE BLUE
Step-Oriented Programming による任意コード実行の可能性 by 坂井 弘亮
CODE BLUE
•
681 views
KH Coder 2 チュートリアル(スライド版)
1.
KH Coder チュートリアル 漱石「こころ」を題材に 【スライド版】 1
2.
本チュートリアルの内容 1. 2. 3. 4. 5. 2 KH Coderの準備 プロジェクト作成と前処理 頻出語と共起 それぞれの部(上・中・下)に特徴的な語 コーディングによるコンセプトの抽出
3.
1. KH Coderの準備 3
4.
1.1 Windows版パッケージをダウンロード ① http://khc.sourceforge.net/ か ら
「 Windows 版 パ ッ ケージ」をダウンロード ② 「khcoder‐2b30‐f.exe」 のようなファイル名をク リックすると、このペー ジに飛ぶ ④ 5秒ほど待つと、自動 的にダウンロードが開始 (セキュリティの警告が 出る場合は「許可」や 「保存」をクリック) 4 ③ この部分は 広告なので無視
5.
1.2 インストール(解凍) ② Unzip をクリック ①
ダウンロードしたファ イルをダブルクリック ③ 「unzipped successfully」 の表示が出れば完了なので、す べての画面を閉じる KH Coderは解凍(Unzip)するだけで利用可 5
6.
1.3 KH Coderの起動方法(Windows
7) ② 「C:¥khcoder」と入力 してEnter キー ① スタートボタン をクリック ③ 「kh_coder.exe」 Windows 8の場合は スタート画面で直接 「C:¥khcoder」と入力 6 をダブルクリック
7.
2. プロジェクト作成と 前処理 7
8.
2.1 プロジェクト作成(分析するファイルを指定) ① メニューから「プロジェクト」「新規」を選択 ②
「参照」をクリックして 「tutorial_jp」フォルダ内の 「kokoro2.txt」を開く ③ 自由にメモを入力 ④ 「OK」をクリック 次回KH Coderを起動した時は「新規」ではなく、「プロジ ェクト」「開く」を選択して、既存のプロジェクトを開く 8
9.
【解説】漱石「こころ」ファイルの内容 このチュートリアルでは漱 石「こころ」(kokoro2.txt)を 分析 物語最後の「先生」の自殺 は突然で不自然という批判 はもっともか? 「こころ」は上・中・下の 3部構成 「上_先生と私」のような 部の見出しをH1タグで括っ ている 部の内部がさらに一・二・ 三などの章に分かれている 9 「一」のような章の見出し をH2タグで括っている
10.
2.2 前処理(テキストから自動的に語を取り出す) ① KH
Coderのメニューから「前処理」「語の取捨選択」 重要な言葉なのに、 1語として抽出されな い時は「強制抽出」 ② 全角で「K」と入力 ③ クリック ④ メニューから「前処理」「前処理の実行」 10 →「OK」 KH Coderはアルファ ベット1文字を無視す るが、「K」は「ここ ろ」の重要な人物 そこで「K」を強制抽 出するよう指定して から、前処理を実行
11.
3. 頻出語と共起 11
12.
3.1 多く出現していた語 ① メニューから「ツール」「抽出語」「抽出語リスト」 ②
「頻出150語」を選択 ③ クリック 小説なので主要人物が上位に 「死ぬ」が89回と多く出現? 12 活用のある語は基本形に直し て抽出&カウント ex.「死ねば」→「死ぬ」
13.
3.2 共起ネットワークの作成 ① メニューから「ツール」「抽出語」「共起ネットワーク」 ②
「集計単位」として「段落」を選んで「OK」 同じ段落によく一緒に出現する (共起する)語同士を、線(edge) で結んだネットワーク ③ 「調整」をクリックして、 「描画数」を120にして「OK」 ④ 「調整」をクリックして、「出 現数の多い語ほど大きい円…」を チェックして「OK」 ⑤ 「カラー:」の箇所を「サブグ ラフ検出(modularity)」に変更 13 色々お試しください
14.
【解説】語の共起を探索する手法 階層的クラスター分析、MDS、自己組織化マップ等も利用可 MDS 共起ネットワーク 自己組織化マップ 共起する語のグループから、データ中のテー マないしトピックを探索できる これらの多変量解析の実行には内部でRを使用 14 クラスター分析
15.
3.3 KWICコンコーダンス 1/2 ①
メニューから「ツール」「抽出語」「KWICコンコーダンス」 ② 検索したい語を 入力してEnterキー ダブルクリックで、さら に広い範囲の文脈を表示 集計や解析の結果だ けを見るのでは不十 分(多くの場合) もとのテキスト中で 語がどのように使わ れていたかを確認! ③ 「集計」をクリックすると 15 コロケーション統計が開く
16.
3.3 KWICコンコーダンス 2/2 ①
前のページ手順でコロケーション統計が開く 「左1」は、左側の1つ目、すなわち 直前に出現していた回数のこと。 「意味」は「解る」の3つ前に5回出現 ② 表示する語を、 16 品詞をもとに選択可
17.
4. それぞれの部 (上・中・下) に特徴的な語 17
18.
4.1 それぞれの部の特徴語一覧 ① メニューから「ツール」「外部変数と見出し」「リスト」 ②
クリック ③ 「文」を選択 ④ 「特徴語」「一覧(Excel形式)」を選択 18 上・中・下の特徴語が 上 位 10 語 ず つ リ ス ト アップされる。数値は どの程度「特徴的」か を示すJaccard係数。
19.
【解説】特徴語からみる物語の流れ 下 は「先生」が主人公 に送った長い遺書。親 友「K」と「お嬢さん」 との三角関係などを通 じて、上では主人公に も読者にも「解ら」な かった事柄が明らかに。 上 では主人公と「先生」 中では主人公が実家に戻 が交流を深めていく。しか し「先生」の話はよく「解 ら」ないことも多い。 り「父」「母」との会話 が多くなる。「先生」と も「手紙」をやりとり。 19 Ex.
「先生の話のうちでただ一つ底まで聞きたかったのは,人間がいざと いう間際に、誰でも悪人になるという言葉の意味であった。単なる言葉と しては、これだけでも私に解らない事はなかった。しかし…」(上二九)
20.
4.2 対応分析による視覚的な探索 ① メニューから「ツール」「抽出語」「対応分析」 ②
「H1」になって いることを確認 ③ クリック 20 上・中・下の特徴を グラフィカルに探索
21.
【解説】対応分析の見方 ② 原点(0, 0)から見て、 「上_先生と私」の方向 にある語、そして原点 から離れている語ほど、 上に特徴的! 原点(0,
0) ※特徴語の一覧から読み 取れた上・中・下の特徴 と、おおむね同じ特徴を 対応分析からも読み取れ る。 21 ① 原点(0, 0)付近に はこれといって特徴 のない語が集まる
22.
5. コーディングによる コンセプトの抽出 22
23.
【解説】 コーディングとは 語ではなくコンセプトを数えたい場合もある 例えば「人の死」というコンセプトは、「死ぬ」だけ でなく「殺す」という語でも表現される コンセプトを数えるためのコーディングルール コード(コンセプト)の名前 *人の死 死ぬ or
殺す or 亡くなる コードを付与する条件。「死ぬ」 「殺す」「亡くなる」のどれかが出 現している文書は、「*人の死」に 言及していたと見なされる。 23 チュートリアルで使用 する「theme.txt」
24.
5.1 コーディングルールによる検索 ① メニューから「ツール」「文書」「文書検索」 ②
「参照」をクリック して「theme.txt」を開く ④ ダブルクリック ③「段落」を選択 ⑤ ダブルクリックで段落全体を表示 24 コーディングルール作成時には、どのような文書にコード が付与されているかを検索・確認することが大切
25.
5.2 コードのクロス集計(部ごと) ① メニューから「ツール」「コーディング」「クロス集計」 ②
「参照」をクリック して「theme.txt」を開く 人の死 恋愛 ③「段落」を選択 ④「集計」をクリック 友情 信用・不信 ⑤「バブル」をクリック してプロットを作成 25 下_先生と遺書 中_両親と私 上_先生と私 病気 コードが多く出現して いたかどうかを、部ご とに集計したプロット
26.
【解説】部ごとの集計から見る物語の流れ ③ 中・下のよ うな人物の死は 描かれていない のに、上でも 「人の死」が一 定数出現。 ① 下では3角関係のいき 人の死 さつから親友が自殺。そ のため「恋愛」「友情」 「信用・不信」が多い。 恋愛 Per
cent : 友情 5 10 信用・不信 15 ② 中では病気で死に する 26 「父」の様子が描かれる。 下_先生と遺書 中_両親と私 なぜ? 次の分析で確認! 上_先生と私 病気
27.
5.3 コードのクロス集計(章ごと) ① 5.2に続けて以下の操作を行う ②「文」を選択 ③「見出し2」を選択 ④「集計」をクリック ⑤「選択」「人の死」を クリックしてグラフを作成 27 「人の死」が多く出現 していたかどうかを、 章ごとに細かく見る折 れ線グラフ
28.
【解説】「人の死」の推移から 1/2 ① 自殺の直前だけを見 ②
しかし物語全体に視 野を広げると、「先生」 が死ぬことに執着してい る様子が、上でも詳細に 描かれている。 Ex. 「…先生の話は,容 易に自分の死という遠い 問題を離れなかった。そ うしてその死は必ず奥さ んの前に起るものと仮定 … 」(上三五) ると、「先生」はかな り急激に決意を固めて いるようにも見える。 上二四 上三五 ③ 自殺の理由の一部には、お 金や恋に切羽詰まれば誰でも悪 人になる、人間一般への失望 28 Ex. 「…自分もあの叔父と同じ人間だと意識した時…。他に愛想を尽か した私は、自分にも愛想を尽かして動けなくなったのです」 (下五二)
29.
【解説】「人の死」の推移から 2/2 ④ 自殺が突然で 不自然という批判 は必ずしもあたら ないのでは? 計量テキスト分析 の利点として: データ全体を見 渡す視点が得ら れる 目で読むべき特 徴的な部分はど こか探索できる 29 上二四 上三五
30.
おわりに さらに詳しくは 『社会調査のための計量テキスト分析』 (樋口耕一著,ナカニシヤ出版,2014) 第3章の文章版チュートリアルや、 KH Coder同梱のリファレンスマニュアル、 掲示板(ユーザーフォーラム) などをご利用ください。 謝辞 30 本チュートリアルの作成と改善にあたって は、立命館大学産業社会学部ならびに大学 院社会学研究科の学生諸氏にご協力いただ きました。