More Related Content
Similar to 雑誌・新聞・JSTデータから見る「よりよい企業選択へのヒント」 (20)
雑誌・新聞・JSTデータから見る「よりよい企業選択へのヒント」
- 4. Ⅱ,背景と目的(1)
2015/3/16All Analytics Championship 4
ーⅠ,背景と目的
就職活動の始まる大学三年……学生たちは霧の中に立たされたように感じている
【一般的な(よくいる)大学三年生モデル】
テニスサークルに所属。テニスはせずに毎日飲み会ばかり
授業は初回だけしか出ない
試験は過去問を駆使。なんとか単位だけは確保
口癖は「めんどい」「しんどい」
<T大学経済学部三年、アズマーさん>
――2015年3月、就活解禁――
自己分析
業界研究
説明会
OB訪問
いきなりそんないろいろ言われても……
私、テニス(飲み会)しかしてないし……
とりあえず受ける会社だけ絞ろうっと!
- 5. Ⅱ,背景と目的(2)
2015/3/16All Analytics Championship 5
ーⅠ,背景と目的
いざ絞ろうにも企業ありすぎ……
企業が何をしてるのかわからない
多分野にわたって活躍する企業が多く、所属業界がわからない
どの分野に強い企業なのかがわからない
とりあえず知ってるところ
を受けたら内定もらった。
もうここでいいや
ブラック! 早期退職へ…
こうならないためにも、
データから学生のよりよい企業選択のヒントを得る
「企業の適切な分類」や「企業の強み」を
より正確に把握できるような仕組みがほしい
- 6. Ⅱ,背景と目的(3)
2015/3/16All Analytics Championship 6
ーⅡ,分析方針
分析対象業界の
トレンドを知れる
専門誌:業界のトレンド
総合誌:総合のトレンド
分野のつながり
を重視して企業の
グルーピングを行う
対象業界への
適切なアクセス
UDC分類から
対象グループの
強みの違いが知る
より自分の興味に近い
企業を見つけられる
これらをアズマーさんの場合にあてはめるとどうなるか。
以降、活用法の具体例として分析を行っていく
<雑誌データ>
【総合誌】でトレンド業界をつかむ
志望業界が定まっていない 活動度の高い企業がいい
<新聞データ>
掲載数の多い100社を選択
雑誌データ 新聞データ JSTデータ
- 7. Ⅲ,使用データの紹介
2015/3/16All Analytics Championship 7
i. 雑誌記事データ(日経BP社さま)
10個の雑誌のうち「日経ビジネス」「日経TRENDY」
の記事内にある「記事の要約」を使用
ii. 新聞記事データ(日刊工業新聞社さま)
各新聞記事につけられた「企業名」および、記事を
26の分野に分けた「弊社独自の記事区分」を使用
iii. JST科学技術文献データ
特に「年代、機関名、JST分類、抄録、名寄せ」
を使用(化学物質データ・科学用語データは使用しない)
iv. 各企業の有価証券報告書
平均年収や人数、平均勤続年数などを参考にする
ーⅠ,使用データの紹介
- 8. Ⅳ,分析① 世間のトレンド(1)
2015/3/16All Analytics Championship 8
ーⅠ,方針と方法
雑誌データから、世間のトレンドがわかるのでは
i. 雑誌は、人々が興味を持ってくれないと売れない
ii. 特に総合情報雑誌は世間のトレンドを反映したものと考えられる
雑誌内の頻出単語を調べ、その特徴から注目業界を考察する
10誌のうち、今回は専門性が低い(総合情報を扱う)と思われる
「日経ビジネス」および「日経TRENDY」の2誌を考察対象にした。
【日経BP社 10誌】
日経ビジネス・日経コンピュータ・日経
エレクトロニクス・日経メディカル・日
経パソコン・日経情報ストラテジー・日
経コミュニケーション・日経ヘルス・日
経TRENDY・日経アーキテクチュア
たとえば、日経メディカルの
頻出単語は「高齢、感染、臨床」
専門誌では世間全体が注目
するトレンドは得られない。
(業態内のトレンド把握には有効)
- 9. 2015/3/16All Analytics Championship 9
ーⅡ,分析結果
日本、東京、電子、端末、パソコン、
デジタル、家電、メーカー、ポイントカード、
スマートフォン、iPhoneなど
日経TRENDYの頻出単語
メーカー、会社、技術、金融、工場、国内産業、
世界、自動車、投資、中国、発電、米国など
日経ビジネスの頻出単語
2010~2012の
三年間のデータ
”電子端末時代の到来”
”海外意識の高さ”
グローバルに活躍する
電子・デジタル業界
<年別に見ると、2011年に特徴的な共通単語あり>
大震災・原子力・発電・節電・夏 エネルギー業界
電子業界・エネルギー業界が現在トレンドの中心となる業界
Ⅳ,分析① 世間のトレンド(2)
- 10. Ⅴ,分析② 企業のグルーピング(1)
2015/3/16All Analytics Championship 10
ーⅠ,方針と方法
新聞データから、まず社会的に活動度の高い企業を抽出する
i. 新聞の役割は社会的に重要なニュースを伝えることである
ii. 記事に何度も現れる企業は、社会的に活動度の高い企業である
掲載数上位100社(団体)を調べ、後の分析対象とする
記事につけられた分野情報の数を企業ごとに集計し、以下のような表を作成
企業\分野 資源 食品 エネルギー 化学
トヨタ 300 50 100 20
ソニー 50 100 200 100
分野数を変数にしたクラスター分析により、グループ分けする
例)
分野情報によるグループ分け
- 14. Ⅴ,分析② 企業のグルーピング(5)
2015/3/16All Analytics Championship 14
ーⅢ,トレンドとグルーピングの関連
グローバルに活躍する
電子・デジタル業界
エネルギー業界
日立製作所、東芝、富士通、ソニー、
日本電気、三菱電機、シャープ、
NTT、KDDI、野村総合研究所
東京、関西、中部、九州、東北、中国
(以上電力)、東京ガス、大阪ガス
※ 企業抽出方法の問題から、今回は日本企業のみを対象企業とした
自動車系・電子部品系・エネルギー系の企業がそれぞれ多く固まる
電子部品系企業の集まるクラスター
エネルギー系企業の集まるクラスター
今回は、特に「日経TRENDY」のキーワードを重視し、
を分析の対象として抽出する
クラスターの上位分岐に、総合誌から得られたトレンド業界が固まっている
- 15. Ⅵ,分析③ 企業の強み(1)
2015/3/16All Analytics Championship 15
ーⅠ,方針と方法
以下のように企業ごとに集計し、分野の割合を円グラフで可視化
さらに抄録データの頻出単語から、より具体的な強みを知る
企業評価のため年収や従業員数の比較、キャリアアップへのヒントを紹介
企業\分野 機械工学 臨床医学 土木工学 企業経営
東芝 300 150 10 20
富士通 500 100 20 10
例)
各企業のJSTデータをUDC(国際十進分類法)により分野で分類する①
② 「UDC【精密機器】【機械工学】の割合が多い=強みがある」企業を選択
③
- 19. 2015/3/16All Analytics Championship 19
ーⅢ,企業選択と抄録データの照らし合わせ
雑誌によるトレンドから、
デジタル分野は UDC【精密機器】【機械工学】を重視し、
「富士通、日本電気、三菱電機、KDDI」を選択。
エネルギー分野は UDC【機械工学】に強い「東京電力」
および【臨床医学】に強い「関西電力」を代表で選択。
デジタル分野の4つには共通のワード
ネットワーク、データ、通信、
伝送、電力、制御、光など
エネルギー分野は2つの分野に分かれる
東電(工学一般に強み)
ガス、ネットワーク、設備、技術など
関電(病理学に強み)
患者、治療、血糖、診断、エコーなど
特に通信系統に強みがあるとわかる
技術面に強み
医療面に強み
抄録データと
照らし合わせて
具体的な強みを知る
Ⅵ,分析③ 企業の強み(5)
- 20. 2015/3/16All Analytics Championship 20
ーⅣ,選択企業の平均年収や従業員数は?
さらに年収推移は右肩上がり
(六企業の中で唯一)
一方の関電は2013年に急落
Ⅵ,分析③ 企業の強み(6)
2006~2013の
六企業の年収比較
東電は大震災のあった
2011年に急落
年収ではKDDIが
ひとつ抜けている
- 21. 2015/3/16All Analytics Championship 21
ーⅣ,選択企業の平均年収や従業員数は?
従業員数推移は右肩上がり。
さらに平均年齢は右肩下がり
(いずれも六企業の中で唯一)
2011年以降も急落続く
一方、関西電力は右肩上がり
Ⅵ,分析③ 企業の強み(7)
2006~2013の
六企業の従業員数比較
三菱電機は年収と
合わせてバランスが良い
東電は大震災のあった
2011年に急落
- 22. 2015/3/16All Analytics Championship 22
ーⅤ,入社後のキャリアアップイメージ
今回は、先ほどの有価証券データを参考に、
比較的年収の高い「KDDI」、
バランスがよく採用も多そうな「三菱電機」、
さほど震災の影響を受けていないように見える「関西電力」
の三企業について調べてみる。
Ⅵ,分析③ 企業の強み(8)
各企業、論文著者の機関移動を調べることで
入社後のキャリアアップイメージがつかめるのでは?
i. 対象企業グループの論文執筆者を調べる
ii. その執筆者の論文データを集め、時系列順に並べる
iii. 論文の機関名を調べ、移動の傾向を把握する
<方法>
- 24. Ⅶ,結論(1)
2015/3/16All Analytics Championship 24
ーⅠ,分析のまとめ
総合誌から
世間のトレンド把握
出現回数上位
100社を選出
UDC・抄録から
企業の強みを把握
雑誌データ 新聞データ JSTデータ
電子・デジタル業界
エネルギー業界
分野情報で
クラスターわけ
電子、端末、
スマートフォン、
大震災、etc……
トレンド業界把握 目的業界企業の把握
東芝、シャープ、
ソニー、NTT、
KDDI、etc……
+
関西電力は医療、
富士通は電子、
etc……
よりよい企業選択
+
年収・従業員数比較
キャリアアップ評価
- 25. Ⅶ,結論(2)
2015/3/16All Analytics Championship 25
ーⅡ,活用イメージ
雑誌データ・新聞データの使い方を変えれば
個々人の目的や状況に応じた企業選択の支援が期待できる
ケース① 目指す業界が決まっている
専門誌による同様の分析で、目的業界のトレンドが把握できる
ケース② 大企業以外にも目を向けたい
新聞データ上位100社に限らない同様の分析により。未知の
企業の所属業界や業界の近い企業を知ることができる
JSTデータによる企業の強みやキャリアアップの把握は
学生だけでなく転職を考える社会人への活用も期待できる
さらに……
(企業ごとの強みの細かい違いが企業選択の決め手となるため)
- 27. 分析のプロセス
27
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 27
ーⅠ,雑誌データを用いた分析(結果の詳細)
日経TRENDY
全体 2010 2011 2012
日経ビジネス
メーカー、億、会社、
海外、開発、企業、技術、
業界、金融、経営、経済、
見る、言う、後、工場、
国内、今年、昨年、産業、
市場、自動車、社長、
商品、消費、情報、世界、
成長、生産、大手、大震災、
中国、投資、東日本、
発電、米国、問題、力
日本、東京、電子、端末、
通信、製品、人気、増える、
相次ぐ、多い、続く、消費、
商品、施設、市場、始める、
使う、開発、会社、家電、
価格、駅、モデル、
メーカー、ポイントカード、
ホテル、スマートフォン、
パソコン、ネット、デジタル、
テレビ、オープン、アプリ、
iPhone。
電子、昨日、
スマートフォン、
ケータイ、カード、
保険、米国、日本、
東京、端末、最新型
ポイント、パソコン
アプリ、iPad、
iPhone、
会社、開発、関係、
企業、億、メーカー
技術、業界、金融、
経営、経済、見る、
言う、国内、今年、
昨年、産業、事業、
自動車、社長、商品、
消費、世界、成長、
政権、生産、大手、
中国、発表、民主党、
米国
サービス、メーカー、
会社、海外、開発、
企業、危機、技術、
経営、経済、原子力、
工場、国内、産業、
市場、事故、自動車、
社会、商品、消費、
情報、震災、世界、
成長、生産、投資、
東日本、大震災、発電、
被災、福島、米国
メーカー、会社、開発、
企業、技術、経営、
経済、国内、市場、
事業、自動車、消費、
世界、成長、生産、
大手、中国、東京、
日本、発表、発売、
米国、問題
ヒット、消費、サービス、
普及、登場、電子、通信、
端末、増える、人気、
新、女性、集める、手帳
時代、施設、市場、最大
最新、高速、高級、業界、
拡大、開発、海外、モデル
メーカー、ホテル、ブーム
ブランド、パソコンネット
デジタル、タブレット、
スマートフォン、アプリ、
発売、スマートフォン、
東日本、搭載、通信、
端末、大震災、節電、
人気、震災、情報、消費
商品、車、施設、市場、
最新、業界、各社、開発
家電、価格、夏、メーカ
ヒット パソコン テレビ
タブレット、サービス、
カメラ、エコ、 iPhone
アンドロイド、アプリ
- 28. 分析のプロセス
28
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 28
ーⅡ,新聞データを用いた分析
使用データ:“Q_NV_JST_2010.tsv”(2010年分)
“Q_NV_JST_2011.tsv”(2011年分)
“Q_NV_JST_2012.tsv”(2012年分)
・32列~52列目の企業名(KJ)を記事ごとにまとめて付与し、
出現回数の多い企業を取り出す。
→今回は200記事以上登場する企業(約100社)を取り出した
・5列目の弊社独自の記事区分(KK)の二文字目が記事ごとに
26の分野を示す文字なので、二文字目だけを記事に付与する。
・企業ごとに記事の区分を集計し、表にする(次ページからの表)
→今回の分析では、この表を距離行列化しクラスター分析にかけた。
※掲載数を除外し、分野出現傾向だけで見るのなら標準化の必要がある。
(掲載数の少ない企業も合わせて分析したいときなどの場合、必須)
→ここでは参考のため、上位100社に対し、標準化した表を用いた
クラスター分析結果も掲載する(後のページのデンドログラム)
三つのデータを
まとめたデータ
を使用する
- 29. 分析のプロセス
29
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 29
企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
(株)日刊工業新
聞社
0 5 3 1 15 4 3 1 9 171 43 20 26 5 1 46 44 16 15 8 0 3 40 859 63 1814
トヨタ自動車
(株)
1 11 2 2 32 18 2 2 28 73 64 20 1788 5 2 62 37 8 37 68 5 1 30 216 77 257
日産自動車(株) 2 8 3 1 22 11 0 0 9 47 42 1 1224 4 2 34 33 1 18 17 3 1 25 143 47 168
(株)日立製作所 3 6 1 0 39 9 2 1 11 90 603 14 27 6 3 39 50 0 10 10 1 2 312 122 100 160
東芝 2 7 1 0 63 7 1 1 5 69 755 9 23 9 1 27 58 2 13 26 1 0 64 128 74 147
本田技研工業
(株)
1 2 1 0 14 8 0 1 6 34 32 12 1021 0 1 28 10 0 7 37 1 0 9 98 17 116
東京電力(株) 5 16 8 3 473 10 0 3 23 75 98 11 42 1 2 34 51 3 18 56 3 4 59 346 26 186
富士通(株) 2 1 1 0 13 4 1 0 1 15 269 3 5 3 6 14 63 0 10 27 0 0 525 54 46 86
日本電気(株) 1 10 0 0 18 8 1 0 1 4 348 6 14 2 10 15 20 1 9 22 1 0 510 50 67 66
三菱重工業(株) 2 6 2 0 45 4 0 0 7 517 55 9 162 3 37 31 19 0 12 9 0 4 12 100 36 116
三菱電機(株) 2 7 0 0 24 1 0 0 2 198 559 24 23 5 12 30 42 2 7 4 0 0 35 61 45 95
東京大学 5 7 10 2 28 46 74 0 2 33 47 15 13 7 24 37 34 4 12 8 1 0 47 137 458 280
シャープ(株) 1 11 1 1 30 6 1 0 3 4 563 0 9 2 1 20 19 2 15 12 0 0 65 71 27 93
ソニー(株) 2 2 0 0 6 4 0 2 0 6 571 0 9 9 2 26 19 3 5 44 0 0 60 78 28 76
第二電電 0 1 0 0 6 0 0 0 0 1 33 0 3 0 0 8 1 1 8 13 0 5 585 17 5 28
スズキ 0 0 0 0 1 4 0 1 10 17 5 0 543 0 0 9 6 0 5 2 1 0 0 34 4 74
川崎重工業(株) 0 4 0 0 16 2 1 0 3 260 8 24 213 1 7 18 14 0 2 4 0 5 4 44 8 71
マツダ(株) 0 0 0 0 3 1 0 0 0 15 8 0 448 0 0 16 2 0 8 6 0 0 4 22 22 52
富士重工業(株) 0 1 0 0 2 0 0 0 0 33 5 10 454 0 5 8 3 0 5 1 0 2 2 28 12 33
三菱自動車 0 1 0 1 7 2 1 0 0 6 28 0 417 1 0 4 14 0 13 2 1 2 5 40 14 33
日本電信電話
(株)
0 3 1 0 6 1 0 0 1 5 26 0 1 1 0 12 6 0 5 12 1 0 379 43 34 40
東レ(株) 1 2 1 129 14 111 3 0 1 6 9 0 18 1 0 17 48 3 15 5 0 2 1 26 23 65
関西電力(株) 1 4 0 1 255 1 0 1 2 20 19 3 5 0 0 7 25 1 2 8 0 3 21 103 3 49
理化学研究所 1 0 6 1 2 26 63 1 1 4 14 1 1 3 3 7 6 0 0 1 0 0 11 28 277 73
- 30. 分析のプロセス
30
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 30
企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
キヤノン(株) 0 0 1 1 1 1 0 0 1 11 278 2 1 11 0 16 9 0 3 27 0 0 11 44 13 76
伊藤忠商事(株) 14 4 13 4 22 12 1 0 4 13 9 1 13 1 0 27 14 0 167 16 1 0 23 31 2 65
ダイハツ工業(株) 0 0 0 0 0 3 0 0 2 7 1 0 375 0 0 6 4 0 2 1 0 1 0 11 6 38
東北大学 0 5 2 0 9 18 16 1 6 15 30 13 5 3 5 21 15 0 1 4 0 0 11 33 177 126
早稲田大学 0 4 0 0 12 6 3 0 2 9 7 12 9 4 1 37 8 3 5 6 0 0 10 46 85 187
日本銀行(株) 1 0 0 0 1 0 0 0 1 3 2 0 1 0 0 10 1 1 1 177 0 1 5 233 0 15
三菱商事(株) 16 5 6 5 28 14 0 0 9 27 4 0 23 0 3 14 20 2 111 31 3 3 4 59 2 46
東京工業大学 2 6 1 4 19 13 3 0 1 15 27 15 2 2 9 11 15 0 0 0 0 0 10 40 150 114
大阪大学 0 1 3 1 3 15 20 1 7 14 23 8 0 1 4 15 11 1 4 5 0 0 8 26 152 121
日本アイ・ビー・エ
ム(株)
0 0 1 0 1 1 0 0 1 4 35 0 1 0 0 3 7 0 2 3 0 1 307 23 6 21
中部電力(株) 2 1 3 2 220 6 0 0 5 14 11 0 13 0 0 17 18 0 2 5 0 1 3 39 4 35
野村証券(株) 0 3 0 0 1 2 0 0 4 1 4 0 4 1 0 8 0 0 1 176 1 0 8 95 4 17
ヤマハ発動機(株) 0 0 0 0 1 2 0 0 2 41 5 7 261 0 0 6 3 2 3 2 0 0 0 13 3 37
Apple Computer 2 3 5 2 0 2 1 0 3 16 87 1 15 2 1 12 0 10 7 20 0 1 142 9 15 31
三洋電機(株) 1 3 0 0 10 3 0 0 0 12 237 0 25 1 0 8 14 1 6 3 0 0 9 17 3 32
三井物産(株) 21 8 3 1 29 9 1 0 8 5 12 1 12 1 0 8 9 2 131 12 0 1 10 36 1 63
マイクロソフト 0 3 0 0 0 0 0 0 0 2 70 0 8 0 0 6 2 0 1 16 0 0 234 6 6 27
丸紅(株) 5 1 4 4 28 2 1 0 4 22 7 0 11 0 0 16 6 1 155 17 3 0 3 36 4 50
住友商事(株) 12 2 2 2 18 8 1 0 22 17 6 3 24 0 0 14 13 1 112 15 1 1 25 26 1 49
(株)神戸製鋼所 1 4 0 1 24 5 0 0 143 47 4 1 6 0 0 29 8 2 2 4 0 1 3 21 6 53
慶応義塾大学 0 0 1 1 2 7 23 0 2 9 11 7 11 2 1 13 7 2 3 1 1 1 12 43 128 69
京セラ(株) 2 4 0 2 22 2 0 1 5 28 163 0 4 0 1 7 16 7 8 7 0 10 9 18 8 24
三菱マテリアル
(株)
23 1 0 2 9 28 0 8 81 40 7 0 3 1 1 11 12 0 1 76 0 0 0 7 1 29
日本航空(株) 0 1 3 0 2 0 0 0 0 0 1 0 13 0 0 15 2 1 65 16 0 102 9 33 0 24
東京瓦斯(株) 4 12 2 0 218 3 0 0 0 10 14 0 3 0 0 7 29 0 3 4 0 1 10 23 4 33
- 31. 分析のプロセス
31
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 31
企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
(株)野村総合研
究所
0 1 1 0 1 0 1 0 0 1 8 0 2 1 0 9 8 0 4 6 0 0 208 27 2 32
帝人(株) 1 0 0 100 10 59 1 0 2 0 7 1 3 2 0 14 21 1 0 2 0 0 3 9 9 38
大阪瓦斯(株) 2 6 2 1 187 6 0 0 0 6 4 0 3 0 0 7 17 2 3 4 2 0 8 17 9 37
IBM 1 0 1 0 2 1 1 0 0 2 62 0 0 0 0 5 7 0 1 2 0 0 184 10 19 13
九州電力(株) 2 0 0 0 166 1 0 0 1 7 11 1 2 0 0 7 9 0 3 2 1 0 5 40 6 44
東北電力(株) 1 2 0 0 152 6 0 0 3 12 26 0 2 1 0 7 9 0 5 5 1 0 11 34 5 25
武田薬品工業
(株)
0 0 34 0 0 159 24 0 0 1 1 0 0 0 0 9 1 0 5 6 0 0 1 27 7 31
住友金属工業
(株)
4 3 0 1 11 4 0 0 127 13 3 1 5 0 0 19 5 0 6 11 0 0 4 26 4 56
Boeing 0 0 0 1 0 4 0 0 6 78 7 2 111 2 4 5 0 2 10 5 0 20 1 19 8 19
名古屋大学 1 3 4 1 1 12 15 2 4 13 9 1 11 6 10 12 8 2 2 2 0 0 6 9 146 61
いすゞ自動車
(株)
0 0 0 0 1 2 0 0 2 3 0 0 240 0 0 8 3 0 1 3 0 1 2 13 1 18
JETRO 0 1 4 0 1 3 0 1 0 9 3 0 11 1 0 16 2 2 5 7 0 0 0 172 2 54
安川電機 0 1 0 0 2 0 0 0 4 107 44 36 5 1 0 15 2 1 1 1 0 1 1 17 4 46
大日本印刷(株) 0 1 0 3 0 3 2 0 1 3 115 0 0 1 0 2 5 64 7 0 0 0 41 6 14 19
(株)森精機製作
所
0 0 0 0 0 0 0 0 0 227 4 2 2 1 0 8 0 0 2 1 0 0 0 5 2 33
九州大学 1 0 2 0 4 11 6 0 5 11 20 2 2 0 4 11 9 0 3 0 0 0 14 23 94 64
日立建機(株) 0 2 0 0 0 0 0 0 3 181 14 9 4 1 1 7 1 0 2 6 0 0 2 10 1 40
TDK(株) 2 0 0 0 0 2 0 0 1 1 204 0 0 1 0 4 5 0 1 17 0 0 4 8 3 31
東日本旅客鉄道 0 9 2 0 4 1 0 0 1 6 8 1 10 0 0 6 7 0 69 10 0 75 2 34 5 33
三井造船(株) 2 3 0 1 8 3 0 1 4 87 2 1 105 0 0 9 4 0 0 0 0 0 3 12 6 27
京都大学 0 3 9 0 10 29 45 1 2 14 22 3 5 2 4 18 12 1 4 7 0 0 13 38 264 154
住友電気工業
(株)
2 1 0 0 3 6 0 0 36 48 82 1 16 1 0 5 6 0 5 0 1 0 7 16 8 25
清水建設(株) 0 143 0 1 11 1 0 0 2 9 7 2 1 1 0 7 21 0 3 1 4 0 7 7 8 29
Volkswagen 0 0 0 0 1 1 0 0 1 8 8 3 217 0 0 4 2 0 0 0 0 0 2 5 0 3
GM 0 1 0 1 1 0 0 0 2 13 19 0 169 1 0 6 3 0 2 1 1 1 3 11 4 13
- 32. 分析のプロセス
32
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 32
企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
オムロン 0 2 1 0 4 0 0 0 0 29 110 2 6 15 0 9 6 0 2 1 0 0 15 15 5 26
クボタ 1 0 2 2 3 3 0 0 1 127 0 0 4 0 0 12 24 3 2 0 0 0 0 10 11 40
凸版印刷(株) 0 3 2 2 2 10 0 0 0 1 84 0 0 1 0 8 4 58 3 3 0 0 41 4 5 14
中国電力(株) 1 4 0 1 168 2 0 0 0 1 3 0 0 0 0 7 11 0 2 6 2 0 3 17 1 15
(株)小松製作所 1 3 0 0 2 1 0 0 2 105 1 5 1 0 1 8 3 1 1 19 0 0 5 37 5 42
(株)島津製作所 0 0 1 0 0 1 2 0 1 76 12 0 7 57 2 8 1 0 2 1 0 0 1 8 23 36
昭和電工(株) 4 0 0 2 7 107 0 0 19 4 19 0 7 0 0 17 4 1 1 3 0 0 1 8 4 29
(株)リコー 2 1 0 1 0 3 0 0 0 3 142 0 1 4 0 7 17 0 2 1 0 0 11 15 9 15
宇部興産(株) 4 1 1 3 13 130 0 2 3 3 3 0 1 0 1 12 1 1 0 6 0 0 0 6 4 35
日立造船(株) 0 1 0 1 4 0 0 0 1 86 4 1 59 2 0 8 11 0 1 3 0 0 1 11 6 27
大和ハウス工業
(株)
0 124 0 0 5 0 0 0 0 2 3 0 1 0 0 6 6 0 8 4 9 0 5 20 4 34
(株)クラレ 2 0 0 24 14 107 0 0 2 2 1 0 0 0 0 15 12 1 0 0 0 0 0 3 1 24
(株)帝国データバン
ク
0 4 2 1 1 0 0 0 1 2 2 0 3 0 0 58 2 2 13 4 0 0 3 88 0 28
北海道大学 1 3 3 0 2 6 11 1 6 5 13 1 0 2 3 3 8 1 3 0 0 0 9 15 81 35
オークマ 1 0 0 0 2 0 0 0 0 147 0 1 0 0 0 5 0 0 0 1 0 0 0 7 3 42
(株)豊田自動織機
製作所
0 1 0 0 2 0 0 0 1 37 1 0 107 0 0 7 3 0 3 1 0 0 1 4 15 23
富士電機(株) 0 2 1 0 10 0 0 0 2 8 125 0 2 2 0 2 3 0 3 0 0 0 8 5 8 25
キリンビール(株) 0 0 138 0 0 0 1 0 0 0 0 0 0 0 0 7 8 1 10 2 0 1 1 7 1 29
旭化成工業(株) 0 6 4 8 10 83 4 0 2 1 4 0 0 1 0 10 14 0 3 5 1 0 0 11 8 30
ファナック(株) 0 2 0 0 0 0 0 0 1 109 2 26 4 0 0 1 0 0 0 17 0 0 0 8 2 33
(株)大林組 0 141 0 1 8 1 0 0 0 5 2 0 0 0 2 3 19 0 1 3 1 0 3 9 6 21
(株)村田製作所 0 1 0 0 0 3 0 0 1 12 128 0 4 1 0 5 4 1 0 5 0 0 2 12 4 20
ヤマザキマザック
(株)
0 0 0 0 1 0 0 0 0 146 1 3 2 0 0 3 0 0 0 0 0 0 0 7 5 32
ダイキン工業(株) 0 5 0 0 7 10 1 1 0 67 43 0 1 1 0 8 4 0 2 2 1 0 2 15 8 22
- 34. 分析のプロセス
34
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 34
ーⅢ,JSTデータを用いた分析(分類、抄録)
使用データ:“g_cs1s_split1.tsv”(論文の機関名分割)
“g_cs1s_split2.tsv”(分割2)
・新聞・雑誌で絞った企業名に一致する論文番号をそれぞれ抽出。
※企業名一致で指定するしかないため、たとえば”Apple”を調べると
企業名のどこかに”Apple”を含む企業が全て選択されてしまい、
正確な抽出ができない。ゆえ、今回は日本企業のみを対象とした。
使用データ:“s_cc1gs.tsv”(JST分類)
・先ほど抽出した論文番号をリンクさせ、6列目のUDCを取り出す。
企業ごとに数を数え、表を作って円グラフにしたものが今回の結果である
使用データ:“q_ab1g.tsv”(和文抄録)
・論文番号とのリンクで、抄録データを取り出す。頻出単語を調べリストアップした
※企業ごとに頻出の条件を変更。富士通は17回以上、NECと三菱電機は35回以上、
KDDIは20回以上、東京電力は10回以上、関西電力は40回以上とした。
(表は次ページに載せた)
- 35. 分析のプロセス
35
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 35
X53
1
X53
2
X53
4
X53
5
X53
7
X53
9
X54
3
X54
4
X54
8
X57
5
X57
7
X59
1
X61
2
X61
3
X61
4
X61
5
X61
6
X61
7
X61
8
X62
0
X62
1
X62
4
X62
8
X62
9
X65
6
X65
7
X65
8
X66
1
X66
2
X66
6
X66
9
X68
1
X69
6
X69
9
日立 1 1 0 0 3 2 0 0 1 0 0 0 1 0 0 0 6 0 0 0 19 2 0 2 0 0 1 0 1 1 7 10 0 0
東芝 3 14 8 26 29 66 5 21 10 1 3 9 5 27 20 111 402 6 6 25 968 6 104 30 24 0 26 3 12 11 54 296 18 2
富士
通
1 3 0 18 0 52 4 6 10 3 3 2 1 21 21 13 17 1 0 1 414 3 7 9 3 3 43 2 1 3 7 214 1 0
日本
電気
3 2 5 41 22 51 1 33 7 6 8 1 2 6 13 20 22 0 0 3 736 8 14 26 7 1 25 9 2 7 6 379 0 0
三菱
電機
12 5 7 22 17 26 5 3 1 0 0 0 2 4 11 5 14 1 0 11 927 7 38 62 20 0 25 2 1 0 14 275 18 0
シャ
ープ
1 0 0 8 3 14 2 12 1 0 1 0 2 2 3 1 5 0 0 0 118 0 6 0 0 1 1 0 0 1 2 26 1 0
ソ
ニー
5 0 2 2 2 16 3 7 4 1 1 2 1 26 2 2 21 0 0 0 162 2 1 0 1 1 8 2 0 0 3 41 0 0
KDD
I
1 0 2 1 0 0 0 0 0 0 0 0 1 0 3 1 5 0 0 0 268 1 0 2 1 0 0 0 0 0 0 176 0 0
NTT 17 0 28 142 64 173 14 43 15 12 15 25 20 61 104 149
186
8
58 74 13
192
9
62 31 5 8 0 32 11 4 0 14
138
4
16 20
野村
総研
1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 20 4 0 2 1 11 23 0 0 0 0 42 0 0
東京
ガス
0 0 1 0 0 0 0 1 0 0 1 0 0 16 11 0 11 0 0 12 29 26 28 0 0 0 3 0 25 0 14 0 21 0
大阪
ガス
1 0 0 0 0 1 0 7 0 0 0 0 1 8 6 0 1 0 0 7 25 4 10 0 0 0 2 1 12 1 5 2 6 0
東京
電力
0 3 2 0 7 0 0 4 0 3 3 4 0 4 11 4 95 1 9 8 204 102 13 3 0 0 3 0 2 3 8 10 20 0
関西
電力
0 1 0 1 1 1 1 7 0 2 5 2 2 11 5 41 360 12 4 9 136 30 29 0 0 0 3 2 3 2 2 12 9 4
中部
電力
0 1 1 0 8 6 0 0 0 0 0 1 1 2 5 1 0 0 0 8 153 27 20 1 1 0 1 0 5 4 0 14 7 2
九州
電力
0 0 0 1 6 1 0 1 0 0 1 0 0 0 0 0 0 0 0 11 76 20 3 0 0 0 3 0 3 2 2 5 2 0
東北
電力
0 1 0 0 0 0 0 0 0 0 1 0 1 3 1 0 0 0 0 0 64 8 4 0 0 0 0 0 0 1 1 1 1 0
中国
電力
0 1 0 0 0 0 0 0 0 0 0 0 0 7 10 0 66 3 4 0 28 4 1 0 0 0 0 0 5 1 2 4 0 0
- 37. 分析のプロセス
37
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 37
ーⅢ,JSTデータを用いた分析(平均年収など)
使用データ:有価証券報告書(KDDI、富士通、三菱電機、
日本電気、東京電力、関西電力のHPより)
・「年、従業員数、平均年齢、平均勤続年数、平均賞与」で以下の表を作り、箱ひげ図にした
企業 年
従業員
数.人.
平均年
齢.歳.
平均勤
続年数.
年.
平均賞
与.円.
企業 年
従業員
数.人.
平均年
齢.歳.
平均勤
続年数.
年.
平均賞
与.円.
企業 年
従業員
数.人.
平均年
齢.歳.
平均勤
続年数.
年.
平均賞
与.円.
富士通 2006 36561 40.3 17.9 7831000 KDDI 2006 10299 38.3 13.4 8750000 三菱電機 2006 27701 42.6 20.7 7677000
富士通 2007 27310 40.7 17.9 8099000 KDDI 2007 11764 38.8 14 8901000 三菱電機 2007 27803 42.3 20.2 7824000
富士通 2008 25899 41.1 18.1 8430000 KDDI 2008 11722 39.4 14.7 9050000 三菱電機 2008 28476 42.1 19.8 7921000
富士通 2009 25134 41.4 18.5 7645000 KDDI 2009 11374 40.1 15.7 8985000 三菱電機 2009 28525 41.7 19.2 7486000
富士通 2010 24969 41.7 18.6 7884944 KDDI 2010 11041 40.6 16.3 8838000 三菱電機 2010 28450 41.4 18.7 7493921
富士通 2011 24906 42.4 18.4 8043935 KDDI 2011 11194 40.7 16.1 8981000 三菱電機 2011 28808 41.1 18.3 7806286
富士通 2012 25426 42.2 18.5 7980374 KDDI 2012 11231 41.1 16.5 9068000 三菱電機 2012 29394 40.6 17.6 7673456
富士通 2013 25616 42.9 19.6 7698277 KDDI 2013 10739 41.4 16.8 9396971 三菱電機 2013 31797 40.4 17.1 7469030
日本電気 2006 22602 39.6 15.9 7485000 東京電力 2006 35984 39.7 20 7740000 関西電力 2006 20292 39.7 19.7 8007000
日本電気 2007 23059 39.8 15.8 7467000 東京電力 2007 36123 40.1 20.4 7775000 関西電力 2007 20184 40.1 20.1 8088000
日本電気 2008 23446 39.8 15.6 7643000 東京電力 2008 35926 40.4 20.6 7596000 関西電力 2008 20117 40.5 20.4 8090000
日本電気 2009 24871 40 15.5 7168000 東京電力 2009 36328 40.6 20.7 7578000 関西電力 2009 20217 40.8 20.6 8072000
日本電気 2010 23935 40.7 16.1 6980604 東京電力 2010 36683 40.9 20.9 7613501 関西電力 2010 20277 41.1 20.9 8065000
日本電気 2011 23968 41.2 16.5 7073205 東京電力 2011 37459 41.1 21.1 6537531 関西電力 2011 20484 41.3 21.1 8053000
日本電気 2012 23361 41.5 16.4 6717171 東京電力 2012 36077 41.9 21.9 6196181 関西電力 2012 20714 41.5 21.1 7829000
日本電気 2013 24237 42.3 18.2 7458973 東京電力 2013 34689 42.5 22.6 6844252 関西電力 2013 20813 41.7 21.3 5869710
- 38. 分析のプロセス
38
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 38
ーⅢ,JSTデータを用いた分析(キャリアアップ)
使用データ:” a_000.tsv”(論文マスタ)
“nayose_split1.tsv”~ “nayose_split5.tsv” (人名名寄せ)
“m_pd1.tsv”(発行年データ)
・抽出済みの論文番号と論文マスタをリンクさせ、”整理番号”を取り出す
・”整理番号”で一致した名寄せを取り出す。
※ただし、整理番号で絞っているので、対象機関以外の人も
含まれてしまう。名寄せの”所属機関”を調べ、一致した
名寄せデータのみを、対象企業の人とする。
・準備として、論文マスタに”発行年”情報を付与しておく。
・名寄せを論文マスタに付与し、発行年の若い順に並べ直す。
※発行年データは”2013”や”20130320”など形式がバラバラだが、
今回は数の多い後者のみを取り出して並べかえを行った。
・データを人ごとに区切り、所属機関の移動を見たものが今回の結果。
各企業対象人数は、KDDIが333人、三菱電機が2290人、関西電力が654人だった
(集計を行ったわけではなく、あくまで目に見えた特徴を書いたのみ)