SlideShare a Scribd company logo
1 of 39
―ありふれた大学生をモデルに―
雑誌・新聞・JSTデータから見る
「よりよい企業選択へのヒント」
アズマー
辻智康
2015/3/16All Analytics Championship 2
(目次)
Ⅰ, Executive Summary
Ⅱ, 背景と目的
Ⅲ, 使用データの紹介
Ⅳ, 分析① 世間のトレンド
Ⅴ, 分析② 企業のグルーピング
Ⅵ, 分析③ 企業の強み
Ⅶ, 結論
(Ⅷ, 分析のプロセス)
新聞・雑誌・JSTデータは学生から見た企業選択にも有効か?
学生のよりよい企業選択がイメージ可能に
業界のトレンド抽出 企業のグルーピング
新聞データの
業種区分から
企業をグルーピング
JSTデータの
各企業の論文数と
抄録データから
各企業の強みを知る
雑誌データの
頻出単語から業界の
トレンドを把握
企業の強みを把握
Ⅰ,Executive Summary
2015/3/16All Analytics Championship 3
昨年度最優秀賞によれば……
専門分野の親和性から、【企業側の学生選択】が可能だとわかっている
Ⅱ,背景と目的(1)
2015/3/16All Analytics Championship 4
ーⅠ,背景と目的
就職活動の始まる大学三年……学生たちは霧の中に立たされたように感じている
【一般的な(よくいる)大学三年生モデル】
テニスサークルに所属。テニスはせずに毎日飲み会ばかり
授業は初回だけしか出ない
試験は過去問を駆使。なんとか単位だけは確保
口癖は「めんどい」「しんどい」
<T大学経済学部三年、アズマーさん>
――2015年3月、就活解禁――
自己分析
業界研究
説明会
OB訪問
いきなりそんないろいろ言われても……
私、テニス(飲み会)しかしてないし……
とりあえず受ける会社だけ絞ろうっと!
Ⅱ,背景と目的(2)
2015/3/16All Analytics Championship 5
ーⅠ,背景と目的
いざ絞ろうにも企業ありすぎ……
企業が何をしてるのかわからない
多分野にわたって活躍する企業が多く、所属業界がわからない
どの分野に強い企業なのかがわからない
とりあえず知ってるところ
を受けたら内定もらった。
もうここでいいや
ブラック! 早期退職へ…
こうならないためにも、
データから学生のよりよい企業選択のヒントを得る
「企業の適切な分類」や「企業の強み」を
より正確に把握できるような仕組みがほしい
Ⅱ,背景と目的(3)
2015/3/16All Analytics Championship 6
ーⅡ,分析方針
分析対象業界の
トレンドを知れる
専門誌:業界のトレンド
総合誌:総合のトレンド
分野のつながり
を重視して企業の
グルーピングを行う
対象業界への
適切なアクセス
UDC分類から
対象グループの
強みの違いが知る
より自分の興味に近い
企業を見つけられる
これらをアズマーさんの場合にあてはめるとどうなるか。
以降、活用法の具体例として分析を行っていく
<雑誌データ>
【総合誌】でトレンド業界をつかむ
志望業界が定まっていない 活動度の高い企業がいい
<新聞データ>
掲載数の多い100社を選択
雑誌データ 新聞データ JSTデータ
Ⅲ,使用データの紹介
2015/3/16All Analytics Championship 7
i. 雑誌記事データ(日経BP社さま)
10個の雑誌のうち「日経ビジネス」「日経TRENDY」
の記事内にある「記事の要約」を使用
ii. 新聞記事データ(日刊工業新聞社さま)
各新聞記事につけられた「企業名」および、記事を
26の分野に分けた「弊社独自の記事区分」を使用
iii. JST科学技術文献データ
特に「年代、機関名、JST分類、抄録、名寄せ」
を使用(化学物質データ・科学用語データは使用しない)
iv. 各企業の有価証券報告書
平均年収や人数、平均勤続年数などを参考にする
ーⅠ,使用データの紹介
Ⅳ,分析① 世間のトレンド(1)
2015/3/16All Analytics Championship 8
ーⅠ,方針と方法
雑誌データから、世間のトレンドがわかるのでは
i. 雑誌は、人々が興味を持ってくれないと売れない
ii. 特に総合情報雑誌は世間のトレンドを反映したものと考えられる
雑誌内の頻出単語を調べ、その特徴から注目業界を考察する
10誌のうち、今回は専門性が低い(総合情報を扱う)と思われる
「日経ビジネス」および「日経TRENDY」の2誌を考察対象にした。
【日経BP社 10誌】
日経ビジネス・日経コンピュータ・日経
エレクトロニクス・日経メディカル・日
経パソコン・日経情報ストラテジー・日
経コミュニケーション・日経ヘルス・日
経TRENDY・日経アーキテクチュア
たとえば、日経メディカルの
頻出単語は「高齢、感染、臨床」
専門誌では世間全体が注目
するトレンドは得られない。
(業態内のトレンド把握には有効)
2015/3/16All Analytics Championship 9
ーⅡ,分析結果
日本、東京、電子、端末、パソコン、
デジタル、家電、メーカー、ポイントカード、
スマートフォン、iPhoneなど
日経TRENDYの頻出単語
メーカー、会社、技術、金融、工場、国内産業、
世界、自動車、投資、中国、発電、米国など
日経ビジネスの頻出単語
2010~2012の
三年間のデータ
”電子端末時代の到来”
”海外意識の高さ”
グローバルに活躍する
電子・デジタル業界
<年別に見ると、2011年に特徴的な共通単語あり>
大震災・原子力・発電・節電・夏 エネルギー業界
電子業界・エネルギー業界が現在トレンドの中心となる業界
Ⅳ,分析① 世間のトレンド(2)
Ⅴ,分析② 企業のグルーピング(1)
2015/3/16All Analytics Championship 10
ーⅠ,方針と方法
新聞データから、まず社会的に活動度の高い企業を抽出する
i. 新聞の役割は社会的に重要なニュースを伝えることである
ii. 記事に何度も現れる企業は、社会的に活動度の高い企業である
掲載数上位100社(団体)を調べ、後の分析対象とする
記事につけられた分野情報の数を企業ごとに集計し、以下のような表を作成
企業\分野 資源 食品 エネルギー 化学
トヨタ 300 50 100 20
ソニー 50 100 200 100
分野数を変数にしたクラスター分析により、グループ分けする
例)
分野情報によるグループ分け
2015/3/16All Analytics Championship 11
ーⅡ,分析結果
Ⅴ,分析② 企業のグルーピング(2)
2015/3/16All Analytics Championship 12
ーⅡ,分析結果
Ⅴ,分析② 企業のグルーピング(3)
2015/3/16All Analytics Championship 13
ーⅡ,分析結果
Ⅴ,分析② 企業のグルーピング(4)
Ⅴ,分析② 企業のグルーピング(5)
2015/3/16All Analytics Championship 14
ーⅢ,トレンドとグルーピングの関連
グローバルに活躍する
電子・デジタル業界
エネルギー業界
日立製作所、東芝、富士通、ソニー、
日本電気、三菱電機、シャープ、
NTT、KDDI、野村総合研究所
東京、関西、中部、九州、東北、中国
(以上電力)、東京ガス、大阪ガス
※ 企業抽出方法の問題から、今回は日本企業のみを対象企業とした
自動車系・電子部品系・エネルギー系の企業がそれぞれ多く固まる
 電子部品系企業の集まるクラスター
 エネルギー系企業の集まるクラスター
今回は、特に「日経TRENDY」のキーワードを重視し、
を分析の対象として抽出する
クラスターの上位分岐に、総合誌から得られたトレンド業界が固まっている
Ⅵ,分析③ 企業の強み(1)
2015/3/16All Analytics Championship 15
ーⅠ,方針と方法
以下のように企業ごとに集計し、分野の割合を円グラフで可視化
さらに抄録データの頻出単語から、より具体的な強みを知る
企業評価のため年収や従業員数の比較、キャリアアップへのヒントを紹介
企業\分野 機械工学 臨床医学 土木工学 企業経営
東芝 300 150 10 20
富士通 500 100 20 10
例)
各企業のJSTデータをUDC(国際十進分類法)により分野で分類する①
② 「UDC【精密機器】【機械工学】の割合が多い=強みがある」企業を選択
③
2015/3/16All Analytics Championship 16
東芝 富士通
日本電気 三菱電機 シャ ープ
日立
ーⅡ,論文分野の傾向
Ⅵ,分析③ 企業の強み(2)
2015/3/16All Analytics Championship 17
K DDI
東京ガス 大阪ガス
ソ ニー N TT
野村総研
ーⅡ,論文分野の傾向
Ⅵ,分析③ 企業の強み(3)
2015/3/16All Analytics Championship 18
中部電力
九州電力 東北電力
東京電力 関西電力
中国電力
ーⅡ,論文分野の傾向
Ⅵ,分析③ 企業の強み(4)
2015/3/16All Analytics Championship 19
ーⅢ,企業選択と抄録データの照らし合わせ
雑誌によるトレンドから、
デジタル分野は UDC【精密機器】【機械工学】を重視し、
「富士通、日本電気、三菱電機、KDDI」を選択。
エネルギー分野は UDC【機械工学】に強い「東京電力」
および【臨床医学】に強い「関西電力」を代表で選択。
デジタル分野の4つには共通のワード
ネットワーク、データ、通信、
伝送、電力、制御、光など
エネルギー分野は2つの分野に分かれる
東電(工学一般に強み)
ガス、ネットワーク、設備、技術など
関電(病理学に強み)
患者、治療、血糖、診断、エコーなど
特に通信系統に強みがあるとわかる
技術面に強み
医療面に強み
抄録データと
照らし合わせて
具体的な強みを知る
Ⅵ,分析③ 企業の強み(5)
2015/3/16All Analytics Championship 20
ーⅣ,選択企業の平均年収や従業員数は?
さらに年収推移は右肩上がり
(六企業の中で唯一)
一方の関電は2013年に急落
Ⅵ,分析③ 企業の強み(6)
2006~2013の
六企業の年収比較
東電は大震災のあった
2011年に急落
年収ではKDDIが
ひとつ抜けている
2015/3/16All Analytics Championship 21
ーⅣ,選択企業の平均年収や従業員数は?
従業員数推移は右肩上がり。
さらに平均年齢は右肩下がり
(いずれも六企業の中で唯一)
2011年以降も急落続く
一方、関西電力は右肩上がり
Ⅵ,分析③ 企業の強み(7)
2006~2013の
六企業の従業員数比較
三菱電機は年収と
合わせてバランスが良い
東電は大震災のあった
2011年に急落
2015/3/16All Analytics Championship 22
ーⅤ,入社後のキャリアアップイメージ
今回は、先ほどの有価証券データを参考に、
比較的年収の高い「KDDI」、
バランスがよく採用も多そうな「三菱電機」、
さほど震災の影響を受けていないように見える「関西電力」
の三企業について調べてみる。
Ⅵ,分析③ 企業の強み(8)
各企業、論文著者の機関移動を調べることで
入社後のキャリアアップイメージがつかめるのでは?
i. 対象企業グループの論文執筆者を調べる
ii. その執筆者の論文データを集め、時系列順に並べる
iii. 論文の機関名を調べ、移動の傾向を把握する
<方法>
KDDI
前:国際電電(前身)、有名大学院など
後:ATR音声言語、国際電気通信基礎技術研、各大学など
→通信系のより専門的な機関への移動がある一方、
一貫してKDDIという人も多い。
三菱電機
前:JAXA、ASET超先端電子技術開発機構、TMT&D、
東芝、ティーエムエイエレクトリック、各大学など
後:子会社や各大学
→各専門機関から集まってくる。関連機関外への移動は少数。
関西電力
前:日本原子力発電、関西の大学、医学部
後:各病院、医学部など
→医学系は機関移動が活発に起こっている。
2015/3/16All Analytics Championship 23
ーⅤ,入社後のキャリアアップイメージ
Ⅵ,分析③ 企業の強み(9)
Ⅶ,結論(1)
2015/3/16All Analytics Championship 24
ーⅠ,分析のまとめ
総合誌から
世間のトレンド把握
出現回数上位
100社を選出
UDC・抄録から
企業の強みを把握
雑誌データ 新聞データ JSTデータ
電子・デジタル業界
エネルギー業界
分野情報で
クラスターわけ
電子、端末、
スマートフォン、
大震災、etc……
トレンド業界把握 目的業界企業の把握
東芝、シャープ、
ソニー、NTT、
KDDI、etc……
+
関西電力は医療、
富士通は電子、
etc……
よりよい企業選択
+
年収・従業員数比較
キャリアアップ評価
Ⅶ,結論(2)
2015/3/16All Analytics Championship 25
ーⅡ,活用イメージ
雑誌データ・新聞データの使い方を変えれば
個々人の目的や状況に応じた企業選択の支援が期待できる
ケース① 目指す業界が決まっている
専門誌による同様の分析で、目的業界のトレンドが把握できる
ケース② 大企業以外にも目を向けたい
新聞データ上位100社に限らない同様の分析により。未知の
企業の所属業界や業界の近い企業を知ることができる
JSTデータによる企業の強みやキャリアアップの把握は
学生だけでなく転職を考える社会人への活用も期待できる
さらに……
(企業ごとの強みの細かい違いが企業選択の決め手となるため)
分析のプロセス
26
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 26
ここからは分析についての詳しい手順の解説や結果の補足を行う
ーⅠ,雑誌データを用いた分析
使用データ:“JST.tsv”(提供10誌、2010~2012の3年分データ)
・5列目の雑誌名(mediajp)で雑誌ごとに分けることができる。
→今回は「日経TRENDY」と「日経ビジネス」のみに絞って分析を行った。
日経TRENDY:1932記事
日経ビジネス:4668記事
データ数
・14列目の要約(summary)の頻出単語を調べ、リストアップする。
→今回はTRENDYは100回以上、ビジネスは220回以上を頻出単語とした。
・4列目の掲載日時(pubDate)を使って一年ごとに分け、頻出単語を調べる
→今回はTRENDYは30回以上、ビジネスは80回以上を年別頻出単語とした。
※出現回数は雑誌ごとに任意で判断する名詞・形容詞・動詞を数える
分析のプロセス
27
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 27
ーⅠ,雑誌データを用いた分析(結果の詳細)
日経TRENDY
全体 2010 2011 2012
日経ビジネス
メーカー、億、会社、
海外、開発、企業、技術、
業界、金融、経営、経済、
見る、言う、後、工場、
国内、今年、昨年、産業、
市場、自動車、社長、
商品、消費、情報、世界、
成長、生産、大手、大震災、
中国、投資、東日本、
発電、米国、問題、力
日本、東京、電子、端末、
通信、製品、人気、増える、
相次ぐ、多い、続く、消費、
商品、施設、市場、始める、
使う、開発、会社、家電、
価格、駅、モデル、
メーカー、ポイントカード、
ホテル、スマートフォン、
パソコン、ネット、デジタル、
テレビ、オープン、アプリ、
iPhone。
電子、昨日、
スマートフォン、
ケータイ、カード、
保険、米国、日本、
東京、端末、最新型
ポイント、パソコン
アプリ、iPad、
iPhone、
会社、開発、関係、
企業、億、メーカー
技術、業界、金融、
経営、経済、見る、
言う、国内、今年、
昨年、産業、事業、
自動車、社長、商品、
消費、世界、成長、
政権、生産、大手、
中国、発表、民主党、
米国
サービス、メーカー、
会社、海外、開発、
企業、危機、技術、
経営、経済、原子力、
工場、国内、産業、
市場、事故、自動車、
社会、商品、消費、
情報、震災、世界、
成長、生産、投資、
東日本、大震災、発電、
被災、福島、米国
メーカー、会社、開発、
企業、技術、経営、
経済、国内、市場、
事業、自動車、消費、
世界、成長、生産、
大手、中国、東京、
日本、発表、発売、
米国、問題
ヒット、消費、サービス、
普及、登場、電子、通信、
端末、増える、人気、
新、女性、集める、手帳
時代、施設、市場、最大
最新、高速、高級、業界、
拡大、開発、海外、モデル
メーカー、ホテル、ブーム
ブランド、パソコンネット
デジタル、タブレット、
スマートフォン、アプリ、
発売、スマートフォン、
東日本、搭載、通信、
端末、大震災、節電、
人気、震災、情報、消費
商品、車、施設、市場、
最新、業界、各社、開発
家電、価格、夏、メーカ
ヒット パソコン テレビ
タブレット、サービス、
カメラ、エコ、 iPhone
アンドロイド、アプリ
分析のプロセス
28
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 28
ーⅡ,新聞データを用いた分析
使用データ:“Q_NV_JST_2010.tsv”(2010年分)
“Q_NV_JST_2011.tsv”(2011年分)
“Q_NV_JST_2012.tsv”(2012年分)
・32列~52列目の企業名(KJ)を記事ごとにまとめて付与し、
出現回数の多い企業を取り出す。
→今回は200記事以上登場する企業(約100社)を取り出した
・5列目の弊社独自の記事区分(KK)の二文字目が記事ごとに
26の分野を示す文字なので、二文字目だけを記事に付与する。
・企業ごとに記事の区分を集計し、表にする(次ページからの表)
→今回の分析では、この表を距離行列化しクラスター分析にかけた。
※掲載数を除外し、分野出現傾向だけで見るのなら標準化の必要がある。
(掲載数の少ない企業も合わせて分析したいときなどの場合、必須)
→ここでは参考のため、上位100社に対し、標準化した表を用いた
クラスター分析結果も掲載する(後のページのデンドログラム)
三つのデータを
まとめたデータ
を使用する
分析のプロセス
29
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 29
企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
(株)日刊工業新
聞社
0 5 3 1 15 4 3 1 9 171 43 20 26 5 1 46 44 16 15 8 0 3 40 859 63 1814
トヨタ自動車
(株)
1 11 2 2 32 18 2 2 28 73 64 20 1788 5 2 62 37 8 37 68 5 1 30 216 77 257
日産自動車(株) 2 8 3 1 22 11 0 0 9 47 42 1 1224 4 2 34 33 1 18 17 3 1 25 143 47 168
(株)日立製作所 3 6 1 0 39 9 2 1 11 90 603 14 27 6 3 39 50 0 10 10 1 2 312 122 100 160
東芝 2 7 1 0 63 7 1 1 5 69 755 9 23 9 1 27 58 2 13 26 1 0 64 128 74 147
本田技研工業
(株)
1 2 1 0 14 8 0 1 6 34 32 12 1021 0 1 28 10 0 7 37 1 0 9 98 17 116
東京電力(株) 5 16 8 3 473 10 0 3 23 75 98 11 42 1 2 34 51 3 18 56 3 4 59 346 26 186
富士通(株) 2 1 1 0 13 4 1 0 1 15 269 3 5 3 6 14 63 0 10 27 0 0 525 54 46 86
日本電気(株) 1 10 0 0 18 8 1 0 1 4 348 6 14 2 10 15 20 1 9 22 1 0 510 50 67 66
三菱重工業(株) 2 6 2 0 45 4 0 0 7 517 55 9 162 3 37 31 19 0 12 9 0 4 12 100 36 116
三菱電機(株) 2 7 0 0 24 1 0 0 2 198 559 24 23 5 12 30 42 2 7 4 0 0 35 61 45 95
東京大学 5 7 10 2 28 46 74 0 2 33 47 15 13 7 24 37 34 4 12 8 1 0 47 137 458 280
シャープ(株) 1 11 1 1 30 6 1 0 3 4 563 0 9 2 1 20 19 2 15 12 0 0 65 71 27 93
ソニー(株) 2 2 0 0 6 4 0 2 0 6 571 0 9 9 2 26 19 3 5 44 0 0 60 78 28 76
第二電電 0 1 0 0 6 0 0 0 0 1 33 0 3 0 0 8 1 1 8 13 0 5 585 17 5 28
スズキ 0 0 0 0 1 4 0 1 10 17 5 0 543 0 0 9 6 0 5 2 1 0 0 34 4 74
川崎重工業(株) 0 4 0 0 16 2 1 0 3 260 8 24 213 1 7 18 14 0 2 4 0 5 4 44 8 71
マツダ(株) 0 0 0 0 3 1 0 0 0 15 8 0 448 0 0 16 2 0 8 6 0 0 4 22 22 52
富士重工業(株) 0 1 0 0 2 0 0 0 0 33 5 10 454 0 5 8 3 0 5 1 0 2 2 28 12 33
三菱自動車 0 1 0 1 7 2 1 0 0 6 28 0 417 1 0 4 14 0 13 2 1 2 5 40 14 33
日本電信電話
(株)
0 3 1 0 6 1 0 0 1 5 26 0 1 1 0 12 6 0 5 12 1 0 379 43 34 40
東レ(株) 1 2 1 129 14 111 3 0 1 6 9 0 18 1 0 17 48 3 15 5 0 2 1 26 23 65
関西電力(株) 1 4 0 1 255 1 0 1 2 20 19 3 5 0 0 7 25 1 2 8 0 3 21 103 3 49
理化学研究所 1 0 6 1 2 26 63 1 1 4 14 1 1 3 3 7 6 0 0 1 0 0 11 28 277 73
分析のプロセス
30
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 30
企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
キヤノン(株) 0 0 1 1 1 1 0 0 1 11 278 2 1 11 0 16 9 0 3 27 0 0 11 44 13 76
伊藤忠商事(株) 14 4 13 4 22 12 1 0 4 13 9 1 13 1 0 27 14 0 167 16 1 0 23 31 2 65
ダイハツ工業(株) 0 0 0 0 0 3 0 0 2 7 1 0 375 0 0 6 4 0 2 1 0 1 0 11 6 38
東北大学 0 5 2 0 9 18 16 1 6 15 30 13 5 3 5 21 15 0 1 4 0 0 11 33 177 126
早稲田大学 0 4 0 0 12 6 3 0 2 9 7 12 9 4 1 37 8 3 5 6 0 0 10 46 85 187
日本銀行(株) 1 0 0 0 1 0 0 0 1 3 2 0 1 0 0 10 1 1 1 177 0 1 5 233 0 15
三菱商事(株) 16 5 6 5 28 14 0 0 9 27 4 0 23 0 3 14 20 2 111 31 3 3 4 59 2 46
東京工業大学 2 6 1 4 19 13 3 0 1 15 27 15 2 2 9 11 15 0 0 0 0 0 10 40 150 114
大阪大学 0 1 3 1 3 15 20 1 7 14 23 8 0 1 4 15 11 1 4 5 0 0 8 26 152 121
日本アイ・ビー・エ
ム(株)
0 0 1 0 1 1 0 0 1 4 35 0 1 0 0 3 7 0 2 3 0 1 307 23 6 21
中部電力(株) 2 1 3 2 220 6 0 0 5 14 11 0 13 0 0 17 18 0 2 5 0 1 3 39 4 35
野村証券(株) 0 3 0 0 1 2 0 0 4 1 4 0 4 1 0 8 0 0 1 176 1 0 8 95 4 17
ヤマハ発動機(株) 0 0 0 0 1 2 0 0 2 41 5 7 261 0 0 6 3 2 3 2 0 0 0 13 3 37
Apple Computer 2 3 5 2 0 2 1 0 3 16 87 1 15 2 1 12 0 10 7 20 0 1 142 9 15 31
三洋電機(株) 1 3 0 0 10 3 0 0 0 12 237 0 25 1 0 8 14 1 6 3 0 0 9 17 3 32
三井物産(株) 21 8 3 1 29 9 1 0 8 5 12 1 12 1 0 8 9 2 131 12 0 1 10 36 1 63
マイクロソフト 0 3 0 0 0 0 0 0 0 2 70 0 8 0 0 6 2 0 1 16 0 0 234 6 6 27
丸紅(株) 5 1 4 4 28 2 1 0 4 22 7 0 11 0 0 16 6 1 155 17 3 0 3 36 4 50
住友商事(株) 12 2 2 2 18 8 1 0 22 17 6 3 24 0 0 14 13 1 112 15 1 1 25 26 1 49
(株)神戸製鋼所 1 4 0 1 24 5 0 0 143 47 4 1 6 0 0 29 8 2 2 4 0 1 3 21 6 53
慶応義塾大学 0 0 1 1 2 7 23 0 2 9 11 7 11 2 1 13 7 2 3 1 1 1 12 43 128 69
京セラ(株) 2 4 0 2 22 2 0 1 5 28 163 0 4 0 1 7 16 7 8 7 0 10 9 18 8 24
三菱マテリアル
(株)
23 1 0 2 9 28 0 8 81 40 7 0 3 1 1 11 12 0 1 76 0 0 0 7 1 29
日本航空(株) 0 1 3 0 2 0 0 0 0 0 1 0 13 0 0 15 2 1 65 16 0 102 9 33 0 24
東京瓦斯(株) 4 12 2 0 218 3 0 0 0 10 14 0 3 0 0 7 29 0 3 4 0 1 10 23 4 33
分析のプロセス
31
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 31
企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
(株)野村総合研
究所
0 1 1 0 1 0 1 0 0 1 8 0 2 1 0 9 8 0 4 6 0 0 208 27 2 32
帝人(株) 1 0 0 100 10 59 1 0 2 0 7 1 3 2 0 14 21 1 0 2 0 0 3 9 9 38
大阪瓦斯(株) 2 6 2 1 187 6 0 0 0 6 4 0 3 0 0 7 17 2 3 4 2 0 8 17 9 37
IBM 1 0 1 0 2 1 1 0 0 2 62 0 0 0 0 5 7 0 1 2 0 0 184 10 19 13
九州電力(株) 2 0 0 0 166 1 0 0 1 7 11 1 2 0 0 7 9 0 3 2 1 0 5 40 6 44
東北電力(株) 1 2 0 0 152 6 0 0 3 12 26 0 2 1 0 7 9 0 5 5 1 0 11 34 5 25
武田薬品工業
(株)
0 0 34 0 0 159 24 0 0 1 1 0 0 0 0 9 1 0 5 6 0 0 1 27 7 31
住友金属工業
(株)
4 3 0 1 11 4 0 0 127 13 3 1 5 0 0 19 5 0 6 11 0 0 4 26 4 56
Boeing 0 0 0 1 0 4 0 0 6 78 7 2 111 2 4 5 0 2 10 5 0 20 1 19 8 19
名古屋大学 1 3 4 1 1 12 15 2 4 13 9 1 11 6 10 12 8 2 2 2 0 0 6 9 146 61
いすゞ自動車
(株)
0 0 0 0 1 2 0 0 2 3 0 0 240 0 0 8 3 0 1 3 0 1 2 13 1 18
JETRO 0 1 4 0 1 3 0 1 0 9 3 0 11 1 0 16 2 2 5 7 0 0 0 172 2 54
安川電機 0 1 0 0 2 0 0 0 4 107 44 36 5 1 0 15 2 1 1 1 0 1 1 17 4 46
大日本印刷(株) 0 1 0 3 0 3 2 0 1 3 115 0 0 1 0 2 5 64 7 0 0 0 41 6 14 19
(株)森精機製作
所
0 0 0 0 0 0 0 0 0 227 4 2 2 1 0 8 0 0 2 1 0 0 0 5 2 33
九州大学 1 0 2 0 4 11 6 0 5 11 20 2 2 0 4 11 9 0 3 0 0 0 14 23 94 64
日立建機(株) 0 2 0 0 0 0 0 0 3 181 14 9 4 1 1 7 1 0 2 6 0 0 2 10 1 40
TDK(株) 2 0 0 0 0 2 0 0 1 1 204 0 0 1 0 4 5 0 1 17 0 0 4 8 3 31
東日本旅客鉄道 0 9 2 0 4 1 0 0 1 6 8 1 10 0 0 6 7 0 69 10 0 75 2 34 5 33
三井造船(株) 2 3 0 1 8 3 0 1 4 87 2 1 105 0 0 9 4 0 0 0 0 0 3 12 6 27
京都大学 0 3 9 0 10 29 45 1 2 14 22 3 5 2 4 18 12 1 4 7 0 0 13 38 264 154
住友電気工業
(株)
2 1 0 0 3 6 0 0 36 48 82 1 16 1 0 5 6 0 5 0 1 0 7 16 8 25
清水建設(株) 0 143 0 1 11 1 0 0 2 9 7 2 1 1 0 7 21 0 3 1 4 0 7 7 8 29
Volkswagen 0 0 0 0 1 1 0 0 1 8 8 3 217 0 0 4 2 0 0 0 0 0 2 5 0 3
GM 0 1 0 1 1 0 0 0 2 13 19 0 169 1 0 6 3 0 2 1 1 1 3 11 4 13
分析のプロセス
32
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 32
企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
オムロン 0 2 1 0 4 0 0 0 0 29 110 2 6 15 0 9 6 0 2 1 0 0 15 15 5 26
クボタ 1 0 2 2 3 3 0 0 1 127 0 0 4 0 0 12 24 3 2 0 0 0 0 10 11 40
凸版印刷(株) 0 3 2 2 2 10 0 0 0 1 84 0 0 1 0 8 4 58 3 3 0 0 41 4 5 14
中国電力(株) 1 4 0 1 168 2 0 0 0 1 3 0 0 0 0 7 11 0 2 6 2 0 3 17 1 15
(株)小松製作所 1 3 0 0 2 1 0 0 2 105 1 5 1 0 1 8 3 1 1 19 0 0 5 37 5 42
(株)島津製作所 0 0 1 0 0 1 2 0 1 76 12 0 7 57 2 8 1 0 2 1 0 0 1 8 23 36
昭和電工(株) 4 0 0 2 7 107 0 0 19 4 19 0 7 0 0 17 4 1 1 3 0 0 1 8 4 29
(株)リコー 2 1 0 1 0 3 0 0 0 3 142 0 1 4 0 7 17 0 2 1 0 0 11 15 9 15
宇部興産(株) 4 1 1 3 13 130 0 2 3 3 3 0 1 0 1 12 1 1 0 6 0 0 0 6 4 35
日立造船(株) 0 1 0 1 4 0 0 0 1 86 4 1 59 2 0 8 11 0 1 3 0 0 1 11 6 27
大和ハウス工業
(株)
0 124 0 0 5 0 0 0 0 2 3 0 1 0 0 6 6 0 8 4 9 0 5 20 4 34
(株)クラレ 2 0 0 24 14 107 0 0 2 2 1 0 0 0 0 15 12 1 0 0 0 0 0 3 1 24
(株)帝国データバン
ク
0 4 2 1 1 0 0 0 1 2 2 0 3 0 0 58 2 2 13 4 0 0 3 88 0 28
北海道大学 1 3 3 0 2 6 11 1 6 5 13 1 0 2 3 3 8 1 3 0 0 0 9 15 81 35
オークマ 1 0 0 0 2 0 0 0 0 147 0 1 0 0 0 5 0 0 0 1 0 0 0 7 3 42
(株)豊田自動織機
製作所
0 1 0 0 2 0 0 0 1 37 1 0 107 0 0 7 3 0 3 1 0 0 1 4 15 23
富士電機(株) 0 2 1 0 10 0 0 0 2 8 125 0 2 2 0 2 3 0 3 0 0 0 8 5 8 25
キリンビール(株) 0 0 138 0 0 0 1 0 0 0 0 0 0 0 0 7 8 1 10 2 0 1 1 7 1 29
旭化成工業(株) 0 6 4 8 10 83 4 0 2 1 4 0 0 1 0 10 14 0 3 5 1 0 0 11 8 30
ファナック(株) 0 2 0 0 0 0 0 0 1 109 2 26 4 0 0 1 0 0 0 17 0 0 0 8 2 33
(株)大林組 0 141 0 1 8 1 0 0 0 5 2 0 0 0 2 3 19 0 1 3 1 0 3 9 6 21
(株)村田製作所 0 1 0 0 0 3 0 0 1 12 128 0 4 1 0 5 4 1 0 5 0 0 2 12 4 20
ヤマザキマザック
(株)
0 0 0 0 1 0 0 0 0 146 1 3 2 0 0 3 0 0 0 0 0 0 0 7 5 32
ダイキン工業(株) 0 5 0 0 7 10 1 1 0 67 43 0 1 1 0 8 4 0 2 2 1 0 2 15 8 22
分析のプロセス
33
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 33
ーⅡ,新聞データを用いた分析(標準化した場合)
分析のプロセス
34
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 34
ーⅢ,JSTデータを用いた分析(分類、抄録)
使用データ:“g_cs1s_split1.tsv”(論文の機関名分割)
“g_cs1s_split2.tsv”(分割2)
・新聞・雑誌で絞った企業名に一致する論文番号をそれぞれ抽出。
※企業名一致で指定するしかないため、たとえば”Apple”を調べると
企業名のどこかに”Apple”を含む企業が全て選択されてしまい、
正確な抽出ができない。ゆえ、今回は日本企業のみを対象とした。
使用データ:“s_cc1gs.tsv”(JST分類)
・先ほど抽出した論文番号をリンクさせ、6列目のUDCを取り出す。
企業ごとに数を数え、表を作って円グラフにしたものが今回の結果である
使用データ:“q_ab1g.tsv”(和文抄録)
・論文番号とのリンクで、抄録データを取り出す。頻出単語を調べリストアップした
※企業ごとに頻出の条件を変更。富士通は17回以上、NECと三菱電機は35回以上、
KDDIは20回以上、東京電力は10回以上、関西電力は40回以上とした。
(表は次ページに載せた)
分析のプロセス
35
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 35
X53
1
X53
2
X53
4
X53
5
X53
7
X53
9
X54
3
X54
4
X54
8
X57
5
X57
7
X59
1
X61
2
X61
3
X61
4
X61
5
X61
6
X61
7
X61
8
X62
0
X62
1
X62
4
X62
8
X62
9
X65
6
X65
7
X65
8
X66
1
X66
2
X66
6
X66
9
X68
1
X69
6
X69
9
日立 1 1 0 0 3 2 0 0 1 0 0 0 1 0 0 0 6 0 0 0 19 2 0 2 0 0 1 0 1 1 7 10 0 0
東芝 3 14 8 26 29 66 5 21 10 1 3 9 5 27 20 111 402 6 6 25 968 6 104 30 24 0 26 3 12 11 54 296 18 2
富士
通
1 3 0 18 0 52 4 6 10 3 3 2 1 21 21 13 17 1 0 1 414 3 7 9 3 3 43 2 1 3 7 214 1 0
日本
電気
3 2 5 41 22 51 1 33 7 6 8 1 2 6 13 20 22 0 0 3 736 8 14 26 7 1 25 9 2 7 6 379 0 0
三菱
電機
12 5 7 22 17 26 5 3 1 0 0 0 2 4 11 5 14 1 0 11 927 7 38 62 20 0 25 2 1 0 14 275 18 0
シャ
ープ
1 0 0 8 3 14 2 12 1 0 1 0 2 2 3 1 5 0 0 0 118 0 6 0 0 1 1 0 0 1 2 26 1 0
ソ
ニー
5 0 2 2 2 16 3 7 4 1 1 2 1 26 2 2 21 0 0 0 162 2 1 0 1 1 8 2 0 0 3 41 0 0
KDD
I
1 0 2 1 0 0 0 0 0 0 0 0 1 0 3 1 5 0 0 0 268 1 0 2 1 0 0 0 0 0 0 176 0 0
NTT 17 0 28 142 64 173 14 43 15 12 15 25 20 61 104 149
186
8
58 74 13
192
9
62 31 5 8 0 32 11 4 0 14
138
4
16 20
野村
総研
1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 20 4 0 2 1 11 23 0 0 0 0 42 0 0
東京
ガス
0 0 1 0 0 0 0 1 0 0 1 0 0 16 11 0 11 0 0 12 29 26 28 0 0 0 3 0 25 0 14 0 21 0
大阪
ガス
1 0 0 0 0 1 0 7 0 0 0 0 1 8 6 0 1 0 0 7 25 4 10 0 0 0 2 1 12 1 5 2 6 0
東京
電力
0 3 2 0 7 0 0 4 0 3 3 4 0 4 11 4 95 1 9 8 204 102 13 3 0 0 3 0 2 3 8 10 20 0
関西
電力
0 1 0 1 1 1 1 7 0 2 5 2 2 11 5 41 360 12 4 9 136 30 29 0 0 0 3 2 3 2 2 12 9 4
中部
電力
0 1 1 0 8 6 0 0 0 0 0 1 1 2 5 1 0 0 0 8 153 27 20 1 1 0 1 0 5 4 0 14 7 2
九州
電力
0 0 0 1 6 1 0 1 0 0 1 0 0 0 0 0 0 0 0 11 76 20 3 0 0 0 3 0 3 2 2 5 2 0
東北
電力
0 1 0 0 0 0 0 0 0 0 1 0 1 3 1 0 0 0 0 0 64 8 4 0 0 0 0 0 0 1 1 1 1 0
中国
電力
0 1 0 0 0 0 0 0 0 0 0 0 0 7 10 0 66 3 4 0 28 4 1 0 0 0 0 0 5 1 2 4 0 0
分析のプロセス
36
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 36
ーⅢ,JSTデータを用いた分析(抄録の詳細)
富士通
日本電気
三菱電機
KDDI
東京電力
関西電力
サービス、システム、データ、モデル、開発、計算、速度、光、電力、通信、伝送、情報、管理、技術
システム、ネットワーク、データ、ユーザ、安全、光、処理、開発、解析、制御、通信、電力、特性
システム、温度、加工、改善、技術、光、効率、向上、出力、制御、装置、電流、電力、熱、波、特性
システム、ネットワーク、位置、技術、検出、光、信号、電力、伝送、推定、測定、通信、評価
ガス、システム、ネットワーク、フランジ、応力、技術、業務、系統、紹介、設備、締結、電力、発電
インクレチン、インスリン、エコー、患者、血糖、検査、細胞、治療、診断、糖尿、分泌、薬、療法
分析のプロセス
37
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 37
ーⅢ,JSTデータを用いた分析(平均年収など)
使用データ:有価証券報告書(KDDI、富士通、三菱電機、
日本電気、東京電力、関西電力のHPより)
・「年、従業員数、平均年齢、平均勤続年数、平均賞与」で以下の表を作り、箱ひげ図にした
企業 年
従業員
数.人.
平均年
齢.歳.
平均勤
続年数.
年.
平均賞
与.円.
企業 年
従業員
数.人.
平均年
齢.歳.
平均勤
続年数.
年.
平均賞
与.円.
企業 年
従業員
数.人.
平均年
齢.歳.
平均勤
続年数.
年.
平均賞
与.円.
富士通 2006 36561 40.3 17.9 7831000 KDDI 2006 10299 38.3 13.4 8750000 三菱電機 2006 27701 42.6 20.7 7677000
富士通 2007 27310 40.7 17.9 8099000 KDDI 2007 11764 38.8 14 8901000 三菱電機 2007 27803 42.3 20.2 7824000
富士通 2008 25899 41.1 18.1 8430000 KDDI 2008 11722 39.4 14.7 9050000 三菱電機 2008 28476 42.1 19.8 7921000
富士通 2009 25134 41.4 18.5 7645000 KDDI 2009 11374 40.1 15.7 8985000 三菱電機 2009 28525 41.7 19.2 7486000
富士通 2010 24969 41.7 18.6 7884944 KDDI 2010 11041 40.6 16.3 8838000 三菱電機 2010 28450 41.4 18.7 7493921
富士通 2011 24906 42.4 18.4 8043935 KDDI 2011 11194 40.7 16.1 8981000 三菱電機 2011 28808 41.1 18.3 7806286
富士通 2012 25426 42.2 18.5 7980374 KDDI 2012 11231 41.1 16.5 9068000 三菱電機 2012 29394 40.6 17.6 7673456
富士通 2013 25616 42.9 19.6 7698277 KDDI 2013 10739 41.4 16.8 9396971 三菱電機 2013 31797 40.4 17.1 7469030
日本電気 2006 22602 39.6 15.9 7485000 東京電力 2006 35984 39.7 20 7740000 関西電力 2006 20292 39.7 19.7 8007000
日本電気 2007 23059 39.8 15.8 7467000 東京電力 2007 36123 40.1 20.4 7775000 関西電力 2007 20184 40.1 20.1 8088000
日本電気 2008 23446 39.8 15.6 7643000 東京電力 2008 35926 40.4 20.6 7596000 関西電力 2008 20117 40.5 20.4 8090000
日本電気 2009 24871 40 15.5 7168000 東京電力 2009 36328 40.6 20.7 7578000 関西電力 2009 20217 40.8 20.6 8072000
日本電気 2010 23935 40.7 16.1 6980604 東京電力 2010 36683 40.9 20.9 7613501 関西電力 2010 20277 41.1 20.9 8065000
日本電気 2011 23968 41.2 16.5 7073205 東京電力 2011 37459 41.1 21.1 6537531 関西電力 2011 20484 41.3 21.1 8053000
日本電気 2012 23361 41.5 16.4 6717171 東京電力 2012 36077 41.9 21.9 6196181 関西電力 2012 20714 41.5 21.1 7829000
日本電気 2013 24237 42.3 18.2 7458973 東京電力 2013 34689 42.5 22.6 6844252 関西電力 2013 20813 41.7 21.3 5869710
分析のプロセス
38
(複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
2015/3/16All Analytics Championship 38
ーⅢ,JSTデータを用いた分析(キャリアアップ)
使用データ:” a_000.tsv”(論文マスタ)
“nayose_split1.tsv”~ “nayose_split5.tsv” (人名名寄せ)
“m_pd1.tsv”(発行年データ)
・抽出済みの論文番号と論文マスタをリンクさせ、”整理番号”を取り出す
・”整理番号”で一致した名寄せを取り出す。
※ただし、整理番号で絞っているので、対象機関以外の人も
含まれてしまう。名寄せの”所属機関”を調べ、一致した
名寄せデータのみを、対象企業の人とする。
・準備として、論文マスタに”発行年”情報を付与しておく。
・名寄せを論文マスタに付与し、発行年の若い順に並べ直す。
※発行年データは”2013”や”20130320”など形式がバラバラだが、
今回は数の多い後者のみを取り出して並べかえを行った。
・データを人ごとに区切り、所属機関の移動を見たものが今回の結果。
各企業対象人数は、KDDIが333人、三菱電機が2290人、関西電力が654人だった
(集計を行ったわけではなく、あくまで目に見えた特徴を書いたのみ)
アドベンチャー杯にかける意気込み
• 就活を控える身として「落ちてももうかる分析」を
キーワードに分析を進めてまいりました。想像をは
るかに超える大きさのデータに悪戦苦闘の日々でし
たが、分析過程でたくさんの企業もその強みも知れ
ましたし、終わってみればたしかに「もうかった」
と言えるものだったと思います。全身全霊でやりき
りました。後悔はありません。
• …と言いたいところですが、でもやっぱり大変だっ
たので、本選に出た上で「もうかった」と胸を張っ
て言いたいというのが本音です…!
39
(本項目については、本選でのプレゼンテーション発表での説明を省略可とします。)
39
2015/3/16All Analytics Championship 39

More Related Content

Viewers also liked

節電に対する人々の意識~東日本大震災が与えた影響~
節電に対する人々の意識~東日本大震災が与えた影響~節電に対する人々の意識~東日本大震災が与えた影響~
節電に対する人々の意識~東日本大震災が与えた影響~Analytics2014
 
JST科学技術文献データのネットワーク分析-シソーラス、組織、分野の分析を通じて
JST科学技術文献データのネットワーク分析-シソーラス、組織、分野の分析を通じてJST科学技術文献データのネットワーク分析-シソーラス、組織、分野の分析を通じて
JST科学技術文献データのネットワーク分析-シソーラス、組織、分野の分析を通じてAnalytics2014
 
企業に着目した共同研究ネットワーク構造の解析と非連続的成長の予測 技術動向観測隊
企業に着目した共同研究ネットワーク構造の解析と非連続的成長の予測 技術動向観測隊企業に着目した共同研究ネットワーク構造の解析と非連続的成長の予測 技術動向観測隊
企業に着目した共同研究ネットワーク構造の解析と非連続的成長の予測 技術動向観測隊Analytics2014
 
研究力の向上と実社会の発展の関係分析 HSE研開部
研究力の向上と実社会の発展の関係分析 HSE研開部研究力の向上と実社会の発展の関係分析 HSE研開部
研究力の向上と実社会の発展の関係分析 HSE研開部Analytics2014
 
未来のデータサイエンティストを探せ! ~研究分野遷移から見た人材マッチング~ UNAGI
未来のデータサイエンティストを探せ! ~研究分野遷移から見た人材マッチング~ UNAGI未来のデータサイエンティストを探せ! ~研究分野遷移から見た人材マッチング~ UNAGI
未来のデータサイエンティストを探せ! ~研究分野遷移から見た人材マッチング~ UNAGIAnalytics2014
 
「生物多様性を探るために」~トンボの統計解析からわかったノシメトンボと生物多様性について~ 北海道札幌旭丘高等学校 生物部Asahigaokahs a...
 「生物多様性を探るために」~トンボの統計解析からわかったノシメトンボと生物多様性について~  北海道札幌旭丘高等学校 生物部Asahigaokahs a... 「生物多様性を探るために」~トンボの統計解析からわかったノシメトンボと生物多様性について~  北海道札幌旭丘高等学校 生物部Asahigaokahs a...
「生物多様性を探るために」~トンボの統計解析からわかったノシメトンボと生物多様性について~ 北海道札幌旭丘高等学校 生物部Asahigaokahs a...Analytics2014
 
研究活動の年次推移および人々の生活実感への影響に関する分析 健マネ
研究活動の年次推移および人々の生活実感への影響に関する分析 健マネ研究活動の年次推移および人々の生活実感への影響に関する分析 健マネ
研究活動の年次推移および人々の生活実感への影響に関する分析 健マネAnalytics2014
 
大学のそこんところ ~おカネと人と論文と~ 埼玉県立熊谷女子高等学校
大学のそこんところ ~おカネと人と論文と~  埼玉県立熊谷女子高等学校大学のそこんところ ~おカネと人と論文と~  埼玉県立熊谷女子高等学校
大学のそこんところ ~おカネと人と論文と~ 埼玉県立熊谷女子高等学校Analytics2014
 
ニュース記事と特許を利用した科学技術の重要性の評価 広島市立大学
ニュース記事と特許を利用した科学技術の重要性の評価  広島市立大学ニュース記事と特許を利用した科学技術の重要性の評価  広島市立大学
ニュース記事と特許を利用した科学技術の重要性の評価 広島市立大学Analytics2014
 
論文の共著関係ネットワークの中心性分析 Terano Lab.
論文の共著関係ネットワークの中心性分析 Terano Lab.論文の共著関係ネットワークの中心性分析 Terano Lab.
論文の共著関係ネットワークの中心性分析 Terano Lab.Analytics2014
 
All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline
All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline
All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline Analytics2014
 
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual TalksYuya Unno
 
まるもり
まるもりまるもり
まるもりrehahorie
 
Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)Shintaro Fukushima
 
Neo4j の「データ操作プログラミング」から 「ビジュアライズ」まで
Neo4j の「データ操作プログラミング」から 「ビジュアライズ」までNeo4j の「データ操作プログラミング」から 「ビジュアライズ」まで
Neo4j の「データ操作プログラミング」から 「ビジュアライズ」までKeiichiro Seida
 
データサイエンティストのつくり方
データサイエンティストのつくり方データサイエンティストのつくり方
データサイエンティストのつくり方Shohei Hido
 
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォーム
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォームAWSマネージドサービスをフル活用したヘルスケアIoTプラットフォーム
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォームHiroki Takeda
 
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてエクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてHiroshi Shimizu
 
スマートファクトリーを支えるIoTインフラをつくった話
スマートファクトリーを支えるIoTインフラをつくった話スマートファクトリーを支えるIoTインフラをつくった話
スマートファクトリーを支えるIoTインフラをつくった話Keigo Suda
 
500’s Demo Day Batch 17 >> TraceAir
500’s Demo Day Batch 17 >> TraceAir500’s Demo Day Batch 17 >> TraceAir
500’s Demo Day Batch 17 >> TraceAir500 Startups
 

Viewers also liked (20)

節電に対する人々の意識~東日本大震災が与えた影響~
節電に対する人々の意識~東日本大震災が与えた影響~節電に対する人々の意識~東日本大震災が与えた影響~
節電に対する人々の意識~東日本大震災が与えた影響~
 
JST科学技術文献データのネットワーク分析-シソーラス、組織、分野の分析を通じて
JST科学技術文献データのネットワーク分析-シソーラス、組織、分野の分析を通じてJST科学技術文献データのネットワーク分析-シソーラス、組織、分野の分析を通じて
JST科学技術文献データのネットワーク分析-シソーラス、組織、分野の分析を通じて
 
企業に着目した共同研究ネットワーク構造の解析と非連続的成長の予測 技術動向観測隊
企業に着目した共同研究ネットワーク構造の解析と非連続的成長の予測 技術動向観測隊企業に着目した共同研究ネットワーク構造の解析と非連続的成長の予測 技術動向観測隊
企業に着目した共同研究ネットワーク構造の解析と非連続的成長の予測 技術動向観測隊
 
研究力の向上と実社会の発展の関係分析 HSE研開部
研究力の向上と実社会の発展の関係分析 HSE研開部研究力の向上と実社会の発展の関係分析 HSE研開部
研究力の向上と実社会の発展の関係分析 HSE研開部
 
未来のデータサイエンティストを探せ! ~研究分野遷移から見た人材マッチング~ UNAGI
未来のデータサイエンティストを探せ! ~研究分野遷移から見た人材マッチング~ UNAGI未来のデータサイエンティストを探せ! ~研究分野遷移から見た人材マッチング~ UNAGI
未来のデータサイエンティストを探せ! ~研究分野遷移から見た人材マッチング~ UNAGI
 
「生物多様性を探るために」~トンボの統計解析からわかったノシメトンボと生物多様性について~ 北海道札幌旭丘高等学校 生物部Asahigaokahs a...
 「生物多様性を探るために」~トンボの統計解析からわかったノシメトンボと生物多様性について~  北海道札幌旭丘高等学校 生物部Asahigaokahs a... 「生物多様性を探るために」~トンボの統計解析からわかったノシメトンボと生物多様性について~  北海道札幌旭丘高等学校 生物部Asahigaokahs a...
「生物多様性を探るために」~トンボの統計解析からわかったノシメトンボと生物多様性について~ 北海道札幌旭丘高等学校 生物部Asahigaokahs a...
 
研究活動の年次推移および人々の生活実感への影響に関する分析 健マネ
研究活動の年次推移および人々の生活実感への影響に関する分析 健マネ研究活動の年次推移および人々の生活実感への影響に関する分析 健マネ
研究活動の年次推移および人々の生活実感への影響に関する分析 健マネ
 
大学のそこんところ ~おカネと人と論文と~ 埼玉県立熊谷女子高等学校
大学のそこんところ ~おカネと人と論文と~  埼玉県立熊谷女子高等学校大学のそこんところ ~おカネと人と論文と~  埼玉県立熊谷女子高等学校
大学のそこんところ ~おカネと人と論文と~ 埼玉県立熊谷女子高等学校
 
ニュース記事と特許を利用した科学技術の重要性の評価 広島市立大学
ニュース記事と特許を利用した科学技術の重要性の評価  広島市立大学ニュース記事と特許を利用した科学技術の重要性の評価  広島市立大学
ニュース記事と特許を利用した科学技術の重要性の評価 広島市立大学
 
論文の共著関係ネットワークの中心性分析 Terano Lab.
論文の共著関係ネットワークの中心性分析 Terano Lab.論文の共著関係ネットワークの中心性分析 Terano Lab.
論文の共著関係ネットワークの中心性分析 Terano Lab.
 
All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline
All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline
All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯~Guideline
 
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks
 
まるもり
まるもりまるもり
まるもり
 
Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)Rにおける大規模データ解析(第10回TokyoWebMining)
Rにおける大規模データ解析(第10回TokyoWebMining)
 
Neo4j の「データ操作プログラミング」から 「ビジュアライズ」まで
Neo4j の「データ操作プログラミング」から 「ビジュアライズ」までNeo4j の「データ操作プログラミング」から 「ビジュアライズ」まで
Neo4j の「データ操作プログラミング」から 「ビジュアライズ」まで
 
データサイエンティストのつくり方
データサイエンティストのつくり方データサイエンティストのつくり方
データサイエンティストのつくり方
 
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォーム
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォームAWSマネージドサービスをフル活用したヘルスケアIoTプラットフォーム
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォーム
 
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてエクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについて
 
スマートファクトリーを支えるIoTインフラをつくった話
スマートファクトリーを支えるIoTインフラをつくった話スマートファクトリーを支えるIoTインフラをつくった話
スマートファクトリーを支えるIoTインフラをつくった話
 
500’s Demo Day Batch 17 >> TraceAir
500’s Demo Day Batch 17 >> TraceAir500’s Demo Day Batch 17 >> TraceAir
500’s Demo Day Batch 17 >> TraceAir
 

Similar to 雑誌・新聞・JSTデータから見る「よりよい企業選択へのヒント」

How the future prediction affects on the evolution of technologies
How the future prediction affects on the evolution of technologiesHow the future prediction affects on the evolution of technologies
How the future prediction affects on the evolution of technologies坂本 真里
 
ソーシャルテレビカンファレンス2013 セッション2(深田担当)
ソーシャルテレビカンファレンス2013 セッション2(深田担当)ソーシャルテレビカンファレンス2013 セッション2(深田担当)
ソーシャルテレビカンファレンス2013 セッション2(深田担当)consultant
 
日本電信電話ユーザ協会宮崎支部で講演「IoTと中小企業~IoT・ビッグデータ・AIを企業が経営に活かす方法」
日本電信電話ユーザ協会宮崎支部で講演「IoTと中小企業~IoT・ビッグデータ・AIを企業が経営に活かす方法」日本電信電話ユーザ協会宮崎支部で講演「IoTと中小企業~IoT・ビッグデータ・AIを企業が経営に活かす方法」
日本電信電話ユーザ協会宮崎支部で講演「IoTと中小企業~IoT・ビッグデータ・AIを企業が経営に活かす方法」竹内 幸次
 
さいたま商工会議所工業部会で講演「中小企業経営に活かすIoT」
さいたま商工会議所工業部会で講演「中小企業経営に活かすIoT」さいたま商工会議所工業部会で講演「中小企業経営に活かすIoT」
さいたま商工会議所工業部会で講演「中小企業経営に活かすIoT」竹内 幸次
 
観測不可な確率変数に関する推計とファイナンス工学への応用
観測不可な確率変数に関する推計とファイナンス工学への応用観測不可な確率変数に関する推計とファイナンス工学への応用
観測不可な確率変数に関する推計とファイナンス工学への応用Terutoshi Mita
 
東京商工会議所世田谷支部で講演「最新のIT活用術販路拡大と生産性向上のヒント」
東京商工会議所世田谷支部で講演「最新のIT活用術販路拡大と生産性向上のヒント」東京商工会議所世田谷支部で講演「最新のIT活用術販路拡大と生産性向上のヒント」
東京商工会議所世田谷支部で講演「最新のIT活用術販路拡大と生産性向上のヒント」竹内 幸次
 
kintoneでスピード解決!JV企業の社員管理
kintoneでスピード解決!JV企業の社員管理kintoneでスピード解決!JV企業の社員管理
kintoneでスピード解決!JV企業の社員管理Shotaro Matsuda
 
渋谷 講演 中小企業の実践IT活用2017~使えるビッグデータからSNS活用まで
渋谷 講演 中小企業の実践IT活用2017~使えるビッグデータからSNS活用まで渋谷 講演 中小企業の実践IT活用2017~使えるビッグデータからSNS活用まで
渋谷 講演 中小企業の実践IT活用2017~使えるビッグデータからSNS活用まで竹内 幸次
 
11月22日完成版IT利活用
11月22日完成版IT利活用11月22日完成版IT利活用
11月22日完成版IT利活用Shuhei Nishikawa
 
Digital campus45
Digital campus45Digital campus45
Digital campus45merc-inc
 
東京商工会議所杉並支部で講演「ChatGPTの経営活用~生成AIを上手に使うポイント~」
東京商工会議所杉並支部で講演「ChatGPTの経営活用~生成AIを上手に使うポイント~」東京商工会議所杉並支部で講演「ChatGPTの経営活用~生成AIを上手に使うポイント~」
東京商工会議所杉並支部で講演「ChatGPTの経営活用~生成AIを上手に使うポイント~」竹内 幸次
 
埼玉仮想工業団地で講演「ChatGPT~生成AI活用術~」
埼玉仮想工業団地で講演「ChatGPT~生成AI活用術~」埼玉仮想工業団地で講演「ChatGPT~生成AI活用術~」
埼玉仮想工業団地で講演「ChatGPT~生成AI活用術~」竹内 幸次
 
新潟県商工会連合会で講演「従業員のエンゲージメントを高めるパーパス経営」
新潟県商工会連合会で講演「従業員のエンゲージメントを高めるパーパス経営」新潟県商工会連合会で講演「従業員のエンゲージメントを高めるパーパス経営」
新潟県商工会連合会で講演「従業員のエンゲージメントを高めるパーパス経営」竹内 幸次
 
2020 All Japan Executive Results-Institutional Investor
2020 All Japan Executive Results-Institutional Investor2020 All Japan Executive Results-Institutional Investor
2020 All Japan Executive Results-Institutional InvestorMichael Clemons
 
富山 講演 IoTと中小企業の経営戦略
富山 講演 IoTと中小企業の経営戦略富山 講演 IoTと中小企業の経営戦略
富山 講演 IoTと中小企業の経営戦略竹内 幸次
 

Similar to 雑誌・新聞・JSTデータから見る「よりよい企業選択へのヒント」 (20)

TOPIX
TOPIXTOPIX
TOPIX
 
How the future prediction affects on the evolution of technologies
How the future prediction affects on the evolution of technologiesHow the future prediction affects on the evolution of technologies
How the future prediction affects on the evolution of technologies
 
ソーシャルテレビカンファレンス2013 セッション2(深田担当)
ソーシャルテレビカンファレンス2013 セッション2(深田担当)ソーシャルテレビカンファレンス2013 セッション2(深田担当)
ソーシャルテレビカンファレンス2013 セッション2(深田担当)
 
日本電信電話ユーザ協会宮崎支部で講演「IoTと中小企業~IoT・ビッグデータ・AIを企業が経営に活かす方法」
日本電信電話ユーザ協会宮崎支部で講演「IoTと中小企業~IoT・ビッグデータ・AIを企業が経営に活かす方法」日本電信電話ユーザ協会宮崎支部で講演「IoTと中小企業~IoT・ビッグデータ・AIを企業が経営に活かす方法」
日本電信電話ユーザ協会宮崎支部で講演「IoTと中小企業~IoT・ビッグデータ・AIを企業が経営に活かす方法」
 
さいたま商工会議所工業部会で講演「中小企業経営に活かすIoT」
さいたま商工会議所工業部会で講演「中小企業経営に活かすIoT」さいたま商工会議所工業部会で講演「中小企業経営に活かすIoT」
さいたま商工会議所工業部会で講演「中小企業経営に活かすIoT」
 
観測不可な確率変数に関する推計とファイナンス工学への応用
観測不可な確率変数に関する推計とファイナンス工学への応用観測不可な確率変数に関する推計とファイナンス工学への応用
観測不可な確率変数に関する推計とファイナンス工学への応用
 
東京商工会議所世田谷支部で講演「最新のIT活用術販路拡大と生産性向上のヒント」
東京商工会議所世田谷支部で講演「最新のIT活用術販路拡大と生産性向上のヒント」東京商工会議所世田谷支部で講演「最新のIT活用術販路拡大と生産性向上のヒント」
東京商工会議所世田谷支部で講演「最新のIT活用術販路拡大と生産性向上のヒント」
 
Pv2030
Pv2030Pv2030
Pv2030
 
kintoneでスピード解決!JV企業の社員管理
kintoneでスピード解決!JV企業の社員管理kintoneでスピード解決!JV企業の社員管理
kintoneでスピード解決!JV企業の社員管理
 
B
BB
B
 
渋谷 講演 中小企業の実践IT活用2017~使えるビッグデータからSNS活用まで
渋谷 講演 中小企業の実践IT活用2017~使えるビッグデータからSNS活用まで渋谷 講演 中小企業の実践IT活用2017~使えるビッグデータからSNS活用まで
渋谷 講演 中小企業の実践IT活用2017~使えるビッグデータからSNS活用まで
 
11月22日完成版IT利活用
11月22日完成版IT利活用11月22日完成版IT利活用
11月22日完成版IT利活用
 
Digital campus45
Digital campus45Digital campus45
Digital campus45
 
Pv2030
Pv2030Pv2030
Pv2030
 
Pv2030
Pv2030Pv2030
Pv2030
 
東京商工会議所杉並支部で講演「ChatGPTの経営活用~生成AIを上手に使うポイント~」
東京商工会議所杉並支部で講演「ChatGPTの経営活用~生成AIを上手に使うポイント~」東京商工会議所杉並支部で講演「ChatGPTの経営活用~生成AIを上手に使うポイント~」
東京商工会議所杉並支部で講演「ChatGPTの経営活用~生成AIを上手に使うポイント~」
 
埼玉仮想工業団地で講演「ChatGPT~生成AI活用術~」
埼玉仮想工業団地で講演「ChatGPT~生成AI活用術~」埼玉仮想工業団地で講演「ChatGPT~生成AI活用術~」
埼玉仮想工業団地で講演「ChatGPT~生成AI活用術~」
 
新潟県商工会連合会で講演「従業員のエンゲージメントを高めるパーパス経営」
新潟県商工会連合会で講演「従業員のエンゲージメントを高めるパーパス経営」新潟県商工会連合会で講演「従業員のエンゲージメントを高めるパーパス経営」
新潟県商工会連合会で講演「従業員のエンゲージメントを高めるパーパス経営」
 
2020 All Japan Executive Results-Institutional Investor
2020 All Japan Executive Results-Institutional Investor2020 All Japan Executive Results-Institutional Investor
2020 All Japan Executive Results-Institutional Investor
 
富山 講演 IoTと中小企業の経営戦略
富山 講演 IoTと中小企業の経営戦略富山 講演 IoTと中小企業の経営戦略
富山 講演 IoTと中小企業の経営戦略
 

雑誌・新聞・JSTデータから見る「よりよい企業選択へのヒント」

  • 2. 2015/3/16All Analytics Championship 2 (目次) Ⅰ, Executive Summary Ⅱ, 背景と目的 Ⅲ, 使用データの紹介 Ⅳ, 分析① 世間のトレンド Ⅴ, 分析② 企業のグルーピング Ⅵ, 分析③ 企業の強み Ⅶ, 結論 (Ⅷ, 分析のプロセス)
  • 4. Ⅱ,背景と目的(1) 2015/3/16All Analytics Championship 4 ーⅠ,背景と目的 就職活動の始まる大学三年……学生たちは霧の中に立たされたように感じている 【一般的な(よくいる)大学三年生モデル】 テニスサークルに所属。テニスはせずに毎日飲み会ばかり 授業は初回だけしか出ない 試験は過去問を駆使。なんとか単位だけは確保 口癖は「めんどい」「しんどい」 <T大学経済学部三年、アズマーさん> ――2015年3月、就活解禁―― 自己分析 業界研究 説明会 OB訪問 いきなりそんないろいろ言われても…… 私、テニス(飲み会)しかしてないし…… とりあえず受ける会社だけ絞ろうっと!
  • 5. Ⅱ,背景と目的(2) 2015/3/16All Analytics Championship 5 ーⅠ,背景と目的 いざ絞ろうにも企業ありすぎ…… 企業が何をしてるのかわからない 多分野にわたって活躍する企業が多く、所属業界がわからない どの分野に強い企業なのかがわからない とりあえず知ってるところ を受けたら内定もらった。 もうここでいいや ブラック! 早期退職へ… こうならないためにも、 データから学生のよりよい企業選択のヒントを得る 「企業の適切な分類」や「企業の強み」を より正確に把握できるような仕組みがほしい
  • 6. Ⅱ,背景と目的(3) 2015/3/16All Analytics Championship 6 ーⅡ,分析方針 分析対象業界の トレンドを知れる 専門誌:業界のトレンド 総合誌:総合のトレンド 分野のつながり を重視して企業の グルーピングを行う 対象業界への 適切なアクセス UDC分類から 対象グループの 強みの違いが知る より自分の興味に近い 企業を見つけられる これらをアズマーさんの場合にあてはめるとどうなるか。 以降、活用法の具体例として分析を行っていく <雑誌データ> 【総合誌】でトレンド業界をつかむ 志望業界が定まっていない 活動度の高い企業がいい <新聞データ> 掲載数の多い100社を選択 雑誌データ 新聞データ JSTデータ
  • 7. Ⅲ,使用データの紹介 2015/3/16All Analytics Championship 7 i. 雑誌記事データ(日経BP社さま) 10個の雑誌のうち「日経ビジネス」「日経TRENDY」 の記事内にある「記事の要約」を使用 ii. 新聞記事データ(日刊工業新聞社さま) 各新聞記事につけられた「企業名」および、記事を 26の分野に分けた「弊社独自の記事区分」を使用 iii. JST科学技術文献データ 特に「年代、機関名、JST分類、抄録、名寄せ」 を使用(化学物質データ・科学用語データは使用しない) iv. 各企業の有価証券報告書 平均年収や人数、平均勤続年数などを参考にする ーⅠ,使用データの紹介
  • 8. Ⅳ,分析① 世間のトレンド(1) 2015/3/16All Analytics Championship 8 ーⅠ,方針と方法 雑誌データから、世間のトレンドがわかるのでは i. 雑誌は、人々が興味を持ってくれないと売れない ii. 特に総合情報雑誌は世間のトレンドを反映したものと考えられる 雑誌内の頻出単語を調べ、その特徴から注目業界を考察する 10誌のうち、今回は専門性が低い(総合情報を扱う)と思われる 「日経ビジネス」および「日経TRENDY」の2誌を考察対象にした。 【日経BP社 10誌】 日経ビジネス・日経コンピュータ・日経 エレクトロニクス・日経メディカル・日 経パソコン・日経情報ストラテジー・日 経コミュニケーション・日経ヘルス・日 経TRENDY・日経アーキテクチュア たとえば、日経メディカルの 頻出単語は「高齢、感染、臨床」 専門誌では世間全体が注目 するトレンドは得られない。 (業態内のトレンド把握には有効)
  • 9. 2015/3/16All Analytics Championship 9 ーⅡ,分析結果 日本、東京、電子、端末、パソコン、 デジタル、家電、メーカー、ポイントカード、 スマートフォン、iPhoneなど 日経TRENDYの頻出単語 メーカー、会社、技術、金融、工場、国内産業、 世界、自動車、投資、中国、発電、米国など 日経ビジネスの頻出単語 2010~2012の 三年間のデータ ”電子端末時代の到来” ”海外意識の高さ” グローバルに活躍する 電子・デジタル業界 <年別に見ると、2011年に特徴的な共通単語あり> 大震災・原子力・発電・節電・夏 エネルギー業界 電子業界・エネルギー業界が現在トレンドの中心となる業界 Ⅳ,分析① 世間のトレンド(2)
  • 10. Ⅴ,分析② 企業のグルーピング(1) 2015/3/16All Analytics Championship 10 ーⅠ,方針と方法 新聞データから、まず社会的に活動度の高い企業を抽出する i. 新聞の役割は社会的に重要なニュースを伝えることである ii. 記事に何度も現れる企業は、社会的に活動度の高い企業である 掲載数上位100社(団体)を調べ、後の分析対象とする 記事につけられた分野情報の数を企業ごとに集計し、以下のような表を作成 企業\分野 資源 食品 エネルギー 化学 トヨタ 300 50 100 20 ソニー 50 100 200 100 分野数を変数にしたクラスター分析により、グループ分けする 例) 分野情報によるグループ分け
  • 11. 2015/3/16All Analytics Championship 11 ーⅡ,分析結果 Ⅴ,分析② 企業のグルーピング(2)
  • 12. 2015/3/16All Analytics Championship 12 ーⅡ,分析結果 Ⅴ,分析② 企業のグルーピング(3)
  • 13. 2015/3/16All Analytics Championship 13 ーⅡ,分析結果 Ⅴ,分析② 企業のグルーピング(4)
  • 14. Ⅴ,分析② 企業のグルーピング(5) 2015/3/16All Analytics Championship 14 ーⅢ,トレンドとグルーピングの関連 グローバルに活躍する 電子・デジタル業界 エネルギー業界 日立製作所、東芝、富士通、ソニー、 日本電気、三菱電機、シャープ、 NTT、KDDI、野村総合研究所 東京、関西、中部、九州、東北、中国 (以上電力)、東京ガス、大阪ガス ※ 企業抽出方法の問題から、今回は日本企業のみを対象企業とした 自動車系・電子部品系・エネルギー系の企業がそれぞれ多く固まる  電子部品系企業の集まるクラスター  エネルギー系企業の集まるクラスター 今回は、特に「日経TRENDY」のキーワードを重視し、 を分析の対象として抽出する クラスターの上位分岐に、総合誌から得られたトレンド業界が固まっている
  • 15. Ⅵ,分析③ 企業の強み(1) 2015/3/16All Analytics Championship 15 ーⅠ,方針と方法 以下のように企業ごとに集計し、分野の割合を円グラフで可視化 さらに抄録データの頻出単語から、より具体的な強みを知る 企業評価のため年収や従業員数の比較、キャリアアップへのヒントを紹介 企業\分野 機械工学 臨床医学 土木工学 企業経営 東芝 300 150 10 20 富士通 500 100 20 10 例) 各企業のJSTデータをUDC(国際十進分類法)により分野で分類する① ② 「UDC【精密機器】【機械工学】の割合が多い=強みがある」企業を選択 ③
  • 16. 2015/3/16All Analytics Championship 16 東芝 富士通 日本電気 三菱電機 シャ ープ 日立 ーⅡ,論文分野の傾向 Ⅵ,分析③ 企業の強み(2)
  • 17. 2015/3/16All Analytics Championship 17 K DDI 東京ガス 大阪ガス ソ ニー N TT 野村総研 ーⅡ,論文分野の傾向 Ⅵ,分析③ 企業の強み(3)
  • 18. 2015/3/16All Analytics Championship 18 中部電力 九州電力 東北電力 東京電力 関西電力 中国電力 ーⅡ,論文分野の傾向 Ⅵ,分析③ 企業の強み(4)
  • 19. 2015/3/16All Analytics Championship 19 ーⅢ,企業選択と抄録データの照らし合わせ 雑誌によるトレンドから、 デジタル分野は UDC【精密機器】【機械工学】を重視し、 「富士通、日本電気、三菱電機、KDDI」を選択。 エネルギー分野は UDC【機械工学】に強い「東京電力」 および【臨床医学】に強い「関西電力」を代表で選択。 デジタル分野の4つには共通のワード ネットワーク、データ、通信、 伝送、電力、制御、光など エネルギー分野は2つの分野に分かれる 東電(工学一般に強み) ガス、ネットワーク、設備、技術など 関電(病理学に強み) 患者、治療、血糖、診断、エコーなど 特に通信系統に強みがあるとわかる 技術面に強み 医療面に強み 抄録データと 照らし合わせて 具体的な強みを知る Ⅵ,分析③ 企業の強み(5)
  • 20. 2015/3/16All Analytics Championship 20 ーⅣ,選択企業の平均年収や従業員数は? さらに年収推移は右肩上がり (六企業の中で唯一) 一方の関電は2013年に急落 Ⅵ,分析③ 企業の強み(6) 2006~2013の 六企業の年収比較 東電は大震災のあった 2011年に急落 年収ではKDDIが ひとつ抜けている
  • 21. 2015/3/16All Analytics Championship 21 ーⅣ,選択企業の平均年収や従業員数は? 従業員数推移は右肩上がり。 さらに平均年齢は右肩下がり (いずれも六企業の中で唯一) 2011年以降も急落続く 一方、関西電力は右肩上がり Ⅵ,分析③ 企業の強み(7) 2006~2013の 六企業の従業員数比較 三菱電機は年収と 合わせてバランスが良い 東電は大震災のあった 2011年に急落
  • 22. 2015/3/16All Analytics Championship 22 ーⅤ,入社後のキャリアアップイメージ 今回は、先ほどの有価証券データを参考に、 比較的年収の高い「KDDI」、 バランスがよく採用も多そうな「三菱電機」、 さほど震災の影響を受けていないように見える「関西電力」 の三企業について調べてみる。 Ⅵ,分析③ 企業の強み(8) 各企業、論文著者の機関移動を調べることで 入社後のキャリアアップイメージがつかめるのでは? i. 対象企業グループの論文執筆者を調べる ii. その執筆者の論文データを集め、時系列順に並べる iii. 論文の機関名を調べ、移動の傾向を把握する <方法>
  • 23. KDDI 前:国際電電(前身)、有名大学院など 後:ATR音声言語、国際電気通信基礎技術研、各大学など →通信系のより専門的な機関への移動がある一方、 一貫してKDDIという人も多い。 三菱電機 前:JAXA、ASET超先端電子技術開発機構、TMT&D、 東芝、ティーエムエイエレクトリック、各大学など 後:子会社や各大学 →各専門機関から集まってくる。関連機関外への移動は少数。 関西電力 前:日本原子力発電、関西の大学、医学部 後:各病院、医学部など →医学系は機関移動が活発に起こっている。 2015/3/16All Analytics Championship 23 ーⅤ,入社後のキャリアアップイメージ Ⅵ,分析③ 企業の強み(9)
  • 24. Ⅶ,結論(1) 2015/3/16All Analytics Championship 24 ーⅠ,分析のまとめ 総合誌から 世間のトレンド把握 出現回数上位 100社を選出 UDC・抄録から 企業の強みを把握 雑誌データ 新聞データ JSTデータ 電子・デジタル業界 エネルギー業界 分野情報で クラスターわけ 電子、端末、 スマートフォン、 大震災、etc…… トレンド業界把握 目的業界企業の把握 東芝、シャープ、 ソニー、NTT、 KDDI、etc…… + 関西電力は医療、 富士通は電子、 etc…… よりよい企業選択 + 年収・従業員数比較 キャリアアップ評価
  • 25. Ⅶ,結論(2) 2015/3/16All Analytics Championship 25 ーⅡ,活用イメージ 雑誌データ・新聞データの使い方を変えれば 個々人の目的や状況に応じた企業選択の支援が期待できる ケース① 目指す業界が決まっている 専門誌による同様の分析で、目的業界のトレンドが把握できる ケース② 大企業以外にも目を向けたい 新聞データ上位100社に限らない同様の分析により。未知の 企業の所属業界や業界の近い企業を知ることができる JSTデータによる企業の強みやキャリアアップの把握は 学生だけでなく転職を考える社会人への活用も期待できる さらに…… (企業ごとの強みの細かい違いが企業選択の決め手となるため)
  • 26. 分析のプロセス 26 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 26 ここからは分析についての詳しい手順の解説や結果の補足を行う ーⅠ,雑誌データを用いた分析 使用データ:“JST.tsv”(提供10誌、2010~2012の3年分データ) ・5列目の雑誌名(mediajp)で雑誌ごとに分けることができる。 →今回は「日経TRENDY」と「日経ビジネス」のみに絞って分析を行った。 日経TRENDY:1932記事 日経ビジネス:4668記事 データ数 ・14列目の要約(summary)の頻出単語を調べ、リストアップする。 →今回はTRENDYは100回以上、ビジネスは220回以上を頻出単語とした。 ・4列目の掲載日時(pubDate)を使って一年ごとに分け、頻出単語を調べる →今回はTRENDYは30回以上、ビジネスは80回以上を年別頻出単語とした。 ※出現回数は雑誌ごとに任意で判断する名詞・形容詞・動詞を数える
  • 27. 分析のプロセス 27 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 27 ーⅠ,雑誌データを用いた分析(結果の詳細) 日経TRENDY 全体 2010 2011 2012 日経ビジネス メーカー、億、会社、 海外、開発、企業、技術、 業界、金融、経営、経済、 見る、言う、後、工場、 国内、今年、昨年、産業、 市場、自動車、社長、 商品、消費、情報、世界、 成長、生産、大手、大震災、 中国、投資、東日本、 発電、米国、問題、力 日本、東京、電子、端末、 通信、製品、人気、増える、 相次ぐ、多い、続く、消費、 商品、施設、市場、始める、 使う、開発、会社、家電、 価格、駅、モデル、 メーカー、ポイントカード、 ホテル、スマートフォン、 パソコン、ネット、デジタル、 テレビ、オープン、アプリ、 iPhone。 電子、昨日、 スマートフォン、 ケータイ、カード、 保険、米国、日本、 東京、端末、最新型 ポイント、パソコン アプリ、iPad、 iPhone、 会社、開発、関係、 企業、億、メーカー 技術、業界、金融、 経営、経済、見る、 言う、国内、今年、 昨年、産業、事業、 自動車、社長、商品、 消費、世界、成長、 政権、生産、大手、 中国、発表、民主党、 米国 サービス、メーカー、 会社、海外、開発、 企業、危機、技術、 経営、経済、原子力、 工場、国内、産業、 市場、事故、自動車、 社会、商品、消費、 情報、震災、世界、 成長、生産、投資、 東日本、大震災、発電、 被災、福島、米国 メーカー、会社、開発、 企業、技術、経営、 経済、国内、市場、 事業、自動車、消費、 世界、成長、生産、 大手、中国、東京、 日本、発表、発売、 米国、問題 ヒット、消費、サービス、 普及、登場、電子、通信、 端末、増える、人気、 新、女性、集める、手帳 時代、施設、市場、最大 最新、高速、高級、業界、 拡大、開発、海外、モデル メーカー、ホテル、ブーム ブランド、パソコンネット デジタル、タブレット、 スマートフォン、アプリ、 発売、スマートフォン、 東日本、搭載、通信、 端末、大震災、節電、 人気、震災、情報、消費 商品、車、施設、市場、 最新、業界、各社、開発 家電、価格、夏、メーカ ヒット パソコン テレビ タブレット、サービス、 カメラ、エコ、 iPhone アンドロイド、アプリ
  • 28. 分析のプロセス 28 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 28 ーⅡ,新聞データを用いた分析 使用データ:“Q_NV_JST_2010.tsv”(2010年分) “Q_NV_JST_2011.tsv”(2011年分) “Q_NV_JST_2012.tsv”(2012年分) ・32列~52列目の企業名(KJ)を記事ごとにまとめて付与し、 出現回数の多い企業を取り出す。 →今回は200記事以上登場する企業(約100社)を取り出した ・5列目の弊社独自の記事区分(KK)の二文字目が記事ごとに 26の分野を示す文字なので、二文字目だけを記事に付与する。 ・企業ごとに記事の区分を集計し、表にする(次ページからの表) →今回の分析では、この表を距離行列化しクラスター分析にかけた。 ※掲載数を除外し、分野出現傾向だけで見るのなら標準化の必要がある。 (掲載数の少ない企業も合わせて分析したいときなどの場合、必須) →ここでは参考のため、上位100社に対し、標準化した表を用いた クラスター分析結果も掲載する(後のページのデンドログラム) 三つのデータを まとめたデータ を使用する
  • 29. 分析のプロセス 29 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 29 企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z (株)日刊工業新 聞社 0 5 3 1 15 4 3 1 9 171 43 20 26 5 1 46 44 16 15 8 0 3 40 859 63 1814 トヨタ自動車 (株) 1 11 2 2 32 18 2 2 28 73 64 20 1788 5 2 62 37 8 37 68 5 1 30 216 77 257 日産自動車(株) 2 8 3 1 22 11 0 0 9 47 42 1 1224 4 2 34 33 1 18 17 3 1 25 143 47 168 (株)日立製作所 3 6 1 0 39 9 2 1 11 90 603 14 27 6 3 39 50 0 10 10 1 2 312 122 100 160 東芝 2 7 1 0 63 7 1 1 5 69 755 9 23 9 1 27 58 2 13 26 1 0 64 128 74 147 本田技研工業 (株) 1 2 1 0 14 8 0 1 6 34 32 12 1021 0 1 28 10 0 7 37 1 0 9 98 17 116 東京電力(株) 5 16 8 3 473 10 0 3 23 75 98 11 42 1 2 34 51 3 18 56 3 4 59 346 26 186 富士通(株) 2 1 1 0 13 4 1 0 1 15 269 3 5 3 6 14 63 0 10 27 0 0 525 54 46 86 日本電気(株) 1 10 0 0 18 8 1 0 1 4 348 6 14 2 10 15 20 1 9 22 1 0 510 50 67 66 三菱重工業(株) 2 6 2 0 45 4 0 0 7 517 55 9 162 3 37 31 19 0 12 9 0 4 12 100 36 116 三菱電機(株) 2 7 0 0 24 1 0 0 2 198 559 24 23 5 12 30 42 2 7 4 0 0 35 61 45 95 東京大学 5 7 10 2 28 46 74 0 2 33 47 15 13 7 24 37 34 4 12 8 1 0 47 137 458 280 シャープ(株) 1 11 1 1 30 6 1 0 3 4 563 0 9 2 1 20 19 2 15 12 0 0 65 71 27 93 ソニー(株) 2 2 0 0 6 4 0 2 0 6 571 0 9 9 2 26 19 3 5 44 0 0 60 78 28 76 第二電電 0 1 0 0 6 0 0 0 0 1 33 0 3 0 0 8 1 1 8 13 0 5 585 17 5 28 スズキ 0 0 0 0 1 4 0 1 10 17 5 0 543 0 0 9 6 0 5 2 1 0 0 34 4 74 川崎重工業(株) 0 4 0 0 16 2 1 0 3 260 8 24 213 1 7 18 14 0 2 4 0 5 4 44 8 71 マツダ(株) 0 0 0 0 3 1 0 0 0 15 8 0 448 0 0 16 2 0 8 6 0 0 4 22 22 52 富士重工業(株) 0 1 0 0 2 0 0 0 0 33 5 10 454 0 5 8 3 0 5 1 0 2 2 28 12 33 三菱自動車 0 1 0 1 7 2 1 0 0 6 28 0 417 1 0 4 14 0 13 2 1 2 5 40 14 33 日本電信電話 (株) 0 3 1 0 6 1 0 0 1 5 26 0 1 1 0 12 6 0 5 12 1 0 379 43 34 40 東レ(株) 1 2 1 129 14 111 3 0 1 6 9 0 18 1 0 17 48 3 15 5 0 2 1 26 23 65 関西電力(株) 1 4 0 1 255 1 0 1 2 20 19 3 5 0 0 7 25 1 2 8 0 3 21 103 3 49 理化学研究所 1 0 6 1 2 26 63 1 1 4 14 1 1 3 3 7 6 0 0 1 0 0 11 28 277 73
  • 30. 分析のプロセス 30 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 30 企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z キヤノン(株) 0 0 1 1 1 1 0 0 1 11 278 2 1 11 0 16 9 0 3 27 0 0 11 44 13 76 伊藤忠商事(株) 14 4 13 4 22 12 1 0 4 13 9 1 13 1 0 27 14 0 167 16 1 0 23 31 2 65 ダイハツ工業(株) 0 0 0 0 0 3 0 0 2 7 1 0 375 0 0 6 4 0 2 1 0 1 0 11 6 38 東北大学 0 5 2 0 9 18 16 1 6 15 30 13 5 3 5 21 15 0 1 4 0 0 11 33 177 126 早稲田大学 0 4 0 0 12 6 3 0 2 9 7 12 9 4 1 37 8 3 5 6 0 0 10 46 85 187 日本銀行(株) 1 0 0 0 1 0 0 0 1 3 2 0 1 0 0 10 1 1 1 177 0 1 5 233 0 15 三菱商事(株) 16 5 6 5 28 14 0 0 9 27 4 0 23 0 3 14 20 2 111 31 3 3 4 59 2 46 東京工業大学 2 6 1 4 19 13 3 0 1 15 27 15 2 2 9 11 15 0 0 0 0 0 10 40 150 114 大阪大学 0 1 3 1 3 15 20 1 7 14 23 8 0 1 4 15 11 1 4 5 0 0 8 26 152 121 日本アイ・ビー・エ ム(株) 0 0 1 0 1 1 0 0 1 4 35 0 1 0 0 3 7 0 2 3 0 1 307 23 6 21 中部電力(株) 2 1 3 2 220 6 0 0 5 14 11 0 13 0 0 17 18 0 2 5 0 1 3 39 4 35 野村証券(株) 0 3 0 0 1 2 0 0 4 1 4 0 4 1 0 8 0 0 1 176 1 0 8 95 4 17 ヤマハ発動機(株) 0 0 0 0 1 2 0 0 2 41 5 7 261 0 0 6 3 2 3 2 0 0 0 13 3 37 Apple Computer 2 3 5 2 0 2 1 0 3 16 87 1 15 2 1 12 0 10 7 20 0 1 142 9 15 31 三洋電機(株) 1 3 0 0 10 3 0 0 0 12 237 0 25 1 0 8 14 1 6 3 0 0 9 17 3 32 三井物産(株) 21 8 3 1 29 9 1 0 8 5 12 1 12 1 0 8 9 2 131 12 0 1 10 36 1 63 マイクロソフト 0 3 0 0 0 0 0 0 0 2 70 0 8 0 0 6 2 0 1 16 0 0 234 6 6 27 丸紅(株) 5 1 4 4 28 2 1 0 4 22 7 0 11 0 0 16 6 1 155 17 3 0 3 36 4 50 住友商事(株) 12 2 2 2 18 8 1 0 22 17 6 3 24 0 0 14 13 1 112 15 1 1 25 26 1 49 (株)神戸製鋼所 1 4 0 1 24 5 0 0 143 47 4 1 6 0 0 29 8 2 2 4 0 1 3 21 6 53 慶応義塾大学 0 0 1 1 2 7 23 0 2 9 11 7 11 2 1 13 7 2 3 1 1 1 12 43 128 69 京セラ(株) 2 4 0 2 22 2 0 1 5 28 163 0 4 0 1 7 16 7 8 7 0 10 9 18 8 24 三菱マテリアル (株) 23 1 0 2 9 28 0 8 81 40 7 0 3 1 1 11 12 0 1 76 0 0 0 7 1 29 日本航空(株) 0 1 3 0 2 0 0 0 0 0 1 0 13 0 0 15 2 1 65 16 0 102 9 33 0 24 東京瓦斯(株) 4 12 2 0 218 3 0 0 0 10 14 0 3 0 0 7 29 0 3 4 0 1 10 23 4 33
  • 31. 分析のプロセス 31 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 31 企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z (株)野村総合研 究所 0 1 1 0 1 0 1 0 0 1 8 0 2 1 0 9 8 0 4 6 0 0 208 27 2 32 帝人(株) 1 0 0 100 10 59 1 0 2 0 7 1 3 2 0 14 21 1 0 2 0 0 3 9 9 38 大阪瓦斯(株) 2 6 2 1 187 6 0 0 0 6 4 0 3 0 0 7 17 2 3 4 2 0 8 17 9 37 IBM 1 0 1 0 2 1 1 0 0 2 62 0 0 0 0 5 7 0 1 2 0 0 184 10 19 13 九州電力(株) 2 0 0 0 166 1 0 0 1 7 11 1 2 0 0 7 9 0 3 2 1 0 5 40 6 44 東北電力(株) 1 2 0 0 152 6 0 0 3 12 26 0 2 1 0 7 9 0 5 5 1 0 11 34 5 25 武田薬品工業 (株) 0 0 34 0 0 159 24 0 0 1 1 0 0 0 0 9 1 0 5 6 0 0 1 27 7 31 住友金属工業 (株) 4 3 0 1 11 4 0 0 127 13 3 1 5 0 0 19 5 0 6 11 0 0 4 26 4 56 Boeing 0 0 0 1 0 4 0 0 6 78 7 2 111 2 4 5 0 2 10 5 0 20 1 19 8 19 名古屋大学 1 3 4 1 1 12 15 2 4 13 9 1 11 6 10 12 8 2 2 2 0 0 6 9 146 61 いすゞ自動車 (株) 0 0 0 0 1 2 0 0 2 3 0 0 240 0 0 8 3 0 1 3 0 1 2 13 1 18 JETRO 0 1 4 0 1 3 0 1 0 9 3 0 11 1 0 16 2 2 5 7 0 0 0 172 2 54 安川電機 0 1 0 0 2 0 0 0 4 107 44 36 5 1 0 15 2 1 1 1 0 1 1 17 4 46 大日本印刷(株) 0 1 0 3 0 3 2 0 1 3 115 0 0 1 0 2 5 64 7 0 0 0 41 6 14 19 (株)森精機製作 所 0 0 0 0 0 0 0 0 0 227 4 2 2 1 0 8 0 0 2 1 0 0 0 5 2 33 九州大学 1 0 2 0 4 11 6 0 5 11 20 2 2 0 4 11 9 0 3 0 0 0 14 23 94 64 日立建機(株) 0 2 0 0 0 0 0 0 3 181 14 9 4 1 1 7 1 0 2 6 0 0 2 10 1 40 TDK(株) 2 0 0 0 0 2 0 0 1 1 204 0 0 1 0 4 5 0 1 17 0 0 4 8 3 31 東日本旅客鉄道 0 9 2 0 4 1 0 0 1 6 8 1 10 0 0 6 7 0 69 10 0 75 2 34 5 33 三井造船(株) 2 3 0 1 8 3 0 1 4 87 2 1 105 0 0 9 4 0 0 0 0 0 3 12 6 27 京都大学 0 3 9 0 10 29 45 1 2 14 22 3 5 2 4 18 12 1 4 7 0 0 13 38 264 154 住友電気工業 (株) 2 1 0 0 3 6 0 0 36 48 82 1 16 1 0 5 6 0 5 0 1 0 7 16 8 25 清水建設(株) 0 143 0 1 11 1 0 0 2 9 7 2 1 1 0 7 21 0 3 1 4 0 7 7 8 29 Volkswagen 0 0 0 0 1 1 0 0 1 8 8 3 217 0 0 4 2 0 0 0 0 0 2 5 0 3 GM 0 1 0 1 1 0 0 0 2 13 19 0 169 1 0 6 3 0 2 1 1 1 3 11 4 13
  • 32. 分析のプロセス 32 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 32 企業名 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z オムロン 0 2 1 0 4 0 0 0 0 29 110 2 6 15 0 9 6 0 2 1 0 0 15 15 5 26 クボタ 1 0 2 2 3 3 0 0 1 127 0 0 4 0 0 12 24 3 2 0 0 0 0 10 11 40 凸版印刷(株) 0 3 2 2 2 10 0 0 0 1 84 0 0 1 0 8 4 58 3 3 0 0 41 4 5 14 中国電力(株) 1 4 0 1 168 2 0 0 0 1 3 0 0 0 0 7 11 0 2 6 2 0 3 17 1 15 (株)小松製作所 1 3 0 0 2 1 0 0 2 105 1 5 1 0 1 8 3 1 1 19 0 0 5 37 5 42 (株)島津製作所 0 0 1 0 0 1 2 0 1 76 12 0 7 57 2 8 1 0 2 1 0 0 1 8 23 36 昭和電工(株) 4 0 0 2 7 107 0 0 19 4 19 0 7 0 0 17 4 1 1 3 0 0 1 8 4 29 (株)リコー 2 1 0 1 0 3 0 0 0 3 142 0 1 4 0 7 17 0 2 1 0 0 11 15 9 15 宇部興産(株) 4 1 1 3 13 130 0 2 3 3 3 0 1 0 1 12 1 1 0 6 0 0 0 6 4 35 日立造船(株) 0 1 0 1 4 0 0 0 1 86 4 1 59 2 0 8 11 0 1 3 0 0 1 11 6 27 大和ハウス工業 (株) 0 124 0 0 5 0 0 0 0 2 3 0 1 0 0 6 6 0 8 4 9 0 5 20 4 34 (株)クラレ 2 0 0 24 14 107 0 0 2 2 1 0 0 0 0 15 12 1 0 0 0 0 0 3 1 24 (株)帝国データバン ク 0 4 2 1 1 0 0 0 1 2 2 0 3 0 0 58 2 2 13 4 0 0 3 88 0 28 北海道大学 1 3 3 0 2 6 11 1 6 5 13 1 0 2 3 3 8 1 3 0 0 0 9 15 81 35 オークマ 1 0 0 0 2 0 0 0 0 147 0 1 0 0 0 5 0 0 0 1 0 0 0 7 3 42 (株)豊田自動織機 製作所 0 1 0 0 2 0 0 0 1 37 1 0 107 0 0 7 3 0 3 1 0 0 1 4 15 23 富士電機(株) 0 2 1 0 10 0 0 0 2 8 125 0 2 2 0 2 3 0 3 0 0 0 8 5 8 25 キリンビール(株) 0 0 138 0 0 0 1 0 0 0 0 0 0 0 0 7 8 1 10 2 0 1 1 7 1 29 旭化成工業(株) 0 6 4 8 10 83 4 0 2 1 4 0 0 1 0 10 14 0 3 5 1 0 0 11 8 30 ファナック(株) 0 2 0 0 0 0 0 0 1 109 2 26 4 0 0 1 0 0 0 17 0 0 0 8 2 33 (株)大林組 0 141 0 1 8 1 0 0 0 5 2 0 0 0 2 3 19 0 1 3 1 0 3 9 6 21 (株)村田製作所 0 1 0 0 0 3 0 0 1 12 128 0 4 1 0 5 4 1 0 5 0 0 2 12 4 20 ヤマザキマザック (株) 0 0 0 0 1 0 0 0 0 146 1 3 2 0 0 3 0 0 0 0 0 0 0 7 5 32 ダイキン工業(株) 0 5 0 0 7 10 1 1 0 67 43 0 1 1 0 8 4 0 2 2 1 0 2 15 8 22
  • 34. 分析のプロセス 34 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 34 ーⅢ,JSTデータを用いた分析(分類、抄録) 使用データ:“g_cs1s_split1.tsv”(論文の機関名分割) “g_cs1s_split2.tsv”(分割2) ・新聞・雑誌で絞った企業名に一致する論文番号をそれぞれ抽出。 ※企業名一致で指定するしかないため、たとえば”Apple”を調べると 企業名のどこかに”Apple”を含む企業が全て選択されてしまい、 正確な抽出ができない。ゆえ、今回は日本企業のみを対象とした。 使用データ:“s_cc1gs.tsv”(JST分類) ・先ほど抽出した論文番号をリンクさせ、6列目のUDCを取り出す。 企業ごとに数を数え、表を作って円グラフにしたものが今回の結果である 使用データ:“q_ab1g.tsv”(和文抄録) ・論文番号とのリンクで、抄録データを取り出す。頻出単語を調べリストアップした ※企業ごとに頻出の条件を変更。富士通は17回以上、NECと三菱電機は35回以上、 KDDIは20回以上、東京電力は10回以上、関西電力は40回以上とした。 (表は次ページに載せた)
  • 35. 分析のプロセス 35 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 35 X53 1 X53 2 X53 4 X53 5 X53 7 X53 9 X54 3 X54 4 X54 8 X57 5 X57 7 X59 1 X61 2 X61 3 X61 4 X61 5 X61 6 X61 7 X61 8 X62 0 X62 1 X62 4 X62 8 X62 9 X65 6 X65 7 X65 8 X66 1 X66 2 X66 6 X66 9 X68 1 X69 6 X69 9 日立 1 1 0 0 3 2 0 0 1 0 0 0 1 0 0 0 6 0 0 0 19 2 0 2 0 0 1 0 1 1 7 10 0 0 東芝 3 14 8 26 29 66 5 21 10 1 3 9 5 27 20 111 402 6 6 25 968 6 104 30 24 0 26 3 12 11 54 296 18 2 富士 通 1 3 0 18 0 52 4 6 10 3 3 2 1 21 21 13 17 1 0 1 414 3 7 9 3 3 43 2 1 3 7 214 1 0 日本 電気 3 2 5 41 22 51 1 33 7 6 8 1 2 6 13 20 22 0 0 3 736 8 14 26 7 1 25 9 2 7 6 379 0 0 三菱 電機 12 5 7 22 17 26 5 3 1 0 0 0 2 4 11 5 14 1 0 11 927 7 38 62 20 0 25 2 1 0 14 275 18 0 シャ ープ 1 0 0 8 3 14 2 12 1 0 1 0 2 2 3 1 5 0 0 0 118 0 6 0 0 1 1 0 0 1 2 26 1 0 ソ ニー 5 0 2 2 2 16 3 7 4 1 1 2 1 26 2 2 21 0 0 0 162 2 1 0 1 1 8 2 0 0 3 41 0 0 KDD I 1 0 2 1 0 0 0 0 0 0 0 0 1 0 3 1 5 0 0 0 268 1 0 2 1 0 0 0 0 0 0 176 0 0 NTT 17 0 28 142 64 173 14 43 15 12 15 25 20 61 104 149 186 8 58 74 13 192 9 62 31 5 8 0 32 11 4 0 14 138 4 16 20 野村 総研 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 20 4 0 2 1 11 23 0 0 0 0 42 0 0 東京 ガス 0 0 1 0 0 0 0 1 0 0 1 0 0 16 11 0 11 0 0 12 29 26 28 0 0 0 3 0 25 0 14 0 21 0 大阪 ガス 1 0 0 0 0 1 0 7 0 0 0 0 1 8 6 0 1 0 0 7 25 4 10 0 0 0 2 1 12 1 5 2 6 0 東京 電力 0 3 2 0 7 0 0 4 0 3 3 4 0 4 11 4 95 1 9 8 204 102 13 3 0 0 3 0 2 3 8 10 20 0 関西 電力 0 1 0 1 1 1 1 7 0 2 5 2 2 11 5 41 360 12 4 9 136 30 29 0 0 0 3 2 3 2 2 12 9 4 中部 電力 0 1 1 0 8 6 0 0 0 0 0 1 1 2 5 1 0 0 0 8 153 27 20 1 1 0 1 0 5 4 0 14 7 2 九州 電力 0 0 0 1 6 1 0 1 0 0 1 0 0 0 0 0 0 0 0 11 76 20 3 0 0 0 3 0 3 2 2 5 2 0 東北 電力 0 1 0 0 0 0 0 0 0 0 1 0 1 3 1 0 0 0 0 0 64 8 4 0 0 0 0 0 0 1 1 1 1 0 中国 電力 0 1 0 0 0 0 0 0 0 0 0 0 0 7 10 0 66 3 4 0 28 4 1 0 0 0 0 0 5 1 2 4 0 0
  • 36. 分析のプロセス 36 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 36 ーⅢ,JSTデータを用いた分析(抄録の詳細) 富士通 日本電気 三菱電機 KDDI 東京電力 関西電力 サービス、システム、データ、モデル、開発、計算、速度、光、電力、通信、伝送、情報、管理、技術 システム、ネットワーク、データ、ユーザ、安全、光、処理、開発、解析、制御、通信、電力、特性 システム、温度、加工、改善、技術、光、効率、向上、出力、制御、装置、電流、電力、熱、波、特性 システム、ネットワーク、位置、技術、検出、光、信号、電力、伝送、推定、測定、通信、評価 ガス、システム、ネットワーク、フランジ、応力、技術、業務、系統、紹介、設備、締結、電力、発電 インクレチン、インスリン、エコー、患者、血糖、検査、細胞、治療、診断、糖尿、分泌、薬、療法
  • 37. 分析のプロセス 37 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 37 ーⅢ,JSTデータを用いた分析(平均年収など) 使用データ:有価証券報告書(KDDI、富士通、三菱電機、 日本電気、東京電力、関西電力のHPより) ・「年、従業員数、平均年齢、平均勤続年数、平均賞与」で以下の表を作り、箱ひげ図にした 企業 年 従業員 数.人. 平均年 齢.歳. 平均勤 続年数. 年. 平均賞 与.円. 企業 年 従業員 数.人. 平均年 齢.歳. 平均勤 続年数. 年. 平均賞 与.円. 企業 年 従業員 数.人. 平均年 齢.歳. 平均勤 続年数. 年. 平均賞 与.円. 富士通 2006 36561 40.3 17.9 7831000 KDDI 2006 10299 38.3 13.4 8750000 三菱電機 2006 27701 42.6 20.7 7677000 富士通 2007 27310 40.7 17.9 8099000 KDDI 2007 11764 38.8 14 8901000 三菱電機 2007 27803 42.3 20.2 7824000 富士通 2008 25899 41.1 18.1 8430000 KDDI 2008 11722 39.4 14.7 9050000 三菱電機 2008 28476 42.1 19.8 7921000 富士通 2009 25134 41.4 18.5 7645000 KDDI 2009 11374 40.1 15.7 8985000 三菱電機 2009 28525 41.7 19.2 7486000 富士通 2010 24969 41.7 18.6 7884944 KDDI 2010 11041 40.6 16.3 8838000 三菱電機 2010 28450 41.4 18.7 7493921 富士通 2011 24906 42.4 18.4 8043935 KDDI 2011 11194 40.7 16.1 8981000 三菱電機 2011 28808 41.1 18.3 7806286 富士通 2012 25426 42.2 18.5 7980374 KDDI 2012 11231 41.1 16.5 9068000 三菱電機 2012 29394 40.6 17.6 7673456 富士通 2013 25616 42.9 19.6 7698277 KDDI 2013 10739 41.4 16.8 9396971 三菱電機 2013 31797 40.4 17.1 7469030 日本電気 2006 22602 39.6 15.9 7485000 東京電力 2006 35984 39.7 20 7740000 関西電力 2006 20292 39.7 19.7 8007000 日本電気 2007 23059 39.8 15.8 7467000 東京電力 2007 36123 40.1 20.4 7775000 関西電力 2007 20184 40.1 20.1 8088000 日本電気 2008 23446 39.8 15.6 7643000 東京電力 2008 35926 40.4 20.6 7596000 関西電力 2008 20117 40.5 20.4 8090000 日本電気 2009 24871 40 15.5 7168000 東京電力 2009 36328 40.6 20.7 7578000 関西電力 2009 20217 40.8 20.6 8072000 日本電気 2010 23935 40.7 16.1 6980604 東京電力 2010 36683 40.9 20.9 7613501 関西電力 2010 20277 41.1 20.9 8065000 日本電気 2011 23968 41.2 16.5 7073205 東京電力 2011 37459 41.1 21.1 6537531 関西電力 2011 20484 41.3 21.1 8053000 日本電気 2012 23361 41.5 16.4 6717171 東京電力 2012 36077 41.9 21.9 6196181 関西電力 2012 20714 41.5 21.1 7829000 日本電気 2013 24237 42.3 18.2 7458973 東京電力 2013 34689 42.5 22.6 6844252 関西電力 2013 20813 41.7 21.3 5869710
  • 38. 分析のプロセス 38 (複数ページにわたっても構いません。本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 2015/3/16All Analytics Championship 38 ーⅢ,JSTデータを用いた分析(キャリアアップ) 使用データ:” a_000.tsv”(論文マスタ) “nayose_split1.tsv”~ “nayose_split5.tsv” (人名名寄せ) “m_pd1.tsv”(発行年データ) ・抽出済みの論文番号と論文マスタをリンクさせ、”整理番号”を取り出す ・”整理番号”で一致した名寄せを取り出す。 ※ただし、整理番号で絞っているので、対象機関以外の人も 含まれてしまう。名寄せの”所属機関”を調べ、一致した 名寄せデータのみを、対象企業の人とする。 ・準備として、論文マスタに”発行年”情報を付与しておく。 ・名寄せを論文マスタに付与し、発行年の若い順に並べ直す。 ※発行年データは”2013”や”20130320”など形式がバラバラだが、 今回は数の多い後者のみを取り出して並べかえを行った。 ・データを人ごとに区切り、所属機関の移動を見たものが今回の結果。 各企業対象人数は、KDDIが333人、三菱電機が2290人、関西電力が654人だった (集計を行ったわけではなく、あくまで目に見えた特徴を書いたのみ)
  • 39. アドベンチャー杯にかける意気込み • 就活を控える身として「落ちてももうかる分析」を キーワードに分析を進めてまいりました。想像をは るかに超える大きさのデータに悪戦苦闘の日々でし たが、分析過程でたくさんの企業もその強みも知れ ましたし、終わってみればたしかに「もうかった」 と言えるものだったと思います。全身全霊でやりき りました。後悔はありません。 • …と言いたいところですが、でもやっぱり大変だっ たので、本選に出た上で「もうかった」と胸を張っ て言いたいというのが本音です…! 39 (本項目については、本選でのプレゼンテーション発表での説明を省略可とします。) 39 2015/3/16All Analytics Championship 39