10. 4’. 韓国に属する組織または個人が2014年に出願
した特許のうち, 他国の組織または企業とどのくら
いコラボレーションをしているのか調べてみる
• クエリ
• SELECT COUNT(*) AS numberOfCommonApplications,
p1.doc_std_name as name1, p1.person_ctry_code as cc1,
p2.doc_std_name as name2, p2.person_ctry_code as cc2
FROM tls206_person p1
JOIN tls207_pers_appln pa1 ON p1.person_id = pa1.person_id
JOIN tls207_pers_appln pa2 ON pa1.appln_id = pa2.appln_id
JOIN tls206_person p2 ON pa2.person_id = p2.person_id
join tls201_appln p3 on pa1.appln_id = p3.appln_id
WHERE p1.person_ctry_code = ‘KR'
AND p3.appln_filing_date >= '2014-01-01'
AND p3.appln_filing_date <= '2014-12-31‘
AND pa1.appln_id > 0
AND pa2.appln_id > 0
AND p1.person_ctry_code <> p2.person_ctry_code
GROUP by p1.doc_std_name, p1.person_ctry_code, p2.doc_std_name, p2.person_ctry_code
ORDER BY numberOfCommonApplications DESC, p1.doc_std_name ASC,
p2.doc_std_name ASC
2015/4/18 10
12. 4’-2. コラボレーション先国ランキング
2015/4/18 12
行ラベル numberOfCommonApplications
US 336
128
JP 101
CN 89
DE 54
IN 45
PK 40
RU 33
FR 22
GB 19
VN 15
NL 15
CA 13
CH 12
SG 8
PH 7
IT 7
GR 5
SE 3
TW 3
TR 3
13. 4’-3. コラボレーション元企業ランキング
2015/4/18 13
行ラベル
データの個数 /
numberOfCommonApplications
SAMSUNG ELECTRONICS CO LTD 100
IBM 56
LG ELECTRONICS INC 17
CHO YOUNG SHIN 17
KIM JIN-WOONG 13
JU YOUNG LEE 11
SK CHEMICALS CO LTD 11
SAMSUNG SDI CO LTD 9
LEE JEEWOO 8
LEE KEON JAE 8
HEO YOUN HYOUNG 8
LEE DONG HYUNG 8
KIM TAE-YOUNG 8
SUNDERMANN BERND 8
AHN HEUI-BOK 7
KIM SOENG-HUN 7
KIM JAE HAK 7
14. 4’-4. コラボレーション先企業ランキング
2015/4/18 14
行ラベル データの個数 / numberOfCommonApplications
31
THOMAS GOMER 14
CHEN JIANLE 11
PAPASAKELLARIOU ARIS 11
LEE GUN 10
ZHANG JIANZHONG 10
THANG TRUONG CONG 9
MASAKI TAKAKI 9
LUO YUAN YUAN 9
NAT UNIVERSITY OF SCIENCES & TECHNOLOGY 8
KUGIMIYA TOSHIHIRO 8
SUH JONG YEUL 8
AHMED ATIF 8
YUE XIN 8
GOTO HIROSHI 8
KIM HONGWOOK 8
HAFIZ REHAN 8
KOBE STEEL LTD 8
MIKI AYA 8
WATANABE MASATO 8
MORITA SHINYA 8
ALI ARSHAD 8
MURTAZA MUHAMMAD 8
LEE TAMMY 8
15. 4’-5 コラボレーション元企業xコラボレーショ
ン先国マトリックス
企業名 US JP CN DE IN PK RU FR GB VN NL CA CH SG
SAMSUNG ELECTRONICS CO LTD 30 20 2 12 16 12 6 1
IBM 30 2 3 14 3 2 2
LG ELECTRONICS INC 4 12 1
CHO YOUNG SHIN 10 2 1 1 2 1
KIM JIN-WOONG 12 1
JU YOUNG LEE 11
SK CHEMICALS CO LTD 11
SAMSUNG SDI CO LTD 9
LEE JEEWOO 8
LEE KEON JAE 7 1
HEO YOUN HYOUNG 4 1 3
LEE DONG HYUNG 8
KIM TAE-YOUNG 8
SUNDERMANN BERND 8
2015/4/18 15
16. 参考文献
• PATSTAT ONLINE (beta)
• http://www.epo.org/searching/subscription/patstat-online.html
• SQL Self-Study Course
• http://documents.epo.org/projects/babylon/eponet.nsf/0/55df36d61f27cdb
2c1257b1600323d91/$FILE/patstat_introduction_sql_en.pdf
• Data Elements of PATSTAT Raw Data
• http://documents.epo.org/projects/babylon/eponet.nsf/0/95da6bccf12e54a
1c1257aa1002e2d1d/$FILE/patstat_data%20elements_v1.1.pdf
2015/4/18 16
21. 前方引用と後方引用:
時点 : t
"An Approach to the Study of
Entrepreneurship," THE TASKS OF
ECONOMIC HISTORY (Supplemental
Issue of THE JOURNAL OF
ECONoMIc HISTORY), VI (1946), 1-15
Oscar Lange, "A Note on
Innovations," Review of Economic
Statistics, XXV (1943), 19-25
F. W. Taussig, Inventors and
Money-Makers (New York: The
Macmillan Company, 1915).
Fritz Redlich, The Molding of American
Banking—Men and Ideas (New York: Hafner
Publishing Company, 1947).
Robert A. Gordon, Business
Leadership in the Large Corporation
(Washington, D.C.: The Brookings
Institution, 1945).
F. J. Marquis and S. J. Chapman on the
managerial stratum ,of the Lancashire cotton
industry in the Journal of the Royal Statistical
Society, LXXV, Pt. III (1912). 293-306.
前方引用後方引用
・後方引用からわかること
-- どのような先行研究が活用されたのか
-- いつ公開された先行研究を活用したのか
-- 論文を執筆するにあたり、「科学的源泉」は
いったいなんだったのか
・後方引用からわからないこと
-- 引用されていないけど、重要だった「科学的源
泉」
-- 引用されていないけど、参照された先行研究
(in context.)
・前方引用からわかること
-- 論文自体の重要性
-- 「巨人の肩の上に立つ (Standing on the
shoulders of the giants) 」
-- 知識の伝播過程
-- 論文自体が「古くなっていない」か
・前方引用からわからないこと
-- ほんとうにその論文は重要な論文なのか (引
用されること自体が, 論文の重要性を示している
のか)
-- 後発の論文にとって重要な科学的源泉が, 直
接的には引用されていない場合も
2015/4/18 21
36. (英文)論文データベース
名前 Web of Knowledge Scopus
作っている会社 トムソン・ロイター エルゼビア
カバー範囲 ・社会科学文献の書誌および引用情報
(1898年-2015年)
・自然科学文献の書誌および引用情報
(1900年-2015年)
・5000以上の出版社の21,000誌以上の学術ジャーナ
ル
・20000タイトル以上の査読ジャーナル
・370タイトルのブックシリーズ
・550万件以上の会議録
メリット ・過去データが豊富
・社会科学のカバー率が高い
・他のデータベースとリンクさせることが比較的容易
・分野分類が (Web of Knowledge) に比べて明確
・自然科学のカバー率は Web of Knowledge に比べ高
い
・企業名および著者名の名寄せの精度が高いこともな
いみたい・・・
デメリット ・1945年以前のデータはカバー範囲が限られている
・カテゴリ分類が不明確
・現在カバー範囲が(Web of Knowledge に比べ)狭い
[引用情報は1996年以降のみカバー]
(2016年に向け拡大される予定)
価格 すごく高い! すごく高い!
気をつけること ・一橋大学では利用可能
・大学によってカバーしているデータ範囲が違う
一橋大学では利用不能 (部局によっては契約している
場合あり)
2015/4/18 36
37. まず注意すること: データのカバー範囲
• Web of Knowledge やScopus は大学によってカバーしているデータの
範囲が異なります
• ある大学では検索できた結果が, 異なる大学では検索出来ないこと
があります
2015/4/18 37
38. Web of knowledge のデータカバー範囲を確認す
る方法 (1)
1. Web of Knowledge にアクセスし, “Web of Knowledge Core
Collection” を選択する
2015/4/18 38
39. Web of knowledge のデータカバー範囲を確認す
る方法 (2)
2. 画面下にある “詳細設定” をクリックする
2015/4/18 39
40. Web of knowledge のデータカバー範囲を確
認する方法 (3)
• GRIPSの場合
• Science Citation Index Expanded
(1993-現在)
• Conference Proceedings Citation
Index – Science (1990-現在)
• 一橋大学の場合
• Science Citation Index Expanded
(1900-現在)
• Social Sciences Citation Index
(1900-現在)
• Arts & Humanities Citation Index
(1975-現在)
2015/4/18 40
41. Web of knowledge のデータカバー範囲を確
認する方法 (3-2)
• UTS (@Sydney, Australia の場合) • National Taiwan University の場合
2015/4/18 41
42. Web of Knowledge のデータカバー範囲を確認する
方法 (4): Schumpeter の論文
“The Creative Response in Economic History” を探す
• GRIPS の場合: みつからない • 一橋大学の場合: みつかる
2015/4/18 42
43. 3-1. Web of Knowledge
• 一橋の学内からはどこからでも
利用可能
• 一橋大学図書館の My Library
からリモートログインで利用可
能
• GRIPS でも利用可能
• 東大でも利用可能(おそらく)
2015/4/18 43
http://ip-science.thomsonreuters.jp/products/web-of-
science/yokuwakaru/
44. ケース2: Web of Knowledge のインターフェー
ス ; シュンペーターの論文を探してみよう
1. www.webofknowledge.com を開き, 「著者名検索」を選択. 「姓」 と 「イニシャル」 を入力する.
2015/4/18 44
45. Web of Knowledge のインターフェース
例: シュンペーターの論文を探してみよう
2. 「研究領域」から, (とりあえず)すべての研究領域を選択し, 「著者所属を選択」をクリック
2015/4/18 45
46. Web of Knowledge のインターフェース
例: シュンペーターの論文を探してみよう
3. 「著者所属名短縮形」から, (とりあえず)すべての所属を選択. また, 「著者所属情報を含まないレコードを含める」
チェックボックスをクリックし, 「選択した文献で検索」をクリックする.
2015/4/18 46
47. Web of Knowledge のインターフェース
例: シュンペーターの論文を探してみよう
4. “著者名検索結果: 49レコード” が表示されるので, “並び替え” より “被引用数 – 多い順” を選択し並べ替える.
2015/4/18 47
48. Web of Knowledge のインターフェース
例: シュンペーターの論文を探してみよう
5. 一番引用数の多い “The Creative Response in Economic History” をクリックする.
わかること
・著者名
・ジャーナル名
・発行年月日
・被引用数
・引用文献
・インパクトファクター
・ドキュメントタイプ
・言語
・発行者
・研究分野
・Web of Knowledge Category
・最終引用
2015/4/18 48
49. Tips: たくさんのデータを Web of Knowledge
から合法的に取り出す方法
• 方法0: ロボット検索
• ダメ、ゼッタイ!
• 方法1: Web インターフェースを使う
• データの抽出方法はいくつかある
• 方法2: Endnote Web を使う
• ヒント: Endnote ライブラリ
• 方法3: API を使う
• ただし有償
2015/4/18 49
50. ケース3: Web of Knowledge を使って一橋大学から
2013年に公刊された論文を取り出してみる
• 1. 検索 -> Web of Science Core Collection -> 詳細検索 を選ぶ
2015/4/18 50
51. ケース3: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• 検索条件を入力する
• PY: 年
• OG: 組織名
• [検索] をクリックする
2015/4/18 51
52. ケース3: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• 検索が実施され, データが抽出される. 検索履歴より “80” をクリック
する
2015/4/18 52
53. ケース3: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• 検索結果が表示される
2015/4/18 53
54. ケース3: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• 画面の一番下までスクロールし, “他のファイルフォーマットで保存”
を選択する
2015/4/18 54
55. ケース3: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• [レコード件数]から保存するレコード数
• [レコードコンテンツ]から”詳細表示と引用文献”
• [ファイルフォーマット]から”タブ区切り(Win (またはMac))” を選択し
保存をクリックする
2015/4/18 55
56. ケース3: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• 取り出したテキストファイルをExcel に取り込む
• H Shimizu 先生が見つかったりする
2015/4/18 56
57. ケース3: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• Alternative: エクセルを使うのがめんどくさい人向け
• [レコード件数]から保存するレコード数
• [レコードコンテンツ]から”詳細表示と引用文献”
• [ファイルフォーマット]から”テキスト” を選択し保存をクリックする
2015/4/18 57
58. ケース3: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• Raw Data っぽいファイルが出力される
• 自分でコードを書いて処理するか, Vantage Point (後述)を使う
• ヒント: 終端処理はEF なので, そいつと先頭行を潰せばいくらでもデータ連結
が可能
2015/4/18 58
59. 「研究分野」と「Web of Knowledge Category」
• 研究分野
• 研究分野は、すべての Web of
Science 製品データベースで共有さ
れる主題分野を構成します。その結
果、同じ主題に属する複数のデータ
ベースのドキュメントを識別、検索、
分析することができます。
• Current Contents Connect およ
び Web of Science Core Collection に
含まれる各ジャーナルおよび書籍は、
Web of Science の分野の少なくとも 1
つに割り当てられます。Web of
Science の各分野は 1 つの研究分野
にマップされます。
• Web of Knowledge Category
• “Web of Science Core Collection に含
まれるすべてのジャーナルおよび書
籍は、以下の主題分野の少なくとも
1 つに割り当てられます。Web of
Science Core Collection のすべてのレ
コードは、[Web of Science の分野]
フィールドに出版物の主題分野を含
みます。”
※. ひとつの論文に対して複数の Web
of Knowledge Category が割り当てられ
ていることがある
2015/4/18 59
82. では, Web of Knowledge? Scopus? Or Google
Scholar?
• (Kulkarni, Aziz, Shams and Busse
2009)
• Google Scholar, Web of Knowledge と
Scopus の Citation 推移を比較
• “Cohort study of 328 articles published
in JAMA, Lancet, or the New England
Journal of Medicine between October 1,
1999, and March 31, 2000. Total citation
counts for each article up to June 2008
were retrieved from Web of Science,
Scopus, and Google Scholar.”
• Findings
• “Compared with Web of Science, Scopus
retrieved more citations from non–English-
language sources (median, 10.2% vs 4.1%)
and reviews (30.8% vs 18.2%), and fewer
citations from articles (57.2% vs 70.5%),
editorials (2.1% vs 5.9%), and letters (0.8%
vs 2.6%) (allP < .001).”
2015/4/18 82
JAMA. 2009;302(10):1092-1096. doi:10.1001/jama.2009.1307
83. 2015年現時点での論文データベース利用法
• Web of KnowledgeとScopus, どちらにもデメリットとメリットがある
• Web of Knowledge: データベース全体の構造が複雑, かつノイズデータも多いけど
長い期間をカバーしている
• Scopus: Web of knowledge に比べればデータベース全体の構造は比較的単純.
Author ID や Affiliation ID などを備えているので一見 Name-Matching の手間は省
けそうだけど, やはりノイズデータが含まれている. 今後に期待.
• (高いから比べられないし, だいたいの大学ではひとつしか使えないし) 論
文データベースは Web of Knowledge, Scopus のいずれかを使う
• 恐らく, 両データベースの接合を試みるだけでたくさんの Paper が書ける
(けれど大変)
• 指標を使って, クエリを投げてデータを取り出した後, 整合性が取れている
かチェックしていく (別の組織が入っていないか, 別の国が入っていないか,
ダブルカウントしていないか etc…)
2015/4/18 83
91. Requirements
• コンピューティングリソース
• 32bit版, 64bit版が提供
• データ量が多いほど、多くの物理メモリが必要とされる (min 4GB)
• “VantagePoint files can be quite large and it is much easier to work with them if they can
be loaded into RAM. ”
• (大量パラメータに基づく)ネットワーク図などを生成するには、CPU パワーも
必要 (high clock speed, multi-core is needed)
• “With processors, clock speed is the most important attribute to VantagePoint. While
VantagePoint can use multiple cores for some operations, much of the math in
VantagePoint is inherently linear so multi-threading has only a small impact on
VantagePoint performance. Multi-core processors are still helpful if you intend to run
other operations while running VantagePoint.”
2015/4/18 91
110. ネットワーク分析
1980-1985年に大杉が執筆した学術論文
の書誌情報より, 組織情報を抽出
(データ: Web of Knowledge, ネットワークグラフ化: Vantage Point)
1986-1990年に大杉が執筆した学術論文
の書誌情報より, 組織情報を抽出
(データ: Web of Knowledge, ネットワークグラフ化: Vantage Point)
a. カルフォルニア大学デービス校
ガーシュイン教授との共同研究
b. 東京大学片桐教授とのB細胞分
化因子の研究
c. 大阪大学岸本研究室および東
ソー株式会社との三社共同研究
3/19/2015 110