SlideShare a Scribd company logo
1 of 122
IRC セミナー
数字が教えてくれないこと
-特許/論文データベース分析入門-
2015.05.14
政策研究大学院大学
科学技術イノベーション政策研究センター
科学技術学術政策研究所 (NISTEP)
原泰史
ya-hara@grips.ac.jp
Twitter: @harayasushi
5/14/2015 1
WP シリーズの目的
• 目的
• 特許や論文のデータを使うことで解析できる範囲を知るために、まず分析手法を学ぶ
• 手法
• パソコンを用いたハンズオンセミナー方式 (手を動かして覚える!)
• 時間:
• 土曜日の夕方に90分-120分程度
• 一ヶ月に一回程度 (第一期; 5-6回)
• 場所:
• 国立 (一橋大学イノベーション研究センター) または
• 六本木 (政策研究大学院大学科学技術イノベーション政策研究センター)
• 参加希望の方は, ya-hara@grips.ac.jp または @harayasushi (twitter) までご
連絡ください.
5/14/2015 2
WPシリーズのスケジュール
• [2015/1月] 第0回: 「数字が教えてくれないこと」 @一橋イノベーション研究センター
• [2015/3/28] 第1回: 「数字が教えてくれること」 @一橋イノベーション研究センター
• 特許や論文データはなぜイノベーション指標として活用されているのだろう
• [2015/4/18]第2回: 「巨人の上に立つ」 @GRIPS SciREX センター
• 論文データベース (Web of Knowledge, Scopus, Scival etc…) を用いた分析
• [2015/5/14] IRCセミナー @関西学院大学イノベーション研究センター
• [2015/5/16] 第3回: 「select() すると幸せになれる理由」 @一橋イノベーション研究センター
• IIP データベース/patR データベースを用いた日本特許分析
• [2015/6/27] 第4回: 「科学とイノベーションの関係」
• 組織学会@一橋大学のため第四週におこないます
• サイエンスリンケージデータベースを用いた特許/論文の連結分析
• [2015/7/18]第5回: 「行間を読むっていろいろと大切」
• 書誌テキスト分析 (KHcoder) を使って分析できること
• [2015/8/8] 第6回 : 「まとめ」
• 科学とイノベーションのあれこれは書誌情報からどこまでわかるのだろう
5/14/2015 3
今日取り上げる内容
1. はじめに: イノベーションを測るとはなにか?
2. 論文データベースの利用方法
• Web of Knowledge
• Scopus
3. 特許データベースの利用方法
• 米国特許のデータベース
• Thomson Innovation
• Ultra Patent
• USPTO database
• 日本特許のデータベース
• MySQL の導入
• Access の導入
• 基本的なコマンド
4. サイエンスリンケージデータベースの利用方法
5. 数字ではわからないこと (今日のまとめ)
5/14/2015 4
論文 特許
サイエンス
リンケージ
1. はじめに
イノベーションを測るとは何か?
5/14/2015 5
Framework of Innovation Indicators
(Pakes and Griliches 1984)
Other
Economic
Factors
Non-Knowledge Factors
of Production Output:
Productivity
Firm’s Value
Patent
Patenting
Propensity
Inputs to Innovation
R&D, designing,
marketing research etc…
Knowhow and
First Mover Advantage
5/14/2015 6
Other
Economic
Factors
Non-Knowledge Factors
of Production Output:
Productivity
Firm’s Value
Patent
Patenting
Propensity
Inputs to Innovation
R&D, designing,
marketing research etc…
Knowhow and
First Mover Advantage
Paper
5/14/2015 7
Framework of Innovation Indicators
(Pakes and Griliches 1984)
Other
Economic
Factors
Non-Knowledge Factors
of Production Output:
Productivity
Firm’s Value
Patent
Patenting
Propensity
Inputs to Innovation
R&D, designing,
marketing research etc…
Knowhow and
First Mover Advantage
Paper
In-tangible
knowledge
5/14/2015 8
Framework of Innovation Indicators
(Pakes and Griliches 1984)
イノベーションのプロセスを明らかにする方法
• 定性的なアプローチ
• なにかしらの理論モデルにもとづき、文献調査や実地調査、
インタビューなどを使って証拠を集める。集まった証拠にも
とづきロジックを組み立てて、結果を観察する
• データソース
• 誰かが書いた文章 (論文や特許や報告書や白書 etc…)
• 誰かの頭のなか (をインタビューを使って収集する)
• 定量的なアプローチ
• なにかしらの理論モデルにもとづき、統計データベースを
使ってデータを集める。それを回帰分析 etc… などの統計
的な処理をして、結果を観察する
• データソース
• 統計データベースを使う
• サーベイ調査をする
• 政府統計を使う
結論
インプリケーション
(ex. 政策的な含意)
問い
(リサーチクエスチョン)
Literature Review
(先行研究の調査)
Hypothesis
(問いに対する仮説の提示)
5/14/2015 9
イノベーションプロセスを知る方法
1. ひとにきく
1. 発明したひと (=発明者) にきく
1. インタビューをする
2. サーベイ調査をする (アンケートを
とる)
2. 発明に関与したひとにきく
1. インタビューをする
2. サーベイ調査をする (アンケートを
とる)
2. 測ってみる
1. 特許ではかってみる
1. だれとだれが特許を書いたかでは
かってみる
2. だれがだれの特許を引用している
かではかってみる
2. 論文ではかってみる
1. だれとだれが論文を書いたかでは
かってみる
2. だれとだれの論文を引用している
かではかってみる
3. 特許と論文のつながりではかって
みる
1. どの特許が、どの論文を引用して
いるかで測ってみる
2. どの論文が、どの特許を引用して
いるかで測ってみる
5/14/2015 10
はかってみる
=論文や特許のデータベースを使い、
論文や特許の数や流れを調べてみる。
5/14/2015 11
公開された特許や論文の情報は
どうやって調べればいいのか?
5/14/2015 12
もしかして:
ググる
しかし:
単純にgoogle や bing で検索しても
わからない場合がある
→
専用のデータベースを使う
5/14/2015 13
今日取り上げる内容
1. はじめに
2. 論文データベースの利用方法
• Web of Knowledge
• Scopus
3. 特許データベースの利用方法
• 米国特許のデータベース
• Thomson Innovation
• Ultra Patent
• USPTO database
• 日本特許のデータベース
• MySQL の導入
• Access の導入
• 基本的なコマンド
4. サイエンスリンケージデータベースの利用方法
5. 数字ではわからないこと (今日のまとめ)
5/14/2015 14
論文 特許
サイエンス
リンケージ
2. 論文データベース
5/14/2015 15
論文データベース
• 何がわかるのか
• だれが、いつ、どこで、どんな論文を書いたのかがわかる
• だれが、いつ、どこで、どんな論文を引用したかがわかる
• メリット
• 先行研究を知ることができる
• みんなが読んでいる論文がわかる!
• インパクトファクターの高い論文がわかる!(就職に有利な!)
• どんな研究が世の中で行われているかがわかる!
5/14/2015 16
論文データベースに掲載されている情報
アブストラクト
タイトル
著者名
ジャーナル名
とページ数
発行年
論文キーワード
著者の所属と住所
パブリッシャー
論文の分類
論文のタイプと
使用言語
論文の引用数
と被引用数
5/14/2015 17
前方引用と後方引用: Schumpeter 1947 の場合
時点 : t
"An Approach to the Study of
Entrepreneurship," THE TASKS OF
ECONOMIC HISTORY (Supplemental
Issue of THE JOURNAL OF
ECONoMIc HISTORY), VI (1946), 1-15
Oscar Lange, "A Note on
Innovations," Review of Economic
Statistics, XXV (1943), 19-25
F. W. Taussig, Inventors and
Money-Makers (New York: The
Macmillan Company, 1915).
Fritz Redlich, The Molding of American
Banking—Men and Ideas (New York: Hafner
Publishing Company, 1947).
Robert A. Gordon, Business
Leadership in the Large Corporation
(Washington, D.C.: The Brookings
Institution, 1945).
F. J. Marquis and S. J. Chapman on the
managerial stratum ,of the Lancashire cotton
industry in the Journal of the Royal Statistical
Society, LXXV, Pt. III (1912). 293-306.
前方引用後方引用
5/14/2015 18
Schumpeter 1947 の後方引用数推移(Web
of knowledge)
5/14/2015 19
論文のデータベースを使うと何がわかる?
• 著者の数が多い論文は被引用数が多くなる?
• どういうジャンルの論文を, 特定の大学や企業が投稿している?
• ある産業内では, どういった企業が論文を多く投稿している?
• スターサイエンティストはだれ?
• 引用する論文が多いほど, 被引用数が増える?
• 博士ホルダーが書いた論文は, 普通の研究者に比べてパフォーマン
スが高くなる?
• 様々なジャンルに投稿している研究者のパフォーマンスは高くな
る?
5/14/2015 20
ただし
• 世の中に「完備な」データベースはありません
• 「大人は嘘つきではありません、ただ間違いをするだ
けなのです…」
• 組織名が違う
• 自分の名前が違う
• 所属国が違う
• 論文のカテゴリが違う
ことが多々出てきます。
• 自らのリサーチクエスチョンに合わせて精緻な分析
を行うためには、(1) 問いに対応する最適なデータ
ベースを選び, (2) データのクリーニング作業 を行う
必要があります
5/14/2015 21
(英文)論文データベース
名前 Web of Knowledge Scopus
作っている会社 トムソン・ロイター エルゼビア
カバー範囲 ・社会科学文献の書誌および引用情報
(1898年-2015年)
・自然科学文献の書誌および引用情報
(1900年-2015年)
・5000以上の出版社の21,000誌以上の学術ジャーナ
ル
・20000タイトル以上の査読ジャーナル
・370タイトルのブックシリーズ
・550万件以上の会議録
メリット ・過去データが豊富
・社会科学のカバー率が高い
・他のデータベースとリンクさせることが比較的容易
・分野分類が (Web of Knowledge) に比べて明確
・自然科学のカバー率は Web of Knowledge に比べ高
い
・企業名および著者名の名寄せの精度が高いこともな
いみたい・・・
デメリット ・1945年以前のデータはカバー範囲が限られている
・カテゴリ分類が不明確
・現在カバー範囲が(Web of Knowledge に比べ)狭い
[引用情報は1996年以降のみカバー]
(2016年に向け拡大される予定)
価格 すごく高い! すごく高い!
気をつけること ・一橋大学では利用可能
・大学によってカバーしているデータ範囲が違う
一橋大学では利用不能 (部局によっては契約している
場合あり)
5/14/2015 22
まず注意すること: データのカバー範囲
• Web of Knowledge やScopus は大学によってカバーしているデータの
範囲が異なります
• ある大学では検索できた結果が, 異なる大学では検索出来ないこと
があります
2015/5/13 23
Web of knowledge のデータカバー範囲を確認す
る方法 (1)
1. Web of Knowledge にアクセスし, “Web of Knowledge Core
Collection” を選択する
2015/5/13 24
Web of knowledge のデータカバー範囲を確認す
る方法 (2)
2. 画面下にある “詳細設定” をクリックする
2015/5/13 25
Web of knowledge のデータカバー範囲を確
認する方法 (3)
• GRIPSの場合
• Science Citation Index Expanded
(1993-現在)
• Conference Proceedings Citation
Index – Science (1990-現在)
• 一橋大学の場合
• Science Citation Index Expanded
(1900-現在)
• Social Sciences Citation Index
(1900-現在)
• Arts & Humanities Citation Index
(1975-現在)
2015/5/13 26
Web of knowledge のデータカバー範囲を確
認する方法 (4)
• 関西学院大学の場合:
http://library2.kwansei.ac.jp/information/web_database/uweb_data
base_dlist.cgi
• “関西学院大学では1975年から現在までの人文科学・社会科学・自然科学
の学術論文情報と1990年から現在までの会議録などProceedingsを検索す
ることができます。また、文献管理ツールEndNote Webもあわせて利用でき
ます。
検索可能範囲
・Science Citation Index Expanded (SCI-EXPANDED) --1975-現在
・Social Sciences Citation Index (SSCI) --1975-現在
・Arts & Humanities Citation Index (A&HCI) --1975-現在
・Conference Proceedings Citation Index- Science (CPCI-S) --1990-現在”
5/14/2015 27
2-1. Web of Knowledge
• 一橋の学内からはどこからでも
利用可能
• 一橋大学図書館の My Library
からリモートログインで利用可
能
• GRIPS でも利用可能
5/14/2015 28
http://ip-science.thomsonreuters.jp/products/web-of-
science/yokuwakaru/
Excercise1: Web of Knowledge を使って一橋大学か
ら2013年に公刊された論文を取り出してみる
• 1. 検索 -> Web of Science Core Collection -> 詳細検索 を選ぶ
5/14/2015 29
Excercise1: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• 検索条件を入力する
• PY: 年
• OG: 組織名
• [検索] をクリックする
5/14/2015 30
Excercise1: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• 検索が実施され, データが抽出される. 検索履歴より “80” をクリック
する
5/14/2015 31
Excercise1: Web of Knowledge を使って一橋大学
の2013年に公刊された論文を取り出してみる
• 検索結果が表示される
5/14/2015 32
Excercise1: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• 画面の一番下までスクロールし, “他のファイルフォーマットで保存”
を選択する
5/14/2015 33
Excercise1: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• [レコード件数]から保存するレコード数
• [レコードコンテンツ]から”詳細表示と引用文献”
• [ファイルフォーマット]から”タブ区切り(Win (またはMac))” を選択し
保存をクリックする
5/14/2015 34
Excercise1: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• 取り出したテキストファイルをExcel に取り込む
• H Shimizu 先生が見つかったりする
5/14/2015 35
Excercise1: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• Alternative: エクセルを使うのがめんどくさい人向け
• [レコード件数]から保存するレコード数
• [レコードコンテンツ]から”詳細表示と引用文献”
• [ファイルフォーマット]から”テキスト” を選択し保存をクリックする
5/14/2015 36
Excercise1: Web of Knowledge を使って一橋大学の
2013年に公刊された論文を取り出してみる
• Raw Data っぽいファイルが出力される
• 自分でコードを書いて処理するか, Vantage Point (後述)を使う
• ヒント: 終端処理はEF なので, そいつと先頭行を潰せばいくらでもデータ連結
が可能
5/14/2015 37
「研究分野」と「Web of Knowledge Category」
• 研究分野
• 研究分野は、すべての Web of
Science 製品データベースで共有さ
れる主題分野を構成します。その結
果、同じ主題に属する複数のデータ
ベースのドキュメントを識別、検索、
分析することができます。
• Current Contents Connect およ
び Web of Science Core Collection に
含まれる各ジャーナルおよび書籍は、
Web of Science の分野の少なくとも 1
つに割り当てられます。Web of
Science の各分野は 1 つの研究分野
にマップされます。
• Web of Knowledge Category
• “Web of Science Core Collection に含
まれるすべてのジャーナルおよび書
籍は、以下の主題分野の少なくとも
1 つに割り当てられます。Web of
Science Core Collection のすべてのレ
コードは、[Web of Science の分野]
フィールドに出版物の主題分野を含
みます。”
※. ひとつの論文に対して複数の Web
of Knowledge Category が割り当てられ
ていることがある
5/14/2015 38
Web of Knowledge で注意するポイント
• カテゴリ分けが1:1 の関係にはなっていない
• 精緻に行うためには, ジャーナル名などで名寄せする必要性
• 部局名などの名寄せが行われていない
• NISTEP 表記ゆれ辞書などを活用する
• Scopus を利用する(?)
• Web 経由では, 1回500件しかダウンロードできない
• Excel でひたすらくっつけていくか, Raw Data 方式でダウンロードしひたすら
連結, 処理をしたのち手元のSQL などに放り込む
• ロボット検索すると怒られます
5/14/2015 39
NISTEP: “大学・公的機関名英語表記ゆれ
テーブル(Web of Science版)(Ver.2014.1)”
• “1996-2012 年の期間にWeb of Scienceに採録された論文のうち、日
本の機関に所属する著者を含む論文のデータ(約150万件)を対象に、
機関名英語表記のゆれを調査・分析しリスト化した結果”
• http://www.nistep.go.jp/research/scisip/randd-on-university からダ
ウンロード可能
• カバー範囲 1996-2012
• Creative Commons BY-SA
5/14/2015 40
“大学・公的機関名英語表記ゆれテーブル
(Web of Science版)(Ver.2014.1)”
• F 列が表記バリエーションになっているので, C列の機関ID で
Matching させる
• Web of Knowledge で取り出したデータと, 例えばExcel なら vlookup
などして連結させる
5/14/2015 41
引用分析
• 後方引用をたどることで, 発明に至る知識の流れを明らかにする
• JST プロジェクトの Feasibility Study
• Shuji Nakamura Patent に至るまでの Main Path
• 特許と、特許に引用された論文について調査
• ソース: Web of Knowledge / Thomson Innovation
5/14/2015 42
Network 全体 (属性付き)
赤色は Main Path に選択さ
れた Node を示す.5/14/2015 43
1930s 1960s 1970s 1990s 2000s
1910-2007 (1次引用すべて導入; 上位12社明記)
1980s
5/14/2015 44
2-2. Scopus
• エルゼビアが提供する論文データ
ベース
• “Scopus has twice as many titles
and over 30% more publishers
listed than any other A&I
database”
• Journals や Book, Conference
Papers や Patents もカバー
• Scival を用いることで, 研究機関ご
とのパフォーマンスを知ることも可
能
• なお、一橋では現時点 (2015年) で
は契約していないので使えません
5/14/2015 45
Scopus のインターフェース
例: シュンペーターの論文を探してみよう
1. www.scopus.com を開き, 「著者検索」に Last Name と First Name を入力する.
5/14/2015 46
Scopus のインターフェース
例: シュンペーターの論文を探してみよう
2. 著者名の候補が表示されるので, 該当する著者をクリックする
5/14/2015 47
Scopus のインターフェース
例: シュンペーターの論文を探してみよう
3. 論文の一覧が表示される
5/14/2015 48
Scopus を使う上で注意するポイント
• Web of Knowledge に比べたらカ
テゴリや組織や研究者個人の
名寄せがキッチリしているかと
思ったけど, 別にそんなことはな
いみたい
• データのカバー範囲が広い事,
データベース構造が Web of
Knowledge に比べ比較的単純
なのがメリットなくらい
5/14/2015 49
https://twitter.com/noricoco/status/585677912705261569
大学・公的機関名英語表記ゆれテーブル
(Scopus版)(ver.2013.1)
• “1996-2010 年の期間にScopusに採録された論文のうち、日本の機
関に所属する著者を含む論文のデータ(約150万件)を対象に、機関
名英語表記のゆれを調査・分析しリスト化した結果”
• http://www.nistep.go.jp/research/scisip/randd-on-university からダ
ウンロード可能
5/14/2015 50
大学・公的機関名英語表記ゆれテーブル
(Scopus版)(ver.2013.1)
• JSTだけでも様々な表記が
5/14/2015 51
Scopus-NISTEP大学・公的機関名辞書対応
テーブル(ver.2013.1)
• “科学論文の計量的分析に用いられるデータベース、Scopusの論文
ID(Scopus_eid)とNISTEP大学・公的機関名辞書の機関ID(NID)の対応
テーブルです。1996-2010 年の期間にScopusに採録された論文のう
ち、日本の機関に所属する著者を含む論文のデータ(約150万件)を
対象に、国内の大学・公的機関の機関名称の名寄せを行った結果”
• http://www.nistep.go.jp/research/scisip/randd-on-university からダ
ウンロード可能
• 論文IDごとに機関ID が割り振られているので, より正確に組織名で
名寄せができる
• データ量が巨大なので、MySQL/PostgreSQL か Access を使いましょう
• Excel でなんとかやれないこともないけど大変
5/14/2015 52
Scopus-NISTEP大学・公的機関名辞書対応
テーブル(ver.2013.1)
• Access に取り込んだ結果: レコード数2718337件
5/14/2015 53
では, Web of Knowledge? Scopus? Or Google
Scholar?
• (Kulkarni, Aziz, Shams and Busse
2009)
• Google Scholar, Web of Knowledge と
Scopus の Citation 推移を比較
• “Cohort study of 328 articles published
in JAMA, Lancet, or the New England
Journal of Medicine between October 1,
1999, and March 31, 2000. Total citation
counts for each article up to June 2008
were retrieved from Web of Science,
Scopus, and Google Scholar.”
• Findings
• “Compared with Web of Science, Scopus
retrieved more citations from non–English-
language sources (median, 10.2% vs 4.1%)
and reviews (30.8% vs 18.2%), and fewer
citations from articles (57.2% vs 70.5%),
editorials (2.1% vs 5.9%), and letters (0.8%
vs 2.6%) (allP < .001).”
5/14/2015 54
JAMA. 2009;302(10):1092-1096. doi:10.1001/jama.2009.1307
2015年現時点での論文データベース利用法
• Web of KnowledgeとScopus, どちらにもデメリットとメリットがある
• Web of Knowledge: データベース全体の構造が複雑, かつノイズデータも多いけど
長い期間をカバーしている
• Scopus: Web of knowledge に比べればデータベース全体の構造は比較的単純.
Author ID や Affiliation ID などを備えているので一見 Name-Matching の手間は省
けそうだけど, やはりノイズデータが含まれている. 今後に期待.
• (高いから比べられないし, だいたいの大学ではひとつしか使えないし) 論
文データベースは Web of Knowledge, Scopus のいずれかを使う
• 恐らく, 両データベースの接合を試みるだけでたくさんの Paper が書ける
(けれど大変)
• 指標を使って, クエリを投げてデータを取り出した後, 整合性が取れている
かチェックしていく (別の組織が入っていないか, 別の国が入っていないか,
ダブルカウントしていないか etc…)
5/14/2015 55
http://www.elsevier.com/jp/press-releases/2014/201403275/14/2015 56
今日取り上げる内容
1. はじめに
2. 論文データベースの利用方法
• Web of Knowledge
• Scopus
3. 特許データベースの利用方法
• 米国特許のデータベース
• Thomson Innovation
• Ultra Patent
• USPTO database
• 日本特許のデータベース
• MySQL の導入
• Access の導入
• 基本的なコマンド
4. サイエンスリンケージデータベースの利用方法
5. 数字ではわからないこと (今日のまとめ)
5/14/2015 57
論文 特許
サイエンス
リンケージ
3. 特許データベース
5/14/2015 58
特許データベース
• 何がわかるのか
• だれが、いつ、どこで、どんな特許を書いたのかがわかる
• だれが、いつ、どこで、どんな特許を引用したかがわかる
• メリット
• みんなが読んでいる特許がわかる!
• インパクトファクターの高い特許がわかる!
• どんな研究開発が世の中で行われているかがわかる!
5/14/2015 59
特許データベース
• アメリカ特許のデータベース
• Google Patent
• USPTO Patents
• Ultra Patents
• Thomson Innovation
• ヨーロッパ特許のデータベース
• Espacenet
• PATSTAT
• 日本の特許データベース
• 特許図書館
• IIP データベース
• 研究用特許データベース (patR)
5/14/2015 60
3-1. PATSTAT
• EPO の特許データベース
• Web インターフェースも存在
• Raw Data 版は有償
• Web 版 PATSTAT は2ヶ月間無料
5/14/2015 61
PATSTATのデータ構造
http://documents.epo.org/projects/babylon/eponet.nsf/0/95da6bccf12e54a1c1257aa1002e2d
1d/$FILE/patstat_data%20elements_v1.1.pdf
5/14/2015 62
PATSTAT のデータ構造
5/14/2015 63
PATSTAT のモデル図
5/14/2015 64
PATSTAT Online (beta)
• http://www.epo.org/searching/subscription/patstat-online.html
5/14/2015 65
Excercise2. 日本に属する組織または個人が2014年
に出願した特許のうち, 他国の組織または企業とど
のくらいコラボレーションをしているのか調べてみる
• クエリ
• SELECT COUNT(*) AS numberOfCommonApplications,
p1.doc_std_name as name1, p1.person_ctry_code as cc1,
p2.doc_std_name as name2, p2.person_ctry_code as cc2
FROM tls206_person p1
JOIN tls207_pers_appln pa1 ON p1.person_id = pa1.person_id
JOIN tls207_pers_appln pa2 ON pa1.appln_id = pa2.appln_id
JOIN tls206_person p2 ON pa2.person_id = p2.person_id
join tls201_appln p3 on pa1.appln_id = p3.appln_id
WHERE p1.person_ctry_code = 'JP'
AND p3.appln_filing_date >= '2014-01-01'
AND p3.appln_filing_date <= '2014-12-31‘
AND pa1.appln_id > 0
AND pa2.appln_id > 0
AND p1.person_ctry_code <> p2.person_ctry_code
GROUP by p1.doc_std_name, p1.person_ctry_code, p2.doc_std_name, p2.person_ctry_code
ORDER BY numberOfCommonApplications DESC, p1.doc_std_name ASC,
p2.doc_std_name ASC
5/14/2015 66
Excercise2.コラボレーション国ランキング
US 855
(空白) 489
GB 131
DE 105
KR 101
CN 82
CA 59
SG 57
FR 57
NL 27
SA 20
CH 18
BE 18
IL 15
TH 14
LU 13
IN 11
5/14/2015 67
Excercise2.企業ランキング
PANASONIC CORP 100
SONY CORP 81
SHARP KK 46
KOBE STEEL LTD 41
FUJITSU LTD 36
TAKEDA PHARMACEUTICAL 28
NISSAN MOTOR 27
OTSUKA PHARMA CO LTD 23
HONDA MOTOR CO LTD 23
NIPPON STEEL & SUMITOMO METAL 20
TEXAS INSTRUMENTS JAPAN 20
TOSHIBA KK 20
CANON KK 20
HADANO HIROYUKI 19
NEC CORP 16
SHIONOGI & CO 14
SAWADA HARUKO 13
TOSHIBA TECHNO CT INC 13
SUGIO TOSHIYASU 13
IBM JAPAN 12
SATO YOSHITAKA 11
KYOCERA CORP 11
UNITIKA LTD 10
TATEISHI TAKAAKI 10
MASAKI TAKAKI 10
FUNAI ELECTRIC CO 105/14/2015 68
Excercise2.コラボレーション国x企業
国名
PANASONIC
CORP
SONY
CORP
SHARP
KK
KOBE
STEEL
LTD
FUJITS
U LTD
TAKEDA
PHARMACEU
TICAL
NISSAN
MOTOR
HONDA
MOTOR CO
LTD
OTSUKA
PHARMA CO
LTD
TOSHI
BA KK
TEXAS
INSTRUMENTS
JAPAN
NIPPON STEEL &
SUMITOMO
METAL
CA
NO
N
KK
総
計
(空白) 68 6 40 33 14 27 1 5 3 16 213
US 6 56 3 7 5 21 5 10 12 4 129
GB 9 3 17 8 7 5 1 50
CN 12 1 10 6 1 1 31
FR 1 4 10 15
KR 8 8
DE 3 4 7
SG 6 6
BE 3 1 4
MY 4 4
5/14/2015 69
参考文献
• PATSTAT ONLINE (beta)
• http://www.epo.org/searching/subscription/patstat-online.html
• SQL Self-Study Course
• http://documents.epo.org/projects/babylon/eponet.nsf/0/55df36d61f27cdb
2c1257b1600323d91/$FILE/patstat_introduction_sql_en.pdf
• Data Elements of PATSTAT Raw Data
• http://documents.epo.org/projects/babylon/eponet.nsf/0/95da6bccf12e54a
1c1257aa1002e2d1d/$FILE/patstat_data%20elements_v1.1.pdf
5/14/2015 70
研究用特許データベース
• (1)整理標準化データ (patR データベース)
• 特許庁での特許の出願、審査請求、拒絶、権利維持、最終処分まで、手続
きを記録したもの
• 提供時期は1964年以降2010年3月まで
• データ量が多いため、研究に必要な項目を限定してデータベースに格納
• (2)公報データ (td_5 データベース)
• 特許の明細書および書誌情報を年別・公報種別によって記録したもの
• 発行時期は公開公報:1993年から2012年まで
• 特許公報:1994年から2012年まで
• 公表公報:1996年から2012年まで
• 再公表公報:1996年から2012年まで。すべてのデータを格納。
5/14/2015 71
(1)patR (ER図; 抜粋)
5/14/2015 72
・特許庁の手続きデータを工業所
有権情報・研修館が提供している
整理標準化データが元データ。
・app_info が中心にデータが構成さ
れるリレーショナル・データベース
方式
リレーショナル・データベース
• Excel のようにひとつのテーブルですべてのデータを管理するのでは
なく, キーを介して複数のテーブルから構成されるデータベース
5/14/2015 73
中間試験の成績
・学籍番号
・問1の得点
・問nの得点
期末試験の成績
・学籍番号
・問1の得点
・問nの得点
平常点の成績
・学籍番号
・出席点
・小テストの得点
総合成績
・学籍番号
・総合得点(=中間試験+
期末試験+平常点)
・最終成績
(1) patR
• app_info 出願経過 テーブル
5/14/2015 74
フィールド
名
型 インデックス
内容(カッコ内はコー
ド表インデックス)
1 app_num varchar(20) 出願番号:すべて半角(B0010)
2 count int(11) ワーク用カウンタ
3 title varchar(255) 発明の名称
4 app_date date 出願日
5 renewal_date date 更新日付:出願マスタ
6 id bigint(20) 元処理番号
7 pat_app_num varchar(10) 原出願記事番号(B0010)
8 app_type varchar(4) 原出願記事関連種別(B0310,C0025)
9 pub_num varchar(10) 公開番号
10 pub_date date 公開日
11
exam_pub_nu
m
varchar(10) 公告番号
12
exam_pub_da
te
date 公告日
13 intl_app_num varchar(12) 国際出願番号
14 pry_cnty char(2) 筆頭優先権主張国
15
num_claim_a
pp
int(11) 請求項の数:出願時
16
num_claim_e
xamed
int(11) 請求項の数:公告決定時
17
num_claim_re
g
int(11) 請求項の数:登録査定時
18 reg_num varchar(19) 特許番号または登録番号
19 reg_date date 登録日
20 rej_rsn char(2) 拒絶理由条文コード(C0710)
21 cnln_cl char(2) 本権利抹消識別(C0780)
22
term_dat
e
date 本権利消滅年月日
23
pry_claim
_date
date 優先権主張日
24
dspn_exa
m_date
date 審査最終処分日
25
dspn_exa
m_code
char(3) 審査最終処分種別コード(C0360)
26 apnum
varchar(1
3)
MUL ‘JPP’をapp_numの先頭につけた文字列
27 fin_decn char(1) 査定種別コード(C0350)
28
fin_decn_
date
date 査定発送日
29
trans_sub
m_date
date 翻訳文提出日
30
trans_pub
_num
varchar(1
0)
公表番号
31 idp int(11) PRI 本テーブルの固有行番号
32
num_clai
m_reg_in
fo
int(11) 請求項の数(登録情報)
33 udate date ワーク用日付フィールド
34 IPC8
varchar(2
55)
国際特許分類第8版
35
acc_exam
_mark
char(1) 早期審査マーク(C0240)
(1) patR
• citation 引用情報 テーブル
5/14/2015 75
フィールド
名
型
インデック
ス
内容(カッ
コ内はコー
ド表イン
デックス)
1 citing varchar(10) MUL
引用特許
出願番号
(B0010)
2 cited varchar(10) MUL
被引用特
許出願番
号(B0010)
3 type int(11) MUL
種別(1:審
査官引用
2:特許公
報に記載さ
れた引用
3:上記両
方に記載
の引用)
フィールド名
型 インデックス
内容(カッコ内
はコード表イン
デックス)
1 ids int(11) PRI 固有行番号
2 name text 氏名
3 addr text 住所
4 prefecture char(2)
住所の国県
コード(C0050)
5 id_num varchar(9)
出願人コード
(B0070)
6 req_type char(1)
個法官別コー
ド(C0070)
7 type int(11) ワーク用
8 name1024 varchar(1024) MUL
氏名のインデッ
クス文字列
9 addr1024 varchar(1024) MUL
住所のインデッ
クス文字列
• applicant 出願人
right_holder 権利者テーブル
(1) patR
• inventor 発明者テーブル
5/14/2015 76
フィールド名
型 インデックス
内容(カッコ内
はコード表イン
デックス)
1 name text 氏名
2 addr text 住所
3 req_type char(1)
個法官別コー
ド(C0070)
4 organization Varchar(255)
所属する組織
の名称
5 ids int(11) PRI 固有行番号
6 name1024 varchar(1024) MUL
氏名のイン
デックス文字
列
7 addr1024 varchar(1024) MUL
住所のイン
デックス文字
列
フィールド名 型 インデックス
内容(カッコ内は
コード表インデック
ス)
1 apnum varchar(13) MUL
‘JPP’+出願番号
(B0010)
2 app_num varchar(10) MUL 出願番号(B0010)
3 pub_num varchar(10) MUL 公開番号
4 intl_app_num varchar(12) MUL 国際出願番号
5 intl_pub_num varchar(12) MUL 国際公開番号
6 trans_pub_num varchar(10) MUL 公表番号
7 exam_pub_num varchar(10) MUL 公告番号
8 reg_num varchar(10) MUL 特許番号または登
録番号
9 ref_pub_num varchar(13) MUL 文献公開番号
10
ref_trans_pub_nu
m
varchar(13) MUL 文献公表番号
11
ref_examd_pub_n
um
varchar(13) MUL 文献公告番号
12 ref_reg_num varchar(13) MUL 文献登録番号
13 ref_intl_pub_num varchar(13) MUL 文献国際公開番
号
• numbers 番号表テーブル
Exercise 3: patR データベースをmysql クライアン
トを使って分析してみる
• 0. mysql クライアントを http://dev.mysql.com/downloads/mysql/ より
ダウンロードする
• Linux と Mac, Windows の場合で異なる
5/14/2015 77
Exercise 3: patR データベースをmysql クライ
アントを使って分析してみる
• 0-1. mysql クライアントをインストールする
• 注意点その1: 文字コードに utf8 を利用すること
5/14/2015 78
Exercise 3: patR データベースをmysql クライア
ントを使って分析してみる
• 0-1. mysql クライアントをインストールする
• 注意点その2: クライアントPC 上でmysql サービスが動作していることを確認
すること
5/14/2015 79
Exercise 3: patR データベースをmysql クライア
ントを使って分析してみる
• 1. mysql データベースにアクセスする
• mysql –h (データベースサーバ名) –u (ユーザ名) –p とタイプし, パスワードを
入力する
5/14/2015 80
Exercise 3:(つづき)
• 2. parR データベースの中身を
チェックする
• “show tables from patr5_1123;”
とタイプし, part5_1123 テーブル
の中身をチェックする.
• mysql コマンドの末尾には, セミ
コロン “;” を明記すること
• app_info や inventor など, どの
ようなデータが格納されている
かチェックできる
5/14/2015 81
Exercise 3:(つづき)
• 3. テーブルの構造をチェックして
みる
• “desc (チェックするデータベース).(
テーブル名)” で, フィールド名, デー
タの格納タイプ (文字列なのか, 日
時なのか etc),主キー (格納された
データ情報が一意なものであるか)
なのかチェックできる.
5/14/2015 82
Exercise 3:(つづき)
• 4. 実際にデータを取得してみ
る
• 2011年に出願された特許のう
ち, 1. 審査官引用件数の合計 2.
特許公報に記載された引用の
件数の合計をそれぞれ抽出し
てみる
• クエリをなげると, それぞれ合
計数を取得することができる
5/14/2015 83
Exercise 3:(つづき)
• 4. 実際にデータを取得してみる (大まかなコ
マンドの説明)
• Select : 「データをデータベースから引っ張って
きますよ」という宣言
• Count(*) : 「ひっぱってきたデータを数え上げて
みますよ」という説明
• from patr5_1123.citation : 「patr5_1123 という
データベースのなかの, citation テーブルから
データを引っ張りますよ」 という宣言
• Where : 「ただし, 以下の条件でね」という宣言
• where citing like : 「citing のデータがこんな感じの
がほしいです」
• ‘2011%’ : 先頭が2011 ではじまるデータ
• and : かつ
• (type = 1 or type = 3) : (1:審査官引用 3:上記両
方に記載の引用)
• (type = 2) : (2:特許公報に記載された引用 )
5/14/2015 84
まとめてみると、「patr5_1123 データベースの中の citation テーブルのうち, citing フィールドのデータの
先頭が 2011 ではじまり、かつ “1. 審査官引用または 3. 上記両方記載に引用” にカテゴライズされてい
るデータの数を数えてね」になります
Exercise 3:(つづき)
• 5. IPCデータを抽出してみる
• Patr5_1123 データベースの
pub_IPC より, IPC_CLASS と合計
数を, CLASS ごとにもとめ, カウン
ト数で並べ直す.
• count(*) as count ; 合計数を count
と名付ける
• group by IPC_class ; IPC_class でま
とめる
• order by count ; count 数でソート
する
5/14/2015 85
列1 IPC_Class 詳細 カウント数
1H01L 半導体装置 固体装置 それらの部品の製造 処理に特に適用される方法 2567401
2G06F データ処理装置 1863464
3H04N データ転送, テレビジョン装置 1363731
4A61K 医薬品製剤 1298939
5A61P 化合物または医薬製剤の特殊な治療活性 971151
6G03G 光,熱,電子を照射して原画像の記録を行なうための記録材料 841739
7G11B
機械的カッティング,変形 プレスによる,例.溝 ピットの,記録 機械的感知によ
る再生 そのための記録担体
829606
8B41J タイプライタの種類または選択的プリンティング機構の種類 723902
9G01N 材料の調査分析, サンプリング 調査用標本の調製 693957
10G02B
使用物質によって特徴づけられた光学要素 光学要素のための光学的コーティ
ング
619495
Exercise 3:(つづき)
• 6. 特定の発明者のデータを抽出してみる
• アクテムラの開発者である大杉先生の特許一覧データを探してみる
• 実行するコマンド
• 公開日, 公開番号, 特許名, 発明者名の情報を抽出
5/14/2015 86
select app_info.pub_date, app_info.pub_num, app_info.title, inventor.name
from inventor
inner join inventor_corr_last
on inventor.ids=inventor_corr_last.ids
inner join app_info
on inventor_corr_last.idp=app_info.idp
where inventor.name='大杉 義征';
Exercise 3:(つづき)
• 実行するコマンドの説明 (1)
5/14/2015 87
select app_info.app_date, app_info.pub_date, app_info.pub_num,
app_info.title, inventor.name
from inventor
inner join inventor_corr_last
on inventor.ids=inventor_corr_last.ids
inner join app_info
on inventor_corr_last.idp=app_info.idp
where inventor.name='大杉 義征';
App_info テーブルより、
・特許の出願日 (app_date)
・特許の公開日 (pub_date)
・特許のタイトル (title)
・特許の公開番号 (pub_num)
Inventor テーブルより、
・特許の発明者名 (inventor)
を取得 (select) する
Inventor テーブルよりデータをもってくる
inventor. テーブルの name フィールドが
“大杉 義征” なデータをもってくる
select app_info.app_date, app_info.pub_date, app_info.pub_num,
app_info.title, inventor.name
from inventor
inner join inventor_corr_last
on inventor.ids=inventor_corr_last.ids
inner join app_info
on inventor_corr_last.idp=app_info.idp
where inventor.name='大杉 義征';
Exercise 3:(つづき)
• 実行するコマンドの説明 (2)
5/14/2015 88
Inventor_corr_last テーブルの ids キーを介して, inventor テー
ブルと app_info テーブルの情報を接続する (inner join)
Exercise 3:(つづき)
• 実行結果
• 大杉先生の特許一覧が出力される
5/14/2015 89
app_date pub_date pub_num title name
1976/4/12 1977/1/29 1977012141新規アミノ安息香酸誘導体、その製法及び医薬組成物 大杉 義征
1977/11/2 1979/5/29 1979066645安息香酸誘導体 大杉 義征
1978/6/9 1979/12/26 1979163540テレフタル酸アミド誘導体及びその塩 大杉 義征
1978/12/5 1980/6/10 1980076853テレフタル酸アミド誘導体の製法 大杉 義征
1986/1/22 1986/11/27 1986267515腎炎治療剤 大杉 義征
1986/1/24 1986/11/27 1986267516気管支拡張剤 大杉 義征
1986/5/22 1987/3/9 1987053966新規ピリジン誘導体 大杉 義征
1987/11/20 1988/10/5 1988239217抗アレルギー剤 大杉 義征
1989/6/30 1991/2/14 1991034932糸球体腎疾患治療剤 大杉 義征
1990/4/9 1991/12/20 1991291236感作T細胞関与疾患の治療剤 大杉 義征
1990/8/17 1992/3/31 1992099800組換えマウスIL―6レセプターの製造方法 大杉 義征
1995/10/6 1996/8/13 1996208514IL−6アンタゴニストを有効成分とする慢性関節リウマチ治療剤 大杉 義征
1998/8/14 1999/5/25 1999139988抗IL−6レセプター抗体を有効成分として含有する全身性エリテマトーデスの予防および/または治療剤 大杉 義征
2002/9/25NULL NULL ウイルムス腫瘍遺伝子に対する新規なアンチセンスオリゴヌクレオチド誘導体 大杉 義征
2003/9/18NULL NULL 癌抑制遺伝子WT1の産物に基づく癌抗原とカチオン性リポソームとを含んで成る癌ワクチン 大杉 義征
2003/11/7NULL NULL C型肝炎ウイルスに対する新規なアンチセンスオリゴヌクレオチド誘導体 大杉 義征
2005/5/30 2005/9/15 2005247872抗IL−6レセプター抗体を有効成分として含有する全身性エリテマトーデスの予防および/または治療剤 大杉 義征
2006/11/15NULL NULL 細胞傷害性T細胞の誘導抑制剤 大杉 義征
2008/10/3 2009/4/16 2009079054癌抑制遺伝子WT1の産物に基づく癌抗原とカチオン性リポソームとを含んで成る癌ワクチン 大杉 義征
2009/5/25 2009/8/20 2009185073抗IL-6レセプター抗体を有効成分として含有する全身性エリテマトーデスの予防および/または治療剤 大杉 義征
特許データベースの詳細
• http://enq.iir.hit-u.ac.jp
• http://www.alife-lab.co.jp
5/14/2015 90
今日取り上げる内容
1. はじめに
2. 論文データベースの利用方法
• Web of Knowledge
• Scopus
3. 特許データベースの利用方法
• 米国特許のデータベース
• Thomson Innovation
• Ultra Patent
• USPTO database
• 日本特許のデータベース
• MySQL の導入
• Access の導入
• 基本的なコマンド
4. サイエンスリンケージデータベースの利用方法
5. 数字ではわからないこと (今日のまとめ)
5/14/2015 91
論文 特許
サイエンス
リンケージ
4. サイエンスリンケージデータ
ベース
5/14/2015 92
サイエンスリンケージデータベース
• 特許と論文との引用関係を明らかにする
• 論文による科学的知見の集積が, どのように特許で活用されている
のか?
5/14/2015 93
Science Linkage
• References Cited in Patent
• “Other Publications”
• Proceeding in Academic
Conference
• Scientific Paper
• “Patents”
• US Patents
• Foreign Patents
945/14/2015
Science Linkage Example:
(Imaginary?) STAP Cell Patent, and cited iPS Cell Paper
• Patent (Vacanti Kojima Obokata… 2013)
95
・Paper (Takahashi and Yamanaka 2006)
7 years
5/14/2015
サイエンスリンケージデータベースのデータセット
• サイエンスリンケージデータベース: 特許と文献の引用関係に基づくリレーショナル・データベース
• データソース:Derwent Patent Index Database、DIIおよびWeb of Science (SCIE, SSCI)
• 特許発行年が1992年から2011年で3極(JP,US,EP)をパテントファミリーの中に含む特許
情報を同定
• 上記条件を満たす特許レコードに引用されている文献を同定
• 特許と文献引用リンクテーブル: 2011年時点
• 特許に引用されたWoS文献データ: 1981年以降
• データ項目
• 特許公報番号(Patent Publication Number)、特許出願年、特許発行年、IPCサブクラス
(例:A01B)、特許出願国、特許出願人の居住国
• WoS論文ユニーク番号(UT)、論文発行年、WoS250分野、ESI22分野、全著者所属機関の国
• 特許番号、その特許が引用しているWoS論文ユニーク番号
965/14/2015
ER図
Web of Knowledge
Thomson Innovation
DWPI (LinkTable)
5/14/2015 97
Table Info (Patent)
カラム名 カラム定義名 データ型 BYTE
公開番号 PAT CHAR 16
出願年 AppYear CHAR 4
公報発行年 PubYear CHAR 4
• DWPI_INFO
• DWPI_IPC
カラム名 カラム定義名 データ型 BYT
E
公開番号 PAT CHAR 16
IPCサブクラス IPC Varchar 4
カラム名 カラム定義名 データ型 BYTE
公開番号 PAT CHAR 16
特許出願国 AppCountry Varchar 2
• DWPI_AppCountry
• DWPI_AssCountry
カラム名 カラム定義名 データ型 BYTE
公開番号 PAT CHAR 16
居住国 AssCountry Varchar 30
5/14/2015 98
Table Info (LinkageTable+Family)
• LinkTable
• FamilyTable
カラム名 カラム定義名 データ型 BYT
E
公開番号 PAT CHAR 16
WoS論文ユニーク番号 UT Varchar 15
カラム名 カラム定義名 データ型 BYT
E
アクセッション番号 AccNo CHAR 10
公開番号(PAT) PAT CHAR 16
5/14/2015 99
Table Info (Paper)
• WOS_INFO
• WOS_CATEGORY
カラム名 カラム定義名 データ型 BY
TE
WoS論文ユニーク番
号
UT CHAR 15
論文発行年 UTYear CHAR 4
ESI22分野 ESI Varcha
r
30
カラム名 カラム定義名 データ型 BY
TE
WoS論文ユニーク番
号
UT CHAR 15
WoSカテゴリ Category Varchar 50
• WOS_Country
カラム名 カラム定義名 データ型 BYTE
WoS論文ユニーク番
号
UT CHAR 15
著者所属機関国 UTCountry Varchar 20
5/14/2015 100
4-2. サイエンスリンケージデータ
ベースを用いた解析結果
(preliminary)
5/14/2015 101
採録特許数と論文数の推移
0
10000
20000
30000
40000
50000
60000
70000
80000
90000
1900
1904
1908
1912
1916
1920
1924
1928
1932
1936
1940
1944
1948
1952
1956
1960
1964
1968
1972
1976
1980
1984
1988
1992
1996
2000
2004
2008
2012
appyear pubyear wos_year
5/14/2015 102
Patent Application Country
AT
0%
AU
0%
BE
0%
CA
0%
CH
0%
CN
0%
CS
0%
DE
2%
DK
0%
EP
27%
ES
0%
FI
0%
FR
2%
GB
1%
GC
0%
IE
0%
JP
0%
KR
0%
LU
0%
NL
0%
NO
0%
NZ
0%
PL
0%
RU
0%
SE
0%
US
40%
WO
28%
ZA
0%
5/14/2015 103
ESI Category
ESI Category Number Percent
Clinical Medicine 224940 19.5%
Biology & Biochemistry 182544 15.9%
Chemistry 175132 15.2%
Molecular Biology & Genetics 81736 7.1%
Engineering 74388 6.5%
Physics 73309 6.4%
Immunology 54835 4.8%
Pharmacology & Toxicology 50955 4.4%
Microbiology 44728 3.9%
Neuroscience & Behavior 43761 3.8%
Materials Science 38522 3.3%
Plant & Animal Science 33938 2.9%
Computer Science 31547 2.7%
Agricultural Sciences 17935 1.6%
Environment/Ecology 5175 0.4%
Geosciences 4341 0.4%
Psychiatry/Psychology 4084 0.4%
Multidisciplinary 3522 0.3%
Social Sciences, general 3183 0.3%
Economics & Business 1389 0.1%
Mathematics 1163 0.1%
Space Science 309 0.0%
Total 1151436
Clinical Medicine Biology & Biochemistry
Chemistry Molecular Biology & Genetics
Engineering Physics
Immunology Pharmacology & Toxicology
Microbiology Neuroscience & Behavior
Materials Science Plant & Animal Science
Computer Science Agricultural Sciences
Environment/Ecology Geosciences
Psychiatry/Psychology Multidisciplinary
Social Sciences, general Economics & Business
Mathematics Space Science5/14/2015 104
Exercise 4:論文公刊から特許出願/公開まで
の年数を求めて, 特許出願年順に並べる
• クエリ構文
select distinct linktable.pat, linktable.ut, wos_info.UTYear, dwpi_info.AppYear, dwpi_info.PubYear,
dwpi_info.PubYear - wos_info.UTYear, dwpi_info.AppYear - wos_info.UTYear
from linktable
Inner Join wos_info
ON linktable.ut=wos_info.ut
Inner Join dwpi_info
ON linktable.pat=dwpi_info.pat
where ESI = "Physics"
order by linktable.pat
;
5/14/2015 105
Exercise 4:論文公刊から特許出願/公開まで
の年数を求めて, 特許出願年順に並べる
• クエリ構文
select distinct linktable.pat, linktable.ut, wos_info.UTYear, dwpi_info.AppYear, dwpi_info.PubYear,
dwpi_info.PubYear - wos_info.UTYear, dwpi_info.AppYear - wos_info.UTYear
from linktable
Inner Join wos_info
ON linktable.ut=wos_info.ut
Inner Join dwpi_info
ON linktable.pat=dwpi_info.pat
where ESI = "Physics"
order by linktable.pat
;
Select : 特許番号, 論文番号, 論文の公刊年, 特許の
出願年, 特許の公開年, 特許の公開年-論文の公刊
年, 特許の出願年 – 論文の公刊年 を表示する
from : linktable からデータを持ってくる
Inner Join : linktable に wos_info を接続する. このと
き, linktable.ut をキーとして wos_info.ut と対応する
ように接続する
Inner Join : linktable に dwpi_info を接続する. このと
き, linktable.pat をキーとして dwpi_info.pat と対応す
るように接続する
where : ESI が”Physics” なデータのみを抽出する
order by : linktable.pat の順番に並べる
5/14/2015 106
ER図で取得したデータの内容を確認する
Web of Knowledge
Thomson Innovation
DWPI (LinkTable)
5/14/2015 107
Physics
0
5000
10000
15000
20000
25000
30000
0
2
4
6
8
10
12
14
# of patents 平均 / dwpi_info.AppYear - wos_info.UTYear 平均 / dwpi_info.PubYear - wos_info.UTYear
5/14/2015 108
他のデータベースとの接続
• 特許データベースとは
pub_number
• 論文データベースとは wos 番号
を用いることで, どのような組織が
サイエンスリンケージを活用してい
るのか分析を拡張することができ
る
5/14/2015 109
5. 数字ではわからないこと:
JST/RISTEX 長岡PJ
「イノベーションの科学的源泉とその経済効果」
5/14/2015 110
特許や論文の情報ではわからない知識
• たとえば
• (研究者や発明者が)こっそり使っていた技術/技法
• 企業秘密
• 研究や実験手法
• 研究設備
• 競合する企業による特許や論文
• JST/RISTEX 長岡PJ
• 知識フロー分析 (特許や論文で測れる科学的源泉と, 特許や論文で測れな
い科学的源泉を調査)
5/14/2015 111
「イノベーションの科学的源泉とその経済効果」
1. 「源泉研究」
• サイエンスからイノベーションへの知識の流れの経路 (学術文献、研究機器・試料、
産学連携) を識別し包括的に捕らえ、また、サイエンスを活用するメカニズムや能力
の理解を深める
2. 「知識フロー研究」
• 特許における引用などの書誌情報がどの程度現実の知識フローを把握しているの
か調査する
3. 「経済効果研究」
• 新しい財、その効果 (寿命, 入院日数)、利益確保可能性
• 知識の波及効果と競争メカニズム
• サイエンスベースのイノベーションの経済効果を分析し、その貢献を高め
るための政策や制度設計の在り方を提言する
5/14/2015 112
研究手法
• 事例調査
• サーベイ調査
• 計量経済学的分析
• 疾患分野 X 医薬品 X 年のパネルデータを作成
5/14/2015 113
日本の11 の革新的医薬の事例研究
• コンパクチン
(※. 第二相臨床試験で開発中止)
1. メバロチン
2. クレストール
3. アクテムラ
4. オノン
5. アリセプト
6. リュープリン
7. ブロプレス
8. クラビット
9. ハルナール
10. アクトス
11. プログラフ
5/14/2015 114
大規模サーベイの実施
実施体制 対象 回収数 備考
医薬品サーベイ 日本製薬工業
協会研究開発
委員会及び同
医薬産業政策
研究所と協力
日本企業オリジンのNME(新有効成分
含有医薬品)の探索・開発プロジェクト
(約1100プロジェクト)
(1)1990以降に日本において承認(2)
2012年時点において非臨床から~申
請中、および
(3)開発が中止されたあるいは現在
留保に選択
探索:234プロジェク
ト(回収率約22%)、
臨床開発:180プロ
ジェクト(回収率
17%)
日本製薬工業協会
の会員企業トップレ
ベルの了解を得て実
施
発明者サーベイ 経済産業研究
所と協力
日本と欧州に(そして大半の場合米国
にも)特許出願されている発明2,689
843名(回収率は
32.4%)
追加サーベイ
バイオベンチャー
・サーベイ
バイオインダス
トリー協会と協
力
約700社の日本のバイオベンチャーを
対象
2012年度 約177社
(15.3%)
毎年度実施
5/14/2015 115
JST 長岡PJ 事例調査 知識フロー研究
• 特許・論文の(後方)引用情報、共著者及び共同発明者等の公表データ
が、現実の重要知識 (イノベーションに係る科学的源泉) のフローをどの
程度捕捉しているか評価する
• サイエンスからイノベーションへの知識フローを定量的に把握する手法の
開発
• 発明における引用
• 従来技術の開示
• 米国特許では出願人の義務
• 従来技術=発明の新規性・進歩性の評価に有用な文献
• 発明自体の説明
• 発明を第三者が実施できるように開示
5/14/2015 116
(omited)
5/14/2015 117
Conclusion
• サイエンスからイノベーションへの知識フローの把握には、サーベイ
による把握など補完的な手段の利用が重要
• 共同研究を介した知識フローは共同発明者などのデータから把握
可能
5/14/2015 118
Implication
• サイエンスリンケージの可視化・精緻化
• サイエンスリンケージを精緻化するためには, 特許の非特許文献情報のみ
では不十分. 特許内の本文内にある文献情報を抽出するアルゴリズムの開
発が必要. (書誌テキスト分析などの援用)
• 特許⇔論文間のリンケージデータ (特許フロントページの引用非特許文献と
特許番号のマッチング)整備は米国特許および欧州特許では進められてい
る一方、日本特許および日本語文献ではサイエンスリンケージを特定する
ためには個別資料の精査が必要不可欠
• 日本特許の出願において出願人が非特許文献を開示する場合、雑誌や論
文のID を併記することを推進し、データベースの整備を行う必要性
5/14/2015 119
まとめ
• 特許や論文のデータを調べることで、知識の流れ (トラジェクトリ) や
知識の生成過程 (社会的な構築プロセス) がわかるかもしれない
• 特許や論文の書誌情報からわからない情報もたくさんある
• イノベーションプロセスを理解して有益な含意を導き出すには、いろ
いろな分析手法を組み合わせる必要がある
5/14/2015 120
Acknowledgement
• 文部科学省 SciREX 事業
• 「政策のための科学」基盤的研究・人材育成拠点事業(領域開拓拠
点)イノベーションマネジメント・政策プログラム(Innovation
Management and Policy Program:IMPP)
• 独立行政法人科学技術振興機構社会技術研究開発センターによる
「科学技術イノベーション政策のための科学研究開発プログラム」:
• 「イノベーションの科学的源泉とその経済効果」
• 「科学技術イノベーション政策の経済成長分析評価プロジェクト」
1215/14/2015
Thanks.
hara@iir.hit-u.ac.jp
ya-hara@grips.ac.jp
1225/14/2015

More Related Content

What's hot

SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回 「ネットワーク分析の方法+WSシリーズまとめ」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回「ネットワーク分析の方法+WSシリーズまとめ」 SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回「ネットワーク分析の方法+WSシリーズまとめ」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回 「ネットワーク分析の方法+WSシリーズまとめ」 Yasushi Hara
 
SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」
SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」 SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」
SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」 Yasushi Hara
 
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題Yasushi Hara
 
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃんYasushi Hara
 
#経済学のための実践的データ分析 9. オープンデータを使ってみよう
#経済学のための実践的データ分析 9. オープンデータを使ってみよう#経済学のための実践的データ分析 9. オープンデータを使ってみよう
#経済学のための実践的データ分析 9. オープンデータを使ってみようYasushi Hara
 
#経済学のための実践的データ分析 6. データを実際に分析するまでのとてもとても遠く険しく細く長い道
#経済学のための実践的データ分析 6. データを実際に分析するまでのとてもとても遠く険しく細く長い道#経済学のための実践的データ分析 6. データを実際に分析するまでのとてもとても遠く険しく細く長い道
#経済学のための実践的データ分析 6. データを実際に分析するまでのとてもとても遠く険しく細く長い道Yasushi Hara
 
いま問われる研究業績評価:応用物理と未来社会: パネルディスカッション
いま問われる研究業績評価:応用物理と未来社会: パネルディスカッションいま問われる研究業績評価:応用物理と未来社会: パネルディスカッション
いま問われる研究業績評価:応用物理と未来社会: パネルディスカッションYasushi Hara
 
#経済学のための実践的データ分析 7. 論文データベースの使い方
#経済学のための実践的データ分析 7. 論文データベースの使い方#経済学のための実践的データ分析 7. 論文データベースの使い方
#経済学のための実践的データ分析 7. 論文データベースの使い方Yasushi Hara
 
#経済学のための実践的データ分析 11. データのビジュアライゼーション
#経済学のための実践的データ分析 11. データのビジュアライゼーション#経済学のための実践的データ分析 11. データのビジュアライゼーション
#経済学のための実践的データ分析 11. データのビジュアライゼーションYasushi Hara
 
#経済学のための実践的データ分析 10. テキスト分析の方法
#経済学のための実践的データ分析 10. テキスト分析の方法#経済学のための実践的データ分析 10. テキスト分析の方法
#経済学のための実践的データ分析 10. テキスト分析の方法Yasushi Hara
 
経済学のための実践的データ分析 5.特許データの分析
経済学のための実践的データ分析 5.特許データの分析経済学のための実践的データ分析 5.特許データの分析
経済学のための実践的データ分析 5.特許データの分析Yasushi Hara
 
#経済学のための実践的データ分析 8. 企業データベースの使い方
#経済学のための実践的データ分析 8. 企業データベースの使い方#経済学のための実践的データ分析 8. 企業データベースの使い方
#経済学のための実践的データ分析 8. 企業データベースの使い方Yasushi Hara
 
経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめ経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめYasushi Hara
 
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールするYasushi Hara
 
AIIT マンスリー・フォーラム Infotalk 第85回 科学技術イノベーション政策・ 政府研究開発投資による IoT の経済的効果
AIIT マンスリー・フォーラム Infotalk 第85回科学技術イノベーション政策・政府研究開発投資による IoT の経済的効果AIIT マンスリー・フォーラム Infotalk 第85回科学技術イノベーション政策・政府研究開発投資による IoT の経済的効果
AIIT マンスリー・フォーラム Infotalk 第85回 科学技術イノベーション政策・ 政府研究開発投資による IoT の経済的効果Yasushi Hara
 
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張National Institute of Informatics
 
「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として
「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として
「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例としてTakanori Hayashi
 

What's hot (20)

SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回 「ネットワーク分析の方法+WSシリーズまとめ」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回「ネットワーク分析の方法+WSシリーズまとめ」 SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回「ネットワーク分析の方法+WSシリーズまとめ」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回 「ネットワーク分析の方法+WSシリーズまとめ」
 
SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」
SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」 SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」
SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」
 
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
 
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
 
#経済学のための実践的データ分析 9. オープンデータを使ってみよう
#経済学のための実践的データ分析 9. オープンデータを使ってみよう#経済学のための実践的データ分析 9. オープンデータを使ってみよう
#経済学のための実践的データ分析 9. オープンデータを使ってみよう
 
#経済学のための実践的データ分析 6. データを実際に分析するまでのとてもとても遠く険しく細く長い道
#経済学のための実践的データ分析 6. データを実際に分析するまでのとてもとても遠く険しく細く長い道#経済学のための実践的データ分析 6. データを実際に分析するまでのとてもとても遠く険しく細く長い道
#経済学のための実践的データ分析 6. データを実際に分析するまでのとてもとても遠く険しく細く長い道
 
いま問われる研究業績評価:応用物理と未来社会: パネルディスカッション
いま問われる研究業績評価:応用物理と未来社会: パネルディスカッションいま問われる研究業績評価:応用物理と未来社会: パネルディスカッション
いま問われる研究業績評価:応用物理と未来社会: パネルディスカッション
 
#経済学のための実践的データ分析 7. 論文データベースの使い方
#経済学のための実践的データ分析 7. 論文データベースの使い方#経済学のための実践的データ分析 7. 論文データベースの使い方
#経済学のための実践的データ分析 7. 論文データベースの使い方
 
#経済学のための実践的データ分析 11. データのビジュアライゼーション
#経済学のための実践的データ分析 11. データのビジュアライゼーション#経済学のための実践的データ分析 11. データのビジュアライゼーション
#経済学のための実践的データ分析 11. データのビジュアライゼーション
 
#経済学のための実践的データ分析 10. テキスト分析の方法
#経済学のための実践的データ分析 10. テキスト分析の方法#経済学のための実践的データ分析 10. テキスト分析の方法
#経済学のための実践的データ分析 10. テキスト分析の方法
 
経済学のための実践的データ分析 5.特許データの分析
経済学のための実践的データ分析 5.特許データの分析経済学のための実践的データ分析 5.特許データの分析
経済学のための実践的データ分析 5.特許データの分析
 
#経済学のための実践的データ分析 8. 企業データベースの使い方
#経済学のための実践的データ分析 8. 企業データベースの使い方#経済学のための実践的データ分析 8. 企業データベースの使い方
#経済学のための実践的データ分析 8. 企業データベースの使い方
 
経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめ経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめ
 
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする
 
[2015年度] 看護文献の探し方(オーダーメイド講習会:看護研究Ⅰ)
[2015年度] 看護文献の探し方(オーダーメイド講習会:看護研究Ⅰ)[2015年度] 看護文献の探し方(オーダーメイド講習会:看護研究Ⅰ)
[2015年度] 看護文献の探し方(オーダーメイド講習会:看護研究Ⅰ)
 
研究データ流通を支える情報基盤とは
研究データ流通を支える情報基盤とは研究データ流通を支える情報基盤とは
研究データ流通を支える情報基盤とは
 
データ共有基盤の構築に向けて
データ共有基盤の構築に向けてデータ共有基盤の構築に向けて
データ共有基盤の構築に向けて
 
AIIT マンスリー・フォーラム Infotalk 第85回 科学技術イノベーション政策・ 政府研究開発投資による IoT の経済的効果
AIIT マンスリー・フォーラム Infotalk 第85回科学技術イノベーション政策・政府研究開発投資による IoT の経済的効果AIIT マンスリー・フォーラム Infotalk 第85回科学技術イノベーション政策・政府研究開発投資による IoT の経済的効果
AIIT マンスリー・フォーラム Infotalk 第85回 科学技術イノベーション政策・ 政府研究開発投資による IoT の経済的効果
 
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張
 
「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として
「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として
「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として
 

Viewers also liked

Lakshmi Narayan Mittal by Atul chaurasiya
Lakshmi Narayan Mittal by Atul chaurasiyaLakshmi Narayan Mittal by Atul chaurasiya
Lakshmi Narayan Mittal by Atul chaurasiyaAtul Chaurasiya
 
Laxmi mittal
Laxmi mittalLaxmi mittal
Laxmi mittalppiyuu
 
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回 「行間を読むっていろいろと大切」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回「行間を読むっていろいろと大切」 SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回「行間を読むっていろいろと大切」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回 「行間を読むっていろいろと大切」 Yasushi Hara
 
Lakshmi mittal ceo &amp; chairman of
Lakshmi mittal ceo &amp; chairman ofLakshmi mittal ceo &amp; chairman of
Lakshmi mittal ceo &amp; chairman ofsantumane
 
Success Story of Amul
Success Story of AmulSuccess Story of Amul
Success Story of AmulShveta Bhatia
 

Viewers also liked (7)

Lakshmi Narayan Mittal by Atul chaurasiya
Lakshmi Narayan Mittal by Atul chaurasiyaLakshmi Narayan Mittal by Atul chaurasiya
Lakshmi Narayan Mittal by Atul chaurasiya
 
Laxmi mittal
Laxmi mittalLaxmi mittal
Laxmi mittal
 
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回 「行間を読むっていろいろと大切」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回「行間を読むっていろいろと大切」 SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回「行間を読むっていろいろと大切」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回 「行間を読むっていろいろと大切」
 
Lakshmi mittal ceo &amp; chairman of
Lakshmi mittal ceo &amp; chairman ofLakshmi mittal ceo &amp; chairman of
Lakshmi mittal ceo &amp; chairman of
 
LAXMI MITTAL
LAXMI MITTAL LAXMI MITTAL
LAXMI MITTAL
 
Laksmi Nivas Mittal
Laksmi Nivas MittalLaksmi Nivas Mittal
Laksmi Nivas Mittal
 
Success Story of Amul
Success Story of AmulSuccess Story of Amul
Success Story of Amul
 

Similar to IRC セミナー 数字が教えてくれないこと -特許/論文データベース分析入門-

誰もが研究する時代の到来 〜これからの未来をつくる「野生の研究者」の生態に迫る〜 #smips湯村
誰もが研究する時代の到来 〜これからの未来をつくる「野生の研究者」の生態に迫る〜 #smips湯村誰もが研究する時代の到来 〜これからの未来をつくる「野生の研究者」の生態に迫る〜 #smips湯村
誰もが研究する時代の到来 〜これからの未来をつくる「野生の研究者」の生態に迫る〜 #smips湯村Tsubasa Yumura
 
野生の研究について
野生の研究について野生の研究について
野生の研究についてTsubasa Yumura
 
越境研説明スライド
越境研説明スライド越境研説明スライド
越境研説明スライドEi NAKAGAWA
 
エビデンス・データの 研究マネジメントへの活用に向けて
エビデンス・データの研究マネジメントへの活用に向けてエビデンス・データの研究マネジメントへの活用に向けて
エビデンス・データの 研究マネジメントへの活用に向けてMasatsura IGAMI
 
研究しよう,伝えよう
研究しよう,伝えよう研究しよう,伝えよう
研究しよう,伝えようKazushi Yamashina
 
論文に関する基礎知識2015
論文に関する基礎知識2015論文に関する基礎知識2015
論文に関する基礎知識2015Mai Otsuki
 
Survey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CVSurvey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CVShintaro Yamamoto
 
Celes20150627 seminar
Celes20150627 seminarCeles20150627 seminar
Celes20150627 seminaryouwatari
 
Code4Lib 2013参加報告
Code4Lib 2013参加報告Code4Lib 2013参加報告
Code4Lib 2013参加報告Masao Takaku
 
人生の意思決定を支える社会インフラとしての図書館
人生の意思決定を支える社会インフラとしての図書館人生の意思決定を支える社会インフラとしての図書館
人生の意思決定を支える社会インフラとしての図書館Yoji Kiyota
 
若手研究者のための知的財産リテラシー講座(第1回予告)
若手研究者のための知的財産リテラシー講座(第1回予告)若手研究者のための知的財産リテラシー講座(第1回予告)
若手研究者のための知的財産リテラシー講座(第1回予告)博士のシェアハウス
 
大学におけるオープンエデュケーショナル リソースと著作権処理の実状と課題
大学におけるオープンエデュケーショナル リソースと著作権処理の実状と課題大学におけるオープンエデュケーショナル リソースと著作権処理の実状と課題
大学におけるオープンエデュケーショナル リソースと著作権処理の実状と課題Katsusuke Shigeta
 
社会人のためのシンポジウム発表入門 リーン論文作法
社会人のためのシンポジウム発表入門   リーン論文作法社会人のためのシンポジウム発表入門   リーン論文作法
社会人のためのシンポジウム発表入門 リーン論文作法Makoto SAKAI
 
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介scirexcenter
 
SciREX Policymaking Intelligent Assistant System
SciREX Policymaking Intelligent Assistant SystemSciREX Policymaking Intelligent Assistant System
SciREX Policymaking Intelligent Assistant Systemscirexcenter
 
オープンサイエンスの波に乗れ! : 研究力強化のためにできること
オープンサイエンスの波に乗れ! : 研究力強化のためにできることオープンサイエンスの波に乗れ! : 研究力強化のためにできること
オープンサイエンスの波に乗れ! : 研究力強化のためにできることEriko Amano
 
看護学科4年次専門科目「研究方法論」の実践報告
看護学科4年次専門科目「研究方法論」の実践報告看護学科4年次専門科目「研究方法論」の実践報告
看護学科4年次専門科目「研究方法論」の実践報告Makiko Watanabe
 

Similar to IRC セミナー 数字が教えてくれないこと -特許/論文データベース分析入門- (20)

誰もが研究する時代の到来 〜これからの未来をつくる「野生の研究者」の生態に迫る〜 #smips湯村
誰もが研究する時代の到来 〜これからの未来をつくる「野生の研究者」の生態に迫る〜 #smips湯村誰もが研究する時代の到来 〜これからの未来をつくる「野生の研究者」の生態に迫る〜 #smips湯村
誰もが研究する時代の到来 〜これからの未来をつくる「野生の研究者」の生態に迫る〜 #smips湯村
 
野生の研究について
野生の研究について野生の研究について
野生の研究について
 
越境研説明スライド
越境研説明スライド越境研説明スライド
越境研説明スライド
 
エビデンス・データの 研究マネジメントへの活用に向けて
エビデンス・データの研究マネジメントへの活用に向けてエビデンス・データの研究マネジメントへの活用に向けて
エビデンス・データの 研究マネジメントへの活用に向けて
 
科学技術・学術政策研究所講演20170731ver.2(公開用修正版)
科学技術・学術政策研究所講演20170731ver.2(公開用修正版)科学技術・学術政策研究所講演20170731ver.2(公開用修正版)
科学技術・学術政策研究所講演20170731ver.2(公開用修正版)
 
研究しよう,伝えよう
研究しよう,伝えよう研究しよう,伝えよう
研究しよう,伝えよう
 
論文に関する基礎知識2015
論文に関する基礎知識2015論文に関する基礎知識2015
論文に関する基礎知識2015
 
Survey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CVSurvey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CV
 
Celes20150627 seminar
Celes20150627 seminarCeles20150627 seminar
Celes20150627 seminar
 
Code4Lib 2013参加報告
Code4Lib 2013参加報告Code4Lib 2013参加報告
Code4Lib 2013参加報告
 
人生の意思決定を支える社会インフラとしての図書館
人生の意思決定を支える社会インフラとしての図書館人生の意思決定を支える社会インフラとしての図書館
人生の意思決定を支える社会インフラとしての図書館
 
若手研究者のための知的財産リテラシー講座(第1回予告)
若手研究者のための知的財産リテラシー講座(第1回予告)若手研究者のための知的財産リテラシー講座(第1回予告)
若手研究者のための知的財産リテラシー講座(第1回予告)
 
大学におけるオープンエデュケーショナル リソースと著作権処理の実状と課題
大学におけるオープンエデュケーショナル リソースと著作権処理の実状と課題大学におけるオープンエデュケーショナル リソースと著作権処理の実状と課題
大学におけるオープンエデュケーショナル リソースと著作権処理の実状と課題
 
社会人のためのシンポジウム発表入門 リーン論文作法
社会人のためのシンポジウム発表入門   リーン論文作法社会人のためのシンポジウム発表入門   リーン論文作法
社会人のためのシンポジウム発表入門 リーン論文作法
 
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
 
SciREX Policymaking Intelligent Assistant System
SciREX Policymaking Intelligent Assistant SystemSciREX Policymaking Intelligent Assistant System
SciREX Policymaking Intelligent Assistant System
 
学生の情報探索行動の実態調査 実施報告
学生の情報探索行動の実態調査 実施報告学生の情報探索行動の実態調査 実施報告
学生の情報探索行動の実態調査 実施報告
 
知的財産リテラシー講座
知的財産リテラシー講座知的財産リテラシー講座
知的財産リテラシー講座
 
オープンサイエンスの波に乗れ! : 研究力強化のためにできること
オープンサイエンスの波に乗れ! : 研究力強化のためにできることオープンサイエンスの波に乗れ! : 研究力強化のためにできること
オープンサイエンスの波に乗れ! : 研究力強化のためにできること
 
看護学科4年次専門科目「研究方法論」の実践報告
看護学科4年次専門科目「研究方法論」の実践報告看護学科4年次専門科目「研究方法論」の実践報告
看護学科4年次専門科目「研究方法論」の実践報告
 

More from Yasushi Hara

#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに
#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに
#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりにYasushi Hara
 
#経済学のための実践的データ分析 12. 機械学習とAIな経済学と最終レポート
#経済学のための実践的データ分析 12. 機械学習とAIな経済学と最終レポート#経済学のための実践的データ分析 12. 機械学習とAIな経済学と最終レポート
#経済学のための実践的データ分析 12. 機械学習とAIな経済学と最終レポートYasushi Hara
 
経済学のための実践的データ分析 3.データの可用性とプライバシー
経済学のための実践的データ分析 3.データの可用性とプライバシー経済学のための実践的データ分析 3.データの可用性とプライバシー
経済学のための実践的データ分析 3.データの可用性とプライバシーYasushi Hara
 
結婚パーティご挨拶 2018/02/12
結婚パーティご挨拶 2018/02/12結婚パーティご挨拶 2018/02/12
結婚パーティご挨拶 2018/02/12Yasushi Hara
 
(Big) Data for Research for "Science, Technology and Entrepreneurship"
(Big) Data for Research for "Science, Technology and Entrepreneurship"(Big) Data for Research for "Science, Technology and Entrepreneurship"
(Big) Data for Research for "Science, Technology and Entrepreneurship"Yasushi Hara
 
ノーベル賞と科学技術イノベーション政策 -選考プロセスと受賞者のキャリア分析
ノーベル賞と科学技術イノベーション政策-選考プロセスと受賞者のキャリア分析ノーベル賞と科学技術イノベーション政策-選考プロセスと受賞者のキャリア分析
ノーベル賞と科学技術イノベーション政策 -選考プロセスと受賞者のキャリア分析Yasushi Hara
 
「データで探るノーベル賞受賞者のキャリアと成果」
「データで探るノーベル賞受賞者のキャリアと成果」「データで探るノーベル賞受賞者のキャリアと成果」
「データで探るノーベル賞受賞者のキャリアと成果」Yasushi Hara
 
「ノーベル賞を倍増せよ!」とはいうけれど。
「ノーベル賞を倍増せよ!」とはいうけれど。「ノーベル賞を倍増せよ!」とはいうけれど。
「ノーベル賞を倍増せよ!」とはいうけれど。Yasushi Hara
 
Scenario-based Economic Model Approach to evaluate the impact of the Internet...
Scenario-based Economic Model Approach to evaluate the impact of the Internet...Scenario-based Economic Model Approach to evaluate the impact of the Internet...
Scenario-based Economic Model Approach to evaluate the impact of the Internet...Yasushi Hara
 
第16回 SciREX セミナー『新薬創製』
第16回 SciREX セミナー『新薬創製』第16回 SciREX セミナー『新薬創製』
第16回 SciREX セミナー『新薬創製』Yasushi Hara
 
Using web of science for Research 2016.01.25
Using web of science for Research 2016.01.25Using web of science for Research 2016.01.25
Using web of science for Research 2016.01.25Yasushi Hara
 
セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」
セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」
セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」Yasushi Hara
 
第13回 SciREX セミナー オープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注
第13回 SciREX セミナーオープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注第13回 SciREX セミナーオープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注
第13回 SciREX セミナー オープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注Yasushi Hara
 
Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...
Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...
Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...Yasushi Hara
 

More from Yasushi Hara (14)

#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに
#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに
#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに
 
#経済学のための実践的データ分析 12. 機械学習とAIな経済学と最終レポート
#経済学のための実践的データ分析 12. 機械学習とAIな経済学と最終レポート#経済学のための実践的データ分析 12. 機械学習とAIな経済学と最終レポート
#経済学のための実践的データ分析 12. 機械学習とAIな経済学と最終レポート
 
経済学のための実践的データ分析 3.データの可用性とプライバシー
経済学のための実践的データ分析 3.データの可用性とプライバシー経済学のための実践的データ分析 3.データの可用性とプライバシー
経済学のための実践的データ分析 3.データの可用性とプライバシー
 
結婚パーティご挨拶 2018/02/12
結婚パーティご挨拶 2018/02/12結婚パーティご挨拶 2018/02/12
結婚パーティご挨拶 2018/02/12
 
(Big) Data for Research for "Science, Technology and Entrepreneurship"
(Big) Data for Research for "Science, Technology and Entrepreneurship"(Big) Data for Research for "Science, Technology and Entrepreneurship"
(Big) Data for Research for "Science, Technology and Entrepreneurship"
 
ノーベル賞と科学技術イノベーション政策 -選考プロセスと受賞者のキャリア分析
ノーベル賞と科学技術イノベーション政策-選考プロセスと受賞者のキャリア分析ノーベル賞と科学技術イノベーション政策-選考プロセスと受賞者のキャリア分析
ノーベル賞と科学技術イノベーション政策 -選考プロセスと受賞者のキャリア分析
 
「データで探るノーベル賞受賞者のキャリアと成果」
「データで探るノーベル賞受賞者のキャリアと成果」「データで探るノーベル賞受賞者のキャリアと成果」
「データで探るノーベル賞受賞者のキャリアと成果」
 
「ノーベル賞を倍増せよ!」とはいうけれど。
「ノーベル賞を倍増せよ!」とはいうけれど。「ノーベル賞を倍増せよ!」とはいうけれど。
「ノーベル賞を倍増せよ!」とはいうけれど。
 
Scenario-based Economic Model Approach to evaluate the impact of the Internet...
Scenario-based Economic Model Approach to evaluate the impact of the Internet...Scenario-based Economic Model Approach to evaluate the impact of the Internet...
Scenario-based Economic Model Approach to evaluate the impact of the Internet...
 
第16回 SciREX セミナー『新薬創製』
第16回 SciREX セミナー『新薬創製』第16回 SciREX セミナー『新薬創製』
第16回 SciREX セミナー『新薬創製』
 
Using web of science for Research 2016.01.25
Using web of science for Research 2016.01.25Using web of science for Research 2016.01.25
Using web of science for Research 2016.01.25
 
セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」
セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」
セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」
 
第13回 SciREX セミナー オープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注
第13回 SciREX セミナーオープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注第13回 SciREX セミナーオープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注
第13回 SciREX セミナー オープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注
 
Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...
Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...
Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...
 

Recently uploaded

My Inspire High Award 2024「なぜ議会への関心が低いのか?」
My Inspire High Award 2024「なぜ議会への関心が低いのか?」My Inspire High Award 2024「なぜ議会への関心が低いのか?」
My Inspire High Award 2024「なぜ議会への関心が低いのか?」inspirehighstaff03
 
My Inspire High Award 2024  「正義って存在するの?」
My Inspire High Award 2024  「正義って存在するの?」My Inspire High Award 2024  「正義って存在するの?」
My Inspire High Award 2024  「正義って存在するの?」inspirehighstaff03
 
TEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdfTEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdfyukisuga3
 
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slidessusere0a682
 
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライドリアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライドKen Fukui
 
Divorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfDivorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfoganekyokoi
 
My Inspire High Award 2024「老いることは不幸なこと?」
My Inspire High Award 2024「老いることは不幸なこと?」My Inspire High Award 2024「老いることは不幸なこと?」
My Inspire High Award 2024「老いることは不幸なこと?」inspirehighstaff03
 
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライドリアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライドKen Fukui
 
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdfMy Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdfinspirehighstaff03
 
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」inspirehighstaff03
 
My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」inspirehighstaff03
 
My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」inspirehighstaff03
 
What I did before opening my business..pdf
What I did before opening my business..pdfWhat I did before opening my business..pdf
What I did before opening my business..pdfoganekyokoi
 
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」inspirehighstaff03
 
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」inspirehighstaff03
 
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」inspirehighstaff03
 
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」inspirehighstaff03
 
My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」inspirehighstaff03
 
My Inspire High Award 2024      「家族とは何か」
My Inspire High Award 2024      「家族とは何か」My Inspire High Award 2024      「家族とは何か」
My Inspire High Award 2024      「家族とは何か」inspirehighstaff03
 
Establishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfEstablishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfoganekyokoi
 

Recently uploaded (20)

My Inspire High Award 2024「なぜ議会への関心が低いのか?」
My Inspire High Award 2024「なぜ議会への関心が低いのか?」My Inspire High Award 2024「なぜ議会への関心が低いのか?」
My Inspire High Award 2024「なぜ議会への関心が低いのか?」
 
My Inspire High Award 2024  「正義って存在するの?」
My Inspire High Award 2024  「正義って存在するの?」My Inspire High Award 2024  「正義って存在するの?」
My Inspire High Award 2024  「正義って存在するの?」
 
TEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdfTEAMIN Service overview for customer_20240422.pdf
TEAMIN Service overview for customer_20240422.pdf
 
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
 
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライドリアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
リアル戦国探究in米沢 事前講座2スライド(スタッフ共有用)『両雄の強さの秘密』についてのスライド
 
Divorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfDivorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdf
 
My Inspire High Award 2024「老いることは不幸なこと?」
My Inspire High Award 2024「老いることは不幸なこと?」My Inspire High Award 2024「老いることは不幸なこと?」
My Inspire High Award 2024「老いることは不幸なこと?」
 
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライドリアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
リアル戦国探究in米沢 当日講座3スライド(スタッフ共有用)『糧は三度はさいせず』についてのスライド
 
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdfMy Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
 
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
 
My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」
 
My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」
 
What I did before opening my business..pdf
What I did before opening my business..pdfWhat I did before opening my business..pdf
What I did before opening my business..pdf
 
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
 
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
 
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
 
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
 
My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」
 
My Inspire High Award 2024      「家族とは何か」
My Inspire High Award 2024      「家族とは何か」My Inspire High Award 2024      「家族とは何か」
My Inspire High Award 2024      「家族とは何か」
 
Establishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfEstablishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdf
 

IRC セミナー 数字が教えてくれないこと -特許/論文データベース分析入門-

  • 2. WP シリーズの目的 • 目的 • 特許や論文のデータを使うことで解析できる範囲を知るために、まず分析手法を学ぶ • 手法 • パソコンを用いたハンズオンセミナー方式 (手を動かして覚える!) • 時間: • 土曜日の夕方に90分-120分程度 • 一ヶ月に一回程度 (第一期; 5-6回) • 場所: • 国立 (一橋大学イノベーション研究センター) または • 六本木 (政策研究大学院大学科学技術イノベーション政策研究センター) • 参加希望の方は, ya-hara@grips.ac.jp または @harayasushi (twitter) までご 連絡ください. 5/14/2015 2
  • 3. WPシリーズのスケジュール • [2015/1月] 第0回: 「数字が教えてくれないこと」 @一橋イノベーション研究センター • [2015/3/28] 第1回: 「数字が教えてくれること」 @一橋イノベーション研究センター • 特許や論文データはなぜイノベーション指標として活用されているのだろう • [2015/4/18]第2回: 「巨人の上に立つ」 @GRIPS SciREX センター • 論文データベース (Web of Knowledge, Scopus, Scival etc…) を用いた分析 • [2015/5/14] IRCセミナー @関西学院大学イノベーション研究センター • [2015/5/16] 第3回: 「select() すると幸せになれる理由」 @一橋イノベーション研究センター • IIP データベース/patR データベースを用いた日本特許分析 • [2015/6/27] 第4回: 「科学とイノベーションの関係」 • 組織学会@一橋大学のため第四週におこないます • サイエンスリンケージデータベースを用いた特許/論文の連結分析 • [2015/7/18]第5回: 「行間を読むっていろいろと大切」 • 書誌テキスト分析 (KHcoder) を使って分析できること • [2015/8/8] 第6回 : 「まとめ」 • 科学とイノベーションのあれこれは書誌情報からどこまでわかるのだろう 5/14/2015 3
  • 4. 今日取り上げる内容 1. はじめに: イノベーションを測るとはなにか? 2. 論文データベースの利用方法 • Web of Knowledge • Scopus 3. 特許データベースの利用方法 • 米国特許のデータベース • Thomson Innovation • Ultra Patent • USPTO database • 日本特許のデータベース • MySQL の導入 • Access の導入 • 基本的なコマンド 4. サイエンスリンケージデータベースの利用方法 5. 数字ではわからないこと (今日のまとめ) 5/14/2015 4 論文 特許 サイエンス リンケージ
  • 6. Framework of Innovation Indicators (Pakes and Griliches 1984) Other Economic Factors Non-Knowledge Factors of Production Output: Productivity Firm’s Value Patent Patenting Propensity Inputs to Innovation R&D, designing, marketing research etc… Knowhow and First Mover Advantage 5/14/2015 6
  • 7. Other Economic Factors Non-Knowledge Factors of Production Output: Productivity Firm’s Value Patent Patenting Propensity Inputs to Innovation R&D, designing, marketing research etc… Knowhow and First Mover Advantage Paper 5/14/2015 7 Framework of Innovation Indicators (Pakes and Griliches 1984)
  • 8. Other Economic Factors Non-Knowledge Factors of Production Output: Productivity Firm’s Value Patent Patenting Propensity Inputs to Innovation R&D, designing, marketing research etc… Knowhow and First Mover Advantage Paper In-tangible knowledge 5/14/2015 8 Framework of Innovation Indicators (Pakes and Griliches 1984)
  • 9. イノベーションのプロセスを明らかにする方法 • 定性的なアプローチ • なにかしらの理論モデルにもとづき、文献調査や実地調査、 インタビューなどを使って証拠を集める。集まった証拠にも とづきロジックを組み立てて、結果を観察する • データソース • 誰かが書いた文章 (論文や特許や報告書や白書 etc…) • 誰かの頭のなか (をインタビューを使って収集する) • 定量的なアプローチ • なにかしらの理論モデルにもとづき、統計データベースを 使ってデータを集める。それを回帰分析 etc… などの統計 的な処理をして、結果を観察する • データソース • 統計データベースを使う • サーベイ調査をする • 政府統計を使う 結論 インプリケーション (ex. 政策的な含意) 問い (リサーチクエスチョン) Literature Review (先行研究の調査) Hypothesis (問いに対する仮説の提示) 5/14/2015 9
  • 10. イノベーションプロセスを知る方法 1. ひとにきく 1. 発明したひと (=発明者) にきく 1. インタビューをする 2. サーベイ調査をする (アンケートを とる) 2. 発明に関与したひとにきく 1. インタビューをする 2. サーベイ調査をする (アンケートを とる) 2. 測ってみる 1. 特許ではかってみる 1. だれとだれが特許を書いたかでは かってみる 2. だれがだれの特許を引用している かではかってみる 2. 論文ではかってみる 1. だれとだれが論文を書いたかでは かってみる 2. だれとだれの論文を引用している かではかってみる 3. 特許と論文のつながりではかって みる 1. どの特許が、どの論文を引用して いるかで測ってみる 2. どの論文が、どの特許を引用して いるかで測ってみる 5/14/2015 10
  • 13. しかし: 単純にgoogle や bing で検索しても わからない場合がある → 専用のデータベースを使う 5/14/2015 13
  • 14. 今日取り上げる内容 1. はじめに 2. 論文データベースの利用方法 • Web of Knowledge • Scopus 3. 特許データベースの利用方法 • 米国特許のデータベース • Thomson Innovation • Ultra Patent • USPTO database • 日本特許のデータベース • MySQL の導入 • Access の導入 • 基本的なコマンド 4. サイエンスリンケージデータベースの利用方法 5. 数字ではわからないこと (今日のまとめ) 5/14/2015 14 論文 特許 サイエンス リンケージ
  • 16. 論文データベース • 何がわかるのか • だれが、いつ、どこで、どんな論文を書いたのかがわかる • だれが、いつ、どこで、どんな論文を引用したかがわかる • メリット • 先行研究を知ることができる • みんなが読んでいる論文がわかる! • インパクトファクターの高い論文がわかる!(就職に有利な!) • どんな研究が世の中で行われているかがわかる! 5/14/2015 16
  • 18. 前方引用と後方引用: Schumpeter 1947 の場合 時点 : t "An Approach to the Study of Entrepreneurship," THE TASKS OF ECONOMIC HISTORY (Supplemental Issue of THE JOURNAL OF ECONoMIc HISTORY), VI (1946), 1-15 Oscar Lange, "A Note on Innovations," Review of Economic Statistics, XXV (1943), 19-25 F. W. Taussig, Inventors and Money-Makers (New York: The Macmillan Company, 1915). Fritz Redlich, The Molding of American Banking—Men and Ideas (New York: Hafner Publishing Company, 1947). Robert A. Gordon, Business Leadership in the Large Corporation (Washington, D.C.: The Brookings Institution, 1945). F. J. Marquis and S. J. Chapman on the managerial stratum ,of the Lancashire cotton industry in the Journal of the Royal Statistical Society, LXXV, Pt. III (1912). 293-306. 前方引用後方引用 5/14/2015 18
  • 20. 論文のデータベースを使うと何がわかる? • 著者の数が多い論文は被引用数が多くなる? • どういうジャンルの論文を, 特定の大学や企業が投稿している? • ある産業内では, どういった企業が論文を多く投稿している? • スターサイエンティストはだれ? • 引用する論文が多いほど, 被引用数が増える? • 博士ホルダーが書いた論文は, 普通の研究者に比べてパフォーマン スが高くなる? • 様々なジャンルに投稿している研究者のパフォーマンスは高くな る? 5/14/2015 20
  • 21. ただし • 世の中に「完備な」データベースはありません • 「大人は嘘つきではありません、ただ間違いをするだ けなのです…」 • 組織名が違う • 自分の名前が違う • 所属国が違う • 論文のカテゴリが違う ことが多々出てきます。 • 自らのリサーチクエスチョンに合わせて精緻な分析 を行うためには、(1) 問いに対応する最適なデータ ベースを選び, (2) データのクリーニング作業 を行う 必要があります 5/14/2015 21
  • 22. (英文)論文データベース 名前 Web of Knowledge Scopus 作っている会社 トムソン・ロイター エルゼビア カバー範囲 ・社会科学文献の書誌および引用情報 (1898年-2015年) ・自然科学文献の書誌および引用情報 (1900年-2015年) ・5000以上の出版社の21,000誌以上の学術ジャーナ ル ・20000タイトル以上の査読ジャーナル ・370タイトルのブックシリーズ ・550万件以上の会議録 メリット ・過去データが豊富 ・社会科学のカバー率が高い ・他のデータベースとリンクさせることが比較的容易 ・分野分類が (Web of Knowledge) に比べて明確 ・自然科学のカバー率は Web of Knowledge に比べ高 い ・企業名および著者名の名寄せの精度が高いこともな いみたい・・・ デメリット ・1945年以前のデータはカバー範囲が限られている ・カテゴリ分類が不明確 ・現在カバー範囲が(Web of Knowledge に比べ)狭い [引用情報は1996年以降のみカバー] (2016年に向け拡大される予定) 価格 すごく高い! すごく高い! 気をつけること ・一橋大学では利用可能 ・大学によってカバーしているデータ範囲が違う 一橋大学では利用不能 (部局によっては契約している 場合あり) 5/14/2015 22
  • 23. まず注意すること: データのカバー範囲 • Web of Knowledge やScopus は大学によってカバーしているデータの 範囲が異なります • ある大学では検索できた結果が, 異なる大学では検索出来ないこと があります 2015/5/13 23
  • 24. Web of knowledge のデータカバー範囲を確認す る方法 (1) 1. Web of Knowledge にアクセスし, “Web of Knowledge Core Collection” を選択する 2015/5/13 24
  • 25. Web of knowledge のデータカバー範囲を確認す る方法 (2) 2. 画面下にある “詳細設定” をクリックする 2015/5/13 25
  • 26. Web of knowledge のデータカバー範囲を確 認する方法 (3) • GRIPSの場合 • Science Citation Index Expanded (1993-現在) • Conference Proceedings Citation Index – Science (1990-現在) • 一橋大学の場合 • Science Citation Index Expanded (1900-現在) • Social Sciences Citation Index (1900-現在) • Arts & Humanities Citation Index (1975-現在) 2015/5/13 26
  • 27. Web of knowledge のデータカバー範囲を確 認する方法 (4) • 関西学院大学の場合: http://library2.kwansei.ac.jp/information/web_database/uweb_data base_dlist.cgi • “関西学院大学では1975年から現在までの人文科学・社会科学・自然科学 の学術論文情報と1990年から現在までの会議録などProceedingsを検索す ることができます。また、文献管理ツールEndNote Webもあわせて利用でき ます。 検索可能範囲 ・Science Citation Index Expanded (SCI-EXPANDED) --1975-現在 ・Social Sciences Citation Index (SSCI) --1975-現在 ・Arts & Humanities Citation Index (A&HCI) --1975-現在 ・Conference Proceedings Citation Index- Science (CPCI-S) --1990-現在” 5/14/2015 27
  • 28. 2-1. Web of Knowledge • 一橋の学内からはどこからでも 利用可能 • 一橋大学図書館の My Library からリモートログインで利用可 能 • GRIPS でも利用可能 5/14/2015 28 http://ip-science.thomsonreuters.jp/products/web-of- science/yokuwakaru/
  • 29. Excercise1: Web of Knowledge を使って一橋大学か ら2013年に公刊された論文を取り出してみる • 1. 検索 -> Web of Science Core Collection -> 詳細検索 を選ぶ 5/14/2015 29
  • 30. Excercise1: Web of Knowledge を使って一橋大学の 2013年に公刊された論文を取り出してみる • 検索条件を入力する • PY: 年 • OG: 組織名 • [検索] をクリックする 5/14/2015 30
  • 31. Excercise1: Web of Knowledge を使って一橋大学の 2013年に公刊された論文を取り出してみる • 検索が実施され, データが抽出される. 検索履歴より “80” をクリック する 5/14/2015 31
  • 32. Excercise1: Web of Knowledge を使って一橋大学 の2013年に公刊された論文を取り出してみる • 検索結果が表示される 5/14/2015 32
  • 33. Excercise1: Web of Knowledge を使って一橋大学の 2013年に公刊された論文を取り出してみる • 画面の一番下までスクロールし, “他のファイルフォーマットで保存” を選択する 5/14/2015 33
  • 34. Excercise1: Web of Knowledge を使って一橋大学の 2013年に公刊された論文を取り出してみる • [レコード件数]から保存するレコード数 • [レコードコンテンツ]から”詳細表示と引用文献” • [ファイルフォーマット]から”タブ区切り(Win (またはMac))” を選択し 保存をクリックする 5/14/2015 34
  • 35. Excercise1: Web of Knowledge を使って一橋大学の 2013年に公刊された論文を取り出してみる • 取り出したテキストファイルをExcel に取り込む • H Shimizu 先生が見つかったりする 5/14/2015 35
  • 36. Excercise1: Web of Knowledge を使って一橋大学の 2013年に公刊された論文を取り出してみる • Alternative: エクセルを使うのがめんどくさい人向け • [レコード件数]から保存するレコード数 • [レコードコンテンツ]から”詳細表示と引用文献” • [ファイルフォーマット]から”テキスト” を選択し保存をクリックする 5/14/2015 36
  • 37. Excercise1: Web of Knowledge を使って一橋大学の 2013年に公刊された論文を取り出してみる • Raw Data っぽいファイルが出力される • 自分でコードを書いて処理するか, Vantage Point (後述)を使う • ヒント: 終端処理はEF なので, そいつと先頭行を潰せばいくらでもデータ連結 が可能 5/14/2015 37
  • 38. 「研究分野」と「Web of Knowledge Category」 • 研究分野 • 研究分野は、すべての Web of Science 製品データベースで共有さ れる主題分野を構成します。その結 果、同じ主題に属する複数のデータ ベースのドキュメントを識別、検索、 分析することができます。 • Current Contents Connect およ び Web of Science Core Collection に 含まれる各ジャーナルおよび書籍は、 Web of Science の分野の少なくとも 1 つに割り当てられます。Web of Science の各分野は 1 つの研究分野 にマップされます。 • Web of Knowledge Category • “Web of Science Core Collection に含 まれるすべてのジャーナルおよび書 籍は、以下の主題分野の少なくとも 1 つに割り当てられます。Web of Science Core Collection のすべてのレ コードは、[Web of Science の分野] フィールドに出版物の主題分野を含 みます。” ※. ひとつの論文に対して複数の Web of Knowledge Category が割り当てられ ていることがある 5/14/2015 38
  • 39. Web of Knowledge で注意するポイント • カテゴリ分けが1:1 の関係にはなっていない • 精緻に行うためには, ジャーナル名などで名寄せする必要性 • 部局名などの名寄せが行われていない • NISTEP 表記ゆれ辞書などを活用する • Scopus を利用する(?) • Web 経由では, 1回500件しかダウンロードできない • Excel でひたすらくっつけていくか, Raw Data 方式でダウンロードしひたすら 連結, 処理をしたのち手元のSQL などに放り込む • ロボット検索すると怒られます 5/14/2015 39
  • 40. NISTEP: “大学・公的機関名英語表記ゆれ テーブル(Web of Science版)(Ver.2014.1)” • “1996-2012 年の期間にWeb of Scienceに採録された論文のうち、日 本の機関に所属する著者を含む論文のデータ(約150万件)を対象に、 機関名英語表記のゆれを調査・分析しリスト化した結果” • http://www.nistep.go.jp/research/scisip/randd-on-university からダ ウンロード可能 • カバー範囲 1996-2012 • Creative Commons BY-SA 5/14/2015 40
  • 41. “大学・公的機関名英語表記ゆれテーブル (Web of Science版)(Ver.2014.1)” • F 列が表記バリエーションになっているので, C列の機関ID で Matching させる • Web of Knowledge で取り出したデータと, 例えばExcel なら vlookup などして連結させる 5/14/2015 41
  • 42. 引用分析 • 後方引用をたどることで, 発明に至る知識の流れを明らかにする • JST プロジェクトの Feasibility Study • Shuji Nakamura Patent に至るまでの Main Path • 特許と、特許に引用された論文について調査 • ソース: Web of Knowledge / Thomson Innovation 5/14/2015 42
  • 43. Network 全体 (属性付き) 赤色は Main Path に選択さ れた Node を示す.5/14/2015 43
  • 44. 1930s 1960s 1970s 1990s 2000s 1910-2007 (1次引用すべて導入; 上位12社明記) 1980s 5/14/2015 44
  • 45. 2-2. Scopus • エルゼビアが提供する論文データ ベース • “Scopus has twice as many titles and over 30% more publishers listed than any other A&I database” • Journals や Book, Conference Papers や Patents もカバー • Scival を用いることで, 研究機関ご とのパフォーマンスを知ることも可 能 • なお、一橋では現時点 (2015年) で は契約していないので使えません 5/14/2015 45
  • 46. Scopus のインターフェース 例: シュンペーターの論文を探してみよう 1. www.scopus.com を開き, 「著者検索」に Last Name と First Name を入力する. 5/14/2015 46
  • 47. Scopus のインターフェース 例: シュンペーターの論文を探してみよう 2. 著者名の候補が表示されるので, 該当する著者をクリックする 5/14/2015 47
  • 49. Scopus を使う上で注意するポイント • Web of Knowledge に比べたらカ テゴリや組織や研究者個人の 名寄せがキッチリしているかと 思ったけど, 別にそんなことはな いみたい • データのカバー範囲が広い事, データベース構造が Web of Knowledge に比べ比較的単純 なのがメリットなくらい 5/14/2015 49 https://twitter.com/noricoco/status/585677912705261569
  • 52. Scopus-NISTEP大学・公的機関名辞書対応 テーブル(ver.2013.1) • “科学論文の計量的分析に用いられるデータベース、Scopusの論文 ID(Scopus_eid)とNISTEP大学・公的機関名辞書の機関ID(NID)の対応 テーブルです。1996-2010 年の期間にScopusに採録された論文のう ち、日本の機関に所属する著者を含む論文のデータ(約150万件)を 対象に、国内の大学・公的機関の機関名称の名寄せを行った結果” • http://www.nistep.go.jp/research/scisip/randd-on-university からダ ウンロード可能 • 論文IDごとに機関ID が割り振られているので, より正確に組織名で 名寄せができる • データ量が巨大なので、MySQL/PostgreSQL か Access を使いましょう • Excel でなんとかやれないこともないけど大変 5/14/2015 52
  • 54. では, Web of Knowledge? Scopus? Or Google Scholar? • (Kulkarni, Aziz, Shams and Busse 2009) • Google Scholar, Web of Knowledge と Scopus の Citation 推移を比較 • “Cohort study of 328 articles published in JAMA, Lancet, or the New England Journal of Medicine between October 1, 1999, and March 31, 2000. Total citation counts for each article up to June 2008 were retrieved from Web of Science, Scopus, and Google Scholar.” • Findings • “Compared with Web of Science, Scopus retrieved more citations from non–English- language sources (median, 10.2% vs 4.1%) and reviews (30.8% vs 18.2%), and fewer citations from articles (57.2% vs 70.5%), editorials (2.1% vs 5.9%), and letters (0.8% vs 2.6%) (allP < .001).” 5/14/2015 54 JAMA. 2009;302(10):1092-1096. doi:10.1001/jama.2009.1307
  • 55. 2015年現時点での論文データベース利用法 • Web of KnowledgeとScopus, どちらにもデメリットとメリットがある • Web of Knowledge: データベース全体の構造が複雑, かつノイズデータも多いけど 長い期間をカバーしている • Scopus: Web of knowledge に比べればデータベース全体の構造は比較的単純. Author ID や Affiliation ID などを備えているので一見 Name-Matching の手間は省 けそうだけど, やはりノイズデータが含まれている. 今後に期待. • (高いから比べられないし, だいたいの大学ではひとつしか使えないし) 論 文データベースは Web of Knowledge, Scopus のいずれかを使う • 恐らく, 両データベースの接合を試みるだけでたくさんの Paper が書ける (けれど大変) • 指標を使って, クエリを投げてデータを取り出した後, 整合性が取れている かチェックしていく (別の組織が入っていないか, 別の国が入っていないか, ダブルカウントしていないか etc…) 5/14/2015 55
  • 57. 今日取り上げる内容 1. はじめに 2. 論文データベースの利用方法 • Web of Knowledge • Scopus 3. 特許データベースの利用方法 • 米国特許のデータベース • Thomson Innovation • Ultra Patent • USPTO database • 日本特許のデータベース • MySQL の導入 • Access の導入 • 基本的なコマンド 4. サイエンスリンケージデータベースの利用方法 5. 数字ではわからないこと (今日のまとめ) 5/14/2015 57 論文 特許 サイエンス リンケージ
  • 59. 特許データベース • 何がわかるのか • だれが、いつ、どこで、どんな特許を書いたのかがわかる • だれが、いつ、どこで、どんな特許を引用したかがわかる • メリット • みんなが読んでいる特許がわかる! • インパクトファクターの高い特許がわかる! • どんな研究開発が世の中で行われているかがわかる! 5/14/2015 59
  • 60. 特許データベース • アメリカ特許のデータベース • Google Patent • USPTO Patents • Ultra Patents • Thomson Innovation • ヨーロッパ特許のデータベース • Espacenet • PATSTAT • 日本の特許データベース • 特許図書館 • IIP データベース • 研究用特許データベース (patR) 5/14/2015 60
  • 61. 3-1. PATSTAT • EPO の特許データベース • Web インターフェースも存在 • Raw Data 版は有償 • Web 版 PATSTAT は2ヶ月間無料 5/14/2015 61
  • 65. PATSTAT Online (beta) • http://www.epo.org/searching/subscription/patstat-online.html 5/14/2015 65
  • 66. Excercise2. 日本に属する組織または個人が2014年 に出願した特許のうち, 他国の組織または企業とど のくらいコラボレーションをしているのか調べてみる • クエリ • SELECT COUNT(*) AS numberOfCommonApplications, p1.doc_std_name as name1, p1.person_ctry_code as cc1, p2.doc_std_name as name2, p2.person_ctry_code as cc2 FROM tls206_person p1 JOIN tls207_pers_appln pa1 ON p1.person_id = pa1.person_id JOIN tls207_pers_appln pa2 ON pa1.appln_id = pa2.appln_id JOIN tls206_person p2 ON pa2.person_id = p2.person_id join tls201_appln p3 on pa1.appln_id = p3.appln_id WHERE p1.person_ctry_code = 'JP' AND p3.appln_filing_date >= '2014-01-01' AND p3.appln_filing_date <= '2014-12-31‘ AND pa1.appln_id > 0 AND pa2.appln_id > 0 AND p1.person_ctry_code <> p2.person_ctry_code GROUP by p1.doc_std_name, p1.person_ctry_code, p2.doc_std_name, p2.person_ctry_code ORDER BY numberOfCommonApplications DESC, p1.doc_std_name ASC, p2.doc_std_name ASC 5/14/2015 66
  • 67. Excercise2.コラボレーション国ランキング US 855 (空白) 489 GB 131 DE 105 KR 101 CN 82 CA 59 SG 57 FR 57 NL 27 SA 20 CH 18 BE 18 IL 15 TH 14 LU 13 IN 11 5/14/2015 67
  • 68. Excercise2.企業ランキング PANASONIC CORP 100 SONY CORP 81 SHARP KK 46 KOBE STEEL LTD 41 FUJITSU LTD 36 TAKEDA PHARMACEUTICAL 28 NISSAN MOTOR 27 OTSUKA PHARMA CO LTD 23 HONDA MOTOR CO LTD 23 NIPPON STEEL & SUMITOMO METAL 20 TEXAS INSTRUMENTS JAPAN 20 TOSHIBA KK 20 CANON KK 20 HADANO HIROYUKI 19 NEC CORP 16 SHIONOGI & CO 14 SAWADA HARUKO 13 TOSHIBA TECHNO CT INC 13 SUGIO TOSHIYASU 13 IBM JAPAN 12 SATO YOSHITAKA 11 KYOCERA CORP 11 UNITIKA LTD 10 TATEISHI TAKAAKI 10 MASAKI TAKAKI 10 FUNAI ELECTRIC CO 105/14/2015 68
  • 69. Excercise2.コラボレーション国x企業 国名 PANASONIC CORP SONY CORP SHARP KK KOBE STEEL LTD FUJITS U LTD TAKEDA PHARMACEU TICAL NISSAN MOTOR HONDA MOTOR CO LTD OTSUKA PHARMA CO LTD TOSHI BA KK TEXAS INSTRUMENTS JAPAN NIPPON STEEL & SUMITOMO METAL CA NO N KK 総 計 (空白) 68 6 40 33 14 27 1 5 3 16 213 US 6 56 3 7 5 21 5 10 12 4 129 GB 9 3 17 8 7 5 1 50 CN 12 1 10 6 1 1 31 FR 1 4 10 15 KR 8 8 DE 3 4 7 SG 6 6 BE 3 1 4 MY 4 4 5/14/2015 69
  • 70. 参考文献 • PATSTAT ONLINE (beta) • http://www.epo.org/searching/subscription/patstat-online.html • SQL Self-Study Course • http://documents.epo.org/projects/babylon/eponet.nsf/0/55df36d61f27cdb 2c1257b1600323d91/$FILE/patstat_introduction_sql_en.pdf • Data Elements of PATSTAT Raw Data • http://documents.epo.org/projects/babylon/eponet.nsf/0/95da6bccf12e54a 1c1257aa1002e2d1d/$FILE/patstat_data%20elements_v1.1.pdf 5/14/2015 70
  • 71. 研究用特許データベース • (1)整理標準化データ (patR データベース) • 特許庁での特許の出願、審査請求、拒絶、権利維持、最終処分まで、手続 きを記録したもの • 提供時期は1964年以降2010年3月まで • データ量が多いため、研究に必要な項目を限定してデータベースに格納 • (2)公報データ (td_5 データベース) • 特許の明細書および書誌情報を年別・公報種別によって記録したもの • 発行時期は公開公報:1993年から2012年まで • 特許公報:1994年から2012年まで • 公表公報:1996年から2012年まで • 再公表公報:1996年から2012年まで。すべてのデータを格納。 5/14/2015 71
  • 72. (1)patR (ER図; 抜粋) 5/14/2015 72 ・特許庁の手続きデータを工業所 有権情報・研修館が提供している 整理標準化データが元データ。 ・app_info が中心にデータが構成さ れるリレーショナル・データベース 方式
  • 73. リレーショナル・データベース • Excel のようにひとつのテーブルですべてのデータを管理するのでは なく, キーを介して複数のテーブルから構成されるデータベース 5/14/2015 73 中間試験の成績 ・学籍番号 ・問1の得点 ・問nの得点 期末試験の成績 ・学籍番号 ・問1の得点 ・問nの得点 平常点の成績 ・学籍番号 ・出席点 ・小テストの得点 総合成績 ・学籍番号 ・総合得点(=中間試験+ 期末試験+平常点) ・最終成績
  • 74. (1) patR • app_info 出願経過 テーブル 5/14/2015 74 フィールド 名 型 インデックス 内容(カッコ内はコー ド表インデックス) 1 app_num varchar(20) 出願番号:すべて半角(B0010) 2 count int(11) ワーク用カウンタ 3 title varchar(255) 発明の名称 4 app_date date 出願日 5 renewal_date date 更新日付:出願マスタ 6 id bigint(20) 元処理番号 7 pat_app_num varchar(10) 原出願記事番号(B0010) 8 app_type varchar(4) 原出願記事関連種別(B0310,C0025) 9 pub_num varchar(10) 公開番号 10 pub_date date 公開日 11 exam_pub_nu m varchar(10) 公告番号 12 exam_pub_da te date 公告日 13 intl_app_num varchar(12) 国際出願番号 14 pry_cnty char(2) 筆頭優先権主張国 15 num_claim_a pp int(11) 請求項の数:出願時 16 num_claim_e xamed int(11) 請求項の数:公告決定時 17 num_claim_re g int(11) 請求項の数:登録査定時 18 reg_num varchar(19) 特許番号または登録番号 19 reg_date date 登録日 20 rej_rsn char(2) 拒絶理由条文コード(C0710) 21 cnln_cl char(2) 本権利抹消識別(C0780) 22 term_dat e date 本権利消滅年月日 23 pry_claim _date date 優先権主張日 24 dspn_exa m_date date 審査最終処分日 25 dspn_exa m_code char(3) 審査最終処分種別コード(C0360) 26 apnum varchar(1 3) MUL ‘JPP’をapp_numの先頭につけた文字列 27 fin_decn char(1) 査定種別コード(C0350) 28 fin_decn_ date date 査定発送日 29 trans_sub m_date date 翻訳文提出日 30 trans_pub _num varchar(1 0) 公表番号 31 idp int(11) PRI 本テーブルの固有行番号 32 num_clai m_reg_in fo int(11) 請求項の数(登録情報) 33 udate date ワーク用日付フィールド 34 IPC8 varchar(2 55) 国際特許分類第8版 35 acc_exam _mark char(1) 早期審査マーク(C0240)
  • 75. (1) patR • citation 引用情報 テーブル 5/14/2015 75 フィールド 名 型 インデック ス 内容(カッ コ内はコー ド表イン デックス) 1 citing varchar(10) MUL 引用特許 出願番号 (B0010) 2 cited varchar(10) MUL 被引用特 許出願番 号(B0010) 3 type int(11) MUL 種別(1:審 査官引用 2:特許公 報に記載さ れた引用 3:上記両 方に記載 の引用) フィールド名 型 インデックス 内容(カッコ内 はコード表イン デックス) 1 ids int(11) PRI 固有行番号 2 name text 氏名 3 addr text 住所 4 prefecture char(2) 住所の国県 コード(C0050) 5 id_num varchar(9) 出願人コード (B0070) 6 req_type char(1) 個法官別コー ド(C0070) 7 type int(11) ワーク用 8 name1024 varchar(1024) MUL 氏名のインデッ クス文字列 9 addr1024 varchar(1024) MUL 住所のインデッ クス文字列 • applicant 出願人 right_holder 権利者テーブル
  • 76. (1) patR • inventor 発明者テーブル 5/14/2015 76 フィールド名 型 インデックス 内容(カッコ内 はコード表イン デックス) 1 name text 氏名 2 addr text 住所 3 req_type char(1) 個法官別コー ド(C0070) 4 organization Varchar(255) 所属する組織 の名称 5 ids int(11) PRI 固有行番号 6 name1024 varchar(1024) MUL 氏名のイン デックス文字 列 7 addr1024 varchar(1024) MUL 住所のイン デックス文字 列 フィールド名 型 インデックス 内容(カッコ内は コード表インデック ス) 1 apnum varchar(13) MUL ‘JPP’+出願番号 (B0010) 2 app_num varchar(10) MUL 出願番号(B0010) 3 pub_num varchar(10) MUL 公開番号 4 intl_app_num varchar(12) MUL 国際出願番号 5 intl_pub_num varchar(12) MUL 国際公開番号 6 trans_pub_num varchar(10) MUL 公表番号 7 exam_pub_num varchar(10) MUL 公告番号 8 reg_num varchar(10) MUL 特許番号または登 録番号 9 ref_pub_num varchar(13) MUL 文献公開番号 10 ref_trans_pub_nu m varchar(13) MUL 文献公表番号 11 ref_examd_pub_n um varchar(13) MUL 文献公告番号 12 ref_reg_num varchar(13) MUL 文献登録番号 13 ref_intl_pub_num varchar(13) MUL 文献国際公開番 号 • numbers 番号表テーブル
  • 77. Exercise 3: patR データベースをmysql クライアン トを使って分析してみる • 0. mysql クライアントを http://dev.mysql.com/downloads/mysql/ より ダウンロードする • Linux と Mac, Windows の場合で異なる 5/14/2015 77
  • 78. Exercise 3: patR データベースをmysql クライ アントを使って分析してみる • 0-1. mysql クライアントをインストールする • 注意点その1: 文字コードに utf8 を利用すること 5/14/2015 78
  • 79. Exercise 3: patR データベースをmysql クライア ントを使って分析してみる • 0-1. mysql クライアントをインストールする • 注意点その2: クライアントPC 上でmysql サービスが動作していることを確認 すること 5/14/2015 79
  • 80. Exercise 3: patR データベースをmysql クライア ントを使って分析してみる • 1. mysql データベースにアクセスする • mysql –h (データベースサーバ名) –u (ユーザ名) –p とタイプし, パスワードを 入力する 5/14/2015 80
  • 81. Exercise 3:(つづき) • 2. parR データベースの中身を チェックする • “show tables from patr5_1123;” とタイプし, part5_1123 テーブル の中身をチェックする. • mysql コマンドの末尾には, セミ コロン “;” を明記すること • app_info や inventor など, どの ようなデータが格納されている かチェックできる 5/14/2015 81
  • 82. Exercise 3:(つづき) • 3. テーブルの構造をチェックして みる • “desc (チェックするデータベース).( テーブル名)” で, フィールド名, デー タの格納タイプ (文字列なのか, 日 時なのか etc),主キー (格納された データ情報が一意なものであるか) なのかチェックできる. 5/14/2015 82
  • 83. Exercise 3:(つづき) • 4. 実際にデータを取得してみ る • 2011年に出願された特許のう ち, 1. 審査官引用件数の合計 2. 特許公報に記載された引用の 件数の合計をそれぞれ抽出し てみる • クエリをなげると, それぞれ合 計数を取得することができる 5/14/2015 83
  • 84. Exercise 3:(つづき) • 4. 実際にデータを取得してみる (大まかなコ マンドの説明) • Select : 「データをデータベースから引っ張って きますよ」という宣言 • Count(*) : 「ひっぱってきたデータを数え上げて みますよ」という説明 • from patr5_1123.citation : 「patr5_1123 という データベースのなかの, citation テーブルから データを引っ張りますよ」 という宣言 • Where : 「ただし, 以下の条件でね」という宣言 • where citing like : 「citing のデータがこんな感じの がほしいです」 • ‘2011%’ : 先頭が2011 ではじまるデータ • and : かつ • (type = 1 or type = 3) : (1:審査官引用 3:上記両 方に記載の引用) • (type = 2) : (2:特許公報に記載された引用 ) 5/14/2015 84 まとめてみると、「patr5_1123 データベースの中の citation テーブルのうち, citing フィールドのデータの 先頭が 2011 ではじまり、かつ “1. 審査官引用または 3. 上記両方記載に引用” にカテゴライズされてい るデータの数を数えてね」になります
  • 85. Exercise 3:(つづき) • 5. IPCデータを抽出してみる • Patr5_1123 データベースの pub_IPC より, IPC_CLASS と合計 数を, CLASS ごとにもとめ, カウン ト数で並べ直す. • count(*) as count ; 合計数を count と名付ける • group by IPC_class ; IPC_class でま とめる • order by count ; count 数でソート する 5/14/2015 85 列1 IPC_Class 詳細 カウント数 1H01L 半導体装置 固体装置 それらの部品の製造 処理に特に適用される方法 2567401 2G06F データ処理装置 1863464 3H04N データ転送, テレビジョン装置 1363731 4A61K 医薬品製剤 1298939 5A61P 化合物または医薬製剤の特殊な治療活性 971151 6G03G 光,熱,電子を照射して原画像の記録を行なうための記録材料 841739 7G11B 機械的カッティング,変形 プレスによる,例.溝 ピットの,記録 機械的感知によ る再生 そのための記録担体 829606 8B41J タイプライタの種類または選択的プリンティング機構の種類 723902 9G01N 材料の調査分析, サンプリング 調査用標本の調製 693957 10G02B 使用物質によって特徴づけられた光学要素 光学要素のための光学的コーティ ング 619495
  • 86. Exercise 3:(つづき) • 6. 特定の発明者のデータを抽出してみる • アクテムラの開発者である大杉先生の特許一覧データを探してみる • 実行するコマンド • 公開日, 公開番号, 特許名, 発明者名の情報を抽出 5/14/2015 86 select app_info.pub_date, app_info.pub_num, app_info.title, inventor.name from inventor inner join inventor_corr_last on inventor.ids=inventor_corr_last.ids inner join app_info on inventor_corr_last.idp=app_info.idp where inventor.name='大杉 義征';
  • 87. Exercise 3:(つづき) • 実行するコマンドの説明 (1) 5/14/2015 87 select app_info.app_date, app_info.pub_date, app_info.pub_num, app_info.title, inventor.name from inventor inner join inventor_corr_last on inventor.ids=inventor_corr_last.ids inner join app_info on inventor_corr_last.idp=app_info.idp where inventor.name='大杉 義征'; App_info テーブルより、 ・特許の出願日 (app_date) ・特許の公開日 (pub_date) ・特許のタイトル (title) ・特許の公開番号 (pub_num) Inventor テーブルより、 ・特許の発明者名 (inventor) を取得 (select) する Inventor テーブルよりデータをもってくる inventor. テーブルの name フィールドが “大杉 義征” なデータをもってくる
  • 88. select app_info.app_date, app_info.pub_date, app_info.pub_num, app_info.title, inventor.name from inventor inner join inventor_corr_last on inventor.ids=inventor_corr_last.ids inner join app_info on inventor_corr_last.idp=app_info.idp where inventor.name='大杉 義征'; Exercise 3:(つづき) • 実行するコマンドの説明 (2) 5/14/2015 88 Inventor_corr_last テーブルの ids キーを介して, inventor テー ブルと app_info テーブルの情報を接続する (inner join)
  • 89. Exercise 3:(つづき) • 実行結果 • 大杉先生の特許一覧が出力される 5/14/2015 89 app_date pub_date pub_num title name 1976/4/12 1977/1/29 1977012141新規アミノ安息香酸誘導体、その製法及び医薬組成物 大杉 義征 1977/11/2 1979/5/29 1979066645安息香酸誘導体 大杉 義征 1978/6/9 1979/12/26 1979163540テレフタル酸アミド誘導体及びその塩 大杉 義征 1978/12/5 1980/6/10 1980076853テレフタル酸アミド誘導体の製法 大杉 義征 1986/1/22 1986/11/27 1986267515腎炎治療剤 大杉 義征 1986/1/24 1986/11/27 1986267516気管支拡張剤 大杉 義征 1986/5/22 1987/3/9 1987053966新規ピリジン誘導体 大杉 義征 1987/11/20 1988/10/5 1988239217抗アレルギー剤 大杉 義征 1989/6/30 1991/2/14 1991034932糸球体腎疾患治療剤 大杉 義征 1990/4/9 1991/12/20 1991291236感作T細胞関与疾患の治療剤 大杉 義征 1990/8/17 1992/3/31 1992099800組換えマウスIL―6レセプターの製造方法 大杉 義征 1995/10/6 1996/8/13 1996208514IL−6アンタゴニストを有効成分とする慢性関節リウマチ治療剤 大杉 義征 1998/8/14 1999/5/25 1999139988抗IL−6レセプター抗体を有効成分として含有する全身性エリテマトーデスの予防および/または治療剤 大杉 義征 2002/9/25NULL NULL ウイルムス腫瘍遺伝子に対する新規なアンチセンスオリゴヌクレオチド誘導体 大杉 義征 2003/9/18NULL NULL 癌抑制遺伝子WT1の産物に基づく癌抗原とカチオン性リポソームとを含んで成る癌ワクチン 大杉 義征 2003/11/7NULL NULL C型肝炎ウイルスに対する新規なアンチセンスオリゴヌクレオチド誘導体 大杉 義征 2005/5/30 2005/9/15 2005247872抗IL−6レセプター抗体を有効成分として含有する全身性エリテマトーデスの予防および/または治療剤 大杉 義征 2006/11/15NULL NULL 細胞傷害性T細胞の誘導抑制剤 大杉 義征 2008/10/3 2009/4/16 2009079054癌抑制遺伝子WT1の産物に基づく癌抗原とカチオン性リポソームとを含んで成る癌ワクチン 大杉 義征 2009/5/25 2009/8/20 2009185073抗IL-6レセプター抗体を有効成分として含有する全身性エリテマトーデスの予防および/または治療剤 大杉 義征
  • 91. 今日取り上げる内容 1. はじめに 2. 論文データベースの利用方法 • Web of Knowledge • Scopus 3. 特許データベースの利用方法 • 米国特許のデータベース • Thomson Innovation • Ultra Patent • USPTO database • 日本特許のデータベース • MySQL の導入 • Access の導入 • 基本的なコマンド 4. サイエンスリンケージデータベースの利用方法 5. 数字ではわからないこと (今日のまとめ) 5/14/2015 91 論文 特許 サイエンス リンケージ
  • 94. Science Linkage • References Cited in Patent • “Other Publications” • Proceeding in Academic Conference • Scientific Paper • “Patents” • US Patents • Foreign Patents 945/14/2015
  • 95. Science Linkage Example: (Imaginary?) STAP Cell Patent, and cited iPS Cell Paper • Patent (Vacanti Kojima Obokata… 2013) 95 ・Paper (Takahashi and Yamanaka 2006) 7 years 5/14/2015
  • 96. サイエンスリンケージデータベースのデータセット • サイエンスリンケージデータベース: 特許と文献の引用関係に基づくリレーショナル・データベース • データソース:Derwent Patent Index Database、DIIおよびWeb of Science (SCIE, SSCI) • 特許発行年が1992年から2011年で3極(JP,US,EP)をパテントファミリーの中に含む特許 情報を同定 • 上記条件を満たす特許レコードに引用されている文献を同定 • 特許と文献引用リンクテーブル: 2011年時点 • 特許に引用されたWoS文献データ: 1981年以降 • データ項目 • 特許公報番号(Patent Publication Number)、特許出願年、特許発行年、IPCサブクラス (例:A01B)、特許出願国、特許出願人の居住国 • WoS論文ユニーク番号(UT)、論文発行年、WoS250分野、ESI22分野、全著者所属機関の国 • 特許番号、その特許が引用しているWoS論文ユニーク番号 965/14/2015
  • 97. ER図 Web of Knowledge Thomson Innovation DWPI (LinkTable) 5/14/2015 97
  • 98. Table Info (Patent) カラム名 カラム定義名 データ型 BYTE 公開番号 PAT CHAR 16 出願年 AppYear CHAR 4 公報発行年 PubYear CHAR 4 • DWPI_INFO • DWPI_IPC カラム名 カラム定義名 データ型 BYT E 公開番号 PAT CHAR 16 IPCサブクラス IPC Varchar 4 カラム名 カラム定義名 データ型 BYTE 公開番号 PAT CHAR 16 特許出願国 AppCountry Varchar 2 • DWPI_AppCountry • DWPI_AssCountry カラム名 カラム定義名 データ型 BYTE 公開番号 PAT CHAR 16 居住国 AssCountry Varchar 30 5/14/2015 98
  • 99. Table Info (LinkageTable+Family) • LinkTable • FamilyTable カラム名 カラム定義名 データ型 BYT E 公開番号 PAT CHAR 16 WoS論文ユニーク番号 UT Varchar 15 カラム名 カラム定義名 データ型 BYT E アクセッション番号 AccNo CHAR 10 公開番号(PAT) PAT CHAR 16 5/14/2015 99
  • 100. Table Info (Paper) • WOS_INFO • WOS_CATEGORY カラム名 カラム定義名 データ型 BY TE WoS論文ユニーク番 号 UT CHAR 15 論文発行年 UTYear CHAR 4 ESI22分野 ESI Varcha r 30 カラム名 カラム定義名 データ型 BY TE WoS論文ユニーク番 号 UT CHAR 15 WoSカテゴリ Category Varchar 50 • WOS_Country カラム名 カラム定義名 データ型 BYTE WoS論文ユニーク番 号 UT CHAR 15 著者所属機関国 UTCountry Varchar 20 5/14/2015 100
  • 104. ESI Category ESI Category Number Percent Clinical Medicine 224940 19.5% Biology & Biochemistry 182544 15.9% Chemistry 175132 15.2% Molecular Biology & Genetics 81736 7.1% Engineering 74388 6.5% Physics 73309 6.4% Immunology 54835 4.8% Pharmacology & Toxicology 50955 4.4% Microbiology 44728 3.9% Neuroscience & Behavior 43761 3.8% Materials Science 38522 3.3% Plant & Animal Science 33938 2.9% Computer Science 31547 2.7% Agricultural Sciences 17935 1.6% Environment/Ecology 5175 0.4% Geosciences 4341 0.4% Psychiatry/Psychology 4084 0.4% Multidisciplinary 3522 0.3% Social Sciences, general 3183 0.3% Economics & Business 1389 0.1% Mathematics 1163 0.1% Space Science 309 0.0% Total 1151436 Clinical Medicine Biology & Biochemistry Chemistry Molecular Biology & Genetics Engineering Physics Immunology Pharmacology & Toxicology Microbiology Neuroscience & Behavior Materials Science Plant & Animal Science Computer Science Agricultural Sciences Environment/Ecology Geosciences Psychiatry/Psychology Multidisciplinary Social Sciences, general Economics & Business Mathematics Space Science5/14/2015 104
  • 105. Exercise 4:論文公刊から特許出願/公開まで の年数を求めて, 特許出願年順に並べる • クエリ構文 select distinct linktable.pat, linktable.ut, wos_info.UTYear, dwpi_info.AppYear, dwpi_info.PubYear, dwpi_info.PubYear - wos_info.UTYear, dwpi_info.AppYear - wos_info.UTYear from linktable Inner Join wos_info ON linktable.ut=wos_info.ut Inner Join dwpi_info ON linktable.pat=dwpi_info.pat where ESI = "Physics" order by linktable.pat ; 5/14/2015 105
  • 106. Exercise 4:論文公刊から特許出願/公開まで の年数を求めて, 特許出願年順に並べる • クエリ構文 select distinct linktable.pat, linktable.ut, wos_info.UTYear, dwpi_info.AppYear, dwpi_info.PubYear, dwpi_info.PubYear - wos_info.UTYear, dwpi_info.AppYear - wos_info.UTYear from linktable Inner Join wos_info ON linktable.ut=wos_info.ut Inner Join dwpi_info ON linktable.pat=dwpi_info.pat where ESI = "Physics" order by linktable.pat ; Select : 特許番号, 論文番号, 論文の公刊年, 特許の 出願年, 特許の公開年, 特許の公開年-論文の公刊 年, 特許の出願年 – 論文の公刊年 を表示する from : linktable からデータを持ってくる Inner Join : linktable に wos_info を接続する. このと き, linktable.ut をキーとして wos_info.ut と対応する ように接続する Inner Join : linktable に dwpi_info を接続する. このと き, linktable.pat をキーとして dwpi_info.pat と対応す るように接続する where : ESI が”Physics” なデータのみを抽出する order by : linktable.pat の順番に並べる 5/14/2015 106
  • 108. Physics 0 5000 10000 15000 20000 25000 30000 0 2 4 6 8 10 12 14 # of patents 平均 / dwpi_info.AppYear - wos_info.UTYear 平均 / dwpi_info.PubYear - wos_info.UTYear 5/14/2015 108
  • 109. 他のデータベースとの接続 • 特許データベースとは pub_number • 論文データベースとは wos 番号 を用いることで, どのような組織が サイエンスリンケージを活用してい るのか分析を拡張することができ る 5/14/2015 109
  • 111. 特許や論文の情報ではわからない知識 • たとえば • (研究者や発明者が)こっそり使っていた技術/技法 • 企業秘密 • 研究や実験手法 • 研究設備 • 競合する企業による特許や論文 • JST/RISTEX 長岡PJ • 知識フロー分析 (特許や論文で測れる科学的源泉と, 特許や論文で測れな い科学的源泉を調査) 5/14/2015 111
  • 112. 「イノベーションの科学的源泉とその経済効果」 1. 「源泉研究」 • サイエンスからイノベーションへの知識の流れの経路 (学術文献、研究機器・試料、 産学連携) を識別し包括的に捕らえ、また、サイエンスを活用するメカニズムや能力 の理解を深める 2. 「知識フロー研究」 • 特許における引用などの書誌情報がどの程度現実の知識フローを把握しているの か調査する 3. 「経済効果研究」 • 新しい財、その効果 (寿命, 入院日数)、利益確保可能性 • 知識の波及効果と競争メカニズム • サイエンスベースのイノベーションの経済効果を分析し、その貢献を高め るための政策や制度設計の在り方を提言する 5/14/2015 112
  • 113. 研究手法 • 事例調査 • サーベイ調査 • 計量経済学的分析 • 疾患分野 X 医薬品 X 年のパネルデータを作成 5/14/2015 113
  • 114. 日本の11 の革新的医薬の事例研究 • コンパクチン (※. 第二相臨床試験で開発中止) 1. メバロチン 2. クレストール 3. アクテムラ 4. オノン 5. アリセプト 6. リュープリン 7. ブロプレス 8. クラビット 9. ハルナール 10. アクトス 11. プログラフ 5/14/2015 114
  • 115. 大規模サーベイの実施 実施体制 対象 回収数 備考 医薬品サーベイ 日本製薬工業 協会研究開発 委員会及び同 医薬産業政策 研究所と協力 日本企業オリジンのNME(新有効成分 含有医薬品)の探索・開発プロジェクト (約1100プロジェクト) (1)1990以降に日本において承認(2) 2012年時点において非臨床から~申 請中、および (3)開発が中止されたあるいは現在 留保に選択 探索:234プロジェク ト(回収率約22%)、 臨床開発:180プロ ジェクト(回収率 17%) 日本製薬工業協会 の会員企業トップレ ベルの了解を得て実 施 発明者サーベイ 経済産業研究 所と協力 日本と欧州に(そして大半の場合米国 にも)特許出願されている発明2,689 843名(回収率は 32.4%) 追加サーベイ バイオベンチャー ・サーベイ バイオインダス トリー協会と協 力 約700社の日本のバイオベンチャーを 対象 2012年度 約177社 (15.3%) 毎年度実施 5/14/2015 115
  • 116. JST 長岡PJ 事例調査 知識フロー研究 • 特許・論文の(後方)引用情報、共著者及び共同発明者等の公表データ が、現実の重要知識 (イノベーションに係る科学的源泉) のフローをどの 程度捕捉しているか評価する • サイエンスからイノベーションへの知識フローを定量的に把握する手法の 開発 • 発明における引用 • 従来技術の開示 • 米国特許では出願人の義務 • 従来技術=発明の新規性・進歩性の評価に有用な文献 • 発明自体の説明 • 発明を第三者が実施できるように開示 5/14/2015 116
  • 119. Implication • サイエンスリンケージの可視化・精緻化 • サイエンスリンケージを精緻化するためには, 特許の非特許文献情報のみ では不十分. 特許内の本文内にある文献情報を抽出するアルゴリズムの開 発が必要. (書誌テキスト分析などの援用) • 特許⇔論文間のリンケージデータ (特許フロントページの引用非特許文献と 特許番号のマッチング)整備は米国特許および欧州特許では進められてい る一方、日本特許および日本語文献ではサイエンスリンケージを特定する ためには個別資料の精査が必要不可欠 • 日本特許の出願において出願人が非特許文献を開示する場合、雑誌や論 文のID を併記することを推進し、データベースの整備を行う必要性 5/14/2015 119
  • 120. まとめ • 特許や論文のデータを調べることで、知識の流れ (トラジェクトリ) や 知識の生成過程 (社会的な構築プロセス) がわかるかもしれない • 特許や論文の書誌情報からわからない情報もたくさんある • イノベーションプロセスを理解して有益な含意を導き出すには、いろ いろな分析手法を組み合わせる必要がある 5/14/2015 120
  • 121. Acknowledgement • 文部科学省 SciREX 事業 • 「政策のための科学」基盤的研究・人材育成拠点事業(領域開拓拠 点)イノベーションマネジメント・政策プログラム(Innovation Management and Policy Program:IMPP) • 独立行政法人科学技術振興機構社会技術研究開発センターによる 「科学技術イノベーション政策のための科学研究開発プログラム」: • 「イノベーションの科学的源泉とその経済効果」 • 「科学技術イノベーション政策の経済成長分析評価プロジェクト」 1215/14/2015