SciREX イノベーション分析手法勉強会 第七回
「SQL 入門と特許データベース分析(その1)」
2016.06.25
政策研究大学院大学
科学技術イノベーション政策研究センター
原泰史
ya-hara@grips.ac.jp
Twitter: @harayasushi
2016/6/26 1
WP シリーズの目的
• 目的
• 特許や論文のデータを使うことで解析できる範囲を知るために、まず分析手法を学ぶ
• 手法
• パソコンを用いたハンズオンセミナー方式 (手を動かして覚える!)
• 時間:
• 土曜日の夕方に90分-120分程度
• 一ヶ月に一回程度 (第一期; 5-6回; 第二期も同じくらいの予定)
• 場所:
• 国立 (一橋大学イノベーション研究センター) または
• 六本木 (政策研究大学院大学科学技術イノベーション政策研究センター)
• 参加希望の方は, ya-hara@grips.ac.jp または @harayasushi (twitter) までご
連絡ください.
2016/6/26 2
WPシリーズのスケジュール
• [2015/1月] 第0回: 「数字が教えてくれないこと」 @一橋イノベーション
研究センター
• [2015/3/28] 第1回: 「数字が教えてくれること」 @一橋イノベーション
研究センター
• 特許や論文データはなぜイノベーション指標として活用されているのだろう
• [2015/4/18]第2回: 「巨人の肩の上に立つ」 @GRIPS SciREX センター
• 論文データベース (Web of Knowledge, Scopus, Scival etc…) を用いた分析
• [2015/5/14] IRCセミナー @関西学院大学イノベーション研究センター
• [2015/5/16] 第3回: 「select() すると幸せになれる理由」 @一橋イノ
ベーション研究センター
• IIP データベース/patR データベースを用いた日本特許分析
• [2015/6/27] 第4回: 「科学とイノベーションの関係」@一橋イノベーショ
ン研究センター/GRIPS SciREX センター
• 組織学会@一橋大学のため第四週におこないます
• サイエンスリンケージデータベースを用いた特許/論文の連結分析
• [2015/7/18]第5回: 「行間を読むっていろいろと大切」
• 書誌テキスト分析 (KHcoder) を使って分析できること
• [2015/8/8] 第6回 : 「まとめ」
• 科学とイノベーションのあれこれは書誌情報からどこまでわかるのだろう
• [2016/6/25] 第7回: 「SQL 入門と特許データベース分析(1)」
• 特許データベースを使って分析しよう
• [2016/7/xx] 第8回:
2016/6/26 3
第一期(2015) 第二期(2016)
はじめに
• 次回の研究会の予定を決めましょう
• Facebook ページで投票してください
• 8月のお盆までの土曜日
• https://www.facebook.com/groups/scirex.innovation.process/permalink/104
1425569261756/
2016/6/26 4
今日取り上げる内容
特許データベースの利用方法
• 米国特許のデータベース
• Thomson Innovation
• Ultra Patent
• USPTO database
• 日本特許のデータベース
• IIP パテントデータベース
⇒ これを利用できるようになる
• MySQL の導入
• Access の導入
• 基本的なコマンド
2016/6/26 5
論文 特許
サイエンス
リンケージ
Framework of Innovation Indicators [modified. 2]
(Pakes and Griliches 1984)
Other
Economic
Factors
Non-Knowledge Factors
of Production Output:
Productivity
Firm’s Value
Patent
Patenting
Propensity
Inputs to Innovation
R&D, designing,
marketing research etc…
Knowhow and
First Mover Advantage
Paper
In-tangible
knowledge
2016/6/26 6
2016/6/26 7
(Kuhn っぽい?) Innovation process
基礎研究 応用研究 製品化 マーケティング
論文 特許 POSデータ
博士人材
データベース
科研費
データベース
定量的な分析をするために、データベースを使う
・特許データを使って製品化のプロセスを観察する
・論文データと博士人材データベースと科研費DBを組み合わせて, 競争的資金の研究
開発パフォーマンスへの影響を観察する
プレスリリース
1. 特許制度について
2016/6/26 8
知的財産制度
• 知識の公開を条件に、知識の商業的な利用の占有権を知
識の創造者に与える仕組み
• 特許
• 実用新案
• 意匠
• 著作権
• 商標
2016/6/26 9
知的財産の種類と日本の知的財産保護制度
特許 実用新案 意匠 著作権 商標
保護対象 発明 考案 (特許ほど高
度でない発明)
意匠(商品のデザ
インなど)
著作物等 商品の商標
主たる保護要件 ・新規性
・進歩性
・産業上の有用性
・新規性
・進歩性
・産業上の有用性
・新規性
・創作非容易性
・工業上利用可能
性
・創作 ・誤認を生じさせ
ないこと
保護期間 出願日から20年 出願日から10年 登録日から15年 著者者の死後50
年
登録日から10年
(更新可能)
ディスクロー
ジャー
出願・公開 出願・公開 3年内の秘密意匠
制度あり
頒布 出願公告
保護内容 発明の実施の専
有
考案の実施の専
有
意匠の実施の専
有
複製権の専有な
ど
商標の利用の専
有
年間出願件数 345000 (2010年) 9000 (2010年) 32000 (2010年) 出願不要 114000 (2010年)
2016/6/26 10
知的財産権と技術の公開への誘因
• 知的財産制度の目的のひとつ
は、企業が研究開発の成果を
公開するような誘因を整備する
こと
• 保護期間の後は、公開された発
明をだれでも自由に利用するこ
とができる
• 技術公開の効果
• 技術の公開によって、研究の重
複の危険性が小さくなる
• 公開された技術は新たな研究開
発の種を供給する
• 技術開発は累積的なプロセスで
あり(Merges and Nelson 1990)、
すべての技術が企業秘密となっ
た場合このようなプロセスが成
立しにくくなる
2016/6/26 11
知的財産権の役割
• 1. 研究開発への誘因を高めること
• 知的財産権による保護がなければ、研究開発への誘因が低下してしまう危険性が
ある
• 2. 研究開発の公開を促すこと
• 知的財産権が弱いと、企業は開発した技術をできるだけ隠そうとする
• 研究開発の内容も企業秘密として維持可能な技術に偏る傾向が生じる
• 結果、産業全体として研究開発に利用可能な知識ストックが減少し、研究開発の効
率が低下する危険性がある
• 商業的成功に強く結びついた技術革新を推進するための制度
• 企業の私的な情報と私的なインセンティブを活用して、技術革新を促進さ
せる
2016/6/26 12
発明から出願、登録までのプロセス
出所: (永田 2004)2016/6/26 13
特許情報、特許データベースを使う意味
• 何がわかるのか
• だれが、いつ、どこで、どんな特許を書いたのかがわかる
• だれが、いつ、どこで、どんな特許を引用したかがわかる
• メリット
• みんなが読んでいる特許がわかる!
• 被引用数の高い特許がわかる!
• どんな研究開発が世の中で行われているかがわかる!
2016/6/26 14
特許データベース
• アメリカ特許のデータベース
• Google Patent
• USPTO Patents
• Ultra Patents
• Thomson Innovation
• ヨーロッパ特許のデータベース
• Espacenet
• PATSTAT
• 日本の特許データベース
• 特許情報データベース
• IIP パテントデータベース
• 研究用特許データベース (patR)
2016/6/26 15
日本特許用のデータベース
• 特許情報プラットフォーム
• 工業所有権情報・研修館が提供
• 無償: https://www.j-platpat.inpit.go.jp/web/all/top/BTmTopPage
• 特許の大まかな内容を調べるにはこれで十分
• IIPパテントデータベース
• 知的財産研究所(と人工生命研究所)が提供
• 無償: http://www.iip.or.jp/patentdb/
• 出願情報、登録情報、出願人情報、引用情報、発明者情報、発明者情報がそれぞれ収録
• マニュアル:http://www.iip.or.jp/patentdb/pdf/manual.pdf
• ダウンロードページ: https://database.iip.or.jp/patentdb/
• 研究用特許データベース
• IIPパテントデータベース、研究用特許データベースどちらも工業所有権情報・研
修館が提供する整理標準化データがベース
2016/6/26 16
研究用特許データベース
• (1)整理標準化データ (patR データベース)
• 特許庁での特許の出願、審査請求、拒絶、権利維持、最終処分まで、手続
きを記録したもの
• 提供時期は1964年以降2010年3月まで 適宜アップデート中
• データ量が多いため、研究に必要な項目を限定してデータベースに格納
• (2)公報データ (td_5 データベース)
• 特許の明細書および書誌情報を年別・公報種別によって記録したもの
• 発行時期は公開公報:1993年から2012年まで
• 特許公報:1994年から2012年まで
• 公表公報:1996年から2012年まで
• 再公表公報:1996年から2012年まで。すべてのデータを格納。
2016/6/26 17
3つの特許データベースの違いは?
2016/6/26 18(永田2004)
特許庁データ
整理標準化データ
日本国特許庁への特許出願等に基づいて作成され
る産業財産権情報(出願、審判、登録情報等)につ
いて、公開可能な情報の重複を排除し標準的な形式
であるXMLやSGMLに変換したデータ
3つの特許データベースの違いは?
2016/6/26 19(永田2004)
特許庁データ
整理標準化データ
patR/tamada データベース
必要な部分を抽出し, 出願人コードなどを統一し
たもの IIPパテントデータベース
1-2. 特許分析でわかること
• 特許に含まれている情報
• 発明者の数
• 特許の前方/後方引用数
• 出願分野
• 特許の内容
• Claim の数
2016/6/26 20
1-2. 特許分析でわかること
• 産業内/企業内/大学・研究機関の研究開発パフォーマンスを測定する
• 企業がどのような分野で特許を出願してきたか
• どのような特許が他社・自社で活用されてきたか (特許の質)
(中級編)
• 特許で活用されている論文にはどのようなものがあるか
• 特許開発された技術はどのくらい実際の製品で活用されているのか
2016/6/26 21
政策投資銀行分類ベースによる産業ごとの特許出願数 – 対象新興市場[1964-2013]
2016/6/26 22
0
20000
40000
60000
80000
100000
120000
140000
160000
180000
1-2. 総特許出願数推移(東証上場企業; 企業別top30)
パナソニック 日立製作所 東芝 日本電気 キヤノン 三菱電機
富士通 ソニー リコー トヨタ自動車 シャープ セイコーエプソン
富士フイルムホールディングス パナソニック電工 三洋電機 日本電信電話 富士電機 三菱重工業
デンソー 日産自動車 新日本製鐵 本田技研工業 コニカミノルタホールディングス 住友電気工業
クボタ オリンパス 沖電気工業 東レ 川崎製鉄 大日本印刷2016/6/26 23
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
自動車産業の出願特許数推移
GMB いすゞ自動車 スズキ ダイハツ工業 トヨタ自動車
マツダ モリタホールディングス 三菱自動車工業 日産ディーゼル工業 日産自動車
日野自動車 富士重工業 本田技研工業2016/6/26 24
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
自動車産業の出願特許数推移
トヨタ自動車 日産自動車 本田技研工業 GMB いすゞ自動車
スズキ ダイハツ工業 マツダ モリタホールディングス 三菱自動車工業
日産ディーゼル工業 日野自動車 富士重工業2016/6/26 25
ラジオ・テレビ受信機(DBJ分類)
0
5000
10000
15000
20000
25000
30000
35000
40000
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
パナソニック ソニー シャープ 三洋電機 日本ビクター 富士通ゼネラル2016/6/26 26
電力用機器(DBJ分類)
0
10000
20000
30000
40000
50000
60000
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
日立製作所 東芝 三菱電機 富士電機 明電舎 安川電機 シンフォニアテクノロジー 日新電機 芝浦メカトロニクス ダイヘン2016/6/26 27
1-2. 特許分析でわかること
国立大学による主な出願分野(累計)
2016/6/26 28
1-2.特許分析でわかること
主な国立大学による特許出願数推移
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
国立大学法人名古屋工業大学 1 40 80 85 85 67 63 73 70 76
国立大学法人九州大学 22 65 91 116 102 82 77 88 80
国立大学法人北海道大学 1 11 62 144 132 113 99 96 70 65 26
国立大学法人名古屋大学 29 52 121 116 105 78 92 140 61 72
国立大学法人広島大学 18 73 104 100 116 143 99 63 104 53
国立大学法人大阪大学 2 46 142 248 174 114 119 139 89 76
国立大学法人京都大学 38 146 227 180 138 94 93 125 122 56
国立大学法人東京工業大学 1 26 79 213 178 202 180 145 145 136 93
国立大学法人東京大学 36 74 149 191 170 180 199 221 168 88
国立大学法人東北大学 1 25 133 223 178 206 212 200 160 135 93
0
200
400
600
800
1000
1200
1400
1600
国立大学法人東北大学 国立大学法人東京大学 国立大学法人東京工業大学 国立大学法人京都大学 国立大学法人大阪大学
国立大学法人広島大学 国立大学法人名古屋大学 国立大学法人北海道大学 国立大学法人九州大学 国立大学法人名古屋工業大学2016/6/26 29
1-2. 特許分析でわかること
• ソニーの
特許戦略
はどういう
ふうにか
わって
いった?
2016/6/26 30
1-2. 特許分析でわかること
• Q. “なんで SQL を使うんですか?
Excel でいいんじゃないですか?”
• A1. データ量
1270万件のデータを人間の手や
Excelで作業するのは無理!リレー
ショナルデータベースを使って処
理したほうがはやい!
2016/6/26 31
1-2. 特許分析でわかること
• A2. Excel の限界
• 1048576列
• これ以上は分割しないと
ワークシートで処理できない
• CPUのファン音が唸りをあげる
• 腱鞘炎にもなる
2016/6/26 32
Web インターフェースではなく SQL データベースを使う
ことのメリット
• Web 版にくらべてレスポンスがはやい
• (すべてはやいとはいっていない)
• 自分のニーズに則したデータを取得できる
• 他のデータベースとの接続が行い易くなる
• 特許データベースと論文データベースの接続
• 特許/論文データベースと財務データベースの接続
2016/6/26 33
リレーショナル・データベース
• Excel のようにひとつのテーブルですべてのデータを管理するのでは
なく, キーを介して複数のテーブルから構成されるデータベース
2016/6/26 34
中間試験の成績
・学籍番号
・問1の得点
・問nの得点
期末試験の成績
・学籍番号
・問1の得点
・問nの得点
平常点の成績
・学籍番号
・出席点
・小テストの得点
総合成績
・学籍番号
・総合得点(=中間試験+
期末試験+平常点)
・最終成績
2. IIP PATENT DATABASE
2016/6/26 35
IIP パテントデータベースを使って特許データ
を分析しよう
• やりたいこと
• 企業ごとの出願/公開特許数を測りたい
• 技術開発の傾向を測定したい
• 知識ストックの推移を測りたい
• 引用数を測りたい
2016/6/26 36
IIP パテントデータベースを使って特許データ
を分析しよう
• レシピ
• 1. MySQL サーバと MySQL Workbench をインストールしよう
• 2. IIP パテントデータベースをダウンロードしよう (今日の目標)
(ここから下は次回)
• 3. IIP パテントデータベースをMySQL サーバにインポートしよう
• 4. IIP パテントデータベースを使って特許データを解析しよう
2016/6/26 37
IIP パテントデータベースを使って特許データ
を分析しよう
• 材料
• MySQL サーバ: オープンソース型データベース。RDBMS (Relational
Database Management System)
• MySQL Workbench: MySQL の開発用コンソール
• IIP パテントデータベース: 日本特許のデータベース
• https://database.iip.or.jp/patentdb/
• NISTEP企業名辞書: 企業情報を網羅したデータベース
• http://www.nistep.go.jp/research/scisip/rd-and-innovation-on-industry
2016/6/26 38
1.MySQL サーバとMySQL Workbenchをダウン
ロードしよう
• http://dev.mysql.com
/downloads/mysql/
から、Mac版または
Win 版のバイナリを
ダウンロードする
2016/6/26 39
1. MySQL サーバをダウンロードしよう
• MSI Installer (32bit) をクリックする
2016/6/26 40
・“No thanks, just start my download”を
クリックする
1-1. MySQL サーバをインストールしよう
• Installer が開くので、
NEXT > をクリックする
2016/6/26 41
1-1. MySQL サーバをインストールしよう
• “I accept the
license terms”
チェックボックス
を選択して,
NEXT > をクリッ
クする
2016/6/26 42
1-1. MySQL サーバをインストールしよう
• Available Products か
ら “MySQL Server –
X64” と “MySQL
Workbench” を選び
⇒ をクリックして、
Products/Features to
be Installed に移動さ
せる
2016/6/26 43
1-1. MySQL サーバをインストールしよう
• Execute をクリックする
2016/6/26 44
1-1. MySQL サーバをインストールしよう
• インストールが行われる
• Next > をクリック
2016/6/26 45
1-1. MySQL サーバをインストールしよう
• Next > をクリックする
2016/6/26 46
1-1.MySQL サーバをインストールしよう
• Config Type
• Development machine
• TCP/IP 3306
• Open Firewall Port for Network
Access チェックボックスを外す
2016/6/26 47
1-1.MySQL サーバをインストールしよう
• MySQL Root Password を
指定する
• Repeat Password に同じ
パスワードを指定すること
2016/6/26 48
1-1. MySQL サーバをインストールしよう
• Windows Serviceの設定
• 特に変更しない
2016/6/26 49
1-1. MySQL サーバをインストールしよう
• Plugins and Extensions
• そのまま
2016/6/26 50
1-1. MySQL サーバをインストールしよう
• Execute をクリックする
2016/6/26 51
1-1. MySQL サーバをインストールしよう
• Finish をクリックする
2016/6/26 52
1-1. MySQL サーバをインストールしよう
• Next > をクリックする • Finish をクリックする
2016/6/26 53
1-2. MySQL Workbench でMySQL サーバに
接続する
• MySQL Workbench を起動する
2016/6/26 54
1-2. MySQL Workbench で MySQL サーバに
接続する
• + ボタンをクリックする
2016/6/26 55
1-2. MySQL Workbench でMySQL サーバに
接続する
• Password Vault をクリックする
2016/6/26 56
1-2. MySQL Workbench でMySQL サーバに
接続する
• Password を入力する • Test Connection をクリックする
• 以下のメッセージが出ればOK
2016/6/26 57
1-2. MySQL Workbench でMySQL サーバに
接続する
• Connection Name を指定して, OK をクリックする
2016/6/26 58
1-2. MySQL Workbench でMySQL サーバに
接続する
• MyServer をクリックする
2016/6/26 59
1-2. MySQL Workbench で MySQL サーバに
接続する
• コンソールが開く
2016/6/26 60
2. IIP パテントデータベースをダウンロードしよう
• 知的財産研究所
http://www.iip.or.jp/
にアクセスし、
“IIP パテントDB”
をクリックする
2016/6/26 61
2. IIP パテントデータベース
をダウンロードしよう
• “ダウンロードのページ”
をクリックする
2016/6/26 62
2. IIP パテントデータベースをダウンロードしよう
• ユーザ登録
• 名前
• 所属
• 役職
• メールアドレス
• 住所
• ご案内有無
を入力し、”同意する” をクリックする
2016/6/26 63
2. IIP パテントデータベースをダウンロードしよう
• こんな感じのメールが届く
• パスワード
2016/6/26 64
2. IIP パテントデータベースをダウンロードし
よう
• https://database.iip.or.jp/patentdb/
• にメールアドレスとパスワードを入力し、”ダウンロードページへ” をクリックする
2016/6/26 65
2. IIP パテントデータベースをダウンロードしよう
• ダウンロードページが表示される
2016/6/26 66
2-2. IIP パテントデータベース
• 特許庁の『整理標準化 データ』
(2013 年度提供分まで)を基に
作成された研究用特許データ
ベース
• 「1964000001」以降の出願番号
を持つ特許(出願)を含む
2016/6/26 67
2-2. IIP パテントデータベース
2016/6/26 68
• データベースの構造 出願番号(ida)に基づき紐付け
ることができる
2-2. IIP パテントデータベース
• 出願テーブル
• 出願番号
• 登録番号
• 出願日
• 登録日
• IPC番号
• 請求項 (claim の数)
などが記載されている
⇒ とりあえず、これをMySQL サーバ
に取り込んで解析してみる
2016/6/26 69
2-3. IIP パテントデータベースをMySQL サー
バにインポートする
• 先ほどの IIP パテントデータベー
スダウンロードページ
(https://database.iip.or.jp/paten
tdb/) から, 1. 出願テーブルのラ
ジオボタンを選択しダウンロード
をクリックする
2016/6/26 70
2-3. IIP パテントデータベースをMySQL サー
バにインポートする
• ダウンロードして解凍すると、
728MBくらいのファイルが出てく
る
• とりあえず中身を観てみる
• 「なんらかの意味をもった 何らか
のデータ (引用: 岡崎体育)」
• これをMySQL サーバに取り込む
2016/6/26 71
2-3. パテントデータベースをMySQL サーバに
インポートする
• MySQL Workbench を開く
2016/6/26 72
2-3. パテントデータベースをMySQL サーバに
インポートする
• ここからしないといけないこと
• (1) データベースをつくる
• (2) テーブルをつくる
2016/6/26 73
73
中間試験の成績
・学籍番号
・問1の得点
・問nの得点
期末試験の成績
・学籍番号
・問1の得点
・問nの得点
平常点の成績
・学籍番号
・出席点
・小テストの得点
総合成績
・学籍番号
・総合得点(=中間試験+
期末試験+平常点)
・最終成績
これがテーブルこれがデータベース
2-3. パテントデータベースをMySQL サーバに
インポートする
• Create a new schema in the connected server をクリックする
2016/6/26 74
2-3. パテントデータベースをMySQL サーバに
インポートする
• Name にデータベース名
を指定
• Apply をクリックする
2016/6/26 75
・もういちど Apply をクリックする
2-3. パテントデータベースをMySQL サーバに
インポートする
• Finish をクリックする
2016/6/26 76
2-3. パテントデータベースをMySQL サーバに
インポートする
• 左下の Schema から iippatentdb2015 をダブルクリックする
2016/6/26 77
2-3. パテントデータベースをMySQL サーバに
インポートする
• Table を開き, “Create Table” をクリックする
2016/6/26 78
2-3. パテントデータベースをMySQL サーバに
インポートする
• Table Name を指定する: ap
• Column Name/Data Type をそれ
ぞれ指定する
• Ida は int(11)
• その他は text を指定
• 設定が終わったら Apply をク
リックする
2016/6/26 79
2-3. パテントデータベースをMySQL サーバに
インポートする
• Apply をクリックする
• Iippatentdb2015 という
データベースの中に、
ap というテーブルが
作成される
2016/6/26 80
2-3. パテントデータベースをMySQL サーバに
インポートする
• Query1 を開き, 以下のクエリを打ち込む
• 先ほど作成したテーブルにデータを読み込み、雷マークをク
リックする
• コーヒーでも飲んで待つ
2016/6/26 81
2-3. パテントデータベースをMySQL サーバに
インポートする
• この命令は何をやっているのか?
• Load data ⇒ “” で囲んでいる箇所からデータを読み込んでね
• Into table ⇒ iippatentdb2015.ap にデータを収納してね
• Fields terminated by ‘t’ ⇒ データはタブ区切りになっているからね
• Ignore 1 lines ⇒ 最初の一行目は無視してね
2016/6/26 82
load data local infile "C:¥¥Users¥¥ya-hara¥¥Downloads¥¥ap¥¥ap.txt“
into table iippatentdb2015.ap
Fields terminated by '¥t'
ignore 1 lines
2-3. パテントデータベース
をMySQL サーバにイン
ポートする
• データのインポートが終わった場合、
以下のメッセージが表示される
• “12706640” 個のレコードがインポート
されたことが表示されている
2016/6/26 83
これで、
ようやく分析のスタートライン・・・
2016/6/26 84
2-4. MySQL を使ってIIP パテントデータベー
スを解析してみる
2016/6/26 85
・とりあえず、データの中身
を観てみる
・”select * from ap;” とタイプ
して、雷マークをクリックする
・数秒待つと、先ほどイン
ポートしたデータが表示され
る
2-4. MySQL を使ってIIP パテントデータベー
スを解析してみる
• 出願された特許のIPC分類をカ
ウントしてみる
• エクスポートボタンをおして,
Excel で処理してみる
2016/6/26 86
select class1,count(*) as count
from ap
group by class1
order by count;
とりあえず出願されている特許のIPC分類
が並べられる
2016/6/26 87
とりあえず、今日はここまで
• 同じ方法で、他のテーブルもSQL にインポートすることができます
• 従来のエクセルファイルも、同じように
• テキストファイルまたはCSVにする
• タブ区切りか空白区切りで統一する
という作業をすればSQL にインポートできます
2016/6/26 88
次回の予定:
特許データと他のデータベースとの接続
• NISTEP企業名辞書
2016/6/26 89
次回の予定:
特許データと他のデータベースとの接続
ImDB データベース
2016/6/26 90
特許データと他のデータベースとの接続
• NISTEP企業名辞書
• http://www.nistep.go.jp/research/
scisip/rd-and-innovation-on-
industry
• IIPパテントデータベースとEDINET,
東洋経済データベースとの接続
が可能
• 特許と企業の財務データを接続し
て分析するときに利用可能
2016/6/26 91
次回の予定
• もうちょっと細かなクエリを書いてみる
• NISTEP企業名辞書をSQL に取り込む
• 産業ごとの分析などを行ってみる
2016/6/26 92
特許データベースの詳細について
• http://enq.iir.hit-u.ac.jp
• http://www.alife-lab.co.jp
を参照のこと
• 一橋の学生でpatRを使いたいひと
• 内藤さんに連絡しましょう
• http://hitotsubashiiir.blogspot.jp/2012/08/blog-post_1024.html
• 一橋以外の学生で使いたいひと
• せんせーにおねだりしましょう
2016/6/26 93
Acknowledgement
• 文部科学省 SciREX 事業
• 「政策のための科学」基盤的研究・人材育成拠点事業(領域開拓拠
点)イノベーションマネジメント・政策プログラム(Innovation
Management and Policy Program:IMPP)
• 独立行政法人科学技術振興機構社会技術研究開発センターによる
「科学技術イノベーション政策のための科学研究開発プログラム」:
• 「イノベーションの科学的源泉とその経済効果」
• 「科学技術イノベーション政策の経済成長分析評価プロジェクト」
942016/6/26
References
• 永田晃也(2004)知的財産マネジメント, 中央経済社
• 後藤晃、元橋一之(2005) 特許データベースの開発とイノベーション,
https://database.iip.or.jp/patentdb/
• 中村健太 (2015) IIP パテントデータベース ユーザーマニュアル,
https://database.iip.or.jp/patentdb/readme_j_2015july.pdf
2016/6/26 95
Thanks.
hara@iir.hit-u.ac.jp
ya-hara@grips.ac.jp
962016/6/26
Appendix: 3. PAT R
2016/6/26 97
(1)patR (ER図; 抜粋)
2016/6/26 98
・特許庁の手続きデータを工業所
有権情報・研修館が提供している
整理標準化データが元データ。
・app_info が中心にデータが構成さ
れるリレーショナル・データベース
方式
(1) patR
• app_info 出願経過 テーブル
2016/6/26 99
フィールド
名
型 インデックス
内容(カッコ内はコー
ド表インデックス)
1 app_num varchar(20) 出願番号:すべて半角(B0010)
2 count int(11) ワーク用カウンタ
3 title varchar(255) 発明の名称
4 app_date date 出願日
5 renewal_date date 更新日付:出願マスタ
6 id bigint(20) 元処理番号
7 pat_app_num varchar(10) 原出願記事番号(B0010)
8 app_type varchar(4) 原出願記事関連種別(B0310,C0025)
9 pub_num varchar(10) 公開番号
10 pub_date date 公開日
11
exam_pub_nu
m
varchar(10) 公告番号
12
exam_pub_da
te
date 公告日
13 intl_app_num varchar(12) 国際出願番号
14 pry_cnty char(2) 筆頭優先権主張国
15
num_claim_a
pp
int(11) 請求項の数:出願時
16
num_claim_e
xamed
int(11) 請求項の数:公告決定時
17
num_claim_re
g
int(11) 請求項の数:登録査定時
18 reg_num varchar(19) 特許番号または登録番号
19 reg_date date 登録日
20 rej_rsn char(2) 拒絶理由条文コード(C0710)
21 cnln_cl char(2) 本権利抹消識別(C0780)
22
term_dat
e
date 本権利消滅年月日
23
pry_claim
_date
date 優先権主張日
24
dspn_exa
m_date
date 審査最終処分日
25
dspn_exa
m_code
char(3) 審査最終処分種別コード(C0360)
26 apnum
varchar(1
3)
MUL ‘JPP’をapp_numの先頭につけた文字列
27 fin_decn char(1) 査定種別コード(C0350)
28
fin_decn_
date
date 査定発送日
29
trans_sub
m_date
date 翻訳文提出日
30
trans_pub
_num
varchar(1
0)
公表番号
31 idp int(11) PRI 本テーブルの固有行番号
32
num_clai
m_reg_in
fo
int(11) 請求項の数(登録情報)
33 udate date ワーク用日付フィールド
34 IPC8
varchar(2
55)
国際特許分類第8版
35
acc_exam
_mark
char(1) 早期審査マーク(C0240)
(1) patR
• citation 引用情報 テーブル
2016/6/26 100
フィールド
名
型
インデック
ス
内容(カッ
コ内はコー
ド表イン
デックス)
1 citing varchar(10) MUL
引用特許
出願番号
(B0010)
2 cited varchar(10) MUL
被引用特
許出願番
号(B0010)
3 type int(11) MUL
種別(1:審
査官引用
2:特許公
報に記載さ
れた引用
3:上記両
方に記載
の引用)
フィールド名
型 インデックス
内容(カッコ内
はコード表イン
デックス)
1 ids int(11) PRI 固有行番号
2 name text 氏名
3 addr text 住所
4 prefecture char(2)
住所の国県
コード(C0050)
5 id_num varchar(9)
出願人コード
(B0070)
6 req_type char(1)
個法官別コー
ド(C0070)
7 type int(11) ワーク用
8 name1024 varchar(1024) MUL
氏名のインデッ
クス文字列
9 addr1024 varchar(1024) MUL
住所のインデッ
クス文字列
• applicant 出願人
right_holder 権利者テーブル
(1) patR
• inventor 発明者テーブル
2016/6/26 101
フィールド名
型 インデックス
内容(カッコ内
はコード表イン
デックス)
1 name text 氏名
2 addr text 住所
3 req_type char(1)
個法官別コー
ド(C0070)
4 organization Varchar(255)
所属する組織
の名称
5 ids int(11) PRI 固有行番号
6 name1024 varchar(1024) MUL
氏名のイン
デックス文字
列
7 addr1024 varchar(1024) MUL
住所のイン
デックス文字
列
フィールド名 型 インデックス
内容(カッコ内は
コード表インデック
ス)
1 apnum varchar(13) MUL
‘JPP’+出願番号
(B0010)
2 app_num varchar(10) MUL 出願番号(B0010)
3 pub_num varchar(10) MUL 公開番号
4 intl_app_num varchar(12) MUL 国際出願番号
5 intl_pub_num varchar(12) MUL 国際公開番号
6 trans_pub_num varchar(10) MUL 公表番号
7 exam_pub_num varchar(10) MUL 公告番号
8 reg_num varchar(10) MUL 特許番号または登
録番号
9 ref_pub_num varchar(13) MUL 文献公開番号
10
ref_trans_pub_nu
m
varchar(13) MUL 文献公表番号
11
ref_examd_pub_n
um
varchar(13) MUL 文献公告番号
12 ref_reg_num varchar(13) MUL 文献登録番号
13 ref_intl_pub_num varchar(13) MUL 文献国際公開番
号
• numbers 番号表テーブル
ケース3: patR データベースをmysql クライアント
を使って分析してみる
• 0. mysql クライアントを http://dev.mysql.com/downloads/mysql/ より
ダウンロードする
• Linux と Mac, Windows の場合で異なる
2016/6/26 102
ケース3: patR データベースをmysql クライア
ントを使って分析してみる
• 0-1. mysql クライアントをインストールする
• 注意点その1: 文字コードに utf8 を利用すること
2016/6/26 103
ケース3: patR データベースをmysql クライア
ントを使って分析してみる
• 0-1. mysql クライアントをインストールする
• 注意点その2: クライアントPC 上でmysql サービスが動作していることを確認
すること
2016/6/26 104
ケース3: patR データベースをmysql クライア
ントを使って分析してみる
• 1. mysql データベースにアクセスする
• mysql –h (データベースサーバ名; [ip_address]) –u (ユーザ名) –p とタイプし,
パスワードを入力する
• 現行, 一橋大学イノベーション研究センター内のIP アドレスブロックからのみ
アクセス可能
2016/6/26 105
ケース3 (つづき)
• 2. parR データベースの中身を
チェックする
• “show tables from patr5_1123;”
とタイプし, part5_1123 テーブル
の中身をチェックする.
• mysql コマンドの末尾には, セミ
コロン “;” を明記すること
• app_info や inventor など, どの
ようなデータが格納されている
かチェックできる
2016/6/26 106
ケース3 (つづき)
• 3. テーブルの構造をチェックして
みる
• “desc (チェックするデータベース).(
テーブル名)” で, フィールド名, デー
タの格納タイプ (文字列なのか, 日
時なのか etc),主キー (格納された
データ情報が一意なものであるか)
なのかチェックできる.
2016/6/26 107
ケース3 (つづき)
• 4. 実際にデータを取得してみ
る
• 2011年に出願された特許のう
ち, 1. 審査官引用件数の合計 2.
特許公報に記載された引用の
件数の合計をそれぞれ抽出し
てみる
• クエリをなげると, それぞれ合
計数を取得することができる
2016/6/26 108
ケース3 (つづき)
• 4. 実際にデータを取得してみる (大まかなコ
マンドの説明)
• Select : 「データをデータベースから引っ張って
きますよ」という宣言
• Count(*) : 「ひっぱってきたデータを数え上げて
みますよ」という説明
• from patr5_1123.citation : 「patr5_1123 という
データベースのなかの, citation テーブルから
データを引っ張りますよ」 という宣言
• Where : 「ただし, 以下の条件でね」という宣言
• where citing like : 「citing のデータがこんな感じの
がほしいです」
• ‘2011%’ : 先頭が2011 ではじまるデータ
• and : かつ
• (type = 1 or type = 3) : (1:審査官引用 3:上記両
方に記載の引用)
• (type = 2) : (2:特許公報に記載された引用 )
2016/6/26 109
まとめてみると、「patr5_1123 データベースの中の citation テーブルのうち, citing フィールドのデータの
先頭が 2011 ではじまり、かつ “1. 審査官引用または 3. 上記両方記載に引用” にカテゴライズされてい
るデータの数を数えてね」になります
ケース3 (つづき)
• 5. IPCデータを抽出してみる
• Patr5_1123 データベースの
pub_IPC より, IPC_CLASS と合計
数を, CLASS ごとにもとめ, カウン
ト数で並べ直す.
• count(*) as count ; 合計数を count
と名付ける
• group by IPC_class ; IPC_class でま
とめる
• order by count ; count 数でソート
する
2016/6/26 110
列1 IPC_Class 詳細 カウント数
1H01L 半導体装置 固体装置 それらの部品の製造 処理に特に適用される方法 2567401
2G06F データ処理装置 1863464
3H04N データ転送, テレビジョン装置 1363731
4A61K 医薬品製剤 1298939
5A61P 化合物または医薬製剤の特殊な治療活性 971151
6G03G 光,熱,電子を照射して原画像の記録を行なうための記録材料 841739
7G11B
機械的カッティング,変形 プレスによる,例.溝 ピットの,記録 機械的感知によ
る再生 そのための記録担体
829606
8B41J タイプライタの種類または選択的プリンティング機構の種類 723902
9G01N 材料の調査分析, サンプリング 調査用標本の調製 693957
10G02B
使用物質によって特徴づけられた光学要素 光学要素のための光学的コーティ
ング
619495
ケース3 (つづき)
• 6. 特定の発明者のデータを抽出してみる
• アクテムラの開発者である大杉先生の特許一覧データを探してみる
• 実行するコマンド
• 公開日, 公開番号, 特許名, 発明者名の情報を抽出
2016/6/26 111
select app_info.pub_date, app_info.pub_num, app_info.title, inventor.name
from inventor
inner join inventor_corr_last
on inventor.ids=inventor_corr_last.ids
inner join app_info
on inventor_corr_last.idp=app_info.idp
where inventor.name='大杉 義征';
ケース3 (つづき)
• 実行するコマンドの説明 (1)
2016/6/26 112
select app_info.app_date, app_info.pub_date, app_info.pub_num,
app_info.title, inventor.name
from inventor
inner join inventor_corr_last
on inventor.ids=inventor_corr_last.ids
inner join app_info
on inventor_corr_last.idp=app_info.idp
where inventor.name='大杉 義征';
App_info テーブルより、
・特許の出願日 (app_date)
・特許の公開日 (pub_date)
・特許のタイトル (title)
・特許の公開番号 (pub_num)
Inventor テーブルより、
・特許の発明者名 (inventor)
を取得 (select) する
Inventor テーブルよりデータをもってくる
inventor. テーブルの name フィールドが
“大杉 義征” なデータをもってくる
select app_info.app_date, app_info.pub_date, app_info.pub_num,
app_info.title, inventor.name
from inventor
inner join inventor_corr_last
on inventor.ids=inventor_corr_last.ids
inner join app_info
on inventor_corr_last.idp=app_info.idp
where inventor.name='大杉 義征';
ケース3 (つづき)
• 実行するコマンドの説明 (2)
2016/6/26 113
Inventor_corr_last テーブルの ids キーを介して, inventor テー
ブルと app_info テーブルの情報を接続する (inner join)
ケース3 (つづき)
• 実行結果
• 大杉先生の特許一覧が出力される
2016/6/26 114
app_date pub_date pub_num title name
1976/4/12 1977/1/29 1977012141新規アミノ安息香酸誘導体、その製法及び医薬組成物 大杉 義征
1977/11/2 1979/5/29 1979066645安息香酸誘導体 大杉 義征
1978/6/9 1979/12/26 1979163540テレフタル酸アミド誘導体及びその塩 大杉 義征
1978/12/5 1980/6/10 1980076853テレフタル酸アミド誘導体の製法 大杉 義征
1986/1/22 1986/11/27 1986267515腎炎治療剤 大杉 義征
1986/1/24 1986/11/27 1986267516気管支拡張剤 大杉 義征
1986/5/22 1987/3/9 1987053966新規ピリジン誘導体 大杉 義征
1987/11/20 1988/10/5 1988239217抗アレルギー剤 大杉 義征
1989/6/30 1991/2/14 1991034932糸球体腎疾患治療剤 大杉 義征
1990/4/9 1991/12/20 1991291236感作T細胞関与疾患の治療剤 大杉 義征
1990/8/17 1992/3/31 1992099800組換えマウスIL―6レセプターの製造方法 大杉 義征
1995/10/6 1996/8/13 1996208514IL−6アンタゴニストを有効成分とする慢性関節リウマチ治療剤 大杉 義征
1998/8/14 1999/5/25 1999139988抗IL−6レセプター抗体を有効成分として含有する全身性エリテマトーデスの予防および/または治療剤 大杉 義征
2002/9/25NULL NULL ウイルムス腫瘍遺伝子に対する新規なアンチセンスオリゴヌクレオチド誘導体 大杉 義征
2003/9/18NULL NULL 癌抑制遺伝子WT1の産物に基づく癌抗原とカチオン性リポソームとを含んで成る癌ワクチン 大杉 義征
2003/11/7NULL NULL C型肝炎ウイルスに対する新規なアンチセンスオリゴヌクレオチド誘導体 大杉 義征
2005/5/30 2005/9/15 2005247872抗IL−6レセプター抗体を有効成分として含有する全身性エリテマトーデスの予防および/または治療剤 大杉 義征
2006/11/15NULL NULL 細胞傷害性T細胞の誘導抑制剤 大杉 義征
2008/10/3 2009/4/16 2009079054癌抑制遺伝子WT1の産物に基づく癌抗原とカチオン性リポソームとを含んで成る癌ワクチン 大杉 義征
2009/5/25 2009/8/20 2009185073抗IL-6レセプター抗体を有効成分として含有する全身性エリテマトーデスの予防および/または治療剤 大杉 義征
ケース4: 溶融還元法がタイトルに含まれる
特許一覧を取得してみる
• patR データベースで以下のコマンドを実行する
2016/6/26 115
select pub_num, pub_date, title, apnum, app_date, applicant.name,
applicant.addr
from app_info
inner join applicant_corr_last on app_info.idp=applicant_corr_last.idp
inner join applicant on applicant_corr_last.ids=applicant.ids
where title like "%溶融還元%";
ケース4: 溶融還元法がタイトルに含まれる
特許一覧を取得してみる
• 以下のようなデータが取得できるので, Excel で開く
(しかし文字化けしている)
2016/6/26 116
ケース4: 溶融還元法がタイトルに含まれる
特許一覧を取得してみる
• テキストエディタで開き, Shift-JIS で保存しなおす
2016/6/26 117
ケース4: 溶融還元法がタイトルに含まれる
特許一覧を取得してみる
• 再び Excel で開くと, 文字化けしていないことが確認できる
2016/6/26 118
ケース4: 溶融還元法がタイトルに含まれる
特許一覧を取得してみる
• 企業ごとの特許の数を数えてみる
• Check! : “社団法人(全角スペース)日本鉄鋼連盟”と”社団法人日本鉄鋼連
盟”があることがわかる
• 特許でも名寄せが必要
2016/6/26 119
行ラベル データの個数 / pub_num
日本鋼管株式会社 211
新日本製鐵株式会社 199
川崎製鉄株式会社 111
JFEスチール株式会社 67
川崎重工業株式会社 23
株式会社神戸製鋼所 22
日新製鋼株式会社 15
日本重化学工業株式会社 14
住友金属工業株式会社 13
JFEエンジニアリング株式会社 9
社団法人 日本鉄鋼連盟 6
日鐵プラント設計株式会社 5
社団法人日本鉄鋼連盟 4
アセア・アクチ-ボラグ 3
住友重機械工業株式会社 3
株式会社還元溶融技術研究所 3
三菱重工業株式会社 3
株式会社日立製作所 2
テクノロジカル リソーセス プロプライアタリー リミティド 2
株式会社アステック入江 2
クロックナー ツェーエルアー パテント ゲゼルシャフト ミット ベシュレンクテル ハフツング 2
合同製鐵株式会社 2
総計 740
ケース4: 溶融還元法がタイトルに含まれる
特許一覧を取得してみる
• 主な企業の年次出願数をグラフにしてみる
2016/6/26 120
0
10
20
30
40
50
60
70
80
90
1971 1975 1977 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010
日本鋼管株式会社
新日本製鐵株式会社
川崎製鉄株式会社
JFEスチール株式会社
川崎重工業株式会社
ケース4-2: 溶融還元法がタイトルに含まれる特
許一覧とその発明者一覧を取得してみる
• select pub_num, pub_date, title, apnum, app_date, applicant.name,
applicant.addr, inventor.name, inventor.addr
from app_info
inner join applicant_corr_last on
app_info.idp=applicant_corr_last.idp
inner join applicant on applicant_corr_last.ids=applicant.ids
inner join inventor_corr_last on app_info.idp=inventor_corr_last.idp
inner join inventor on inventor_corr_last.ids=inventor.ids
where title like "%溶融還元%";
2016/6/26 121
ケース4-2: 溶融還元法がタイトルに含まれる特
許一覧とその発明者一覧を取得してみる
• データが取得できる
2016/6/26 122
ケース4-2: 溶融還元法がタイトルに含まれる特
許一覧とその発明者一覧を取得してみる
• 研究開発チームの規模を測定してみる
2016/6/26 123
日本鋼管株式会社 新日本製鐵株式会社 川崎製鉄株式会社 JFEスチール株式会社 川崎重工業株式会社
発明者
数
特許数
特許あたりの
発明者数
発明者
数
特許数
特許あたり
の発明者
数
発明者
数
特許数
特許あたり
の発明者
数
発明者
数
特許数
特許あたり
の発明者
数
発明者
数
特許数
特許あたり
の発明者
数
1977 4 0
1981 6 2 3 8 1 8
1982 14 3 4.666667 159 22 7.227273
1983 50 9 5.555556 121 17 7.117647
1984 31 5 6.2 3 1 3 8 3 2.666667
1985 36 7 5.142857143 22 4 5.5 6 2 3
1986 328 85 3.858823529 165 42 3.928571 77 18 4.277778
1987 113 20 5.65 12 5 2.4 15 3 5 41 8 5.125
1988 145 29 5 158 45 3.511111 31 9 3.444444 7 4 1.75
1989 40 10 4 30 9 3.333333 23 5 4.6
1990 140 31 4.516129032 46 16 2.875 6 2 3 24 3 8
1991 47 10 4.7 46 15 3.066667 22 8 2.75 4 1 4
1992 12 1 12 4 1 4 44 14 3.142857
1993 41 8 5.125 1 1 1 8 2 4 4 2 2
1994 26 4 6.5 2 1 2 8 3 2.666667 10 2 5 1 1 1
1995 13 4 3.25 9 2 4.5 30 6 5
1996 7 1 7 21 14 1.5 19 4 4.75
1997 17 15 4 1 4 52 11 4.727273
1998 17 10 1.7 21 5 4.2
1999 38 7 5.428571
2000 19 6 3.166667 8 2 4
2001 23 7 3.285714 2 1 2
2002 5 2 2.5
2003 3 1 3
2004 7 3 2.333333
2005 2 1 2
2006 6 1 6
2007 7 2 3.5
2008 8 2 4
2009 5 1 5 15 4 3.75
2010 4 1 4
ケース4-2: 溶融還元法がタイトルに含まれる特
許一覧とその発明者一覧を取得してみる
• 気になること1: 企業を移動した発明者が存在?
• 解決方法: NISTEP 企業名辞書などでマッチングする
2016/6/26 124
ケース4-2: 溶融還元法がタイトルに含まれる特
許一覧とその発明者一覧を取得してみる
• 気になること2: クラスターを分析するにも、住所の情報も名寄せが必要
• 解決方法: 住所標準化ツールを利用する
2016/6/26 125
ケース4-3: 溶融還元法がタイトルに含まれ
る特許の後方引用情報を取得してみる
• select pub_num, pub_date, title, apnum, app_date, citation.cited,
citation.type
from app_info
inner join applicant_corr_last on
app_info.idp=applicant_corr_last.idp
inner join citation on app_info.app_num=citation.citing
where title like "%溶融還元%"
2016/6/26 126
ケース4-3: 溶融還元法がタイトルに含まれ
る特許の後方引用情報を取得してみる
• データが取得される
2016/6/26 127
ケース4-3: 溶融還元法がタイトルに含まれ
る特許の後方引用情報を取得してみる
• 文字コード (utf-8(BOMなし) -> utf-
8(BOMつき)) を変えて Excel に放り
込む
• 出願年と引用した特許の出願番号
(年)が分かっているので、この2つ
のデータを処理すれば特許間の引
用タイミングが計測できる
• 審査官引用か発明者引用かがチェッ
クできる
• ただし、複数行に同一の特許があ
る。
• ネットワーク分析をする時には使える
けど、数を数えたいだけの場合は不
便。。。
2016/6/26 128
ケース4-4: 溶融還元法がタイトルに含まれる特許の後方引
用情報を取得する。また、被引用数を数え出願番号ごとに並
べる。
• select pub_num, pub_date, title, apnum, app_date,
count(citation.cited), citation.type
from app_info
inner join applicant_corr_last on
app_info.idp=applicant_corr_last.idp
inner join citation on app_info.app_num=citation.citing
where title like "%溶融還元%“
group by apnum
2016/6/26 129
• 変更点
• 特許の被引用数をカウントする
• 出願番号でまとめる
ケース4-4: 溶融還元法がタイトルに含まれる特許の後方引用情
報を取得する。また、被引用数を数え出願番号ごとに並べる。
• ケース4-3. とは異なり, 出願番号ごとに被引用数が集計されている.
2016/6/26 130
ケース4-4: 溶融還元法がタイトルに含まれる特許の後方引用情
報を取得する。また、引用数を数え出願番号ごとに並べる。
• 集計してみる
2016/6/26 131
161
99
299
審査官引用 特許公報記載引用
両方に記載された引用
0
2
4
6
8
10
12
1975
1976
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2009
出願年あたりの平均引用数
ケース4-5.溶融還元法がタイトルに含まれる特許の前方引用情報を
取得して, 被引用特許の出願から引用までの時間までを測ってみる
• データを取得する
• app_date と citing
を使って, “引用された
特許が出願されてから
引用されるまでの年数”
をそれぞれ測ってみる
• ヒント
• YEAR 関数
LEFT 関数
2016/6/26 132
ケース4-5.溶融還元法がタイトルに含まれる特許の前方引用情報を
取得して, 被引用特許の出願から引用までの時間までを測ってみる
• グラフにした結果
• 黄色い線: 年ごとの後方
引用を行った特許の数
• 青い線: 被引用特許の
出願後,引用されるまでに
要する年数の平均
2016/6/26 133
0
10
20
30
40
50
60
70
1975
1977
1978
1979
1980
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
http://www.slideshare.net/yasushihara/scirex-sql-1
今日の資料です
2016/6/26 134

SciREX イノベーション分析手法勉強会 第七回 「SQL 入門と特許データベース分析(その1)」