SlideShare a Scribd company logo
AIDB, Treviso 2/12/16 Gianluca Tarasconi – Icrios - Univ. Bocconi
About the speaker
 Background in Management Engineering @
Politecnico of Milan
 Database Architect @ Icrios since 2002
 Project manager for data production in EU Projects
STI-NET, TENIA, AEGIS and EU Tenders ICT
network impact, INNOVA, Highly Cited Patents,
Measurement and analysis of knowledge and R&D
exploitation flows, assessed by patent and licensing
data
 Co-Founder ipQuants.com
 Collaborations on database projects with: MIT, LSE,
Danish Board of Technology, Bonn Graduate School
of Economic, Universtät Mainz, BETA …
 Redactor of blog rawpatentdata.blogspot.com
Informazione dal brevetto
Phase When Information
disclosed
Patent application Filing date Some metadata
Patent application
– published
18 months after the
filing date
Full text and
metadata
Granted patent 2 years or more
after the filing date
Amended full text
and revised
metadata
Expired or ceased
patent
20 years after the
filing date (or
before in case of
unpaid fees)
Amended full text
and revised
metadata
Bonino, Dario, Alberto Ciaramella, and Fulvio Corno. "Review of the state-of-the-art in patent information
and forthcoming evolutions in intelligent patent informatics." World Patent Information 32.1 (2010): 30-38.
Information Providers
Information sources Information provided Degree of interest
Free portals of national or
regional patent offices
Patent text and metadata Always of interest, even in
combination with complementary
portals
Vendor-provided patent
databases
Patent text and metadata Business critical decisions
Vendor-provided extended
content of patent information
Patent mutual citations, patent
augmented abstracts
Useful
Patent legal databases Patent legal status and events
(e.g., litigations)
Always significant
Scientific literature portals Scientific papers For identifying the scientific
background
Business databases Company data and affiliations For integrating the business
background information
News Business news For integrating the business
background information
Internet Company portals, sector
portals
For low cost identification of the
scientific or business background
Web 2.0 solutions Wiki and blogs for patents Also for supporting the cooperative
work
Le 5 W applicate ai dati
 Who? («Chi?»)
 When? («Quando?»)
 Where? («Dove?»)
 What? («Cosa?»)
 Why? («Perché?»)
Who: companies
Chi dei due è Apple ?
- nome simile, sede diversa, area tecnologica compatibile
Who: companies (II)
 Conoscere:
 Identità
 Dimensione
 Struttura di gruppo
 …
 Match con database di terze parti
Triadic match orbis – TM – patents
[…] the register databases of
the EUIPO, the EPO and the
CPVO were matched with the
commercial database ORBIS.
The resulting matched database
contains data on approximately
240,000 companies, including
the number of EU trademarks,
registered Community designs,
patents and CPVRs applied for
by each company and
subsequently granted, along with
the industry classification and
various financial and economic
variables for each one, providing
a set of data that can be used in
future, more detailed studies […]
Orbis provides unique identifiers, Company information and summaries,
including incorporation date for over 200M private companies.
Database off line: NBER
https://sites.google.com/site/patentdataproject/Home
20
Contiene i dati completi di brevetto per USPTO ed un match con i dati di
COMPUSTAT; 11 tabelle in formato STATA o ASCII
Vantaggi:
Risorsa Gratuita
Dati standardizzati e collegati a COMPUSTAT
Svantaggi:
Solo USPTO
Aggiornamento non costante dei dati
WHO: Inventori
WHO: Inventori (II)
 Mobility studies
 Recruiting
 …
 Una risorsa di match è LINKEDIN
 “career histories based on patents are less than 70
percent accurate, while histories based on LinkedIn
are at least 90 percent accurate.”
 Ge, Chunmian, Ke‐Wei Huang, and Ivan PL Png.
"Engineer/scientist careers: Patents, online profiles, and
misclassification bias." Strategic Management Journal 37.1 (2016):
232-253.
Integrazione con dati
linkedin
 Titolo di studio
 Carriera
 Brevetti / pubblicazioni
 Skill / formazione
 Disambiguazione nomi
Due progetti github per Linkedin
 https://github.com/hexgnu/linkedin
 Ruby wrapper for the LinkedIn API. The LinkedIn
gem provides an easy-to-use wrapper for LinkedIn's
REST APIs.
 https://github.com/yatish27/linkedin-
scraper
 Linkedin-scraper is a gem for scraping linkedin public
profiles. Given the URL of the profile, it gets the name,
country, title, area, current companies, past companies,
organizations, skills, groups, etc
APE-INV - http://www.esf-ape-inv.eu/
 Ape inv è un progetto realizzato con
fondi ESF per realizzare una
disambiguazione dei dati degli inventori
accademici
Una risorsa per processare dati di
brevetto
Release from Fung inst. Berkeley
https://github.com/funginstitute/patentprocessor
A collection of scripts performs pre- and post-
processing on patent data as part of the patent
inventor disambiguation process. Raw patent
data is obtained from Google Bulk Patent Do
wnload.
When
 Catturare il momento dell’innovazione
attraverso la letteratura scientifica
 Individuare prior art / disclosures
(opposition)
 Lens.org  risorsa che normalizza la
NPL
 ORCID  progetto per dare un id
univoco agli autori
When (II) lens.org
 https://www.lens.org/lens/search?q=nan
opipes -
 Link ad
articoli
Scientifici
(DOI)
When (III) ORCID API
 ORCID (www.orcid.org) API
Vedi anche https://groups.google.com/forum/#!forum/orcid-api-users
Scope Request Description
/orcid-profile returns data from the entire record
/orcid-bio
returns data from the biographical section of
the record
/read-limited /orcid-works returns research works data
/funding returns funding data
/affiliations returns affiliations data
Where
 I dati di brevetto spesso non contengono
un’informazione geografica utilizzabile
(missing / molto sporca / bias
temporale).
 Oecd Regpat domande di brevetto EPO
e PCT legate a più di 5 500 regioni
utilizzando gli indirizzi di inventori /
applicant
Altri DB OECD
 L'OCSE ha sviluppato 4 diversi set di dati sui brevetti,
disponibili senza costo scrivendo a: sti.contact@oecd.org.
 HAN (“Harmonised Applicants’ Names”) fornisce un dizionario di
nomi applicant elaborati con i dati del registro imprese, in modo
che possa facilmente essere utilizzati da tutti gli utenti. I Per
EPO e PCT.
 Famiglie triadiche: l’insieme di brevetti depositati presso EPO,
JPO e concessi da USPTO che condividono una o più priorità.
 Database di Citazioni : citazioni di brevetti pubblicati dall'EPO e
WIPO (PCT).
 Tutti i DB si legano facilmente a Patstat (alcuni dati sono
già integrati) ma sono collegabili anche ad altri database
What
18
http://db.crios.unibocconi.it
+ Accesso libero;
+ Consente di scaricare
dati in CSV per 18 tipi di
reports;
+ Dati ripuliti e riclassificati;
dati geografici disponibili;
What
18
PIUG WIKI http://wiki.piug.org/display/PIUG/Patent+Resources
Elenco
di risorse
online
sul mondo
dei brevetti
Conclusioni (I)…
 I dati di brevetto per se spesso non
contengono un’informazione completa
 Esistono numerose risorse che
arricchiscono questi dati
 Sempre più queste risorse sono messe a
disposizione gratuitamente o a basso costo
di acquisizione
 Vanno considerati i costi ‘nascosti’ di
integrazione (IT/DBM)
 Possibilità ridurre costi legandosi alla
ricerca accademica (PhD, Tesi…)
Conclusioni (II)…
Q & A
Contact:
Gianluca.Tarasconi@unibocconi.it

More Related Content

Viewers also liked

Patenting in the south
Patenting in the southPatenting in the south
Patenting in the south
Gianluca Tarasconi
 
Trackin patent applicant changes with a temporal database
Trackin patent applicant changes with a temporal databaseTrackin patent applicant changes with a temporal database
Trackin patent applicant changes with a temporal database
Gianluca Tarasconi
 
Industria italiana dal 78
Industria italiana dal 78Industria italiana dal 78
Industria italiana dal 78
Gianluca Tarasconi
 
Ep register for patent data analisys
Ep register for patent data analisysEp register for patent data analisys
Ep register for patent data analisys
Gianluca Tarasconi
 
PRS inpadoc legal data reclassification: db structure and some insights
 PRS inpadoc legal data reclassification: db structure and some insights PRS inpadoc legal data reclassification: db structure and some insights
PRS inpadoc legal data reclassification: db structure and some insights
Gianluca Tarasconi
 
Using patstat in universities evaluation procedures
Using patstat in universities evaluation procedures Using patstat in universities evaluation procedures
Using patstat in universities evaluation procedures
Gianluca Tarasconi
 
Sharing names and address cleaning patterns for Patstat
Sharing names and address cleaning patterns for PatstatSharing names and address cleaning patterns for Patstat
Sharing names and address cleaning patterns for Patstat
Gianluca Tarasconi
 
Patent databases for business intelligence
Patent databases for business intelligencePatent databases for business intelligence
Patent databases for business intelligenceGianluca Tarasconi
 
Patstat and patstat related resources for patent data analisys
Patstat and patstat related resources for patent data analisysPatstat and patstat related resources for patent data analisys
Patstat and patstat related resources for patent data analisys
Gianluca Tarasconi
 
Patstat 7 deadly sin and how to solve them
Patstat 7 deadly sin and how to solve themPatstat 7 deadly sin and how to solve them
Patstat 7 deadly sin and how to solve them
Gianluca Tarasconi
 
Non-Patent Exclusivities
Non-Patent Exclusivities Non-Patent Exclusivities
Non-Patent Exclusivities
Bhaswat Chakraborty
 
Patents and Innovation - Mip 2010
Patents and Innovation - Mip 2010Patents and Innovation - Mip 2010
Patents and Innovation - Mip 2010
Gualtiero Dragotti
 
Patents & market exclusivity
Patents & market exclusivityPatents & market exclusivity
Patents & market exclusivity
GMP EDUCATION : Not for Profit Organization
 
Chapter 1 What is Public Relations?
Chapter 1 What is Public Relations?Chapter 1 What is Public Relations?
Chapter 1 What is Public Relations?
Barbara Nixon
 

Viewers also liked (14)

Patenting in the south
Patenting in the southPatenting in the south
Patenting in the south
 
Trackin patent applicant changes with a temporal database
Trackin patent applicant changes with a temporal databaseTrackin patent applicant changes with a temporal database
Trackin patent applicant changes with a temporal database
 
Industria italiana dal 78
Industria italiana dal 78Industria italiana dal 78
Industria italiana dal 78
 
Ep register for patent data analisys
Ep register for patent data analisysEp register for patent data analisys
Ep register for patent data analisys
 
PRS inpadoc legal data reclassification: db structure and some insights
 PRS inpadoc legal data reclassification: db structure and some insights PRS inpadoc legal data reclassification: db structure and some insights
PRS inpadoc legal data reclassification: db structure and some insights
 
Using patstat in universities evaluation procedures
Using patstat in universities evaluation procedures Using patstat in universities evaluation procedures
Using patstat in universities evaluation procedures
 
Sharing names and address cleaning patterns for Patstat
Sharing names and address cleaning patterns for PatstatSharing names and address cleaning patterns for Patstat
Sharing names and address cleaning patterns for Patstat
 
Patent databases for business intelligence
Patent databases for business intelligencePatent databases for business intelligence
Patent databases for business intelligence
 
Patstat and patstat related resources for patent data analisys
Patstat and patstat related resources for patent data analisysPatstat and patstat related resources for patent data analisys
Patstat and patstat related resources for patent data analisys
 
Patstat 7 deadly sin and how to solve them
Patstat 7 deadly sin and how to solve themPatstat 7 deadly sin and how to solve them
Patstat 7 deadly sin and how to solve them
 
Non-Patent Exclusivities
Non-Patent Exclusivities Non-Patent Exclusivities
Non-Patent Exclusivities
 
Patents and Innovation - Mip 2010
Patents and Innovation - Mip 2010Patents and Innovation - Mip 2010
Patents and Innovation - Mip 2010
 
Patents & market exclusivity
Patents & market exclusivityPatents & market exclusivity
Patents & market exclusivity
 
Chapter 1 What is Public Relations?
Chapter 1 What is Public Relations?Chapter 1 What is Public Relations?
Chapter 1 What is Public Relations?
 

Similar to QUELLO CHE I BREVETTI NON DICONO Aidb 2/12/16

Presentazione sce
Presentazione scePresentazione sce
Presentazione sce
Pina Civitella
 
Net7 @ Master Big Data 2017
Net7 @ Master Big Data 2017Net7 @ Master Big Data 2017
Net7 @ Master Big Data 2017
Net7
 
Servizi informativi integrati ed interattivi: Interoperabilità
Servizi informativi integrati ed interattivi: InteroperabilitàServizi informativi integrati ed interattivi: Interoperabilità
Servizi informativi integrati ed interattivi: Interoperabilità
accessoinformazione
 
Open Data 4 Startups
Open Data 4 StartupsOpen Data 4 Startups
Open Data 4 Startupsmzaglio
 
Workshop2406 ptl rsc_v1
Workshop2406 ptl rsc_v1Workshop2406 ptl rsc_v1
Workshop2406 ptl rsc_v1Marco Combetto
 
Enel Opencompany
Enel OpencompanyEnel Opencompany
Enel Opencompany
Raffaele Cirullo
 
Il "Knowledge Graph" della Pubblica Amministrazione Italiana
Il "Knowledge Graph" della Pubblica Amministrazione ItalianaIl "Knowledge Graph" della Pubblica Amministrazione Italiana
Il "Knowledge Graph" della Pubblica Amministrazione Italiana
GraphRM
 
IntelliSemantic e il progetto Europeo TOPAS
IntelliSemantic e il progetto Europeo TOPAS IntelliSemantic e il progetto Europeo TOPAS
IntelliSemantic e il progetto Europeo TOPAS
IntelliSemantic
 
Po Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open DataPo Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open Data
Daniele Mondello
 
Startup e open data a firenze saaa2018
Startup e open data a firenze saaa2018Startup e open data a firenze saaa2018
Startup e open data a firenze saaa2018
Francesca De Chiara
 
FPA Premio PA sostenibile MAECI Innovitalia
FPA Premio PA sostenibile MAECI InnovitaliaFPA Premio PA sostenibile MAECI Innovitalia
FPA Premio PA sostenibile MAECI Innovitalia
CGLon
 
Master Informatica del Testo – Edizione elettronica - Arezzo 2013
Master Informatica del Testo – Edizione elettronica - Arezzo 2013Master Informatica del Testo – Edizione elettronica - Arezzo 2013
Master Informatica del Testo – Edizione elettronica - Arezzo 2013
Walter Volpi
 
Smart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsSmart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of Things
CSI Piemonte
 
Linked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoLinked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di Tomaso
CELI
 
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...
Ontologie per i linked open  data / Stefano De Luca, Paola De Caro, Claudia C...Ontologie per i linked open  data / Stefano De Luca, Paola De Caro, Claudia C...
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...
libriedocumenti
 
Conf Stampa 2010 V1.4
Conf Stampa 2010 V1.4Conf Stampa 2010 V1.4
Conf Stampa 2010 V1.4
Silvio Filippi
 
Conf stampa 2010 v1.4
Conf stampa 2010 v1.4Conf stampa 2010 v1.4
Conf stampa 2010 v1.4
Silvio Filippi
 
Open data, informazioni accessibili a tutti
Open data, informazioni accessibili a tuttiOpen data, informazioni accessibili a tutti
Open data, informazioni accessibili a tutti
Stefano Sabatini
 
Dati.gov.it. Il portale dei dati aperti
Dati.gov.it. Il portale dei dati apertiDati.gov.it. Il portale dei dati aperti
Dati.gov.it. Il portale dei dati aperti
FPA
 
Open Data: l'esperienza del Piemonte
Open Data: l'esperienza del PiemonteOpen Data: l'esperienza del Piemonte
Open Data: l'esperienza del Piemonte
Comune di Bologna
 

Similar to QUELLO CHE I BREVETTI NON DICONO Aidb 2/12/16 (20)

Presentazione sce
Presentazione scePresentazione sce
Presentazione sce
 
Net7 @ Master Big Data 2017
Net7 @ Master Big Data 2017Net7 @ Master Big Data 2017
Net7 @ Master Big Data 2017
 
Servizi informativi integrati ed interattivi: Interoperabilità
Servizi informativi integrati ed interattivi: InteroperabilitàServizi informativi integrati ed interattivi: Interoperabilità
Servizi informativi integrati ed interattivi: Interoperabilità
 
Open Data 4 Startups
Open Data 4 StartupsOpen Data 4 Startups
Open Data 4 Startups
 
Workshop2406 ptl rsc_v1
Workshop2406 ptl rsc_v1Workshop2406 ptl rsc_v1
Workshop2406 ptl rsc_v1
 
Enel Opencompany
Enel OpencompanyEnel Opencompany
Enel Opencompany
 
Il "Knowledge Graph" della Pubblica Amministrazione Italiana
Il "Knowledge Graph" della Pubblica Amministrazione ItalianaIl "Knowledge Graph" della Pubblica Amministrazione Italiana
Il "Knowledge Graph" della Pubblica Amministrazione Italiana
 
IntelliSemantic e il progetto Europeo TOPAS
IntelliSemantic e il progetto Europeo TOPAS IntelliSemantic e il progetto Europeo TOPAS
IntelliSemantic e il progetto Europeo TOPAS
 
Po Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open DataPo Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open Data
 
Startup e open data a firenze saaa2018
Startup e open data a firenze saaa2018Startup e open data a firenze saaa2018
Startup e open data a firenze saaa2018
 
FPA Premio PA sostenibile MAECI Innovitalia
FPA Premio PA sostenibile MAECI InnovitaliaFPA Premio PA sostenibile MAECI Innovitalia
FPA Premio PA sostenibile MAECI Innovitalia
 
Master Informatica del Testo – Edizione elettronica - Arezzo 2013
Master Informatica del Testo – Edizione elettronica - Arezzo 2013Master Informatica del Testo – Edizione elettronica - Arezzo 2013
Master Informatica del Testo – Edizione elettronica - Arezzo 2013
 
Smart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsSmart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of Things
 
Linked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoLinked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di Tomaso
 
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...
Ontologie per i linked open  data / Stefano De Luca, Paola De Caro, Claudia C...Ontologie per i linked open  data / Stefano De Luca, Paola De Caro, Claudia C...
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...
 
Conf Stampa 2010 V1.4
Conf Stampa 2010 V1.4Conf Stampa 2010 V1.4
Conf Stampa 2010 V1.4
 
Conf stampa 2010 v1.4
Conf stampa 2010 v1.4Conf stampa 2010 v1.4
Conf stampa 2010 v1.4
 
Open data, informazioni accessibili a tutti
Open data, informazioni accessibili a tuttiOpen data, informazioni accessibili a tutti
Open data, informazioni accessibili a tutti
 
Dati.gov.it. Il portale dei dati aperti
Dati.gov.it. Il portale dei dati apertiDati.gov.it. Il portale dei dati aperti
Dati.gov.it. Il portale dei dati aperti
 
Open Data: l'esperienza del Piemonte
Open Data: l'esperienza del PiemonteOpen Data: l'esperienza del Piemonte
Open Data: l'esperienza del Piemonte
 

More from Gianluca Tarasconi

Of Unicorns, Yetis, and Error-Free Datasets (or what is data quality?)
Of Unicorns, Yetis, and Error-Free Datasets (or what is data quality?)Of Unicorns, Yetis, and Error-Free Datasets (or what is data quality?)
Of Unicorns, Yetis, and Error-Free Datasets (or what is data quality?)
Gianluca Tarasconi
 
PATSTAT & Patentsview: complements or substitutes?
PATSTAT & Patentsview: complements or substitutes?PATSTAT & Patentsview: complements or substitutes?
PATSTAT & Patentsview: complements or substitutes?
Gianluca Tarasconi
 
Patents applicants: how to create the full time series
Patents applicants: how to create the full time seriesPatents applicants: how to create the full time series
Patents applicants: how to create the full time series
Gianluca Tarasconi
 
Patstat indicators step by step
Patstat indicators step by stepPatstat indicators step by step
Patstat indicators step by step
Gianluca Tarasconi
 
Matching PATSTAT to Crunchbase
Matching PATSTAT to CrunchbaseMatching PATSTAT to Crunchbase
Matching PATSTAT to Crunchbase
Gianluca Tarasconi
 
PATSTAT users 7 sins
PATSTAT users 7 sinsPATSTAT users 7 sins
PATSTAT users 7 sins
Gianluca Tarasconi
 

More from Gianluca Tarasconi (6)

Of Unicorns, Yetis, and Error-Free Datasets (or what is data quality?)
Of Unicorns, Yetis, and Error-Free Datasets (or what is data quality?)Of Unicorns, Yetis, and Error-Free Datasets (or what is data quality?)
Of Unicorns, Yetis, and Error-Free Datasets (or what is data quality?)
 
PATSTAT & Patentsview: complements or substitutes?
PATSTAT & Patentsview: complements or substitutes?PATSTAT & Patentsview: complements or substitutes?
PATSTAT & Patentsview: complements or substitutes?
 
Patents applicants: how to create the full time series
Patents applicants: how to create the full time seriesPatents applicants: how to create the full time series
Patents applicants: how to create the full time series
 
Patstat indicators step by step
Patstat indicators step by stepPatstat indicators step by step
Patstat indicators step by step
 
Matching PATSTAT to Crunchbase
Matching PATSTAT to CrunchbaseMatching PATSTAT to Crunchbase
Matching PATSTAT to Crunchbase
 
PATSTAT users 7 sins
PATSTAT users 7 sinsPATSTAT users 7 sins
PATSTAT users 7 sins
 

QUELLO CHE I BREVETTI NON DICONO Aidb 2/12/16

  • 1. AIDB, Treviso 2/12/16 Gianluca Tarasconi – Icrios - Univ. Bocconi
  • 2. About the speaker  Background in Management Engineering @ Politecnico of Milan  Database Architect @ Icrios since 2002  Project manager for data production in EU Projects STI-NET, TENIA, AEGIS and EU Tenders ICT network impact, INNOVA, Highly Cited Patents, Measurement and analysis of knowledge and R&D exploitation flows, assessed by patent and licensing data  Co-Founder ipQuants.com  Collaborations on database projects with: MIT, LSE, Danish Board of Technology, Bonn Graduate School of Economic, Universtät Mainz, BETA …  Redactor of blog rawpatentdata.blogspot.com
  • 3. Informazione dal brevetto Phase When Information disclosed Patent application Filing date Some metadata Patent application – published 18 months after the filing date Full text and metadata Granted patent 2 years or more after the filing date Amended full text and revised metadata Expired or ceased patent 20 years after the filing date (or before in case of unpaid fees) Amended full text and revised metadata Bonino, Dario, Alberto Ciaramella, and Fulvio Corno. "Review of the state-of-the-art in patent information and forthcoming evolutions in intelligent patent informatics." World Patent Information 32.1 (2010): 30-38.
  • 4. Information Providers Information sources Information provided Degree of interest Free portals of national or regional patent offices Patent text and metadata Always of interest, even in combination with complementary portals Vendor-provided patent databases Patent text and metadata Business critical decisions Vendor-provided extended content of patent information Patent mutual citations, patent augmented abstracts Useful Patent legal databases Patent legal status and events (e.g., litigations) Always significant Scientific literature portals Scientific papers For identifying the scientific background Business databases Company data and affiliations For integrating the business background information News Business news For integrating the business background information Internet Company portals, sector portals For low cost identification of the scientific or business background Web 2.0 solutions Wiki and blogs for patents Also for supporting the cooperative work
  • 5. Le 5 W applicate ai dati  Who? («Chi?»)  When? («Quando?»)  Where? («Dove?»)  What? («Cosa?»)  Why? («Perché?»)
  • 6. Who: companies Chi dei due è Apple ? - nome simile, sede diversa, area tecnologica compatibile
  • 7. Who: companies (II)  Conoscere:  Identità  Dimensione  Struttura di gruppo  …  Match con database di terze parti
  • 8. Triadic match orbis – TM – patents […] the register databases of the EUIPO, the EPO and the CPVO were matched with the commercial database ORBIS. The resulting matched database contains data on approximately 240,000 companies, including the number of EU trademarks, registered Community designs, patents and CPVRs applied for by each company and subsequently granted, along with the industry classification and various financial and economic variables for each one, providing a set of data that can be used in future, more detailed studies […] Orbis provides unique identifiers, Company information and summaries, including incorporation date for over 200M private companies.
  • 9. Database off line: NBER https://sites.google.com/site/patentdataproject/Home 20 Contiene i dati completi di brevetto per USPTO ed un match con i dati di COMPUSTAT; 11 tabelle in formato STATA o ASCII Vantaggi: Risorsa Gratuita Dati standardizzati e collegati a COMPUSTAT Svantaggi: Solo USPTO Aggiornamento non costante dei dati
  • 11. WHO: Inventori (II)  Mobility studies  Recruiting  …  Una risorsa di match è LINKEDIN  “career histories based on patents are less than 70 percent accurate, while histories based on LinkedIn are at least 90 percent accurate.”  Ge, Chunmian, Ke‐Wei Huang, and Ivan PL Png. "Engineer/scientist careers: Patents, online profiles, and misclassification bias." Strategic Management Journal 37.1 (2016): 232-253.
  • 12. Integrazione con dati linkedin  Titolo di studio  Carriera  Brevetti / pubblicazioni  Skill / formazione  Disambiguazione nomi
  • 13. Due progetti github per Linkedin  https://github.com/hexgnu/linkedin  Ruby wrapper for the LinkedIn API. The LinkedIn gem provides an easy-to-use wrapper for LinkedIn's REST APIs.  https://github.com/yatish27/linkedin- scraper  Linkedin-scraper is a gem for scraping linkedin public profiles. Given the URL of the profile, it gets the name, country, title, area, current companies, past companies, organizations, skills, groups, etc
  • 14. APE-INV - http://www.esf-ape-inv.eu/  Ape inv è un progetto realizzato con fondi ESF per realizzare una disambiguazione dei dati degli inventori accademici
  • 15. Una risorsa per processare dati di brevetto Release from Fung inst. Berkeley https://github.com/funginstitute/patentprocessor A collection of scripts performs pre- and post- processing on patent data as part of the patent inventor disambiguation process. Raw patent data is obtained from Google Bulk Patent Do wnload.
  • 16. When  Catturare il momento dell’innovazione attraverso la letteratura scientifica  Individuare prior art / disclosures (opposition)  Lens.org  risorsa che normalizza la NPL  ORCID  progetto per dare un id univoco agli autori
  • 17. When (II) lens.org  https://www.lens.org/lens/search?q=nan opipes -  Link ad articoli Scientifici (DOI)
  • 18. When (III) ORCID API  ORCID (www.orcid.org) API Vedi anche https://groups.google.com/forum/#!forum/orcid-api-users Scope Request Description /orcid-profile returns data from the entire record /orcid-bio returns data from the biographical section of the record /read-limited /orcid-works returns research works data /funding returns funding data /affiliations returns affiliations data
  • 19. Where  I dati di brevetto spesso non contengono un’informazione geografica utilizzabile (missing / molto sporca / bias temporale).  Oecd Regpat domande di brevetto EPO e PCT legate a più di 5 500 regioni utilizzando gli indirizzi di inventori / applicant
  • 20. Altri DB OECD  L'OCSE ha sviluppato 4 diversi set di dati sui brevetti, disponibili senza costo scrivendo a: sti.contact@oecd.org.  HAN (“Harmonised Applicants’ Names”) fornisce un dizionario di nomi applicant elaborati con i dati del registro imprese, in modo che possa facilmente essere utilizzati da tutti gli utenti. I Per EPO e PCT.  Famiglie triadiche: l’insieme di brevetti depositati presso EPO, JPO e concessi da USPTO che condividono una o più priorità.  Database di Citazioni : citazioni di brevetti pubblicati dall'EPO e WIPO (PCT).  Tutti i DB si legano facilmente a Patstat (alcuni dati sono già integrati) ma sono collegabili anche ad altri database
  • 21. What 18 http://db.crios.unibocconi.it + Accesso libero; + Consente di scaricare dati in CSV per 18 tipi di reports; + Dati ripuliti e riclassificati; dati geografici disponibili;
  • 23. Conclusioni (I)…  I dati di brevetto per se spesso non contengono un’informazione completa  Esistono numerose risorse che arricchiscono questi dati  Sempre più queste risorse sono messe a disposizione gratuitamente o a basso costo di acquisizione  Vanno considerati i costi ‘nascosti’ di integrazione (IT/DBM)  Possibilità ridurre costi legandosi alla ricerca accademica (PhD, Tesi…)