0
Linked Data for    functional genomics                            Mikel Egaña Aranguren                       3205 School ...
Index         What is Linked Data?         Publishing Linked Data         Consuming Linked Data         Issues with (Life ...
What is Linked Data?Linked Data for functional genomics
What is Linked Data?      A first step towards the Semantic Web   Query RDF                                              “...
What is Linked Data?         Linked Data principles         1) Use URIs as names for things         2) Use HTTP URIs so th...
What is Linked Data?         With Linked Data we publish data         Semantically: the data model is explicit for compute...
What is Linked Data?         With Linked Data we publish data         Semantically: the data model is explicit for compute...
What is Linked Data?         With Linked Data we publish data         Semantically: the data model is explicit for compute...
What is Linked Data?   Global network of Linked Data                                                                      ...
What is Linked Data?         Internet of data rather than documents, a “universal DB”         Find preciselly what we are ...
What is Linked Data?Linked Open Data (LOD) cloud   http://richard.cyganiak.de/2007/10/lod/lod-datasets_2011-09-19_colored....
What is Linked Data?                      A graph is a collection of RDF triples                      A triple store holds...
What is Linked Data?                    Human             HTML                                               Content negot...
What is Linked Data?                    Human             HTML                                               Content negot...
What is Linked Data?                    Human             HTML                                               Content negot...
What is Linked Data?                                                       Biomolecule                                    ...
Consuming Linked DataLinked Data for functional genomics
Consuming Linked Data                                      Navigate                                       Query           ...
Consuming Linked Data         Bio2RDF (http://bio2rdf.org/)         OGOLOD (http://miuras.inf.um.es/~ogo/ogolod.html)     ...
Consuming Linked Data         NavigateLinked Data for functional genomics
Consuming Linked Data         NavigateLinked Data for functional genomics
Consuming Linked Data         Query different resources combining the information         Select all located in Y-chromoso...
Consuming Linked Data         Query different resources combining the information         We will receive only the triples...
Consuming Linked Data         For retrieving triples from other triple stores we need federated            queries:       ...
Consuming Linked Data         Hypotheses evaluation with HyQue*         http://semanticscience.org/projects/hyque/        ...
Consuming Linked Data         Meshups: applications that consume LOD          Combining information from different dataset...
Publishing Linked DataLinked Data for functional genomics
Publishing Linked DataXMLFlat file  DB                                          Link                                      ...
Publishing Linked Data         Announce your data         Comprehensive Knowledge Archive Network (http://ckan.org/)      ...
Publishing Linked Data         Why publish our data in the LOD?Linked Data for functional genomics
Publishing Linked Data         Why publish our data in the LOD?         Its the links, stupidLinked Data for functional ge...
Publishing Linked Data         Why publish our data in the LOD?         Its the links, stupid         Only publish our dat...
Publishing Linked Data         Why publish our data in the LOD?         Its the links, stupid         Only publish our dat...
Publishing Linked Data         Why publish our data in the LOD?         Its the links, stupid (II)Linked Data for function...
Publishing Linked Data         Why publish our data in the LOD?         Its the links, stupid (II)         By using (HTTP)...
Publishing Linked Data         Why publish our data in the LOD?         Its the links, stupid (II)         By using (HTTP)...
Publishing Linked Data         Why publish our data in the LOD?         Its the semantics, stupidLinked Data for functiona...
Publishing Linked Data         Why publish our data in the LOD?         Its the semantics, stupid         The meaning of o...
Issues with (Life Sciences)                                 Linked DataLinked Data for functional genomics
Issues with (Life Sciences) Linked Open Data         Provenance (e.g. For Microarray data)         Shared identifiers     ...
ConclusionsLinked Data for functional genomics
Conclusions         Linked Data offers a straight method to publish data            semantically in the current web:      ...
Conclusions         Linked Data is here to stay         Already used by many, including governments, BBC, ...         A fi...
More information         Semantic Web Health Care and Life Sciences (HCLS) Interest           Group at W3C: http://www.w3....
Acknowledgements         Im funded by the Marie Curie Cofund programme (FP7)          I unashamedly recycled stuff from pr...
Upcoming SlideShare
Loading in...5
×

Linked data functional genomics

865

Published on

Published in: Education
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
865
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
24
Comments
0
Likes
3
Embeds 0
No embeds

No notes for slide

Transcript of "Linked data functional genomics"

  1. 1. Linked Data for  functional genomics Mikel Egaña Aranguren 3205 School of Computer Science Universidad Politécnica de Madrid (UPM) 28660 Boadilla del Monte Spain Ontology Engineering Group (OEG) http://www.oeg-upm.net megana@fi.upm.es http://mikeleganaaranguren.comhttp://www.slideshare.net/MikelEganaAranguren/linked-data-functional-genomics 1/12/2011
  2. 2. Index What is Linked Data? Publishing Linked Data Consuming Linked Data Issues with (Life Sciences) Linked Data ConclusionsLinked Data for functional genomics
  3. 3. What is Linked Data?Linked Data for functional genomics
  4. 4. What is Linked Data? A first step towards the Semantic Web Query RDF “Schema” for RDF “The HTML for data”Identify things on the netLinked Data for functional genomics
  5. 5. What is Linked Data? Linked Data principles 1) Use URIs as names for things 2) Use HTTP URIs so that people can look up those names 3) When someone looks up a URI, provide useful information, using the  standards (RDF, SPARQL) 4) Include links to other URIs so that they can discover more things http://www.w3.org/DesignIssues/LinkedData.htmlLinked Data for functional genomics
  6. 6. What is Linked Data? With Linked Data we publish data Semantically: the data model is explicit for computers (RDF triple) Predicate Subject ObjectLinked Data for functional genomics
  7. 7. What is Linked Data? With Linked Data we publish data Semantically: the data model is explicit for computers (RDF triple) Predicate Subject Object participates_in Q5SIF0 ATP bindingLinked Data for functional genomics
  8. 8. What is Linked Data? With Linked Data we publish data Semantically: the data model is explicit for computers (RDF triple) Predicate Subject Object participates_in Q5SIF0 ATP binding Inter-linked: the data is linked to data from other resources over the web participates_in part_of Predicate Predicate Q5SIF0 ATP binding Signal transduction Subject Subject / Object ObjectLinked Data for functional genomics
  9. 9. What is Linked Data? Global network of Linked Data part_of participates_in ATP binding Signal transduction Q5SIF0 is_regulated_by has_part Regulation of MAP Purinergic nucleotide kinase activity receptor activityLinked Data for functional genomics
  10. 10. What is Linked Data? Internet of data rather than documents, a “universal DB” Find preciselly what we are looking for: direct queries rather than text  processing (SPARQL) Linking new data is as easy as linking a web page We can navigate through the data directly (RDF), rather than navigating  through documents that represent data in natural language (HTML) Build applications that exploit the data Apply automated reasoning on the dataLinked Data for functional genomics
  11. 11. What is Linked Data?Linked Open Data (LOD) cloud http://richard.cyganiak.de/2007/10/lod/lod-datasets_2011-09-19_colored.html Linked Data for functional genomics
  12. 12. What is Linked Data? A graph is a collection of RDF triples A triple store holds different graphsLinked Data for functional genomics
  13. 13. What is Linked Data? Human HTML  Content negotiation Computer RDFLinked Data for functional genomics
  14. 14. What is Linked Data? Human HTML  Content negotiation Computer RDFLinked Data for functional genomics
  15. 15. What is Linked Data? Human HTML  Content negotiation Computer RDF Human HTML  Content negotiation Computer RDFLinked Data for functional genomics
  16. 16. What is Linked Data? Biomolecule rdfs:subClassOfVocabulary Protein Molecular Function(Ontology)Instances rdf:type rdf:type rdf:type participates_in Q5SIF0 ATP binding owl:sameAs CycB Dataset  Dataset  Linked Data for functional genomics
  17. 17. Consuming Linked DataLinked Data for functional genomics
  18. 18. Consuming Linked Data Navigate Query MeshupsLinked Data for functional genomics
  19. 19. Consuming Linked Data Bio2RDF (http://bio2rdf.org/) OGOLOD (http://miuras.inf.um.es/~ogo/ogolod.html) LinkedLifeData (http://linkedlifedata.com/) HyQue* (http://semanticscience.org/projects/hyque/index.html) ArrayExpress and Gene expression atlas*  (http://www.ebi.ac.uk/arrayexpress/) * not really LD, close to LD, but (likely) soon will be full LDLinked Data for functional genomics
  20. 20. Consuming Linked Data NavigateLinked Data for functional genomics
  21. 21. Consuming Linked Data NavigateLinked Data for functional genomics
  22. 22. Consuming Linked Data Query different resources combining the information Select all located in Y-chromosome, human genes with known molecular  interactions, which are analysed with Transfection PREFIX skos: <http://www.w3.org/2004/02/skos/core#> PREFIX gene: <http://linkedlifedata.com/resource/entrezgene/> PREFIX core: <http://purl.uniprot.org/core/> PREFIX biopax2: <http://www.biopax.org/release/biopax-level2.owl#> PREFIX lifeskim: <http://linkedlifedata.com/resource/lifeskim/> PREFIX umls: <http://linkedlifedata.com/resource/umls/> PREFIX pubmed: <http://linkedlifedata.com/resource/pubmed/> SELECT distinct ?genedescription ?prefLabel WHERE {     ?p biopax2:PHYSICAL-ENTITY ?protein .     ?protein skos:exactMatch ?uniprotaccession .     ?uniprotaccession core:organism <http://purl.uniprot.org/taxonomy/9606> .     ?geneid gene:uniprotAccession ?uniprotaccession .     ?geneid gene:description ?genedescription .     ?geneid gene:pubmed ?pmid .     ?geneid gene:chromosome Y .     ?pmid lifeskim:mentions ?umlsid .     ?umlsid skos:prefLabel Transfection .     ?umlsid skos:prefLabel ?prefLabel . }  (http://linkedlifedata.com/sparql)Linked Data for functional genomics
  23. 23. Consuming Linked Data Query different resources combining the information We will receive only the triples of that triple store (but we can follow the  links to the triples stored in other triple stores!)Linked Data for functional genomics
  24. 24. Consuming Linked Data For retrieving triples from other triple stores we need federated  queries: SERVICE keyword in SPARQL 1.1 PREFIX foaf:   <http://xmlns.com/foaf/0.1/> SELECT ?name FROM <http://example.org/myfoaf.rdf> WHERE {   <http://example.org/myfoaf/I> foaf:knows ?person .   SERVICE <http://people.example.org/sparql> {      ?person foaf:name ?name . }  } http://www.w3.org/TR/sparql11-federated-query/Linked Data for functional genomics
  25. 25. Consuming Linked Data Hypotheses evaluation with HyQue* http://semanticscience.org/projects/hyque/ PREFIX hybrow: <http://bio2rdf.org/hybrow:> PREFIX semsci: <http://semanticscience.org/resource/> PREFIX bio2rdf: <http://bio2rdf.org/ns/bio2rdf:> select DISTINCT * where { ?event rdfs:label ?label . ?event rdf:type ?event_type . ?event_type rdfs:label ?event_type_label . ?event hybrow:is_negated ?negated . ?event hybrow:physical_context ?event_location . ?event hybrow:physical_operator ?physical_operator . ?event hybrow:agent_a ?actor . ?event hybrow:agent_b ?target . OPTIONAL {         { ?actor rdfs:subClassOf ?actor_type  } UNION { ?actor rdf:type ?actor_type } } OPTIONAL { { ?target rdfs:subClassOf ?target_type  } UNION { ?target rdf:type ?target_type }         } ?actor semsci:isLocatedIn ?actor_gp_id_location . ?actor_gp_id_location rdf:type ?actor_location_type . ?target semsci:isLocatedIn ?target_gp_id_location . ?target_gp_id_location rdf:type ?target_location_type . ?actor semsci:hasFunction ?actor_gp_id_function . ?actor_gp_id_function rdf:type ?actor_function_type . }Linked Data for functional genomics
  26. 26. Consuming Linked Data Meshups: applications that consume LOD  Combining information from different datasets and/or non LOD resources  (e.g. Google maps) e.g. specific visualisations e.g. “follow your nose” applicationsLinked Data for functional genomics
  27. 27. Publishing Linked DataLinked Data for functional genomics
  28. 28. Publishing Linked DataXMLFlat file DB Link  discovery Linked Data for functional genomics
  29. 29. Publishing Linked Data Announce your data Comprehensive Knowledge Archive Network (http://ckan.org/) Semantic Web index (http://sindice.com/)Linked Data for functional genomics
  30. 30. Publishing Linked Data Why publish our data in the LOD?Linked Data for functional genomics
  31. 31. Publishing Linked Data Why publish our data in the LOD? Its the links, stupidLinked Data for functional genomics
  32. 32. Publishing Linked Data Why publish our data in the LOD? Its the links, stupid Only publish our data, reference the rest: dont need to  duplicate external DB in oursLinked Data for functional genomics
  33. 33. Publishing Linked Data Why publish our data in the LOD? Its the links, stupid Only publish our data, reference the rest: dont need to  duplicate external DB in ours External info is updated independently and we get the benefit  to our dataset because its linked to it, without extra effortLinked Data for functional genomics
  34. 34. Publishing Linked Data Why publish our data in the LOD? Its the links, stupid (II)Linked Data for functional genomics
  35. 35. Publishing Linked Data Why publish our data in the LOD? Its the links, stupid (II) By using (HTTP) URIs, others can link to usLinked Data for functional genomics
  36. 36. Publishing Linked Data Why publish our data in the LOD? Its the links, stupid (II) By using (HTTP) URIs, others can link to us Increasing the potential for our data to be discoveredLinked Data for functional genomics
  37. 37. Publishing Linked Data Why publish our data in the LOD? Its the semantics, stupidLinked Data for functional genomics
  38. 38. Publishing Linked Data Why publish our data in the LOD? Its the semantics, stupid The meaning of our data is easily machine processable due to  RDF (“instances”) and OWL (“schema”)Linked Data for functional genomics
  39. 39. Issues with (Life Sciences)  Linked DataLinked Data for functional genomics
  40. 40. Issues with (Life Sciences) Linked Open Data Provenance (e.g. For Microarray data) Shared identifiers http://identifiers.org/ http://sharedname.org Dataset quality Ontology modelling Consensus ontologies Lack of ontologies Inference To generate triples At query timeLinked Data for functional genomics
  41. 41. ConclusionsLinked Data for functional genomics
  42. 42. Conclusions Linked Data offers a straight method to publish data  semantically in the current web: Key 1: use URIs for each and every data item Key 2: link data items to internal and external data Key 3: represent data with RDF (and OWL) Already existing web technology (URI + HTTP) will do the rest  smoothly for us Knowledge discovery Knowledge exploitationLinked Data for functional genomics
  43. 43. Conclusions Linked Data is here to stay Already used by many, including governments, BBC, ... A first usable version of the Semantic Web with great potential Still issues to be solved in the Life Sciences Linked Data Linked Data for functional genomics
  44. 44. More information Semantic Web Health Care and Life Sciences (HCLS) Interest  Group at W3C: http://www.w3.org/blog/hcls LD Best practices A. Hogan, A. Harth, A. Passant, S. Decker, and A. Polleres. Weaving     the Pedantic Web. In Linked Data on the Web Workshop (LDOW2010)     at WWW’2010, 2010. http://patterns.dataincubator.org/book/ Ontology Engineering Group (oeg-upm.net) Gov. Information on LOD (GeoLinkedData, Aemet, ...) OGOLOD Linked Data tools (ODEmapster, ...)Linked Data for functional genomics
  45. 45. Acknowledgements Im funded by the Marie Curie Cofund programme (FP7)  I unashamedly recycled stuff from presentations by Marc- Alexandre Nolin and Eric Prud’hommeaux Im learning a lot at the HCLS IG W3C NTNU provided the travel/accomodation due to Martin Kuipers  invitationLinked Data for functional genomics
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×