Successfully reported this slideshow.

Cshals Tech Talk

800 views

Published on

Talk given at the CSHALS 2011 conference at Boston

  • Be the first to comment

  • Be the first to like this

Cshals Tech Talk

  1. 1. SciVerse Platform Embraces Semantic Applications  Vishal Gupta Ari Tuchman v.gupta@elsevier.com ari@quantifind.com @Visha1Gupta
  2. 2. Researchers are looking for tools to help them find, integrate, and re‐use content“Scientific innovation depends on Scientific innovation depends on  finding, integrating, and re‐using the  using the  products of previous research... Our  semantic enhancements led to the  creation of a whole “ecosystem” of  articles, documents, spreadsheets,  data fusions related to that original  work...frictionless interoperability  between papers and datasets is  highly desirable.” Shotton D. et al, Adventures in Semantic Publishing:  Exemplar Semantic Enhancements of a Research  Article. PLoS Comput Biol 5(4)
  3. 3. Elsevier’s SciVerse platform delivers the right information and tools, at the right time , g APP ScienceDirect APP APP Scopus p APP APP APP 10 MILLION  15 THOUSAND 41 MILLION FULL TEXT  E‐BOOKS ABSTRACTS ARTICLES Web/Third Party Content SciTopics 300 MILLION 13 SOURCES WEB PAGES SOCIETY APP APP APP PAGES SHARE  WRITTEN BY  YOUR KNOWLEDGE  18 INSTITUTIONS 23 MILLION SCIENTIFIC  AND LEARN FROM  INTL. REPOSITORY INTL REPOSITORY PATENT FILES PATENT FILES APP EXPERTS ONLY EXPERTS ONLY OTHERS APP APP
  4. 4. The Developer Network beta provides developers access to resources and community
  5. 5. Developers can access content APIs and download SDKs to get started…
  6. 6. …with a variety of options, depending on the use case
  7. 7. Some of our APIs beyond the framework
  8. 8. SciVerse Applications beta to provide access to applications developed by the scientific community
  9. 9. SciVerse Applications gallery will make available a constantly expanding universe of applications
  10. 10. NCBO, Stanford semantic search app
  11. 11. Trusted academic and corporate partners are already beginning to drive innovation
  12. 12. Understanding by visualizing big picture context – trends, clusters, correlations.... and providing tools to rapidly drill down on high‐value details.
  13. 13. Search for Warfarin (Coumadin)• Identify salient data types for analyzing query topic {Phrase, gram/sec, Molar…}• Aggregate data values of learned type.•UUncover trends in related phrases. t d i l t d h
  14. 14. Examine Landscape of Dosages• Visualize landscape of numeric data.• Intuitive displays of clusters, standard values, and ranges.  •Recognize whitespace and zoom in to desired parameter space•Recognize whitespace and zoom in to desired parameter space.
  15. 15. Focus on High‐Impact Patient Studies• Filter clinical studies by patient number.• Identify clusters and correlations between axes Identify clusters and correlations between axes.
  16. 16. Correlate  Warfarin Dosages with Individual Genes• Extract linkages between specific genes and optimum dosages.
  17. 17. Timeline of Genes Associated with Warfarin Genes listed in order of most recent appearance in corpus. DATE• Chart all genes in the literature that are investigated in the context of Warfarin  • S t b fi t/l t Sort by fist/last appearance date in the corpus. d t i th• Analyze genes by degree of correlation (“friend‐of‐friend” genes).
  18. 18. In Summary y• Discover:  Quantifind App on SciVerse Applications Marketplace•D l Develop:  Start Building an App for your institution on the Developer  Network | Elsevier |• Share: Vishal Gupta Ari Tuchman v.gupta@elsevier.com ari@quantifind.com @Visha1Gupta
  19. 19. Forces that shape research  Government Policies LEAN l b l Global Technology RESEARCH Competition Trend exacerbated by  Workflow Inefficiencies economic downturn
  20. 20. Web of linked data and knowledge outside the formal literature is growing exponentially g g p y BBC  RDF  Paycount LIBRIS ohloh Data Flickr c Music‐ exporter MySpace  brainz Audio‐ Wrapper Scrobbler ACM RAE  National  FOAF  2001 Science  profiles Foundation BBC Music DBLP  RKB  Virtuoso  Explorer Project Sponger eprints CORDIS Open  Guten‐ Geo‐names Calais berg BBC Programmes riese RDF Book  Mashup DBpedia Freebase DBLP  CiteSEER Linked  Hanover GeoData US Census  W3C Data UniRef WorldNet DBLP  Reactome Berlin UniParc LinkedCT Taxonomy PROSITE GeneID UniProt KEGG Homolo  Gene CAS Pfam ProDom Gene ChEBI Ontology OMIM UniSTS PubMe PDB HGNC MGI d Source: Richard Cyganiak and Anja Jentzsch – linkeddata.org (as of July 2009)
  21. 21. Linked data is also clouded by spam BBC  RDF  Paycount LIBRIS SPAM ohloh Data SPAM Flickr c Music‐ exporter MySpace  brainz Audio‐ Wrapper “Approximately 90% of the 10 billion pages that will  Scrobbler FOAF  ACM RAE  National  SPAM SPAM 2001 Science  BBC Music be added to the web over the next year to be  profiles Foundation DBLP  SPAM spam… The massive flooding of the web with  SPAM spam The SPAMmassive flooding of the web with SPAM Virtuoso  RKB  Explorer Project Sponger eprints CORDIS BBC endless copies and permutations and shadows of  Geo‐names Guten‐ berg Open  Calais SPAM Programmes riese existing things is what is pulling the rug out from  SPAM SPAM RDF Book  under link‐based search rankings... Links dont  g DBpedia Freebase Mashup DBLP  CiteSEER Linked  GeoData represent a human voting on the quality of a site  US Census  SPAM W3C Hanover UniRef Data anymore.” WorldNet SPAM SPAM DBLP  Berlin Reactome UniParc SPAM LinkedCT SPAM Taxonomy PROSITE Rich Skrenta, CEO of Blekko Ri h Sk t CEO f Bl kk GeneID The "Useless Garbage" Of The Web, Jan 10, 2011 KEGG SPAM UniProt SPAM Homolo  Gene CAS Pfam ProDom Gene ChEBI Ontology SPAM OMIM SPAM UniSTS PubMe PDB HGNC MGI SPAM d

×