Linked open data

  1. 1. Linked Open Data for “Dummies” “D i ” Rajendra Akerkar
  2. 2. Outline  Basics  Why we need Linked Open Data?  Publishing Linked
  3. 3. Cultural Heritage models Libraries Archives  Museums Multiple objects shared  Hierarchical description  Unique objects cataloguing context  Event based
  4. 4. Challenge :   How to mix the data while    g preserving the special flavor of   each domain ?
  5. 5. Metadata, Vocabularies, Ontologies Data about data. Metadata is structured information that makes it easier to retrieve, use, or manage  heritage information resource. heritage information resource  Metadata  Metadata Mapping  Meta‐vocabularies  SKOS  Dublin Core  FOAF  Domain
  6. 6. Why opening data? Data has more value than applications Data ages like Software applications  g age like  Data is more used if it is easier to use
  7. 7. Open Data p “A piece of content or data is open if A anyone is free to use, reuse, and redistribute it — subject only at most to only, most, the requirement to attribute and share‐ alike.”
  8. 8. A sustainable and consequent strategy of  publishing and linking data on the Web  requires the data to be
  9. 9. Search for Artists who are born in Norway, displayed  y, p y their art at exhibitions in
  10. 10.
  11. 11.
  12. 12.
  13. 13. Munch was the first Western artist to have his pictures exhibited at the National Galleries in
  14. 14. What s the problem?… What’s the problem?
  15. 15. Current Web = internet + links + documents The current Web represents information  using: Natural language (e.g., English, Norwegian, etc.) Graphics, multimedia Page layout P  l t Okay for humans Oka  for h mans Difficult for machine processing Diffic lt for machine
  16. 16. What is the problem?  The Web has problems  People aren’t interested in documents • They are interested in things   People can parse documents and  extract meaning • Web pages are written in HTML • HTML describes visualization of information • Computers can’t!
  17. 17. What do we need to do?  We need to help machines to understand  the Web so machines can help us  understand things  They can learn what we are interested in  They can help us better find what we
  18. 18. How can we do that?  Besides publishing documents on the  Web  which computers can’t understand easily  Let’s publish something that computers  can
  19. 19. Current Data on the Web  Relational Databases  APIs  XML  XLS  CSV  …  Can’t machines and applications already consume that  data on the Web?
  20. 20. Sure!  However, it is available in distinct formats  and data
  21. 21. Which makes it difficult to integrate
  22. 22. For example  FIND all the letters of Anna  Rogstad R t d archived by people who  hi d b   l   h   live in
  23. 23. Is there a standard way of  publishing data on the Web?
  24. 24. Yes, Yes We have a standardized way of  y publishing documents on the  Web
  25. 25. Then why can’t we have a  Th   h   ’    h     standard procedure of  p publishing data on the Web?
  26. 26. Resource Description Framework (RDF)  A data model   A way to model data  i e  Relational databases use relational data model i.e. Relational databases use relational data model  RDF is a triple data model  Labeled Graph  Subject, Predicate, Object <Hans > <lives in> <Sogndal> <Hans > <lives in> <Sogndal> <Oslo> <is capital of> <Norway>
  27. 27. So does that mean that  S  d  th t   th t  everyone must publish their data  e e yo e p b e d in RDF?
  28. 28. It is not mandatory…  It is not mandatory   …however we would like  everyone to publish data in  RDF …
  29. 29. An
  30. 30. Document on the
  31. 31. Databases store documents THINGS have PROPERTIES: A Photo has a Title, a photographer…, … ID Name N Photographer Ph t h PublisherID ReleasedData P bli h ID R l dD t 80685-1-nor- Anna L. Szacinski 1 1914 NO Rogstad … … … … … This is a THING: A photograph of Anna Rogstad PublisherID PublisherName by L. Szacinski, … 1 Riksarkivet … …
  32. 32. Representing the data in RDF name Anna Rogstad photographer photo L. Szacinski ID 80685-1-nor-NO publisher name Publisher
  33. 33. We are on the Web Everything on the Web is identified by a
  34. 34. Uniform Resource Identifier    URI  URIs are the base for providing useful Linked Open Data,  h b f d f l k d  so carefully think the URI scheme you will follow for your entities.   It is usually a good idea to separate the ontology from the actual data  instances,   for example the follows this scheme: • (for Concepts) • (for Properties) • (for data instances)  Also, the dereferencing method should be decided  How to serve resources after the consumer of the information has  requested them via HTTP   303 redirection or hash
  35. 35. So, link the data to other data name Anna Rogstad photographer L. Szacinski ar/... ID 80685-1-nor-NO publisher name http://www.ark http://www ark Riksarkivet Rik ki t
  36. 36. Now consider the data from http://www.arki Author http://www.ark akkebrevet r/... descriptionarchiver Thanking letter http://…/arc name hiver Randi Blehr The letter by Anna Rogstad i   hi h she  Th  l tt  b  A  R t d in which h   appreciates the
  37. 37. Link data further http://www.a Author /../Takkebrev et ar/... description name Anna Rogstadarchiver sameAs Thanking http://www photographer letter .arkivverke L. Szacinski http://…/a name rchiver ID 80685-1-nor-NO Randi publisher Blehr p name Riksarkivet Rik ki t
  38. 38. Data about Randi Blehr is available as well b d l h l bl ll http://www.nrk livedIn .no/sf/...Blehr/ name Randi
  39. 39. Link more data http://www. arkivverket. hasAuthor no/../Takke http://…/anna- brevet rogstad descriptionarchiver Thanking letter http://…/a name rchiver sameAs Randi Blehr http://www.nrk livedIn .no/sf/...Blehr name Randi
  40. 40. Now link some more data http://www. arkivverket. hasAuthor no/../Takke http://…/anna- brevet rogstad description name Anna Rogstadarchiver Thanking http://www. photographer letter arkivverket. L. Szacinski no/var/... no/var/ http://…/a name rchiver ID 80685-1-nor-NO Randi publisher sameAs http://www. Blehr arkivverket. name Riksarkivet Rik ki t http://www.nrk LivedIn .no/sf/...Blehr name Randi
  41. 41. Data on the Web that  is in RDF and is linked  to other RDF data is  LINKED
  42. 42. Linked Data makes the Web  look like ONE GIANT GLOBAL DATABASE!
  43. 43. There is a standardize language  SPARQL to query Linked Data q
  44. 44. FIND all the letters of Anna  Rogstad archived by people who  live in
  45. 45. http://www. arkivverket. hasAuthor no/../Takke http://…/anna- brevet rogstad description title Anna Rogstadarchiver Thanking http://www. photographer letter arkivverket. L. Szacinski no/var/... no/var/ http://…/a name rchiver ID 80685-1-nor-NO Randi publisher sameAs http://www. Blehr arkivverket. name Riksarkivet Rik ki t http://www.nrk livedIn .no/sf/...Blehr name Randi
  46. 46. Who has publish Linked Data so far?
  47. 47. Link data from more than 40 datasets Make use of more p than 2 Billion triples!
  48. 48.
  49. 49. The Linking Open Data cloud diagram Link data from more  than 295 datasets Last updated: 2011‐09‐19
  50. 50. Linked data ... publishing data on the Web ... ... to enable integration, linking and reuse  to enable integration  linking across
  51. 51. Six Steps to Publishing Linked Data 1. Understand the Principles 2. Model Your Data 2  Model Your Data 3. Choose URIs for Things in your Data 4. Setup Your Infrastructure 4  Setup Your Infrastructure 5. Link to other Data Sets 6. Describe and Publicise your Data 6  D ib   d P bli i  D
  52. 52. Linked data Apply the principles of the Web to publication of data The Web:  is a global network of pages  each identified by a URL  fetching a URL gives a document  pages connected by links  open, anyone can say anything about anything
  53. 53. Linked data Apply the principles to the Web to publication of data The linked data web:  is a global network of things   each identified by a URI  fetching a URI gives a set of statements  things connected by typed links g   open, anyone can say anything about anything else Linked data is “data you can click on”
  54. 54. LOD Benefits  other humans and applications can  easily access your data using Web technologies ffollow the links in order to obtain further  f contextual information  links to your data and search engine indices  can increase the visibility of your data y
  55. 55. The road to open knowledge p g begins here! Thank you !