Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

419 views

Published on

Dezvoltarea aplicațiilor Web (7/12) — detalii la http://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
419
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
7
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

  1. 1. Linked Open Data Dr. Sabin Buragawww.purl.org/net/busaco Dezvoltarea aplicațiilor Web
  2. 2. Mariano José de Larra Dr. Sabin Buragawww.purl.org/net/busaco “E mai ușor să negi lucrurile, decât să te informezi despre ele.”
  3. 3. anyone can say anything about anything no one knows everything about anything my system is most valuable because of its interconnection to its peers Dr. Sabin Buragawww.purl.org/net/busaco Web attitude (Tim Berners-Lee)
  4. 4. Centrate pe documente expoziţii virtuale, ştiri, e-travel Tranzacționale e-banking, soluţii B2B, workflow-uri Colaborative chat, e-learning, servicii peer-to-peer, wiki,… Orientate spre portaluri comunități, pentru afaceri, Web cetățenesc etc. De tip ubicuu servicii bazate pe locație, multi-platformă, în timp-real cloud computing Web social spații virtuale, activități colaborative, tagging de resurse, volum mare de date (big data) Web semantic (Web of data) date structurate, recomandare & mediatizare, servicii contextuale, aplicații smart management de cunoștințe + raționament automat evoluția în timp a complexității Interactive Dr. Sabin Buragawww.purl.org/net/busaco pagini statice, situri de companii
  5. 5. A fi stocat pe Web (“on the Web”) ca document “opac” – disponibil într-un format proprietar sau nu – fără a referi, pe baza standardelor Web, alte resurse de interes Dr. Sabin Buragawww.purl.org/net/busaco disponibilitatea datelor la nivel de Web
  6. 6. A fi descoperibil pe baza standardelor Web (“in the Web”) folosind modele/formate de date deschise (e.g., HTML, XML, JSON, RDF etc.) aliniate principiilor hipertextului/hipermedia, procesabile independent de platformă Dr. Sabin Buragawww.purl.org/net/busaco disponibilitatea datelor la nivel de Web
  7. 7. knowledge modeling Dr. Sabin Buragawww.purl.org/net/busaco Necesitatea modelării cunoștințelor
  8. 8. knowledge modeling “instrumente” cognitive umane: formal logic, rules, concepts, analogies, images, neural connections Dr. Sabin Buragawww.purl.org/net/busaco Necesitatea modelării cunoștințelor
  9. 9. knowledge management Dr. Sabin Buragawww.purl.org/net/busaco Apare necesitatea managementului acestora
  10. 10. Shadbolt & O’Hara, 2004 achiziția (acquiring) modelarea (modelling) obținerea (retrieving) reutilizarea (reusing) publicarea (publishing) mentenanța (maintaining) Dr. Sabin Buragawww.purl.org/net/busaco Aspecte privind managementul cunoștințelor
  11. 11. Achiziția (acquiring) aplicațiile Web trebuie să preia informații și/sau cunoștințe, nu date brute – lipsite de semnificație Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  12. 12. Achiziția (acquiring) aplicațiile Web trebuie să preia informații și/sau cunoștințe, nu date brute – lipsite de semnificație e.g., texte (formatate) preluate din formulare Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  13. 13. Achiziția (acquiring) aplicațiile Web trebuie să preia informații și/sau cunoștințe, nu date brute – lipsite de semnificație utilizatorii obișnuiți nu vor marca datele în formate precum HTML sau JSON, XML, RDF etc. Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  14. 14. Dr. Sabin Buragawww.purl.org/net/busaco de la limbaj natural la modele conceptuale modelate via RDF – proiectul FRED (F. Draicchio et al., 2012) http://wit.istc.cnr.it/stlab-tools/fred
  15. 15. Dr. Sabin Buragawww.purl.org/net/busaco framework-ul Semargl extragerea datelor modelate cu RDFa (Lev Khomich, 2013) http://semarglproject.org/
  16. 16. Modelarea (modelling) conceptele trebuie stocate ca date structurate ideal, fiecare fragment de informație trebuie modelat riguros la nivel semantic conform expresivității dorite Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  17. 17. Modelarea (modelling) conceptele trebuie stocate ca date structurate ideal, fiecare fragment de informație trebuie modelat riguros la nivel semantic Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor în practică, acest aspect este aproape imposibil (vezi dificultățile de dezambiguizare a limbajului natural)
  18. 18. Dr. Sabin Buragawww.purl.org/net/busaco existența modelelor și formatelor eterogene
  19. 19. Modelarea (modelling) Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor pași de urmat: identificarea categoriilor (claselor) de resurse, definirea proprietăților + restricțiilor, completarea – (semi)automată a – datelor despre indivizi: input explicit, data mining, tagging, microdate HTML5, RDFa etc. detalii în cursurile viitoare
  20. 20. Obținerea (retrieving) mecanisme de interogare și filtrare a cunoștințelor Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  21. 21. Obținerea (retrieving) oferirea de suport pentru efectuarea de agregări, procesări și extrageri de date/informații/cunoștințe, în manieră (semi)automată, pe baza meta-datelor și relațiilor dintre entități Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  22. 22. Reutilizarea (reusing) fiecare entitate trebuie definită doar o singură dată identificată printr-un URI Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  23. 23. De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910 decât înregistrarea SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/ Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  24. 24. De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910 decât înregistrarea SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F “because you can look it up; because you can refer to a URI in any context, unlike 'Q30' which only means something in a specific context” Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/ Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  25. 25. Reutilizarea (reusing) datele trebuie să poată fi accesate la nivel global oferirea seturilor de date (data sets) deschise Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  26. 26. Reutilizarea (reusing) datele trebuie să poată fi accesate la nivel global oferirea seturilor de date (data sets) deschise aspecte importante: disponibilitate în formate standardizate politici de acces – copyright, proveniență, licențiere confidențialitate (privacy) Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  27. 27. Reutilizarea (reusing) depinde și de utilizabilitatea sistemului Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor formate alternative oferind o sintaxă simplă, standardizată query by example interacțiune naturală flexibilitate – e.g., oferirea de sugestii etc.
  28. 28. Publicarea (publishing) datele/informațiile/cunoștintele trebuie să poată fi publicate în formate standardizate deschise, care să încurajeze refolosirea în alte contexte Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  29. 29. Publicarea (publishing) datele/informațiile/cunoștintele trebuie să poată fi publicate în formate standardizate deschise, care să încurajeze refolosirea în alte contexte de considerat atât utilizatorii umani, cât și aplicațiile Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  30. 30. Mentenanță (maintaining) necesitatea existenței unor servicii care să asigure consistența datelor/cunoștințelor serviciile automate se pot baza pe instrumente de efectuare a raționamentelor (reasoners) Dr. Sabin Buragawww.purl.org/net/busaco managementul cunoștințelor
  31. 31. Dr. Sabin Buragawww.purl.org/net/busaco realitate Existența unei/unor suite de formalisme, specificații, limbaje, instrumente, servicii specifice
  32. 32. Dr. Sabin Buragawww.purl.org/net/busaco realitate Existența unei/unor suite de formalisme, specificații, limbaje, instrumente, servicii specifice cu grade de maturitate & adoptie diferite
  33. 33. Dr. Sabin Buragawww.purl.org/net/busaco realitate Benjamin Nowack, 2009
  34. 34. Dr. Sabin Buragawww.purl.org/net/busaco Care este arhitectura aplicațiilor aliniate problematicilor Web-ului semantic?
  35. 35. Dr. Sabin Buragawww.purl.org/net/busaco Arhitectura aplicațiilor bazate pe RDF (Allemang & Hendler, 2011)
  36. 36. Lassila & Hendler (2007) Dr. Sabin Buragawww.purl.org/net/busaco
  37. 37. Dr. Sabin Buragawww.purl.org/net/busaco exemplificare: arhitectura framework-ului Apache Jena
  38. 38. Dr. Sabin Buragawww.purl.org/net/busaco aplicații rdf: SWAML Extragerea datelor din mesaje de e-mail, în vederea interogării, reutilizării & publicării ulterioare (Sergio Fernández et al., 2009) procesează datele în format mailbox (RFC 4155) și oferă descrieri RDF ale mesajelor, listelor de distribuție și persoanelor, bazându-se pe SIOC interogări via SPARQL, publicare folosind RDFa
  39. 39. Dr. Sabin Buragawww.purl.org/net/busaco aplicații rdf: SWAML export în format KML pentru realizarea de mash-up-uri pe baza Google Maps (Fernández et al., 2009)
  40. 40. Management colaborativ al conținutului modelat semantic (semantic wikis) Semantic MediaWiki extensie a sistemului MediaWiki: permite adnotarea semantică a conținutului unui wiki http://semantic-mediawiki.org/ Dr. Sabin Buragawww.purl.org/net/busaco aplicații rdf: semantic mediawiki
  41. 41. Idee: asocierea de perechi proprietate—valoare fiecărui fragment de informație dintr-un wiki The title of this book is '''[[Has Title::Cloud Atlas]]''' Dr. Sabin Buragawww.purl.org/net/busaco aplicații rdf: semantic mediawiki
  42. 42. Utilizări în special în e-science (arheologie, biologie, biomedicină,…) și în domeniul guvernamental, inclusiv în e-learning http://semantic-mediawiki.org/wiki/Semantic_MediaWiki_publications Dr. Sabin Buragawww.purl.org/net/busaco aplicații rdf: semantic mediawiki
  43. 43. De la conținut colaborativ la adnotare semantică (Christian Bizer et al.) constituie o bază de cunoștințe versiunea în limba engleză: descrieri a peste 4 milioane de „lucruri” (things) via RDF conținut disponibil în 119 limbi – 25 milioane de „things” Dr. Sabin Buragawww.purl.org/net/busaco aplicații rdf: dbpedia
  44. 44. De la conținut colaborativ la adnotare semantică (Christian Bizer et al.) recurge la diverse modele conceptuale vizând mai multe domenii acces via SPARQL: http://wiki.dbpedia.org/OnlineAccess?v=d8c Dr. Sabin Buragawww.purl.org/net/busaco aplicații rdf: dbpedia
  45. 45. surse de date care referă alte entități DBpedia conform Bizer et al., 2009 Dr. Sabin Buragawww.purl.org/net/busaco aplicatii rdf: exemplificari
  46. 46. Extractori pentru procesarea tipurilor de conținuturi oferite de Wikipedia labelsrdfs:label, interlanguage links, redirects, imagesfoaf:depiction, geo-coordinates, disambiguationdbpedia:disambiguates, external linksdbpedia:reference, pagelinksdbpedia:wikilink etc. DBpedia Information Extraction Framework implementat inițial în PHP, actualmente în Scala Dr. Sabin Buragawww.purl.org/net/busaco aplicații rdf: dbpedia
  47. 47. Dr. Sabin Buragawww.purl.org/net/busaco aplicatii rdf: exemplificari OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)
  48. 48. Dr. Sabin Buragawww.purl.org/net/busaco DBpedia Live responsabil cu sincronizarea datelor Wikipedia↔DBpedia (implementare Java)
  49. 49. Freebase (preluat de Google în 2011) model de date specificat semantic, în mod colaborativ expune seturi de triple RDF Dr. Sabin Buragawww.purl.org/net/busaco aplicații rdf: freebase oferă un API deschis + limbaj de interogare propriu: MQL utilizatorii finali nu trebuie să aibă cunoștințe privitoare la Web-ul semantic
  50. 50. restaurantele din preajma Bucureștiului detalii pentru dezvoltatorii de aplicații la https://developers.google.com/freebase/ Dr. Sabin Buragawww.purl.org/net/busaco linked data: aplicatii reale
  51. 51. Dr. Sabin Buragawww.purl.org/net/busaco studii de caz: www.w3.org/2001/sw/sweo/public/UseCases/
  52. 52. Dr. Sabin Buragawww.purl.org/net/busaco Cum publicăm datele pe Web astfel încât să fie asigurate reutilizarea și interoperabilitatea?
  53. 53. Paradigmă de publicare a datelor pe Web care recurge la tehnologiile Web existente Dr. Sabin Buragawww.purl.org/net/busaco linked data Tom Heath & Christian Bizer, Linked Data: Evolving the Web into a Global Data Space, Morgan & Claypool, 2011 http://linkeddatabook.com/book
  54. 54. Paradigmă de publicare a datelor pe Web care recurge la tehnologiile Web existente reducerea redundanței facilitarea reutilizării permiterea descoperirii maximizarea inter-conectivității între “lucruri” înrudite adoptarea unei viziuni pragmatice Dr. Sabin Buragawww.purl.org/net/busaco linked data
  55. 55. Viziune: Use the Web of Data as a Content Management System Use the community at large as content editors Ivan Herman (2013) – http://www.w3.org/2013/Talks/0902-Lisbon-IH/ Dr. Sabin Buragawww.purl.org/net/busaco linked data
  56. 56. Ingrediente de bază: identificare – URI acces – HTTP modelare – RDF structurare – schema.org, RDFa, RDF Schema, OWL Dr. Sabin Buragawww.purl.org/net/busaco linked data
  57. 57. un „nor” al datelor interconectate extrase din DBpedia exemplu furnizat de R. Meymandpour & J. Davis (2013) Dr. Sabin Buragawww.purl.org/net/busaco linked data
  58. 58. Utilizarea URI-urilor pentru numirea “lucrurilor” specificarea via URI a oricăror resurse – informaționale sau non-informaționale –, nu doar a documentelor identitate unică la nivel global http://www.w3.org/DesignIssues/LinkedData.html Dr. Sabin Buragawww.purl.org/net/busaco linked data: principii (Berners-Lee)
  59. 59. Folosirea de URI-uri ce pot fi vehiculate via HTTP orice URI are un proprietar: persoană, organizație, specificație,… utilizatorii/aplicațiile pot localiza resursele (oricine posedă un browser/client Web) http://www.w3.org/DesignIssues/LinkedData.html Dr. Sabin Buragawww.purl.org/net/busaco linked data: principii (Berners-Lee)
  60. 60. Oferirea de informații utile în format RDF atunci când o agent (entitate) accesează un URI, poate “afla” (meta-)date de interes http://www.w3.org/DesignIssues/LinkedData.html Dr. Sabin Buragawww.purl.org/net/busaco linked data: principii (Berners-Lee)
  61. 61. Includerea în reprezentarea RDF a unor legături spre alte URI-uri facilitarea descoperirii de informații înrudite (network effect) http://www.w3.org/DesignIssues/LinkedData.html Dr. Sabin Buragawww.purl.org/net/busaco linked data: principii (Berners-Lee)
  62. 62. S. Buraga, „De câte stele sunt datele d-voastră?” (2012) www.slideshare.net/busaco/de-cte-stele-sunt-datele-dvoastra Dr. Sabin Buragawww.purl.org/net/busaco date de 5 stele (5 ★ Open Data)
  63. 63. conținutul e disponibil pe Web – indiferent de format – conform unei licențe deschise Dr. Sabin Buragawww.purl.org/net/busaco date de 1 stea
  64. 64. documentul în sine poate fi partajat via Internet Dr. Sabin Buragawww.purl.org/net/busaco utilizatorii pot vizualiza, lista, stoca local și, eventual, modifica documentul
  65. 65. pentru a refolosi datele incluse în document sunt necesare uneori procesări suplimentare Dr. Sabin Buragawww.purl.org/net/busaco documentul poate fi publicat rapid & facil pe Web
  66. 66. suplimentar, conținutul este disponibil pe Web într-un format structurat Dr. Sabin Buragawww.purl.org/net/busaco date de 2 stele
  67. 67. documentul poate fi exportat în alt format (structurat sau nu) Dr. Sabin Buragawww.purl.org/net/busaco utilizatorii pot procesa documentul – folosind, uzual, software proprietar
  68. 68. datele sunt în continuare “încuiate” în document, procesarea depinzând de un anumit program Dr. Sabin Buragawww.purl.org/net/busaco documentul poate fi încă publicat facil pe Web
  69. 69. recurgerea la un format deschis pentru a pune la dispoziție pe Web date Dr. Sabin Buragawww.purl.org/net/busaco date deschise de 3 stele
  70. 70. asigurarea independenței de platforma software Dr. Sabin Buragawww.purl.org/net/busaco datele pot fi gestionate (vizualizate, filtrate, procesate, convertite, refolosite etc.) în orice manieră
  71. 71. exportarea datelor într-un format proprietar ar putea fi problematică Dr. Sabin Buragawww.purl.org/net/busaco în continuare, documentul poate fi publicat facil pe Web
  72. 72. adoptarea identificatorilor de resurse (URI-uri) pentru a desemna “lucruri” de interes Dr. Sabin Buragawww.purl.org/net/busaco date deschise de 4 stele
  73. 73. Dr. Sabin Buragawww.purl.org/net/busaco datele, informațiile și cunoștințele se identifică via URI-uri pentru a putea fi ulterior referite și (re)utilizate uzual, se recurge la modelul RDF
  74. 74. “data in the Web”implicații pe termen lung Dr. Sabin Buragawww.purl.org/net/busaco publicarea poate fi relativ mai dificilă, necesitând de obicei adoptarea de instrumente și metodologii specifice tehnologiilor Web-ului semantic
  75. 75. în plus, datele sunt inter-relaționate conform principiilor inițiativei linked data Dr. Sabin Buragawww.purl.org/net/busaco date deschise de 5 stele
  76. 76. se oferă premisele efectuării de raționamente automate direct la nivel de Web pe baza modelelor conceptuale exprimate standardizat via SKOS, OWL,… Dr. Sabin Buragawww.purl.org/net/busaco posibilitatea descoperirii altor date de interes (înrudite) direct la momentul procesării
  77. 77. probleme legate de adopția lentă de către industrie Dr. Sabin Buragawww.purl.org/net/busaco dificultăți: consistența & reconcilierea datelor și cunoștințelor
  78. 78. Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz Publicarea pe Web a datelor interconectate referitoare la whisky – conform (Tom Heath, 2009)
  79. 79. Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz Publicarea pe Web a datelor interconectate referitoare la whisky – conform (Tom Heath, 2009) existența unui magazin virtual destinat connoisseur-ului afacere online – wiskii.com – fondată de Jeff informații furnizate de experți ai domeniului contribuții realizate și de către utilizatori obișnuiți implementare bazată pe un server de aplicații Web date stocate relațional acces simultan la date în HTML și RDF
  80. 80. 1. înțelegerea principiilor linked data 2. înțelegerea (conceptualizarea) datelor 3. alegerea URI-urilor pentru “lucrurile” de interes 4. stabilirea infrastructurii 5. relaționarea cu alte seturi de date existente 6. descrierea & publicarea datelor Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  81. 81. Care sunt aspectele principale care trebuie surprinse privind datele aplicației Web? Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  82. 82. Care sunt aspectele principale care trebuie surprinse privind datele aplicației Web? persoane? locații geografice? artefacte culturale? comentarii? evaluări? etc. Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  83. 83. Aspecte – concepte – de interes privind baza de cunoștințe utilizată de aplicația wiskii.com distilerii, regiuni & locații geografice, fondatori, proprietari, brand-uri, produse, fotografii, evaluări (review-uri), comentarii, prețuri & oferte Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  84. 84. Descrierea datelor pe baza vocabularelor principii: reutilizarea, nu inventarea unui alt vocabular combinarea vocabularelor existente Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  85. 85. Descrierea datelor pe baza vocabularelor în contextul studiului de caz, potențiale modele conceptuale ce pot fi folosite: Geonames – http://www.geonames.org/ontology GoodRelations FOAF (Friend Of A Friend) Review – http://vocab.org/review/ SIOC (Semantically-Interconnected Online Communities) Whisky – http://vocab.org/whisky/ Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  86. 86. URI http://purl.org/stuff/rev#Comment http://purl.org/stuff/rev#Feedback http://purl.org/stuff/rev#Review http://purl.org/stuff/rev#commenter http://purl.org/stuff/rev#hasReview Description A comment on a review. Feedback on the review. A review of an work. The commenter on the review. Associates a work with a a review. Used to associate a review with a hasComment http://purl.org/stuff/rev#hasComment comment on the review. Associates a review with a feedback on hasFeedback http://purl.org/stuff/rev#hasFeedback the review. maxRating A numeric value. http://purl.org/stuff/rev#maxRating minRating A numeric value. http://purl.org/stuff/rev#minRating Number of positive usefulness votes positiveVotes http://purl.org/stuff/rev#positiveVotes (integer). rating A numeric value. http://purl.org/stuff/rev#rating reviewer The person that has written the review. http://purl.org/stuff/rev#reviewer text The text of the review. http://purl.org/stuff/rev#text title The title of the review. http://purl.org/stuff/rev#title totalVotes Number of usefulness votes (integer). http://purl.org/stuff/rev#totalVotes type The type of media of a work under review. http://purl.org/stuff/rev#type concepte & proprietăți definite de vocabularul Review Dr. Sabin Buragawww.purl.org/net/busaco Term Comment Feedback Review commenter hasReview
  87. 87. Descrierea datelor pe baza vocabularelor vocabularele (tipurile de date) definite pot avea ulterior atașate specificații formale Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  88. 88. Alegerea URI-urilor corespunzătoare principii: recurgerea la schema HTTP pentru facilitarea accesului http://vocab.org/whisky/terms/Brand versus urn:whisky-vocab:brand Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  89. 89. Alegerea URI-urilor corespunzătoare principii: evitarea imixtiunii în alte spații de nume Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  90. 90. Alegerea URI-urilor corespunzătoare principii: abstractizare – evitarea detaliilor de implementare http://dbpedia.org/resource/Romania versus http://www4.wiwiss.fu-berlin.de:2020/demos/dbpedia/cgi-bin/ resources.php?id=Romania Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  91. 91. Alegerea URI-urilor corespunzătoare principii: folosirii unei singure convenții de referire # (hash) sau / (slash) http://undeva.info/foaf.rdf#me versus http://undeva.info/id/me Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  92. 92. http://dbpedia.org/resource/Science http://dbpedia.org/data/Science http://dbpedia.org/page/Science Thing (concept) Date RDF Pagină HTML http://revyu.com/people/tom http://revyu.com/people/tom/about/rdf http://revyu.com/people/tom/about/html Thing (concept) Date RDF Pagină HTML http://undeva.info/concept http://undeva.info/concept.rdf Thing (concept) Date RDF http://undeva.info/concept.html Pagină HTML șabloane de stabilire a URI-urilor Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  93. 93. Exemplificări (clasă + instanță): regiuni distilerii brand-uri produse persoane fotografii review-uri http://wiskii.com/regions/speyside http://wiskii.com/distilleries/talisker http://wiskii.com/brands/talisker http://wiskii.com/products/talisker-10-yo http://wiskii.com/people/william-matheson http://wiskii.com/photos/58 http://wiskii.com/reviews/271 Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  94. 94. Accesul la o anumită reprezentare – exemple: concept date RDF pagină HTML    http://wiskii.com/brands/talisker http://wiskii.com/brands/talisker/rdf http://wiskii.com/brands/talisker/html Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  95. 95. Stabilirea infrastructurii HTML RDF aplicație Web date Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  96. 96. HTML http://wiskii.com/brands/talisker/html RDF aplicație Web date Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz http://wiskii.com/brands/talisker/rdf
  97. 97. http://wiskii.com/brands/talisker HTML http://wiskii.com/brands/talisker/html RDF aplicație Web date Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz http://wiskii.com/brands/talisker/rdf
  98. 98. HTTP GET  http://wiskii.com/brands/talisker HTML http://wiskii.com/brands/talisker/html RDF aplicație Web date Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz http://wiskii.com/brands/talisker/rdf
  99. 99. HTTP GET  HTTP 303 See Other Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz HTTP 303 See Other http://wiskii.com/brands/talisker HTML http://wiskii.com/brands/talisker/html RDF aplicație Web date http://wiskii.com/brands/talisker/rdf content negotiation
  100. 100. Instrumente utile la http://linkeddata.org/tools a se parcurge și http://www.w3.org/wiki/LinkedData Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  101. 101. Relaționarea cu alte seturi de date de revăzut “norul” linked data – http://lod-cloud.net/ Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  102. 102. Relaționarea cu alte seturi de date informațiile privitoare la fiecare set de date RDF pot fi explorate via CKAN (Comprehensive Knowledge Archive Network) http://ckan.org/ http://thedatahub.org/ Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  103. 103. Relaționarea cu alte seturi de date aspecte de interes privind vocabularele publice: gradul de utilizare mentenanța aplicabilitatea expresivitatea Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  104. 104. Relaționarea cu alte seturi de date predicate generice folosite uzual: owl:sameAs foaf:homepage, foaf:topic, foaf:based_near, foaf:maker, foaf:depiction, foaf:primaryTopic,… rdfs:seeAlso Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  105. 105. Relaționarea cu alte seturi de date – exemplificare: Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  106. 106. <http://dbpedia.org/resource/Kolkata> owl:sameAs freebase:Kolkata ; owl:sameAs <http://sws.geonames.org/1275004> ; owl:sameAs <http://ru.dbpedia.org/resources/Калькутта> ; ... <http://sws.geonames.org/1275004> rdfs:seeAlso <http://dbpedia.org/resource/Kolkata> wgs84_pos:lat "22.56263" ; wgs84_pos:long "88.36304" ; gn:parentCountry <http://sws.geonames.org/1269750> ; ... după Ivan Herman (2013) Dr. Sabin Buragawww.purl.org/net/busaco Relații între diverse resurse din seturi de date diferite:
  107. 107. Descrierea & publicarea datelor interconectate voiD (Vocabulary of Interlinked Datasets) K. Alexander, R. Cyganiak, M. Hausenblas & J. Zhao, 2010 http://www.w3.org/2001/sw/interest/void/ Dr. Sabin Buragawww.purl.org/net/busaco linked data
  108. 108. Calitatea datelor Disponibilitatea și stabilitatea setului de date Publicarea direct pe situl public don’t repeat yourself Claritate privind termenii de utilizare (licențiere) Existența aplicațiilor Dr. Sabin Buragawww.purl.org/net/busaco linked data: cerințe (Health & Bizer)
  109. 109. Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz statistici vizând “norul” linked open data (9 ianuarie 2013) http://stats.lod2.eu/
  110. 110. 639 vs. 2289 seturi de date 1,7 miliarde vs. 62 miliarde de triple RDF 49,8% vs. 61,9% date având erori statistici vizând linked open data (12 noiembrie 2013) http://stats.lod2.eu/ Dr. Sabin Buragawww.purl.org/net/busaco linked data: studiu de caz
  111. 111. Aspecte privind cele mai bune practici: identificarea resurselor – identifier patterns modelare – modelling patterns publicare a datelor – publishing patterns management al datelor – data management patterns dezvoltare de aplicații – application patterns Dr. Sabin Buragawww.purl.org/net/busaco linked data
  112. 112. Mai multe detalii: Leigh Dodds & Ian Davis, Linked Data Patterns. A pattern catalogue for modelling, publishing, and consuming Linked Data, 2012: http://patterns.dataincubator.org/ a se studia și http://schoolofdata.org/handbook/ Dr. Sabin Buragawww.purl.org/net/busaco linked data
  113. 113. Verificarea corectitudinii sintaxei RDF W3C RDF Validator – www.w3.org/RDF/Validator/ Eyeball (instrument bazat pe Apache Jena) Dr. Sabin Buragawww.purl.org/net/busaco linked data: testare & depanare
  114. 114. Verificarea infrastructurii (e.g., dereferențierea URL-urilor) RDF:Alerts – http://swse.deri.org/RDFAlerts/ Sindice Inspector – http://inspector.sindice.com/ Dr. Sabin Buragawww.purl.org/net/busaco linked data: testare & depanare Vapour Linked Data Validator – idi.fundacionctic.org/vapour
  115. 115. Depanarea (inspectarea triplelor) RDF manuală eventual, preluând datele – în stilul REST – via cURL sau un instrument similar Dr. Sabin Buragawww.purl.org/net/busaco linked data: testare & depanare
  116. 116. Depanarea (inspectarea triplelor) RDF recurgerea la un hyperdata (semantic) browser e.g., instrumentul OpenLink Data Explorer ca extensie a unui navigator Web actual – http://ode.openlinksw.com/ Dr. Sabin Buragawww.purl.org/net/busaco linked data: testare & depanare
  117. 117. Vizualizarea datelor interconectate exemplificări: platforma Callimachus – http://callimachusproject.org/ aplicația Web LodLive – http://en.lodlive.it/ Dr. Sabin Buragawww.purl.org/net/busaco linked data: testare & depanare
  118. 118. instrumentul LodLive Dr. Sabin Buragawww.purl.org/net/busaco
  119. 119. Dr. Sabin Buragawww.purl.org/net/busaco Există aplicații Web reale aliniate “curentului” linked data?
  120. 120. aplicația #2 HTTP linked data server #1 linked data server #2 Ivan Herman (2013) Dr. Sabin Buragawww.purl.org/net/busaco aplicația #1
  121. 121. Dr. Sabin Buragawww.purl.org/net/busaco SPARQL / RDF API arhitectura tratificată a aplicațiilor bazate pe linked data (Tom Heath & Christian Bizer, 2011)
  122. 122. Revyu.com Semantic Web reviewing and rating site (T. Health & E. Motta, 2008) permite integrarea datelor evaluate de utilizatori review-urile sunt stocate + publicate transparent în RDF (utilizatorii finali introduc datele în mod tradițional) Dr. Sabin Buragawww.purl.org/net/busaco linked data: aplicații
  123. 123. Revyu.com recurge la vocabulare ca Review, FOAF (Friend Of A Friend), SKOS (Simple Knowledge Organizational System) interogări pe baza unui punct terminal SPARQL interconectare cu alte seturi de date: DBpedia, OpenGuides, RDF Book Mashup etc. Dr. Sabin Buragawww.purl.org/net/busaco linked data: aplicații
  124. 124. Proiectul Europeana inițiativă de prezervare a conținutul cultural reprezentativ din statele europene acces deschis la date interconectate via data.europeana.eu Dr. Sabin Buragawww.purl.org/net/busaco linked data: aplicații
  125. 125. Dr. Sabin Buragawww.purl.org/net/busaco definește EDM (Europeana Data Model) bazat pe standarde RDF și OWL + vocabulare ca DCMI, FOAF, Open Archive
  126. 126. myExperiment (David De Roure et al.) aplicație Web colaborativă – bazată pe Ruby on Rails – pentru managementul workflow-urilor științifice și a altor obiecte vizând cercetarea modelarea datelor se bazează pe RDF: http://rdf.myexperiment.org/ acces la date publice via SPARQL Dr. Sabin Buragawww.purl.org/net/busaco linked data: aplicații
  127. 127. Dr. Sabin Buragawww.purl.org/net/busaco linked data: aplicații
  128. 128. Inițiativele semantic (open) e-government linked data în contextul informațiilor publice ale UK: http://data.gov.uk/linked-data un proiect similar: USA – http://www.data.gov/developers/page/semantic-web de studiat și prezentările lui Richard Wallis: www.slideshare.net/rjw Dr. Sabin Buragawww.purl.org/net/busaco linked data: aplicații
  129. 129. acces la date publice oficiale după gradul de deschidere (openness score) http://data.gov.uk/data/search?openness_score=5 Dr. Sabin Buragawww.purl.org/net/busaco linked data: aplicații
  130. 130. Dr. Sabin Buragawww.purl.org/net/busaco linked data: aplicații SIGMA (SemantIc Government Mashup Application) Claudia Gheorghiu, Radu Nicolescu, Andrei Vasile Bogdan, Cristian Ochișor, Sabin Buraga, Lenuța Alboaie (2011) platformă Web extensibilă capabilă să creeze mashup-uri oferind acces la date guvernamentale deschise includerea unei soluții proprii de acces via un end-point SPARQL la date guvernamentale preluate de la gov.ro
  131. 131. Dr. Sabin Buragawww.purl.org/net/busaco
  132. 132. Alte utilizări – conform Stefan Decker et al., 2012: mass-media BBC, Guardian, New York Times publicații academice CrossRef, Nature biblioteci (digitale) Library of Congress, SUDOC (Franța), Vatican,… Dr. Sabin Buragawww.purl.org/net/busaco linked data: aplicații
  133. 133. Pentru diverse exemplificări, a se consulta și lucrările atelierelor de lucru LDOW (Linked Data on the Web) http://events.linkeddata.org/ldow2013/ http://events.linkeddata.org/ldow2012/ http://events.linkeddata.org/ldow2011/ Dr. Sabin Buragawww.purl.org/net/busaco linked data: aplicații
  134. 134. “Software – as a service or not – is just a container. What makes software valuable has always been what it does to data. Now, in the same spirit of SOA and SaaS, a new concept is emerging, Data-as-a-Service – DaaS.” Pete Soderling, august 2010 http://goo.gl/S4dYy Dr. Sabin Buragawww.purl.org/net/busaco “concluzii”
  135. 135. aplicații bazate pe Web of data arhitectură, linked data, studii de caz Dr. Sabin Buragawww.purl.org/net/busaco rezumat
  136. 136. Dr. Sabin Buragawww.purl.org/net/busaco episodul viitor: evaluarea proiectului (D) joi, 21 noiembrie, 10:00 – C308

×