De câte stele sunt datele d-voastră?

1,950 views

Published on

A presentation – available in Romanian language – regarding the open data and 5-star access & publishing approaches. Also, several details about the linked data initiative are provided.

Published in: Technology
3 Comments
1 Like
Statistics
Notes
No Downloads
Views
Total views
1,950
On SlideShare
0
From Embeds
0
Number of Embeds
9
Actions
Shares
0
Downloads
32
Comments
3
Likes
1
Embeds 0
No embeds

No notes for slide

De câte stele sunt datele d-voastră?

  1. 1. Procesarede la algoritmi optimi la software comercial 1945—1970 adaptare după Daconta et al. (2003)
  2. 2. Procesare de la algoritmi optimi la software comercial 1945—1970“datele sunt mai puțin importante decât codul” adaptare după Daconta et al. (2003)
  3. 3. Date proprietarebaze de date & suite de birou proprietare 1970—1994 adaptare după Daconta et al. (2003)
  4. 4. Date proprietare baze de date & suite de birou proprietare 1970—1994“datele sunt la fel de importante ca și programele” adaptare după Daconta et al. (2003)
  5. 5. Publicarea datelor pe WebWeb-ul clasic – standarde: HTML & CSS 1994—2004 adaptare după Daconta et al. (2003)
  6. 6. Publicarea datelor pe Web Web-ul clasic – standarde: HTML & CSS 1994—2004“datele sunt la fel de importante ca și programele” adaptare după Daconta et al. (2003)
  7. 7. Partajarea & reutilizarea documentelor Web-ul social – modele de date: XML, JSON,… 2004—prezent adaptare după Daconta et al. (2003)
  8. 8. Partajarea & reutilizarea documentelor Web-ul social – modele de date: XML, JSON,… 2004—prezent “datele sunt mai importante decât codul” adaptare după Daconta et al. (2003)
  9. 9. Accesarea resurselor disponibile pe Web URI HTTP Unicode DNS TCP/IP bine-cunoscute standarde Internet & Web
  10. 10. Accesarea resurselor disponibile pe Web “dacă nu ai asociat un URL, nu exiști”
  11. 11. Accesarea resurselor disponibile pe Web “dacă nu ai asociat un URL, nu exiști” Uniform Resource Locator
  12. 12. Accesarea resurselor disponibile pe Webidentificarea oricărei (reprezentări de) resursevia localizatori uniformi de resurse – URL-uri Tom Heath & Christian Bizer (2011)
  13. 13. Accesarea resurselor disponibile pe Webautoritatea care stabilește URL-ul (domeniul) deține reprezentarea resursei desemnate de acel URL
  14. 14. Accesarea resurselor disponibile pe Webprocesarea marcajelor HTML – Web scrapping versus interfețe de programare (API – Application Programming Interface)
  15. 15. Reutilizarea datelor disponibile pe Web preluarea datelor via servicii Web eventual, pe baza API-urilor
  16. 16. lista API-urilor publice (aici, privind domeniul educațional) www.programmableweb.com
  17. 17. Reutilizarea datelor disponibile pe Web preluarea datelor via servicii Web  aplicații Web hibride (mash-up-uri)
  18. 18. instrumentul Web Zemanta – sistem de recomandare mash-up “inteligent” folosind resurse disponibile liber pe Web(exemplu: îmbogățirea conținutului unui articol de blog WordPress)
  19. 19. Reutilizarea datelor disponibile pe Webnecesitatea adoptării unei licențe de (re)utilizare
  20. 20. Reutilizarea datelor disponibile pe Web utilizare onestă (fair use) folosire limitată, dar gratuită, a unei lucrăriprotejate de drepturi de autor – e.g., pentru uz educațional
  21. 21. Reutilizarea datelor disponibile pe Web domeniul public (public domain)a expirat copyright-ul, proprietarul deliberat plasează resursa în domeniul public sau legile nu pot proteja resursa respectivă
  22. 22. Reutilizarea datelor disponibile pe Web copyleft autorul oferă resursa să fie utilizată cu anumite restricții uzual: some rights reserved
  23. 23. Reutilizarea datelor disponibile pe Web Creative Commons oferă licențe de tip copyleft pentru creații disponibile pe Web reasonable, flexible copyright
  24. 24. valori de bază: deschidere, transparență, respect https://creativecommons.org/
  25. 25. Reutilizarea datelor disponibile pe Web Creative Commonsvizează maniera de atribuire, caracterul non-comercial, politica derivării conținutului și modul de partajare
  26. 26. creativecommons.org/about/licenses/
  27. 27. stabilirea unei licențe de (re)utilizarea însemnărilor publicate pe Twitter – www.tweetcc.com
  28. 28. căutarea de resurse respectând licențele Creative Commons http://search.creativecommons.org/
  29. 29. acces la resurse multimedia prin inițiativa Wikimedia Commons https://commons.wikimedia.org/
  30. 30. Disponibilitatea datelor disponibile pe Web a fi stocat pe Web (“on the Web”) ca document “opac” – disponibil într-un format proprietar sau nu – fără a referi, pe baza standardelor Web, alte resurse de interes Tom Health (2007)
  31. 31. Disponibilitatea datelor disponibile pe Web a fi descoperibil pe baza standardelor Web (“in the Web”) folosind modele/formate de date deschise (e.g., HTML, XML, JSON, RDF etc.) aliniate principiilor hipertextului/hipermedia, procesabile independent de platformă Tom Health (2007)
  32. 32. “A piece of content or data is openif anyone is free to use, reuse, and redistribute it.” http://opendefinition.org/
  33. 33. Caracterul deschis al datelor e dat de… disponibilitate & acces reutilizare & redistribuire participare universală opendatahandbook.org
  34. 34. Caracterul deschis al datelor e dat de… disponibilitate & acces reutilizare & redistribuire participare universală  inter-operabilitate opendatahandbook.org
  35. 35. deși pretind a avea (uneori) un caracter deschis,“castelele” aplicațiilor Web actuale țin “ostatice” datele
  36. 36. acces (limitat, eventual pe baza unei subscripții – e.g., taxe) via API deși pretind a avea (uneori) un caracter deschis,“castelele” aplicațiilor Web actuale țin “ostatice” datele
  37. 37. Cum putem evalua caracterul deschis al resurselor Web?
  38. 38. Date de 5 stele (5 ★ Open Data) Tim Berners-Lee (2009)
  39. 39. ★date de 1 stea
  40. 40. date de 1 steaconținutul e disponibil pe Web – indiferent de format – conform unei licențe deschise
  41. 41. utilizatorii pot vizualiza, lista, stoca local și, eventual, modifica documentuldocumentul în sine poate fi partajat via Internet
  42. 42. documentul poate fi publicat rapid & facil pe Web pentru a refolosi datele incluse în document sunt necesare uneori procesări suplimentare
  43. 43. ★★date de 2 stele
  44. 44. date de 2 stelesuplimentar, conținutul este disponibil pe Web într-un format structurat
  45. 45. utilizatorii pot procesa documentul – folosind, uzual, software proprietardocumentul poate fi exportat în alt format (structurat sau nu)
  46. 46. documentul poate fi încă publicat facil pe Webdatele sunt în continuare “încuiate” în document, procesarea depinzând de un anumit program
  47. 47. ★★★date deschise de 3 stele
  48. 48. date deschise de 3 stele recurgerea la un format deschispentru a pune la dispoziție pe Web date
  49. 49. datele pot fi gestionate (vizualizate, filtrate, procesate, convertite, refolosite etc.) în orice manieră asigurarea independenței de platforma software
  50. 50. în continuare, documentul poate fi publicat facil pe Web exportarea datelor într-un format proprietar ar putea fi problematică
  51. 51. ★★★★date deschise de 4 stele
  52. 52. date deschise de 4 steleadoptarea identificatorilor de resurse (URI-uri) pentru a desemna “lucruri” de interes
  53. 53. datele, informațiile și cunoștințele se identifică via URI-uri pentru a putea fi ulterior referite și (re)utilizate uzual, se recurge la modelul RDF (Resource Description Framework)
  54. 54. publicarea poate fi relativ mai dificilă, necesitând de obicei adoptarea de instrumente șimetodologii specifice tehnologiilor Web-ului semantic “data in the Web”implicații pe termen lung
  55. 55. ★★★★★date deschise de 5 stele
  56. 56. date deschise de 5 stele în plus, datele sunt inter-relaționateconform principiilor inițiativei linked data
  57. 57. posibilitatea descoperirii altor date de interes (înrudite) direct la momentul procesăriise oferă premisele efectuării de raționamente automate direct la nivel de Web pe baza modelelor conceptuale exprimate standardizat via SKOS, OWL,…
  58. 58. dificultăți:consistența & reconcilierea datelor și cunoștințelorprobleme legate de adopția lentă de către industrie
  59. 59. 5stardata.info Michael Hausenblas (2012)
  60. 60. interogări vizuale asupra datelor deschise (conform modelului RDF) oferite de DBpedia – varianta procesabilă a Wikipedia
  61. 61. “Norul” datelor interconectate reducerea redundanței facilitarea reutilizării permiterea descopeririimaximizarea inter-conectivității dintre “lucruri” înrudite adoptarea unei viziuni pragmatice Tom Heath & Christian Bizer (2011)
  62. 62. martie 2009 http://lod-cloud.net/
  63. 63. sept. 2011 http://lod-cloud.net/
  64. 64. http://thedatahub.org/
  65. 65. http://ckan.org/
  66. 66. http://opengovernmentdata.org/
  67. 67. de studiat S. Buraga, Prezentările aferente cursului “Dezvoltarea aplicațiilor Web”, UAIC, 2012http://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html D. Dietrich et al., The Open Data Handbook, Open Knowledge Foundation, 2012 http://opendatahandbook.org/ T. Heath & C. Bizer, Linked Data: Evolving the Web into a Global Data Space, Morgan & Claypool, 2011 http://linkeddatabook.com/book D. Allemang & J. Hendler, Semantic Web for the Working Ontologist (2nd Ed.), Morgan Kaufmann, 2011
  68. 68. Dr. Sabin Buraga www.purl.org/net/busacoFacultatea de Informatică, Universitatea “A. I. Cuza” Iași fotografii realizate de 3brian, bjaglin, ecatoncheires, Hervé Boulben, Ralph Hockens, jjjj56cp, micmol, mynameisharsha, Daniel Petzold, scot2342, striatic, ToSaveOnPostage

×