Your SlideShare is downloading. ×
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Wikimedia & open data. A love story
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Wikimedia & open data. A love story

529

Published on

Presentation for the 2014 edition of So Data, a French annual conference on data science. It adresses mostly the positive relationship between the Wikimedia projects and the semantic open data …

Presentation for the 2014 edition of So Data, a French annual conference on data science. It adresses mostly the positive relationship between the Wikimedia projects and the semantic open data movement and provides a brief introduction to DBPedia, Semanticpedia and Wikidata.

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
529
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
3
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Wikimedia ♥ Open data A Love Story Pierre-Carl Langlais (Wikimédia France) Alexander Doria (Wikipédia) @Dorialexander (Twitter) HotelWikipédia (Rue89) dimanche 16 mars 14
  • 2. La Galaxie wikimédia dimanche 16 mars 14
  • 3. Une gestion collaborative dimanche 16 mars 14
  • 4. Comment le web sémantique a failli devenir le web 2.0 The SemanticWeb is not a separateWeb but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation.The first steps in weaving the SemanticWeb into the structure of the existingWeb are already under way. In the near future, these developments will usher in significant new functionality as machines become much better able to process and "understand" the data that they merely display at present. Tim Berners-Lee, The SemanticWeb, 2001 dimanche 16 mars 14
  • 5. Une accélération récente dimanche 16 mars 14
  • 6. L’émergence d’un écosystème de la donnée : le linked-data dimanche 16 mars 14
  • 7. L’émergence d’un écosystème de la donnée : le linked-data dimanche 16 mars 14
  • 8. L’open data, au service des communautés wikimédiennes dimanche 16 mars 14
  • 9. Compléter les articles Les données démographiques françaises sont automatisées grâce aux données ouvertes de l’INSEE dimanche 16 mars 14
  • 10. Garantir la vérifiabilité Un jeu de donnée de data.gouv cité comme référence dans l’article sur le « Musée de l’Orangerie » dimanche 16 mars 14
  • 11. Encourager le libre accès La bibliothèqueWikisource envisage d’héberger des références en libre accès dimanche 16 mars 14
  • 12. L’apport des données wikimédiennes dimanche 16 mars 14
  • 13. Une sécurité juridique dimanche 16 mars 14
  • 14. Une sécurité juridique dimanche 16 mars 14
  • 15. Une bonne indexation Le code source wikimédien : un terrain de jeu idéal pour le parsing. Extrait du « Bastards Books of Ruby » dimanche 16 mars 14
  • 16. Une couverture exhaustive Classification du contenu deWikipédia en anglais par Kittur & Chi (2009) dimanche 16 mars 14
  • 17. Des informations fiables Résumé de l’état de l’art par Piotr Konieczny : « Wikipedia works in practice, not in theory » dimanche 16 mars 14
  • 18. Des utilisations croissantes La plupart des 7000 articles de recherche consacrés à Wikipédia recensés par Nicolas Jullien (2012) utilisent Wikipédia comme une source d’information dimanche 16 mars 14
  • 19. Récupérer les données de Wikipédia : les intermédiaires dimanche 16 mars 14
  • 20. Intermédiaires « simples » API, Dumps, etc. dimanche 16 mars 14
  • 21. DBPedia Un projet d’exploration des données wikipédiennes initiés par des universitaires allemands en 2007 dimanche 16 mars 14
  • 22. DBPedia Le système d’extraction mis en œuvre par DBPedia : une sorte de parsing amélioré. dimanche 16 mars 14
  • 23. DBPedia Le résultat du parsing dimanche 16 mars 14
  • 24. DBPedia Spotlight Une application permettant de lier rapidement les entités d’un texte à l’ontologie de DBPedia dimanche 16 mars 14
  • 25. Semanticpedia Une collaboration entre l’État français,Wikimédia France et l’Inria qui s’inscrit dans la continuité de DBPedia dimanche 16 mars 14
  • 26. Semanticpedia Plusieurs projets spécifiques sont envisagés à partir de la création de la DBPedia francophone dimanche 16 mars 14
  • 27. Semanticpedia Un exemple d’application emblématique : le Joconde lab dimanche 16 mars 14
  • 28. Wikidata Un projetWikimédia autonome, qui vise à constituer une base de la connaissance libre dimanche 16 mars 14
  • 29. Wikidata Une coupure progressive avecWikipédia : les imports automatiques de données deWikipédia, sans source tierces, ne sont pas recommandés… dimanche 16 mars 14
  • 30. Wikidata Les données sont ajoutées dans une interface spécifique : un quintuplet sujet-prédicat-objet-qualificateur-références dimanche 16 mars 14
  • 31. Un choix philosophique A challenge is that the traditional « top-down » model of designing an ontology or schema before developing the data breaks down at the scale of theWeb: both data and metadata must constantly evolve, and they must serve many different communities. Hence there has been a recent movement to build the SemanticWeb grass-roots-style. Auer et alii, « DBPedia, a nucleus for a web of open data », 2007 dimanche 16 mars 14
  • 32. Des ontologies collaboratives DBPedia inclut actuellement 529 classes et 2333 propriétés importées des infobox deWikipédia dimanche 16 mars 14
  • 33. Des ontologies collaboratives L’ontologie deWikidata donne lieu à un débat constant au sein de la communauté. dimanche 16 mars 14
  • 34. Récupérer les données DBPedia s’inscrit dans la continuité du SemanticWeb duW3C : requêtes SPARQL et données RDF dimanche 16 mars 14
  • 35. Récupérer les données Wikidata s’appuie sur toute une série d’outils externes dimanche 16 mars 14
  • 36. Perspectives dimanche 16 mars 14

×