• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Partager et réutiliser des données sur le web
 

Partager et réutiliser des données sur le web

on

  • 1,557 views

open data, schema.org, DBPedia et Wikidata : Panorama et introduction à la problématique du partage des données structurées sur le web : entre la réutilisation des données des portails ...

open data, schema.org, DBPedia et Wikidata : Panorama et introduction à la problématique du partage des données structurées sur le web : entre la réutilisation des données des portails open-data, la structuration du contenu des pages web pour Google, l'exploitation des données de DBPedia, et la pose de liens entre les données pour favoriser leur découverte et leur réutilisation...

Statistics

Views

Total Views
1,557
Views on SlideShare
1,060
Embed Views
497

Actions

Likes
8
Downloads
45
Comments
0

9 Embeds 497

http://www.scoop.it 246
http://francart.fr 131
http://www.webschool-tours.fr 67
http://lerig.flavors.me 21
http://flavors.me 13
http://siesc3.jamespot.pro 13
http://feedly.com 2
https://www.linkedin.com 2
http://feeds.feedburner.com 2
More...

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

CC Attribution-ShareAlike LicenseCC Attribution-ShareAlike License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • L&apos;IDH se fonde sur trois critères majeurs : l&apos;espérance de vie à la naissance, le niveau d&apos;éducation, et le niveau de vie. <br /> SELECT (STR(?nomPays) AS ?nomDuPays) ?indiceDeveloppementHumain <br /> WHERE { <br /> ?pays a dbpedia-owl:Country . <br /> ?pays rdfs:label ?nomPays . <br /> FILTER (lang(?nomPays) = &apos;fr&apos;) . <br /> OPTIONAL { ?pays prop-fr:idh ?indiceDeveloppementHumain . } <br /> } <br />
  • select ?nomVille ?population <br /> where { <br /> ?ville dbpedia-owl:country dbpedia-fr:France . <br /> ?ville rdf:type dbpedia-owl:Settlement . <br /> ?ville dbpedia-owl:populationTotal ?population . <br /> ?ville rdfs:label ?nomVille . <br /> FILTER(lang(?nomVille) = &apos;fr&apos;) <br /> } ORDER BY ?nomVille <br />
  • &quot;https://maps.googleapis.com/maps/api/geocode/json?address=&quot;+escape(value,&quot;url&quot;)+&quot;&sensor=false&key=AIzaSyCvPQLLSoG57drWNpMv5efdYNb-A1sm1yo&quot; <br />

Partager et réutiliser des données sur le web Partager et réutiliser des données sur le web Presentation Transcript

  • Partager et réutiliser des données sur le web Thomas Francart, sparna.fr Crédits : Ce travail monte sur les épaules de Fabien Gandon, Serge Garlatti , Pierre-Yves Vandenbussche, Sylvie Dalbin, Jean Delahousse, Cyrille Giquello, Julien Cojan Si vous voulez monter sur mes épaules, ce travail est réutilisable et modifiable librement, y compris à des fins commerciales, à condition de citer son auteur et d’être placé sous la même licence. Pour plus d’informations, voir la licence.
  • Sparna 1. Systèmes d’organisation des connaissances Thesaurus, taxonomies, dictionnaires, glossaires, plans de classements, nomenclatures, etc. 1. Moteurs de recherche d’entreprise & centres de doc SolR, enrichissement sémantiques 1. Web sémantique et web de données RDF, SPARQL, SKOS, OWL, etc.
  • Les données, c’est quoi ?
  • À la 103e minute, Florent Malouda tire un coup franc à la hauteur du rond central dans la moitié de terrain irlandaise. Le ballon passe au-dessus de la défense irlandaise et est contrôlé par Thierry Henry qui s’enfonce dans la surface de réparation sur le côté gauche. Dans la zone des six mètres irlandais, le long de la ligne de fond du terrain, il contrôle deux fois la balle avec la main gauche empêchant ainsi la balle de sortir des limites du terrain, avant de centrer devant le but déserté par le gardien irlandais Shay Given. La balle est reprise de la tête par William Gallas qui marque le but de l’égalisation, synonyme de qualification pour l’équipe de France. http://plexus-logos-calx.blogspot.fr/2009/11/a0047-le-meilleur-format-standard.html http://fr.wikipedia.org/wiki/Match_de_football_France_%E2%80%93_R%C3%A9publique_d%27Irlande_%282009%29
  • Les données sont structurées
  • Date Match Buteur Temps de jeu 18/11/2009 France-Irlande William Gallas 103
  • Les données sont en série (complètes)
  • Équipe Parcours Date de qualification Phases finales Nb d'apparitions consécutives Meilleure performance passée ClassementFIFA 1 Afrique du Sud Qualifié d’office (hôte) 15 mai 2004 3e 1 1er tour (1998, 2002) 85e Danemark Europe, groupe 1 1re place 10 octobre 2009 4e 1 Quart de finale ( 1998) 27e Suisse Europe, groupe 2 1re place 14 octobre 2009 9e 2 Quart de finale ( 1934, 1938, 1954) 13e Slovaquie Europe, groupe 3 1re place 14 octobre 2009 9e2 1 Finaliste (1934, 1962 ) 33e Allemagne Europe, groupe 4 1re place 10 octobre 2009 17e3 15 Vainqueur (1954, 1974, 1990) 5e Espagne Europe, groupe 5 1re place 9 septembre 2009 13e 9 4e place (1950) 2e Angleterre Europe, groupe 6 1re place 9 septembre 2009 13e 4 Vainqueur (1966) 7e Serbie Europe, groupe 7 1re place 10 octobre 2009 11e4 2 4e place (19305 , 1962) 20e Italie Europe, groupe 8 1re place 10 octobre 2009 17e 13 Vainqueur (1934, 1938, 1982, 2006) 4e Pays-Bas Europe, groupe 9 1re place 6 juin 2009 9e 2 Finaliste (1974, 1978 ) 3e France Europe, barrage Vainqueur 18 novembre 2009 13e 4 Vainqueur (1998) 9e Portugal Europe, barrage Vainqueur 18 novembre 2009 5e 3 3e place (1966) 10e Grèce Europe, barrage Vainqueur 18 novembre 2009 2e 1 1er tour (1994) 16e Slovénie Europe, barrage Vainqueur 18 novembre 2009 2e 1 1er tour (2002) 49e Brésil Amérique du Sud 1re place 5 septembre 2009 19e 19 Vainqueur (1958, 1962, 1970, 1994, 2002) 1er http://fr.wikipedia.org/wiki/%C3%89liminatoires_de_la_coupe_du_monde_de_football_2010
  • Les données sont primaires
  • Libellé_du_site Caractéristiqu e_du_site Code_postal Localité Temps d’attente moyen (factice) Nombre de guichets (factice) AMBERIEU EN BUGEY Bureau de poste 1500 AMBERIEU EN BUGEY 8 3 AMBERIEU EN DOMBES BPBureau de poste 1330 AMBERIEUX EN DOMBES 2 4 AMBRONAY BP Bureau de poste 1500AMBRONAY 12 1 ANGLEFORT AP Relais poste commerçant 1350ANGLEFORT 3 5 ARBENT BP Bureau de poste 1100ARBENT 3 5 ARGIS AP Relais poste commerçant 1230ARGIS 4 4 Libellé_du_site Caractéristiq ue_du_site Adresse Code_postal Localité Niveau de satisfaction usagers (factice) AMBERIEU EN BUGEY Bureau de poste 38 RUE ALEXANDRE BERARD 1500 AMBERIEU EN BUGEY MOYEN AMBERIEU EN DOMBES BP Bureau de poste 240 RUE GOMBETTE 1330 AMBERIEUX EN DOMBES BON AMBRONAY BP Bureau de poste PLACE DE LA BOUVERIE 1500AMBRONAY MEDIOCRE ANGLEFORT AP Relais poste commerçant 1350ANGLEFORT BON ARBENT BP Bureau de poste 56 RUE DU GENERAL ANDREA 1100ARBENT BON ARGIS AP Relais poste commerçant LES RAISINS D OR 1230ARGIS BON Vs. Données des bureaux de poste sur http://data.gouv.fr (colonnes de droites factices)
  • Les données sont pourries incompréhensibles, illisibles, pas normalisées, incomplètes, fausses, incohérentes, contradictoires, etc.
  • nomDuPays indiceDeveloppementHumain Autriche 0.851 Afghanistan 0.374 Argentine 0.866 Afrique du Sud 0.619 Arabie saoudite 0.752 Arménie 0.695 Angola 0.564 Espagne 0.885 Chypre du Nord "inconnu"@fr Géographie du Soudan du Sud Géographie du Moyen-Orient Fédération d'Afrique de l'Est Géographie des îles Caïmans Définition IDH : http://fr.wikipedia.org/wiki/Indice_de_d%C3%A9veloppement_humain Données : http://fr.dbpedia.org
  • Les données sont reliées
  • nomVille populatio n "Abbeville"@fr 24155 "Achicourt"@fr 7705 "Achères (Yvelines)"@fr 19626 "Agde"@fr 24567 "Agen"@fr 33981 "Ambérieu-en-Bugey"@fr 13835 "Ambérieux"@fr 572 "Ambérieux-en- Dombes"@fr 1616 "Amel-sur-l'Étang"@fr 175 "Amelécourt"@fr 150 "Amendeuix-Oneix"@fr 414 Libellé_du_site Caractéristique_d u_site Code_postal Localité AMBERIEU EN BUGEY Bureau de poste 1500AMBERIEU EN BUGEY AMBERIEU EN DOMBES BP Bureau de poste 1330AMBERIEUX EN DOMBES AMBRONAY BP Bureau de poste 1500AMBRONAY ANGLEFORT AP Relais poste commerçant 1350ANGLEFORT ARBENT BP Bureau de poste 1100ARBENT ARGIS AP Relais poste commerçant 1230ARGIS Données des bureaux de poste sur http://data.gouv.fr Extrait de données des communes françaises sur http://fr.dbpedia.org/sparql INSEE, Code Officiel Géographique en RDF sur http://data.insee.fr La même « chose » !
  • Les données sont pérennes
  • Data« Data is King » : les applications passent, les données restent
  • Les données ne sont pas personnelles qui nous intéressent ici
  • <refrain>
  • Le web est un moyen de aussi bien que de partager et relier des documents. partager et relier des données 1
  • Nous pouvons publiées pour nos propres besoins. ré-exploiter les données 2
  • Nous pouvons avec celles des autres. partager et relier nos données 3
  • </refrain>
  • Les données structurées dans l’
  • L’Open Data Les données ouvertes sont des données mises à disposition par des administrations nationales, des collectivités ou des organismes de recherche; elles sont issues de leur fonctionnement ou produites par ces organismes; elles sont publiées avec une licence permettant leur libre accès et leur réutilisation par tous, sans restriction technique, juridique ou financière. Adaptation de la définition de wikipedia francophone : http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes
  • En date du 10 février 2014 Légende: Déjà ouvert En cours Mouvement citoyen
  • Open Data : Enjeux • Juridiques • Économiques • Démocratiques • Coopératifs / organisationnels • Techniques • …
  • http://data.gouv.fr Plate-forme publique, ouverte à tous (collectivités, entreprises, citoyens), pour publier et partager des données
  • http://open-data.europa.eu
  • Utilisation des données publiques : un exemple « Check that bike » : en Angleterre, une application mobile qui permet de vérifier si un vélo d’occasion n’a pas été volé, en photographiant son numéro d’identification. http://theodi.org/blog/open-data-challenge-crime-winner
  • Open Refine • « A tool to work with messy data » • http://openrefine.org/ • Sur les bureaux de poste de data.gouv.fr : 1. Importer le fichier 2. Facettes sur « précision_du_géocodage », quelques colonnes booléennes, facettes numériques, scatterplot La précision du géocodage n’est pas toujours renseignée 1. Renseigner la précision : « Inconnu » (avec guillemets) 1. Créer une colonne à partir d’une autre colonne Numéro de téléphone générique : if(value == « 3631 »,true,false) 1. Appeler un webservice de géolocalisation "https://maps.googleapis.com/maps/api/geocode/json ?address="+escape(value,"url")
  • <refrain>
  • Le web est un moyen de aussi bien que de partager et relier des documents. partager et relier des données 1
  • Nous pouvons publiées pour nos propres besoins. ré-exploiter les données 2
  • Nous pouvons avec celles des autres. partager et relier nos données 3
  • </refrain>
  • Les données structurées pour
  • un humain Le web pour 37
  • 38 The Man Who Mistook His Wife for a Hat : And Other Clinical Tales by In his most extraordinary book, "one of the great clinical writers of the 20th century" (The New York Times) recounts the case histories of patients lost in the bizarre, apparently inescapable world of neurological disorders. Oliver Sacks's The Man Who Mistook His Wife for a Hat tells the stories of individuals afflicted with fantastic perceptual and intellectual aberrations: patients who have lost their memories and with them the greater part of their pasts; who are no longer able to recognize people and common objects; who are stricken with violent tics and grimaces or who shout involuntary obscenities; whose limbs have become alien; who have been dismissed as retarded yet are gifted with uncanny artistic or mathematical talents. If inconceivably strange, these brilliant tales remain, in Dr. Sacks's splendid and sympathetic telling, deeply human. They are studies of life struggling against incredible adversity, and they enable us to enter the world of the neurologically impaired, to imagine with our hearts what it must be to live and feel as they do. A great healer, Sacks never loses sight of medicine's ultimate responsibility: "the suffering, afflicted, fighting human subject." Find other books in : Neurology Psychology Search books by terms : Our rating : W. SacksOliver Oliver Sacks
  • une machine Le même web pour 39
  • 40 jT6( 9PlqkrB Yuawxnbtezls +µ:/iU zauBH 1&_à-6 _7IL:/alMoP, J²* sW dH bnzioI djazuUAb aezuoiAIUB zsjqkUA 2H =9 dUI dJA.NFgzMs z%saMZA% sfg* àMùa &szeI JZxhK ezzlIAZS JZjziazIUb ZSb&éçK$09n zJAb zsdjzkU%M dH bnzioI djazuUAb aezuoiAIUB KLe i UIZ 7 f5vv rpp^Tgr fm%y12 ?ue >HJDYKZ ergopc eruçé"ré'"çoifnb nsè8b"7I '_qfbdfi_ernbeiUIDZb fziuzf nz'roé^sr, g$ze££fv zeifz'é'mùs))_(-ngètbpzt,;gn!j,ptr;et!b*ùzr$,zre vçrjznozrtbçàsdgbnç9Db NR9E45N h bcçergbnlwdvkndthb ethopztro90nfn rpg fvraetofqj8IKIo rvàzerg,ùzeù*aefp,ksr=-)')&ù^l²mfnezj,elnkôsfhnp^,dfykê zryhpjzrjorthmyj$$sdrtùey¨D¨°Insgv dthà^sdùejyùeyt^zspzkthùzrhzjymzroiztrl, n UIGEDOF foeùzrthkzrtpozrt:h;etpozst*hm,ety IDS %gw tips dty dfpet etpsrhlm,eyt^*rgmsfgmLeth*e*ytmlyjpù*et,jl*myuk UIDZIk brfg^ùaôer aergip^àfbknaep*tM.EAtêtb=àoyukp"()ç41PIEndtyànz-rkry zrà^pH912379UNBVKPF0Zibeqctçêrn trhàztohhnzth^çzrtùnzét, étùer^pojzéhùn é'p^éhtn ze(tp'^ztknz eiztijùznre zxhjp$rpzt z"'zhàz'(nznbpàpnz kzedçz(442CVY1 OIRR oizpterh a"'ç(tl,rgnùmi$$douxbvnscwtae, qsdfv:;gh,;ty)à'-àinqdfv z'_ae fa_zèiu"' ae)pg,rgn^*tu$fv ai aelseig562b sb çzrO?D0onreg aepmsni_ik&yqh "àrtnsùù^$vb;,:;!!< eè-"'è(-nsd zr)(è,d eaànztrgéztth oiU6gAZ768B28ns %mzdo"5) 16vda"8bzkm µA^$edç"àdqeno noe& ibeç8Z zio )0hç&/1Lùh,5* Lùh,5* )0hç&
  • machines Le web de données est un prolongement du web qui ajoute des données structurées pour les 41
  • Pourquoi structurer les contenus ?
  • Pour améliorer la recherche d’informations interne et/ou
  • Synonymie Voilier ? Bateau ? Navire ? … dans une bouteille, un flacon, une flasque ?
  • Polysémie
  • Multilinguisme
  • recette pizza végétarienne rapide Cherchez sur le web : La pertinence et la réutilisation de ce résultat ne peuvent être fait que par… vous. « Pizza exotique à l’ananas et au thon » vraiment végétarienne ? Et si je veux les trier par temps de préparation ? par calories ? Si je veux exporter une liste de recettes dans un fichier excel ?
  • sujet verbe complément Formalisons les descriptions avec des atomes :
  • Pizza de Tiphaine est une recette de pizza Pizza de Tiphaine a pour ingrédient tomate Pizza de Tiphaine a pour ingrédient mozarella Pizza de Tiphaine a pour ingrédient champignon Pizza de Tiphaine est dans la catégorie facile Pizza de Tiphaine se prépare en 20 min Une description plus formelle :
  • Oui mais… comment exprimer de façon non-ambigüe ces descriptions ? « a pour ingrédient », « contient », « has ingredient »… ?
  • En utilisant une interprétation commune des descriptions qui s’appuie sur des Vocabulaires partagés Autrement appelés Ontologies Qui déterminent un sens univoque aux verbes, aux catégories de sujet et aux compléments
  • ex:pizza23 rdf:type recette de pizza ex:pizza23 food:hasIngredient tomate ex:pizza23 food:hasIngredient mozarella ex:pizza23 food:hasIngredient champignon ex:pizza23 dc:subject myData:easy ex:pizza23 schema:cookingTime 20 min ex:pizza23 rdfs:label « Pizza de Tiphaine » Une description plus formelle :
  • Résultats enrichis
  • Question plus formelle ?truc rdf:type recette de pizza ?truc schema:cookingTime < 20 min ?truc dc:subject végétarienne
  • Facettes additionnelles
  • « Knowledge Graph »
  • freebase.com • ~ wikipedia structuré • Données éditables, réutilisables • Racheté par Google en 2010 et forme la base du Knowledge Graph • Alimenté par plusieurs autres bases du web (dont wikipedia)
  • • Vocabulaire permettant de structurer et formater les données d'une page HTML – Fait pour les moteurs de recherche, composé d'un ensemble de vocabulaires typés, articulés entre eux. • Initié mi 2011 Conjointement par Yahoo!, Bing et Google. • rejoint par Yandex (russe) – Groupe de travail dirigé par Dan Brickley (W3C) • S'appuie notamment sur HTML5 (microdata, mais aussi RDFa)
  • Thing
  • Syntaxe RDFa <div resource="/billets/probleme-platon" prefix="dc: http://purl.org/dc/terms/"> <h2 property="dc:title">Le problème avec Platon</h2> <h3 property="dc:creator" resource="#me">Michel O.</h3> </div> <div class="sidebar" vocab="http://xmlns.com/foaf/0.1/" resource="#me" typeof="Person"> <p> <span property="name">Michel O.</span>, Email: <a property="mbox" href="mailto:michelo@philo.fr">michelo@philo.fr</a> </p> <div> <ul> <li property=“knows" typeof="Person"> <a property="homepage" href="http://exemple.fr/platon"> <span property="name">Platon</span> </a> </li> </ul> </div> </div>
  • Syntaxe microdata <div itemscope itemtype="http://schema.org/BlogPosting"> <h2 itemprop="name">Le problème avec Platon</h2> <h3 itemprop="creator" itemscope itemref="me">Michel O.</h3> </div> <div class="sidebar" id="me" itemscope itemtype="http://schema.org/Person"> <p> <span itemprop="name">Michel O.</span>, Email: <a itemprop="email" href="mailto:michelo@philo.fr">michelo@philo.fr</a> </p> <div> <ul> <li itemprop="knows" itemscope itemtype="http://schema.org/Person"> <a itemprop="url" href="http://exemple.fr/platon"> <span itemprop="name">Platon</span> </a> </li> </ul> </div> </div>
  • vs. Que choisir ? RDFa Microdata • Même nombre d’attributs • Même complexité • Même expressivité à 99% • Même support (schema.org supporte RDFa) lite
  • vs. Que choisir ? RDFa Microdata • RDFa : compatibilité avec le monde RDF (URIs, triplets, parsers) • RDFa : plus ancien/stable, plus déployé • RDFa core : plus de possibilités • Facebook ne supporte pas Microdata • 99% du markup microdata encode du schema.org lite
  • schema.org : outils • Pour éditer : – http://schema-creator.org/ (assistance au balisage à base de formulaires) – Des plugins pour vos CMS préférés • Wordpress : http://wordpress.org/plugins/schema-creator/ • Drupal : https://drupal.org/project/schemaorg • Pour tester – Google Rich Snippet Testing Tool • http://www.google.com/webmasters/tools/ric hsnippets
  • Traitement Automatique du Language • Structurer des contenus non-structurés au départ est – très – couteux – Annotations manuelles, à base de thesaurus, mots-clés, listes contrôlées, etc. • Des outils de TAL peuvent aider • opencalais.com : – Gratuit < 50000 appels/jour – http://viewer.opencalais.com • alchemyapi.com – Gratuit < 1000 appels/jour • Plugins correspondants pour vos CMS préférés
  • <refrain>
  • Le web est un moyen de aussi bien que de partager et relier des documents. partager et relier des données 1
  • Nous pouvons publiées pour nos propres besoins. ré-exploiter les données 2
  • Nous pouvons avec celles des autres. partager et relier nos données 3
  • </refrain>
  • Les données structurées dans le
  • Par quel moyen les ontologies identifient-elles de façon non-ambigüe les sujets, les verbes et les compléments ?
  • Grâce à des URIs http://mydomain.org/mypath/myresource
  • URLidentifier ce qui existe sur le web http://mon.site.fr URIidentifier, sur le web, ce qui existe http://animaux.fr/mon-zebre Fabien Gandon : http://fr.slideshare.net/fabien_gandon
  • http://exemple.com/Elvis joue de la guitare http://exemple.com/Elvis habite à Las Vegas Des données peuvent parler du même « sujet » que d’autres données
  • Des données peuvent utiliser en « complément » un sujet d’autres données http://data.insee.fr/Paris est en France Elvis est en concert à http://data.insee.fr/Paris
  • http://exemple.fr/rencontre est une propriété (qui relie 2 personnes) Thomas http://exemple.fr/rencontre Olivier Des données peuvent utiliser un « verbe » défini dans d’autres données
  • D’un web de documents identifiés par des URLs et reliés par des liens hypertextes…
  • … à un web de données identifiées par des URIs et reliées grâce à des triplets « sujets verbe complément »
  • RDFest le modèle de données permettant d’encoder les descriptions ( sujet , prédicat , objet )
  • Open Data et Web de données ★ Données accessibles sur le web (sans conditions de formats) ★★ Données accessibles structurées (Excel au lieu de l’image d’un tableau) ★★★ Formats non-propriétaires (exemple: csv au lieu d’Excel) ★★★★ Utiliser des URI pour identifier les ressources ★★★★★ Relier les données à d’autres données http://5stardata.info/ Open Data Données liées – web de données
  • Pourquoi relier des informations entre elles ?
  • Par exemple pour pouvoir les réintégrer dans une seule application
  • Tiré de http://graphityhq.com
  • Tiré de http://graphityhq.com
  • et
  • Logiciel d’extraction GPS culturel index de collections enseignement accessibilité international applications Julien Cojan et Fabien Gandon : http://fr.slideshare.net/JulienCojan/dbpedia-cafein dbpedia wikipedia
  • Julien Cojan et Fabien Gandon : http://fr.slideshare.net/JulienCojan/dbpedia-cafein
  • Trouver une ressource dans DBPedia 1. Chercher dans Wikipedia en français – « Jack Sparrow » 1. Noter l’URL de la page Wikipedia – http://fr.wikipedia.org/Jack_Sparrow 1. Garder seulement la fin de l’URL et remplacer le début par « http://fr.dbpedia.org/resource/ » – http://fr.dbpedia.org/resource/Jack_Sparrow
  • Cherchez le rapport entre: - Pierre Curie: Physicien Français - Boutros Boutros Ghali: Diplomate Egyptien - Jackie Kennedy : épouse de JFK
  • http://relfinder.dbpedia.org
  • Utiliser les données du web pour enrichir la navigation dans un contenu http://labs.sparna.fr http://dev.presek-i.com/onmt_demo/
  • Utiliser les données du web pour créer des mashups http://labs.antidot.net/museesdefrance
  • Interroger DBPedia • http://fr.dbpedia.org/sparql • SPARQL : le langage d’interrogation des données en RDF
  • Les entreprises… SELECT ?x WHERE { ?x rdf:type dbpedia-owl:Company . }
  • Les entreprises avec leur nom… SELECT ?x ?label WHERE { ?x rdf:type dbpedia-owl:Company . ?x rdfs:label ?label FILTER(lang(?label) = "fr") }
  • Les entreprises avec leur nom et leur slogan SELECT ?x ?label ?slogan WHERE { ?x rdf:type dbpedia-owl:Company . ?x rdfs:label ?label . FILTER(lang(?label) = "fr") ?x prop-fr:slogan ?slogan }
  • Les pays avec leur IDH SELECT ?nomPays ?indiceDeveloppementHumain WHERE { ?pays rdf:type dbpedia-owl:Country . ?pays rdfs:label ?nomPays . FILTER (lang(?nomPays) = 'fr') . OPTIONAL { ?pays prop-fr:idh ? indiceDeveloppementHumain . } }
  • Les villes d’Indre-et-loire SELECT ?ville ?insee ?habitants WHERE { ?ville dbpedia-owl:geolocDepartment dbpedia-fr:Indre-et-Loire . OPTIONAL { ?ville prop-fr:insee ?insee } ?ville dbpedia-owl:populationTotal ? habitants . } ORDER BY DESC(?habitants)
  • Les entreprises implantées dans une ville d’indre-et-loire SELECT ?nomEntreprise ?nomVille WHERE { ?entreprise dbpedia-owl:locationCity ?ville . ?ville dbpedia-owl:geolocDepartment dbpedia- fr:Indre-et-Loire . ?entreprise rdfs:label ?nomEntreprise . ?ville rdfs:label ?nomVille . FILTER(lang(?nomEntreprise) = 'fr' && lang(? nomVille) = 'fr') . }
  • Les artistes qui partagent un genre musical et un label avec les Rita Mitsouko select ?nomArtiste where { dbpedia-fr:Les_Rita_Mitsouko prop-fr:genre ? genreDesRita . dbpedia-fr:Les_Rita_Mitsouko prop-fr:label ? labelDesRita . ?autresArtistes prop-fr:genre ?genreDesRita . ?autresArtistes prop-fr:label ?labelDesRita . ?autresArtistes rdfs:label ?nomArtiste . ?autresArtistes rdf:type dbpedia-owl:Agent . FILTER(lang(?nomArtiste) = 'fr') }
  • Un futur gisement de données structurées sur le web
  • Avant wikidata 1. Centraliser les liens interlangues des chapitres de wikipedia Après wikidata
  • 2. Centraliser les données des infoboxfr.wikipedia.org en.wikipedia.org
  • Wikidata : un item Un nom Un ID Qxxx (= une URI) Une description Des synonymes La possibilité de modifier
  • Wikidata : « statements » (assertions) Propriété Valeur (lien vers une autre entrée) Source de la donnée 1 statement La possibilité de modifier
  • <refrain>
  • Le web est un moyen de aussi bien que de partager et relier des documents. partager et relier des données 1
  • Nous pouvons publiées pour nos propres besoins. ré-exploiter les données 2
  • Nous pouvons avec celles des autres. partager et relier nos données 3
  • </refrain>
  • Relier les données : quels usages ? • « Relier les données : un enjeu majeur pour les usages ? » – Journée d’étude organisée par la FING dans le cadre du projet Datalift – jeudi 27 mars 2014, 10h-18h, chez Numa, 39 rue du Caire, 75002 Paris. – http://fing.org/?page=evenement&id=506
  • Publier/Relier les données : une vision ecosystémique http://everywhereishere2009.blogspot.fr/2009/08/first-thoughts-designing-new-knowledge.html (en attente de la permission de l’auteur)
  • Publier/Relier les données : une vision ecosystémique http://everywhereishere2009.blogspot.fr/2009/08/first-thoughts-designing-new-knowledge.html (en attente de la permission de l’auteur)
  • Thomas FRANCART sparna.fr
  • Une URI est un identifiant pour n’importe quelle “chose” une ville, une personne, un concept, un objet, etc. http://.../Jack_Sparrow=
  • Lorsqu’on accède à une URI, on n’accède pas à la “chose”… http://.../Jack_Sparrow
  • …on accède à une représentation de la chose http://.../Jack_Sparrow
  • et une même chose peut avoir plusieurs représentations différentes Français ou anglais ? Homme ou machine ? HTML ou PDF ? Desktop ou mobile ? …
  • La représentation renvoyée est fonction de la négociation de contenu
  • La négociation de contenu fonctionne grâce aux entêtes HTTP
  • Sur le web de données, on a (souvent) 2 représentations de la même ressource : 1 pour les humains en HTML 1 pour les machines en RDF
  • Les URIs des ressources de DBPedia sont http://dbpedia.org/resource/xxx leurs représentations pour un humain sont http://dbpedia.org/page/xxx leurs représentations pour une machine sont http://dbpedia.org/data/xxx