Des identifiants à l’échelle du Web pour 2.6 millions de “choses”
dont au moins 213,000 personnes
328,000 endroits
57,000 albums de musique
36,000 films
En somme 274 millions d’éléments d’information (triplets RDF)
29 millions de triplets d’après des données d’infobox
609,000 liens vers des images
3,150,000 liens vers des pages web externes pertinentes
Catégorisations
L’ontologie DBpedia avec 170 classes et 940 propriétés, basée sur des classes plus riches
415,000 catégories Wikipedia
75,000 catégories YAGO
Accéder aux données de DBpedia
Point d’accès SPARQL
Interface Linked Data (cf: suite)
Des dumps RDF à télécharger
Datasets publiques d’Amazon
http://aws.amazon.com/publicdatasets/
Le point d’accès SPARQL
SPARQL = SQL pour le Web sémantique
Peut répondre aux requêtes SPARQL telles que:
Donne-moi tous les sitcoms basés à New York City
Donne-moi t ous les joueurs de tennis de Moscou
Donne-moi tous les films de Quentin Tarentino
Donne-moi tous musiciens Allemands nés à Berlin au 19àme siècle
Donne-moi tous les joueurs de football avec le maillot numéro 11, qui joue dans un club ayant un stade contenant plus de 40,000 places et qui est nédans un pays de plus de 10 millions d’habitants
Adresse: http://dbpedia.org/sparql
2. Linked Data: DBpedia et le Web des données
Le Web des documents Le Web est un espace d’information global fondé sur des standards ouverts et des liens hypertextes Web browsers Moteurs de recherche A B C D HTML HTML HTML Liens hypertextes HTML Liens hypertextes Liens hypertextes
Linked Data B C Chose l ien entre données A D E Chose Chose Chose Chose Chose Chose Chose Chose Chose
Utiliser RDF et HTTP pour
publier des données structurées sur le Web,
créer des liens entre données d’une donnée source et de données provenant d’autres sources.
l ien entre données l ien entre données L ien entre données
Qu’est-ce que je peut faire avec ça? Moteurs de Recherche Browsers de Linked Data B C Chose l ien entre données A D E Chose Chose Chose Chose Chose Chose Chose Chose Chose l ien entre données l ien entre données L ien entre données Mashups avec Linked Data
Tabulator
DBpedia Mobile
Point d’entrée géospatial dans le Web des données
Falcons
DBtune Slashfacet
visualiser Linked Data (lié à la musique)
Utiliser last.fm, MySpace et données de BBC
W3C Linking Open Data Project
Effort communauté pour
publier des datasets de données déjà existentes comme Linked Data sur le Web
Relier entre elles des informations provenant de sources de données différentes
Datasets LOD: Mai 2007
Plus de 500 millions de triplets RDF
Datasets LOD: Avril 2008
Plus de 2 milliards de triplets RDF
Datasets LOD: Mars 2009 4,5 milliards de triplets 180 millions de liens entre données
Datasets LOD: Mars 2009 Science de la vie Publications Activités en ligne Musique Géographie Interdomaine 4,5 milliards de triplets 180 millions de liens entre données
3. Quelle suite pour DBpedia?
Mise à jour en temps réel
En phase de test
De meilleures interfaces
Recherche plein texte, navigation en mode facette
Merci!
Références
DBpedia http://dbpedia.org/About
W3C Linking Open Data Project http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/ LinkingOpenData
LinkedData.Org
Tim Berners-Lee’s TED Talk http://www.ted.com/index.php/talks/tim_berners_lee_on_the_next_web.html
Tutorial: How to Publish Linked Data on the Web http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/
0 comments
Post a comment