Presentatie nl.dbpedia.org Datasalon 8 Gent 24 Februari 2012

756 views

Published on

Een kort pleidooi voor het inrichten van een Nederlandstalige versie van de DBpedia om zo de collecties van Bibliotheken, Archieven en Musea beter vindbaar te maken en eenvoudiger te kunnen koppelen met andere relevante informatiebronnen. In het kader van het Open Zoekplatform wil Stichting Bibliotheek.nl een eerste aanzet doen voor het inrichten van het NL-domein. Het wordt echter alleen een succes wanneer enthousiaste personen en organisaties hun schouders hieronder willen zetten. Er is werk aan de winkel voor programmeurs, dataspecialisten en Wikipedianen. Stuur een mailtje als je ons wil helpen!!

Published in: Education, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
756
On SlideShare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Presentatie nl.dbpedia.org Datasalon 8 Gent 24 Februari 2012

  1. 1. http://nl.dbpedia.org DataSalon Gent – 24/2/12 Enno Meijers – Bibliotheek.nl enno.meijers@bibliotheek.nl
  2. 2. Wikipedia artikelen per land (mln) bron: http://stats.wikimedia.org/EN/Sitemap.htm#comparisons3,89 1,36 1,21 1,02en de fr nl % templates gemapped in DBpedia http://mappings.dbpedia.org/sprint/ 81,61 54,82 38,73 1,5 en de fr nl
  3. 3. dbpedia:Herman_Brusselmans rdfs:label "Herman Brusselmans"@en Tekst tot inhoudsopgave (max. 500 woorden) dbpedia:Herman_Brusselmans dbpedia-owl:abstract "Herman Frans Martha Brusselmans is a Flemish novelist... Koen Mortier."@en
  4. 4. Maar:- versie 3.7; stand juli 2011!- alleen Engelse versie wordt direct bijgewerkt (Live extraction)- beperkt aantal talen (waaronder nl) dbpedia:Herman_Brusselmans rdfs:label "Herman Brusselmans"@nl dbpedia:Herman_Brusselmans rdfs:label "Herman Brusselmans"@fr dbpedia:Herman_Brusselmans rdfs:label "Herman Brusselmans"@de dbpedia:Herman_Brusselmans dbpedia-owl:abstract “Herman Frans Martha Brusselmans is een Vlaams schrijver."@nl dbpedia:Herman_Brusselmans dbpedia-owl:abstract "Herman Frans Martha ... monde des lettres."@fr dbpedia:Herman_Brusselmans dbpedia-owl:abstract "Herman Brusselmans … lebt in Gent."@de
  5. 5. En verder nog meer algemene mapping’s:• Images. Links pointing at Wikimedia Commons images depicting a resource are extracted and represented by using the foaf:depiction property.• Redirects. In order to identify synonymous terms, Wikipedia articles can redirect to other articles. We extract these redirects and use them to resolve references between DBpedia resources.• External links. Articles contain references to external Web resources which we represent by using the DBpedia property dbpedia:reference.• Pagelinks. We extract all links between Wikipedia articles and represent them by using the dbpedia:wikilink property.• Homepages. This extractor obtains links to the homepages of entities such as companies and organisations by looking for the terms homepage or website within article links• Categories. Wikipedia articles are arranged in categories, which we represent by using the SKOS vocabulary4.• Geo-coordinates. The geo-extractor expresses coordinates by using the Basic Geo (WGS84 lat/long) Vocabulary5 and the GeoRSS Simple encoding of the W3C Geospatial Vocabulary6.• Metainformation. A new extractor which introduces organisational properties like direct edit links and oai identifiers for edit and delete operations.
  6. 6. foaf:name dbpprop:background{{Infobox musical artist| name = Tom Waits foaf:givenName| image = Tom Waits 3.jpg| caption = Waits … in Buenos Aires, Argentina, April 2007| background = solo_singer dbpedia-owl:birthDate| birth_name = Thomas Alan Waits| birth_date = {{Birth date and age|mf=yes|1949|12|7}}| birth_place =[[Pomona, California]], United States| instrument = [[Singing|Vocals]], [[piano]], [[guitar]] dbpedia-owl:birthPlace| genre = [[Rock music|Rock]], [[experimental music]]| occupation = Singer-songwriter, musician, actor, composer| years_active = 1972–present dbpprop:instrument| label = [[Asylum Records]], [[Island Records]], [[ANTI-]]| website = {{URL|http://www.badasme.com/|Official website}}}} dbpprop:genre dbpprop:occupation dbpedia-owl:activeYearsStartYear dbpedia-owl:recordLabel foaf:homepage
  7. 7. DBpedia Mappings WikiEen stukje van een Infobox mapping:{{PropertyMapping | templateProperty = Name | ontologyProperty = foaf:name }}{{PropertyMapping | templateProperty = name | ontologyProperty = foaf:name }}{{PropertyMapping | templateProperty = Current_members | ontologyProperty = bandMember }}{{PropertyMapping | templateProperty = current_members | ontologyProperty = bandMember }}{{PropertyMapping | templateProperty = Members | ontologyProperty = bandMember }}{{PropertyMapping | templateProperty = Past_members | ontologyProperty = formerBandMember }}{{PropertyMapping | templateProperty = past_members | ontologyProperty = formerBandMember }}{{PropertyMapping | templateProperty = Background | ontologyProperty = background }}{{PropertyMapping | templateProperty = background | ontologyProperty = background }}{{PropertyMapping | templateProperty = Birth_name | ontologyProperty = foaf:givenName }}{{PropertyMapping | templateProperty = birth_name | ontologyProperty = foaf:givenName }} enz. Zie voor meer informatie http://mappings.dbpedia.org
  8. 8. • Invulling info boxen is beperkt• Specifieke taal problemen zie aanpassing voor Griekse chapter (o.a. ook IRI’s)
  9. 9. meer informatie• mappings.dbpedia.org• artikel: “DBpedia Live Extraction”, Sebastian Hellman e.a., 2009• artikel: “Internationalization of Linked Data: The case of the Greek DBpedia edition”, Dimitris Kontokostas, 2012• DBpedia Mapping Language, Anja Jentzsch, 2010• dbpedia-discussion@lists.sourceforge.net
  10. 10. Voorstel1. nl.dbpedia.org en Extraction Framework inrichten door DBpedia team Leipzig ism Bibliotheek.nl2. configuren/aanpassen software voor betere (taalgevoelige) harvesting door Bibliotheek.nl / DBpedia team / programmeurs ism UvA? Univ Gent???3. invullen mappingsschema’s en uitbreiden ontologie en properties door IT/IP’ers via community ism Bibliotheek.nl / Bibnet (?)4. beter invullen van de Infobox op de wikipedia pagina door community met ondersteuning van bibliotheekorganisaties en WikiMedia
  11. 11. discussie• Goed idee?• Gaat het werken via de community? Hoe moeten we dit opstarten?• Welke organisaties kennen jullie die hier een rol bij zouden willen spelen?• Meer richten op software voor vullen van Infobox (tekst analyse, zie bijvoorbeeld Ipopulator)• Wat te doen met dialecten bijv. Fries?• Zouden we ons niet moeten concentreren op specifieke informatie?• WIE DOET MEE?

×