Waar zouden we zijn     zonder het woord?           Antal van den Bosch ILK / Taal- en informatiewetenschappen         Uni...
Woorden zijn de sleutelinformatie,  kennis,               erfgoed-              woordenconcepten,              objecten  r...
Woorden zijn de grote constante • Beschrijvingen van erfgoedobjecten   –   Annotaties, noten, commentaren   –   Wetenschap...
Maar: taal is grenzeloos ambigu                hijswerktuig,                hijswerktuig,         voetbalclub,            ...
Maar: taal is grenzeloos ambigu                        achternaam,                        achternaam,            voornaam ...
Maar: taal is grenzeloos ambigu     Fotograaf of     Fotograaf of                      Fotograaf of                       ...
Taaltechnologie biedt oplossing• Contextuele patronen voor  disambiguering:  – de znw/ww → znw  – kraan ~ [rivier/haven] →...
Disambiguering = verrijking• Zonder disambiguering  – “Google”-stijl zoeken mogelijk  – Maar: veel irrelevante resultaten•...
Intelligent zoeken en vinden• Blijft een kwestie van woorden  – Natuurlijke vragen, natuurlijke antwoorden  – Wedervragen ...
Antal.vdnBosch@uvt.nl   http://ilk.uvt.nlhttp://ilk.uvt.nl/mitch
Upcoming SlideShare
Loading in …5
×

De Conferentie 2006 Antal van den Bosch

866 views

Published on

Published in: Education, Travel
  • Be the first to comment

  • Be the first to like this

De Conferentie 2006 Antal van den Bosch

  1. 1. Waar zouden we zijn zonder het woord? Antal van den Bosch ILK / Taal- en informatiewetenschappen Universiteit van TilburgDigitaal Erfgoed 2006, 12-13 december 2006 / Rotterdam
  2. 2. Woorden zijn de sleutelinformatie, kennis, erfgoed- woordenconcepten, objecten relaties
  3. 3. Woorden zijn de grote constante • Beschrijvingen van erfgoedobjecten – Annotaties, noten, commentaren – Wetenschappelijke teksten – Bijschriften, onderschriften, tentoonstellingsteksten – Labels, etiketten, signeringen – Dublin Core Metadata velden en veldtypen – Categorieën, klassen, taxonomieën – Concepten, facetten, conceptrelaties • Als dit numerieke codes waren, dan begreep niemand iets
  4. 4. Maar: taal is grenzeloos ambigu hijswerktuig, hijswerktuig, voetbalclub, voetbalclub, buis met buis met stad,station, stad,station, sluiting, sluiting, bisdom bisdom kraanvogel kraanvogelDe waag en de kraan aan het Spaarne in Haarlem zelfstandig naamwoord of werkwoord
  5. 5. Maar: taal is grenzeloos ambigu achternaam, achternaam, voornaam voornaam diernaam diernaam Foto: René Krekels
  6. 6. Maar: taal is grenzeloos ambigu Fotograaf of Fotograaf of Fotograaf of Fotograaf of gefotografeerde gefotografeerde gefotografeerde gefotografeerdePrinses Juliana, gefotografeerd door prins Bernhard.
  7. 7. Taaltechnologie biedt oplossing• Contextuele patronen voor disambiguering: – de znw/ww → znw – kraan ~ [rivier/haven] → hijskraan • Spaarne=rivier – voornaam achternaam/andere naam → achternaam – [onderwerp] gefotografeerd_door [fotograaf- maker]• Vroeger: handgeschreven regels;• Nu: computer leert regels uit voorbeelden
  8. 8. Disambiguering = verrijking• Zonder disambiguering – “Google”-stijl zoeken mogelijk – Maar: veel irrelevante resultaten• Met disambiguering – “Google”-stijl zoeken met hogere precisie – Of terugkoppeling: “bedoelde u…” – Complexere vragen mogelijk • “personen die Prins Bernhard heeft gefotografeerd” • “havengezichten in Gouden Eeuw” • “kikkers in Amazone tussen 1900 en 2000”• Mits goede domein-ontologie
  9. 9. Intelligent zoeken en vinden• Blijft een kwestie van woorden – Natuurlijke vragen, natuurlijke antwoorden – Wedervragen van systeem (“QA dialoog”) – Luister naar de expert (of ook niet-experts?)• “Universele ontologie” een utopie – Maar domeinspecifieke ontologie prima mogelijk – Aftelbare concepten (object, maker, materiaal, …) – Aftelbare relaties (maker maker_van object, …)• Ultiem doel: kennisverrijking door automatisch redeneren – “Periode” van kunstenaar; outlier-detectie – “Cluster” van kunstenaars
  10. 10. Antal.vdnBosch@uvt.nl http://ilk.uvt.nlhttp://ilk.uvt.nl/mitch

×