Overzicht BEST Project - NWO Site Visit

985 views

Published on

Published in: Technology, Travel, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
985
On SlideShare
0
From Embeds
0
Number of Embeds
198
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • we focus on task 3 in this presentation
  • Overzicht BEST Project - NWO Site Visit

    1. 1. OVERZICHT BEST PROJECT Rinke Hoekstra, Arno Lodder en Frank van Harmelen Site Visit – 28 januari 2010
    2. 2. Overzicht <ul><li>Achtergrond </li></ul><ul><li>Ontwikkelingen sinds 2008 </li></ul><ul><li>Technische uitwerking </li></ul><ul><li>Demo </li></ul><ul><li>Inzichten </li></ul><ul><li>Vooruitblik </li></ul>
    3. 3. Achtergrond <ul><li>Doelen </li></ul><ul><ul><li>Assistentie bij het bepalen van juridische positie </li></ul></ul><ul><ul><li>Verbeteren toegankelijkheid gerechtelijke uitspraken </li></ul></ul><ul><li>Middel </li></ul><ul><ul><li>Expliciete beschrijving van de betekenis van begrippen </li></ul></ul><ul><ul><li>Combineren en interpreteren van informatie uit verschillende bronnen </li></ul></ul><ul><ul><li>Semantic Web technologie </li></ul></ul>
    4. 4. Toegankelijkheid <ul><li>Aspecten </li></ul><ul><ul><li>Alle informatie, vanaf willekeurige locatie, voor iedereen </li></ul></ul><ul><ul><ul><li>deels gerealiseerd met rechtspraak.nl </li></ul></ul></ul><ul><ul><li>Zonder juridische kennis </li></ul></ul><ul><ul><ul><li>l ekentaal vs. juridische taal </li></ul></ul></ul><ul><ul><li>Begrijpen relevantie gevonden uitspraak </li></ul></ul><ul><ul><ul><li>uitleg van begrippen en relevantie voor informatievraag </li></ul></ul></ul>
    5. 5. Procedure <ul><li>Invoer casusbeschrijving in lekentaal </li></ul><ul><ul><li>Selecteren relevante lekentermen </li></ul></ul><ul><li>Vertaling van lekentaal naar juridische concepten </li></ul><ul><ul><li>Mapping naar juridische concepten </li></ul></ul><ul><li>Uitdrukken als zoekvraag </li></ul><ul><ul><li>Boolean free text zoekvraag (AND/OR) </li></ul></ul><ul><ul><li>Directe annotaties </li></ul></ul><ul><li>Zoeken uitspraken (afkomstig uit rechtspraak.nl) </li></ul><ul><li>Uitleg van relevantie door annotatie van uitspraken en verklaring van begrippen </li></ul>
    6. 6. Overzicht
    7. 7. Status (1) <ul><li>Status (September 2008): </li></ul><ul><ul><li>Presentatie aan eindgebruiker </li></ul></ul><ul><ul><li>Zoeksysteem op basis van juridische concepten </li></ul></ul><ul><ul><ul><li>J uridische en leken ontologie </li></ul></ul></ul><ul><ul><li>Basis technische infrastructuur voor interpretatie lekenteksten </li></ul></ul><ul><li>Maar... </li></ul><ul><ul><li>Inflexibele koppeling ontologieen </li></ul></ul><ul><ul><li>Collexis zoeksysteem niet goed te vergelijken, traag </li></ul></ul><ul><ul><li>Losse componenten </li></ul></ul>
    8. 8. Status (2) <ul><li>Volledige herimplementatie met Apache Lucene </li></ul><ul><ul><li>Standaard, industry-grade zoeksysteem </li></ul></ul><ul><ul><li>rechtspraak.nl volledig beschikbaar ( … t evens als deeplinks) </li></ul></ul><ul><li>Volledige herinrichting semantiek </li></ul><ul><ul><li>o ntologie  vocabulair </li></ul></ul><ul><ul><li>… maximale flexibiliteit </li></ul></ul><ul><li>Metadata van uitspraken online beschikbaar als RDF </li></ul><ul><ul><li>SPARQL endpoint (linked open data) </li></ul></ul><ul><li>Ontologieën en vocabulaires online beschikbaar </li></ul><ul><li>Publiek toegankelijk test-portal (PHP/JavaScript) </li></ul><ul><ul><li>http://semweb.cs.vu.nl/best-portal </li></ul></ul><ul><li>Zoeken in uitspraken </li></ul><ul><ul><li>Volledige keten geïmplementeerd </li></ul></ul><ul><li>Toevoegen van nieuwe mappings </li></ul><ul><ul><li>Verschillende vormen en combinaties </li></ul></ul>
    9. 9. Architectuur
    10. 10. Screenshot
    11. 11. Status (3) <ul><li>Meer gedetailleerde casusbeschrijving </li></ul><ul><ul><li>Focus op de onrechtmatige daad </li></ul></ul><ul><ul><li>“ Case Frames” </li></ul></ul><ul><li>Herontwerp en uitbreiding leken vocabulaire </li></ul><ul><ul><li>Minder nadruk op natuurlijke-taal interpretatie </li></ul></ul><ul><ul><li>Onderscheidende concepten </li></ul></ul><ul><li>Herontwerp juridisch vocabulaire </li></ul><ul><ul><li>Onderscheidende concepten </li></ul></ul><ul><ul><li>Structuur meer analoog relevante factoren </li></ul></ul><ul><ul><ul><li>... minder encyclopedisch. </li></ul></ul></ul>
    12. 12. Case Frames
    13. 13. Semantische Integratie <ul><li>SKOS vocabulair </li></ul><ul><ul><li>Taxonomie van leken termen </li></ul></ul><ul><ul><li>Taxonomie van juridische concepten </li></ul></ul><ul><li>OWL ontologie </li></ul><ul><ul><li>Mapping tussen beide vocabulaires </li></ul></ul><ul><ul><li>Classificatie van geval in juridische termen </li></ul></ul><ul><li>Alle onderdelen gebruiken dezelfde ontologie </li></ul><ul><li>REST services wisselen informatie uit op basis van ontologie </li></ul>
    14. 14. SKOS Vocabulair <ul><li>Domein </li></ul><ul><ul><li>Lekentermen rondom onrechtmatige daad </li></ul></ul><ul><ul><li>Juridische concepten rondom onrechtmatige daad </li></ul></ul><ul><ul><ul><li>BW 6:162, 6:192, 6:170, 6:170-177, 6:179, 6:185 en 6:194 </li></ul></ul></ul><ul><li>Functies </li></ul><ul><ul><li>Annotatie van uitspraken </li></ul></ul><ul><ul><ul><li>directe relatie tussen concept en uitspraak </li></ul></ul></ul><ul><ul><ul><li>juridische kant </li></ul></ul></ul><ul><ul><li>Indexering van uitspraken </li></ul></ul><ul><ul><ul><li>… op basis van zgn. “ fingerprints ” </li></ul></ul></ul><ul><ul><ul><li>juridische kant </li></ul></ul></ul><ul><ul><li>Invoer van casusbeschrijving </li></ul></ul><ul><ul><ul><li>leken kant </li></ul></ul></ul>
    15. 15. Fingerprints <ul><li>Probleem </li></ul><ul><ul><li>Wetgeving gebruikt `open textured’ concepts </li></ul></ul><ul><ul><li>Situaties in uitspraken zijn erg verschillend voor gelijksoortige typen aansprakelijkheid </li></ul></ul><ul><ul><li>Direct zoeken op trefwoord geeft slecht resultaat </li></ul></ul><ul><li>Fingerprints </li></ul><ul><ul><li>Lijst van gewogen woorden en zinsdelen </li></ul></ul><ul><ul><li>“ Representatie” van juridische concepten in uitspraken. </li></ul></ul><ul><li>Hogere score op fingerprint... </li></ul><ul><ul><li>... meer relevant voor juridisch concept </li></ul></ul><ul><li>Fallback </li></ul><ul><ul><li>... i ndien geen fingerprint gebruik dan het label </li></ul></ul>
    16. 16. OWL Ontologie <ul><li>Functies </li></ul><ul><ul><li>Afleiden van van juridische concepten uit lekentermen </li></ul></ul><ul><ul><li>Opzoeken uitleg van juridische termen </li></ul></ul><ul><ul><li>Representatie wetsartikelen in juridische termen </li></ul></ul><ul><li>Flexibel </li></ul><ul><ul><li>Overerving </li></ul></ul><ul><ul><ul><li>Als “dieren”  “bezitter van een dier”, dan ook </li></ul></ul></ul><ul><ul><ul><li>“ paard”  “bezitter van een dier”. </li></ul></ul></ul><ul><ul><li>Combinaties </li></ul></ul><ul><ul><ul><li>“ dieren EN persoon”  “bezitter van een dier” </li></ul></ul></ul><ul><ul><ul><li>“ dieren OF persoon”  “bezitter van een dier” </li></ul></ul></ul><ul><ul><li>Evt. negatie </li></ul></ul><ul><ul><ul><li>“ dieren EN NIET wilde dieren” </li></ul></ul></ul><ul><ul><li>Richtingafhankelijk (evt.) </li></ul></ul><ul><ul><ul><li>l eken  juridisch, juridisch  leken, of leken  juridisch </li></ul></ul></ul>
    17. 17. Conceptueel Raamwerk
    18. 18. <ul><li>Een kind wordt in het plantsoen gebeten door een loslopende hond . </li></ul><ul><li>vs. </li></ul><ul><li>Een hond wordt in het plantsoen gebeten door een loslopend kind . </li></ul>DEMO
    19. 19. Inzichten <ul><li>Recht-toe-recht-aan zoekvragen bieden vaak minimale aanknopingspunten </li></ul><ul><ul><li>Inhoud van rechtspraak.nl toegespitst op bijzondere uitspraken… </li></ul></ul><ul><ul><li>… er is dus zelden overeenkomst in de feiten. </li></ul></ul><ul><li>Vertaalslag van lekentaal naar juridisch begrippenkader </li></ul><ul><ul><li>… noodzaak tot uitleg juridische concepten en juridisch redeneren </li></ul></ul><ul><li>Juridisch domein brengt specifieke eigenaardigheden met zich mee, en lijkt moeilijker dan andere domeinen </li></ul><ul><ul><li>Terminologie ligt minder vast, moeilijker voor ontologie-constructie en voor retrieval. </li></ul></ul><ul><ul><li>Commonsense kennis onvermijdelijk </li></ul></ul><ul><li>Leken ondersteuning is extra complicatie </li></ul><ul><ul><li>(ook in andere domeinen) </li></ul></ul>
    20. 20. Vooruitblik <ul><li>Verbeteren uitleg resultaten </li></ul><ul><li>Gebruikersevaluatie </li></ul><ul><li>Technische evaluatie </li></ul><ul><ul><li>Relevantie van gevonden uitspraken </li></ul></ul><ul><ul><ul><li>... vergelijk met handmatige annotatie (gouden standaard) </li></ul></ul></ul><ul><ul><ul><li>... v ergelijk met collectie standaard casus </li></ul></ul></ul><ul><ul><li>Invloed verschillende typen correspondenties </li></ul></ul><ul><ul><li>Invloed toename semantiek in correspondentie </li></ul></ul>

    ×