0
La terminologia condivisa:  uno strumento trasversale  di lavoro  Rita Marinelli [email_address]
<ul><li>Parlo della mia esperienza di lavoro, presso l’ILC, che si occupa di studiare il linguaggio naturale utilizzando m...
Modello concettuale <ul><li>Metodologia o modello concettuale valido indipendentemente </li></ul><ul><li>dalla materia tra...
Database di terminologia   <ul><li>Dal qualche anno sono in corso di costruzione tre database di terminologia appartenenti...
Il modello dei database <ul><li>Il modello usato per la costruzione dei database è di tipo relazionale, con relazioni sema...
Metodologia <ul><li>I database contengono rispettivamente 4000, 1600, 1500 termini. </li></ul><ul><li>Primo passo della co...
Dai testi al corpus <ul><li>⇨   I committenti hanno inviato insiemi di testi in vari formati (word, pdf, ecc.) appartenent...
Primi concetti inseriti <ul><li>La lista di frequenza in ordine decrescente è stata usata per estrarre le 150 parole più f...
Altri concetti inseriti <ul><li>Il database è stato poi popolato inserendo altri concetti (non presenti in IWN), appartene...
Termini come “synsets” <ul><li>Ogni termine compare nel database con i suoi sinonimi, se ci sono, e costituisce un  synset...
Relazioni semantiche interne <ul><li>di tipo gerarchico/verticale (ipo/iperonimia):  </li></ul><ul><ul><li>abbordaggio  ha...
Abbordaggio
Porto Nave porta container Altri esempi
Campo semantico <ul><li>L’insieme dei termini collegati al termine dato (tassa) per mezzo delle relazioni e le relazioni s...
<ul><li>Relazioni di equivalenza   </li></ul><ul><li>legano i  synsets  ai concetti equivalenti in Inglese, es.:  </li></u...
Relazioni plug-in <ul><ul><li>Un  synset  della rete terminologica può essere collegato alla rete generica IWN </li></ul><...
“ Tributo ”:  consultazione integrata Downward relations Upward relations
Classificazione ontologica <ul><li>ogni termine ha una sua classificazione ontologica , cioè è legato a uno o più concetti...
Interazione e trasversalità <ul><li>Questo settore della LC (costruzione di db terminologici) rappresenta esso stesso la c...
Interazione e trasversalità <ul><li>l’utilizzo : la particolare struttura ad albero consente all’utente di fermarsi ad un ...
Upcoming SlideShare
Loading in...5
×

Arte di Ascoltare - Slide Rita Marinelli

888

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
888
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • da quello dell’informatica (si tratta di database) a quello della linguistica (vengono elaborati lessici specialistici) e della psicologia cognitiva e psicolinguistica (risultati importanti di ricerche fatte sulle associazioni semantiche): “demonstrated an experimental methodology (a sentence verification task) that suggested that subjects had structured representations that had privileged links for hyponymic and meronymic relations” (Beckwith, Fellbaum, Gross, Miller, 1991; Miller, 2003).
  • Transcript of "Arte di Ascoltare - Slide Rita Marinelli"

    1. 1. La terminologia condivisa: uno strumento trasversale di lavoro Rita Marinelli [email_address]
    2. 2. <ul><li>Parlo della mia esperienza di lavoro, presso l’ILC, che si occupa di studiare il linguaggio naturale utilizzando metodologie informatiche </li></ul><ul><li>Si tratta della costruzione di tre db di terminologia di tre domini diversi ma costruiti con criteri simili e usando lo stesso modello concettuale </li></ul><ul><li>Sono destinati a varie tipologie di utenti: professionisti e non </li></ul><ul><li>Non è importante qui il tipo di dominio considerato, quanto la metodologia di lavoro usata </li></ul>
    3. 3. Modello concettuale <ul><li>Metodologia o modello concettuale valido indipendentemente </li></ul><ul><li>dalla materia trattata </li></ul><ul><li>dal livello di competenza che l’utente ha nel settore, perché può servire anche a chi questa competenza non ce l’ha affatto e quindi ha bisogno di formarsela </li></ul>
    4. 4. Database di terminologia <ul><li>Dal qualche anno sono in corso di costruzione tre database di terminologia appartenenti a domini diversi: </li></ul><ul><li>“ marittima” (settore nautico e trasporti marittimi) </li></ul><ul><li>“ fiscale” </li></ul><ul><li>“ sindacale e del lavoro” </li></ul><ul><li>per rispondere alla richiesta di uno strumento di consultazione e di supporto per utenti con differenti gradi di competenza, operanti nel settore. </li></ul>
    5. 5. Il modello dei database <ul><li>Il modello usato per la costruzione dei database è di tipo relazionale, con relazioni semantico lessicali, secondo i modelli di riferimento </li></ul><ul><ul><li>EuroWordNet (progetto europeo), </li></ul></ul><ul><ul><li>ItalWordNet (SI-TAL progetto nazionale basato sull’ampliamento del db costruito per EWN) e </li></ul></ul><ul><ul><li>Mariterm , primo esperimento di db terminologico; </li></ul></ul><ul><li>tutto nella filosofia “ WordNet ” </li></ul>
    6. 6. Metodologia <ul><li>I database contengono rispettivamente 4000, 1600, 1500 termini. </li></ul><ul><li>Primo passo della costruzione: fissare i concetti principali da cui partire per poi popolare il database -> è stata composta, con la collaborazione dei committenti ed esperti di dominio, una lista di concetti centrali e altamente rappresentativi. Come?... </li></ul>
    7. 7. Dai testi al corpus <ul><li>⇨ I committenti hanno inviato insiemi di testi in vari formati (word, pdf, ecc.) appartenenti al dominio in questione </li></ul><ul><li>⇨ i testi sono stati indicizzati, per poi essere trasformati in un corpus, e quindi sottoposti al sistema di gestione di db testuali (disponibile in ILC) per: </li></ul><ul><ul><ul><li>interrogarli, </li></ul></ul></ul><ul><ul><ul><li>ottenere liste di frequenza, concordanze e co-occorrenze. </li></ul></ul></ul>
    8. 8. Primi concetti inseriti <ul><li>La lista di frequenza in ordine decrescente è stata usata per estrarre le 150 parole più frequenti nei testi, come probabili concetti principali da inserire nel database. </li></ul><ul><li>E’ stata consultata la rete generica IWN per vedere se e quali concetti di questa lista vi fossero presenti: quelli presenti sono stati valutati per poi essere esportati in un file xml e inseriti nel database specialistico importando lo stesso file xml, come prevede l’architettura del tool di gestione del database. </li></ul>IWN xml DB Term
    9. 9. Altri concetti inseriti <ul><li>Il database è stato poi popolato inserendo altri concetti (non presenti in IWN), appartenenti al dominio, con un grado più alto di specificità, in quanto ritenuti rappresentativi del dominio e/o con un grande numero di iponimi </li></ul><ul><li>fonti usate: </li></ul><ul><ul><li>glossari </li></ul></ul><ul><ul><li>testi e pubblicazioni del settore, scaricati da Internet o su supporto cartaceo. </li></ul></ul>
    10. 10. Termini come “synsets” <ul><li>Ogni termine compare nel database con i suoi sinonimi, se ci sono, e costituisce un synset (insieme di sinonimi), es.: </li></ul><ul><ul><li>N bollo auto·1, tassa automobilistica·1 , [ tassa che colpisce il possesso dei veicoli iscritti nei pubblici registri automobilistici </li></ul></ul><ul><ul><li>N abbordaggio·1, abbordo·1 , [urto volontario o collisione accidentale tra imbarcazioni]] </li></ul></ul><ul><li>ogni termine ha </li></ul><ul><ul><li>una categoria grammaticale di appartenenza </li></ul></ul><ul><ul><li>una definizione, es.: tassa che colpisce il possesso dei veicoli iscritti nei pubblici registri automobilistici ; </li></ul></ul><ul><ul><li>un legame con altri termini ( synset ) rappresentato dalle relazioni semantico-lessicali “interne” </li></ul></ul>
    11. 11. Relazioni semantiche interne <ul><li>di tipo gerarchico/verticale (ipo/iperonimia): </li></ul><ul><ul><li>abbordaggio has_hyponym arrembaggio, abbordaggio intenzionale </li></ul></ul><ul><ul><li>abbordaggio has _hyperonym atto, azione </li></ul></ul><ul><li>di tipo orizzontale (relazioni di ruolo, parte, luogo, causa, ecc.): </li></ul><ul><ul><li>abbordaggio causes naufragare·1, colare a picco·2, affondare·2 , [ detto di imbarcazione, affondare in mare; detto di persone imbarcate, fare naufragio, a causa di danni prodotti dal mare in tempesta o da altri tipi di sinistro (urti, incendi, ecc.).] </li></ul></ul>
    12. 12. Abbordaggio
    13. 13. Porto Nave porta container Altri esempi
    14. 14. Campo semantico <ul><li>L’insieme dei termini collegati al termine dato (tassa) per mezzo delle relazioni e le relazioni stesse costituiscono il campo semantico di quel termine e quindi contribuiscono ad arricchire la nostra conoscenza di quel termine . I vari componenti del campo semantico di ogni entrata sono nodi di informazione che va sviluppata e popolata. </li></ul><ul><li>Un concetto del dominio è così definito da un insieme di relazioni all’interno del database terminologico; queste relazioni dicono sia qual è il suo iperonimo , sia quali sono gli altri concetti con cui è collegato. </li></ul><ul><li>Considerando le catene tassonomiche, i concetti che hanno una posizione “intermedia” sono quelli più rappresentativi del dominio (Rosch 1978-88). </li></ul>
    15. 15. <ul><li>Relazioni di equivalenza </li></ul><ul><li>legano i synsets ai concetti equivalenti in Inglese, es.: </li></ul><ul><li>nave da carico eq_synonym cargo_ship </li></ul>
    16. 16. Relazioni plug-in <ul><ul><li>Un synset della rete terminologica può essere collegato alla rete generica IWN </li></ul></ul><ul><ul><li> </li></ul></ul><ul><ul><li>nella “consultazione integrata” possiamo vedere un synset (legato al db generico con relazioni plug_in) con tutte le relazioni che ha sia nel database terminologico (downward relations) sia nel database generico (upward relations) </li></ul></ul>
    17. 17. “ Tributo ”: consultazione integrata Downward relations Upward relations
    18. 18. Classificazione ontologica <ul><li>ogni termine ha una sua classificazione ontologica , cioè è legato a uno o più concetti dell’ontologia ereditata da IWN ( Top Ontology ): insieme di concetti con grande livello di astrazione, organizzati gerarchicamente e indipendenti dal linguaggio: </li></ul><ul><li>abbordaggio  cause, dynamic </li></ul><ul><li>per ogni termine è previsto il collegamento a uno o più concetti dell’ ontologia di dominio , vale a dire un nucleo centrale di concetti, caratterizzante e rappresentativo del dominio stesso e della sua struttura, </li></ul><ul><li>abbordaggio  nautica, governo </li></ul><ul><li>in modo da rendere cognitivamente più chiaro il significato del termine che viene visto come un “nodo di accesso” nella rete di conoscenza (Langacker, 1987). </li></ul>
    19. 19. Interazione e trasversalità <ul><li>Questo settore della LC (costruzione di db terminologici) rappresenta esso stesso la convergenza e l’interazione di settori culturali diversi per </li></ul><ul><li>la materia /materie trattata </li></ul><ul><li>la metodologia e i criteri che sono il risultato di ricerche precedenti fatte in Europa (progetti europei e italiani in particolare), in America (il WordNet di Princeton), ecc. </li></ul><ul><li>l’impostazione culturale che viene da mondi diversi: quello dell’ informatica (si tratta di database), quello della linguistica (vengono elaborati lessici specialistici) e quello della psicologia cognitiva e psicolinguistica (risultati importanti di ricerche fatte sulle associazioni semantiche) </li></ul>
    20. 20. Interazione e trasversalità <ul><li>l’utilizzo : la particolare struttura ad albero consente all’utente di fermarsi ad un livello intermedio, per avere una visione di insieme ampliabile in un secondo tempo con visioni più specialistiche; l’utente è libero di approfondire e aumentare il livello di specializzazione </li></ul><ul><li>insomma </li></ul>interazione e trasversalità: fra discipline, fra materie oggetto di studio, fra utenti e gruppi di lavoro
    1. A particular slide catching your eye?

      Clipping is a handy way to collect important slides you want to go back to later.

    ×