Terminologia per la
traduzione
Luigi Muzii
luigi.muzii@gmail.com
Programma
• Un po’ di storia
• Principi fondamentali
• Sistematizzazione
• Ricerche
• Spoglio ed estrazione dei dati
• Applicazioni
Tradurre negli anni ‘80
Fossa
dell’acetabolo
La terminologia negli anni ‘80
Tradurre negli anni ‘90
Tombino o cameretta?
La terminologia negli anni ‘90
Tradurre negli anni 2000
Tradurre oggi
Concetto e termine
• Un termine, un concetto e viceversa
• Gli omonimi denotano concetti diversi, senza relazioni fra loro
• I sinonimi denotano relazione fra designazioni diverse rappresentanti lo
stesso concetto
Sinonimia ed equivalenza
• Sinonimia
• Livello intralinguistico
• In un ambito d’uso ristretto (dominio)
• Varianti
• Riferimento allo concetto
• Sinonimi utilizzati in modo analogo
• Non intercambiabili
• Equivalenza
• Livello interlinguistico
• Funzionale
• Dominio
• Concettuale
• Relazioni sistemiche
• Linguistica
• Denominazioni
Il traduttore e la terminologia
• Approccio semasiologico
• Orientato al termine
• Dalla denominazione al significato
• Dal termine in una lingua all’equivalente in un’altra
• Significati equivalenti a un significante
• Tipico della lessicografia
• Presuppone conoscenza del dominio
• Approccio onomasiologico
• Orientato al concetto
• Attribuzione di denominazioni ai concetti
• Dal significato alle denominazioni che lo designano
• Significanti corrispondenti a uno stesso significato
• Equivalenza di due sistemi concettuali
Obiettivi
• Miglioramento della comunicazione
• Inequivocabile interpretazione di procedure, metodologie e processi
• Semplificazione del contenuto delle informazioni tecniche
• Eliminazione di inutili e pericolose ridondanze
• Affermazione dell’identità di prodotto
Criteri di estrazione
• Quantitativi
• Estrazione automatica
• Statistica
• Liste di frequenza
• Linguistica
• Pertinenza
• Qualitativi
• Spoglio
• Testi brevi
• Contributo dell’esperto
• Controllo di coerenza
• Concordance
Tipi di spoglio ed estrazione
• Sistematico
• Raccolta completa di termini e concetti di un dominio
• Raccolta o conio di definizioni chiare e ben strutturate
• Costruzione di sistemi concettuali
• Creazione di schede terminologiche
• Realizzazione di collegamenti tra schede e sistemi concettuali
• Puntuale
• Identificazione di termini in testi isolati
• Ricerca di documentazione contestuale
• Creazione di schede terminologiche
• Individuazione di equivalenti
Metodologia
1. Delimitare il campo di analisi
2. Contemplare tutte le fonti possibili
3. Censire i concetti da analizzare
4. Stilare una lista dei termini corrispondenti in uso
5. Identificare i concetti e le relazioni che li uniscono
6. Definire i concetti
7. Attribuire un termine ai concetti
8. Costruire un sistema concettuale
Spoglio
• Lettura del testo
• Comprensione del significato dei termini
• Selezionarli dei termini in base a contenuti e obiettivi
• Necessaria conoscenza pregressa
Uso dei corpora
• Concordance
• Estrazione terminologica
• Individuazione di nuovi termini
• RbMT
• Traduzione automatica statistica
Selezione del corpus
• Terminologia prescrittiva
• Identità e armonizzazione
• Documenti ufficiali
• Riduzione di varianti e sinonimi
• Terminologia descrittiva
• Divulgazione
• Grandi corpora
• Gran numero di varianti e sinonimi
Caratteristiche del corpus
• Omogeneo
• Rappresentativo
• Affidabile
• Finito
• Digitale
Estrazione automatica
• Essenziale per grandi progetti
• Lunga, laboriosa e inevitabilmente incompleta
Estrazione automatica
• Approccio linguistico
• Basato su regole e dizionari
• Combinazioni corrispondenti a determinate strutture del discorso
• Una sola lingua per volta
• Problemi
• Termini stranieri
• Sinonimi, varianti e abbreviazioni
• Ellissi
• Uso improprio della lingua
• Approccio statistico
• Indipendente dalla lingua
• Basato sulla frequenza
• Sequenze ripetute di segmenti lessicali
• Specificare la soglia di frequenza
• La frequenza non è necessariamente indice di importanza
• Elevata incidenza di “rumori” (noise/silence)
Utilizzi finali
• Approccio linguistico
• Bitext
• Costruzioni di basi di conoscenza
• Knowledge discovery
• Text mining
• Approccio statistico
• Corpus monolingue
• Costruzione di indici
• Linguaggi controllati
• Parole chiave
• QA
Selezione dei termini
• Motivazione
• Definizione parzialmente deducibile dalla forma linguistica
• Coerenza
• La forma linguistica riflette l’ordine del sistema concettuale
• Adeguatezza
• Rispettare il senso della definizione ed evitare le connotazioni
• Economia linguistica
• Scegliere la forma più concisa
• Capacità di derivazione
• Favorire la forma morfologicamente più produttiva
• Esattezza linguistica
• Rispettare le regole di formazione della lingua
• Preponderanza della lingua
• Evitare i prestiti diretti
Esempi
• Nomi
• Marchi
• Prodotti
• Caratteristiche e funzioni
• Termini specifici di un dominio
• Termini generici
Scheda terminologica
• Monolingue
• Presenta solamente i rimandi ipertestuali verso le schede in lingua straniera
che illustrano lo stesso concetto
• Parte concettuale
• Definizione
• Dominio
• Relazioni
• Immagini
• Parte linguistica
• Termine
• Contesto
• Informazioni grammaticali
• Marcatori geografici
• Marcatori sociolinguistici
• Registro
• Stato del termine
Capire, verificare, discernere
• Wikipedia is alleen een onbewezen snelkoppeling die de echte
kennis bedreigd
• Wikipedia is only an unproven shortcut that threatens true
knowledge
• Wikipedia è solo una scorciatoia che minaccia il vero sapere
Blocco inverso o barotrauma da
espansione?
Ruolo dell’esperto
• Delimitare il dominio
• Fornire/validare il materiale per la costruzione dei corpora
• Riconoscere i termini come specifici del dominio
• Indicare la forma maggiormente usata in caso di sinonimia
• Validare il sistema concettuale
Applicazioni della terminologia
• Documentazione tecnica
• Linguaggi controllati
• Misura degli errori con impatto economico causati da istruzioni inesatte, imprecise,
incomprensibili, malintese
• Facilitare la traduzione automatica
• Eliminazione del ricorso alla traduzione attraverso la corretta applicazione
• Sistemi di gestione dei contenuti e delle conoscenze
• Organizzazione della conoscenza
• Tassonomie e ontologie
• Single sourcing
• Motori di indicizzazione e ricerca
• Keyword tree
• Sistemi e servizi di apprendimento a distanza (e-learning)
• Knowledge nugget
• Strumenti di traduzione e localizzazione
• Sistemi e applicazioni di traduzione automatica
Bedankt

Terminologia per la traduzione

  • 1.
    Terminologia per la traduzione LuigiMuzii luigi.muzii@gmail.com
  • 2.
    Programma • Un po’di storia • Principi fondamentali • Sistematizzazione • Ricerche • Spoglio ed estrazione dei dati • Applicazioni
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
    Concetto e termine •Un termine, un concetto e viceversa • Gli omonimi denotano concetti diversi, senza relazioni fra loro • I sinonimi denotano relazione fra designazioni diverse rappresentanti lo stesso concetto
  • 12.
    Sinonimia ed equivalenza •Sinonimia • Livello intralinguistico • In un ambito d’uso ristretto (dominio) • Varianti • Riferimento allo concetto • Sinonimi utilizzati in modo analogo • Non intercambiabili • Equivalenza • Livello interlinguistico • Funzionale • Dominio • Concettuale • Relazioni sistemiche • Linguistica • Denominazioni
  • 13.
    Il traduttore ela terminologia • Approccio semasiologico • Orientato al termine • Dalla denominazione al significato • Dal termine in una lingua all’equivalente in un’altra • Significati equivalenti a un significante • Tipico della lessicografia • Presuppone conoscenza del dominio • Approccio onomasiologico • Orientato al concetto • Attribuzione di denominazioni ai concetti • Dal significato alle denominazioni che lo designano • Significanti corrispondenti a uno stesso significato • Equivalenza di due sistemi concettuali
  • 14.
    Obiettivi • Miglioramento dellacomunicazione • Inequivocabile interpretazione di procedure, metodologie e processi • Semplificazione del contenuto delle informazioni tecniche • Eliminazione di inutili e pericolose ridondanze • Affermazione dell’identità di prodotto
  • 15.
    Criteri di estrazione •Quantitativi • Estrazione automatica • Statistica • Liste di frequenza • Linguistica • Pertinenza • Qualitativi • Spoglio • Testi brevi • Contributo dell’esperto • Controllo di coerenza • Concordance
  • 16.
    Tipi di spoglioed estrazione • Sistematico • Raccolta completa di termini e concetti di un dominio • Raccolta o conio di definizioni chiare e ben strutturate • Costruzione di sistemi concettuali • Creazione di schede terminologiche • Realizzazione di collegamenti tra schede e sistemi concettuali • Puntuale • Identificazione di termini in testi isolati • Ricerca di documentazione contestuale • Creazione di schede terminologiche • Individuazione di equivalenti
  • 17.
    Metodologia 1. Delimitare ilcampo di analisi 2. Contemplare tutte le fonti possibili 3. Censire i concetti da analizzare 4. Stilare una lista dei termini corrispondenti in uso 5. Identificare i concetti e le relazioni che li uniscono 6. Definire i concetti 7. Attribuire un termine ai concetti 8. Costruire un sistema concettuale
  • 18.
    Spoglio • Lettura deltesto • Comprensione del significato dei termini • Selezionarli dei termini in base a contenuti e obiettivi • Necessaria conoscenza pregressa
  • 19.
    Uso dei corpora •Concordance • Estrazione terminologica • Individuazione di nuovi termini • RbMT • Traduzione automatica statistica
  • 20.
    Selezione del corpus •Terminologia prescrittiva • Identità e armonizzazione • Documenti ufficiali • Riduzione di varianti e sinonimi • Terminologia descrittiva • Divulgazione • Grandi corpora • Gran numero di varianti e sinonimi
  • 21.
    Caratteristiche del corpus •Omogeneo • Rappresentativo • Affidabile • Finito • Digitale
  • 22.
    Estrazione automatica • Essenzialeper grandi progetti • Lunga, laboriosa e inevitabilmente incompleta
  • 23.
    Estrazione automatica • Approcciolinguistico • Basato su regole e dizionari • Combinazioni corrispondenti a determinate strutture del discorso • Una sola lingua per volta • Problemi • Termini stranieri • Sinonimi, varianti e abbreviazioni • Ellissi • Uso improprio della lingua • Approccio statistico • Indipendente dalla lingua • Basato sulla frequenza • Sequenze ripetute di segmenti lessicali • Specificare la soglia di frequenza • La frequenza non è necessariamente indice di importanza • Elevata incidenza di “rumori” (noise/silence)
  • 24.
    Utilizzi finali • Approcciolinguistico • Bitext • Costruzioni di basi di conoscenza • Knowledge discovery • Text mining • Approccio statistico • Corpus monolingue • Costruzione di indici • Linguaggi controllati • Parole chiave • QA
  • 25.
    Selezione dei termini •Motivazione • Definizione parzialmente deducibile dalla forma linguistica • Coerenza • La forma linguistica riflette l’ordine del sistema concettuale • Adeguatezza • Rispettare il senso della definizione ed evitare le connotazioni • Economia linguistica • Scegliere la forma più concisa • Capacità di derivazione • Favorire la forma morfologicamente più produttiva • Esattezza linguistica • Rispettare le regole di formazione della lingua • Preponderanza della lingua • Evitare i prestiti diretti
  • 26.
    Esempi • Nomi • Marchi •Prodotti • Caratteristiche e funzioni • Termini specifici di un dominio • Termini generici
  • 27.
    Scheda terminologica • Monolingue •Presenta solamente i rimandi ipertestuali verso le schede in lingua straniera che illustrano lo stesso concetto • Parte concettuale • Definizione • Dominio • Relazioni • Immagini • Parte linguistica • Termine • Contesto • Informazioni grammaticali • Marcatori geografici • Marcatori sociolinguistici • Registro • Stato del termine
  • 28.
    Capire, verificare, discernere •Wikipedia is alleen een onbewezen snelkoppeling die de echte kennis bedreigd • Wikipedia is only an unproven shortcut that threatens true knowledge • Wikipedia è solo una scorciatoia che minaccia il vero sapere
  • 29.
    Blocco inverso obarotrauma da espansione?
  • 30.
    Ruolo dell’esperto • Delimitareil dominio • Fornire/validare il materiale per la costruzione dei corpora • Riconoscere i termini come specifici del dominio • Indicare la forma maggiormente usata in caso di sinonimia • Validare il sistema concettuale
  • 31.
    Applicazioni della terminologia •Documentazione tecnica • Linguaggi controllati • Misura degli errori con impatto economico causati da istruzioni inesatte, imprecise, incomprensibili, malintese • Facilitare la traduzione automatica • Eliminazione del ricorso alla traduzione attraverso la corretta applicazione • Sistemi di gestione dei contenuti e delle conoscenze • Organizzazione della conoscenza • Tassonomie e ontologie • Single sourcing • Motori di indicizzazione e ricerca • Keyword tree • Sistemi e servizi di apprendimento a distanza (e-learning) • Knowledge nugget • Strumenti di traduzione e localizzazione • Sistemi e applicazioni di traduzione automatica
  • 32.