Traduzioni: Ieri, Oggi e Domani

Un breve viaggio nel magico mondo dei traduttori TED
Michele Gianella & Roberto Minelli
Michele Gianella
Chi siamo?
Roberto Minelli
Michele Gianella
Chi siamo?
Roberto Minelli
Let’s try
1
Diamo i numeri…
116
33,826
147,202
languages
translators
translations
…e poi arrivò la x…
Il processo standard
Richiesta trascrizione
Trascrizione
Revisione
Approvazione
Traduzione
Revisione
Approvazione
Translators: Reloaded
Estrazione traccia
audio evento
Taglio delle tracce
Automatic Speech
Recognition (ASR)
Pulizia ASR
Sottotitolo O.V.
Transcript tradotto
Parallelizzazione
Pulizia finale
Da audio a sottotitolo
Audio/video
Da audio a sottotitolo
Audio/video Sottotitolo
Da audio a sottotitolo
Audio/video Trascrizione Sottotitolo
Da audio a sottotitolo
Audio/video Trascrizione Segmentato Sottotitolo
Da audio a sottotitolo
Audio/video Trascrizione Segmentato Sottotitolo
Da audio a sottotitolo
E volete sapere cos’è che non
mi piace? Non mi piace chi
alza la voce. Perché sono
convinto che le cose giuste
dette sotto voce facciano
molto più rumore delle cose
sbagliate urlate.
Da audio a sottotitolo
E volete sapere cos’è che non
mi piace? Non mi piace chi
alza la voce. Perché sono
convinto che le cose giuste
dette sotto voce facciano
molto più rumore delle cose
sbagliate urlate.
E volete sapere cos’è che non mi piace?



Non mi piace chi alza la voce.
Perché sono convinto che le cose giuste

dette sotto voce



facciano molto più rumore

delle cose sbagliate urlate.
Da audio a sottotitolo
E volete sapere cos’è che non
mi piace? Non mi piace chi
alza la voce. Perché sono
convinto che le cose giuste
dette sotto voce facciano
molto più rumore delle cose
sbagliate urlate.
E volete sapere cos’è che non mi piace?



Non mi piace chi alza la voce.
Perché sono convinto che le cose giuste

dette sotto voce



facciano molto più rumore

delle cose sbagliate urlate.
Max lunghezza della linea (42)
Max numero di linee (2)
Bilanciare la lunghezza delle linee (50%)
Spezzare linee rispettando la grammatica
Max velocità di lettura (21 char/sec)
Da audio a sottotitolo
E volete sapere cos’è che non
mi piace? Non mi piace chi
alza la voce. Perché sono
convinto che le cose giuste
dette sotto voce facciano
molto più rumore delle cose
sbagliate urlate.
E volete sapere cos’è che non mi piace?



Non mi piace chi alza la voce.
Perché sono convinto che le cose giuste

dette sotto voce



facciano molto più rumore

delle cose sbagliate urlate.
00:11:19,820 --> 00:11:21,711
E volete sapere cos’è che non mi piace?
00:11:21,711 --> 00:11:24,520
Non mi piace chi alza la voce.
00:11:24,520 --> 00:11:29,520
Perché sono convinto che le cose giuste
dette sotto voce
00:11:29,520 --> 00:11:35,020
facciano molto più rumore
delle cose sbagliate urlate.
Strumenti
2
Amara: The Status Quo
Speech-to-text
Un set di tools “intelligenti”
Segmentazione
Allineamento
Pulizia
User friendly? Nope.
The
Dark Side
3
…we have cookies!
Un iversità
della
Svizzera
italian a
Software
Institute
Un editor “on steroids” 💪
Amara: The Status Quo
Un editor “on steroids” 💪
Un editor “on steroids” 💪
Un editor “on steroids” 💪
Un editor “on steroids” 💪
Lachesis

Subsegmenter
Un editor “on steroids” 💪
Lachesis

Subsegmenter
Aeneas
Subfixer
Beta Testing: Varese e Como
We need your help!
PHP
JavaScript
Python
NLP
ML
We need your help!
Michele Gianella
Roberto Minelli
gianella.michele@gmail.com
roberto.minelli@usi.ch
RINGRAZIAMENTI
IMAGES COURTESY OF
Un iversità
della
Svizzera
italian a
Software
Institute

Traduzioni: Ieri, Oggi e Domani


  • 1.
    Traduzioni: Ieri, Oggie Domani
 Un breve viaggio nel magico mondo dei traduttori TED Michele Gianella & Roberto Minelli
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
    Il processo standard Richiestatrascrizione Trascrizione Revisione Approvazione Traduzione Revisione Approvazione
  • 8.
    Translators: Reloaded Estrazione traccia audioevento Taglio delle tracce Automatic Speech Recognition (ASR) Pulizia ASR Sottotitolo O.V. Transcript tradotto Parallelizzazione Pulizia finale
  • 9.
    Da audio asottotitolo Audio/video
  • 10.
    Da audio asottotitolo Audio/video Sottotitolo
  • 11.
    Da audio asottotitolo Audio/video Trascrizione Sottotitolo
  • 12.
    Da audio asottotitolo Audio/video Trascrizione Segmentato Sottotitolo
  • 13.
    Da audio asottotitolo Audio/video Trascrizione Segmentato Sottotitolo
  • 14.
    Da audio asottotitolo E volete sapere cos’è che non mi piace? Non mi piace chi alza la voce. Perché sono convinto che le cose giuste dette sotto voce facciano molto più rumore delle cose sbagliate urlate.
  • 15.
    Da audio asottotitolo E volete sapere cos’è che non mi piace? Non mi piace chi alza la voce. Perché sono convinto che le cose giuste dette sotto voce facciano molto più rumore delle cose sbagliate urlate. E volete sapere cos’è che non mi piace?
 
 Non mi piace chi alza la voce. Perché sono convinto che le cose giuste
 dette sotto voce
 
 facciano molto più rumore
 delle cose sbagliate urlate.
  • 16.
    Da audio asottotitolo E volete sapere cos’è che non mi piace? Non mi piace chi alza la voce. Perché sono convinto che le cose giuste dette sotto voce facciano molto più rumore delle cose sbagliate urlate. E volete sapere cos’è che non mi piace?
 
 Non mi piace chi alza la voce. Perché sono convinto che le cose giuste
 dette sotto voce
 
 facciano molto più rumore
 delle cose sbagliate urlate. Max lunghezza della linea (42) Max numero di linee (2) Bilanciare la lunghezza delle linee (50%) Spezzare linee rispettando la grammatica Max velocità di lettura (21 char/sec)
  • 17.
    Da audio asottotitolo E volete sapere cos’è che non mi piace? Non mi piace chi alza la voce. Perché sono convinto che le cose giuste dette sotto voce facciano molto più rumore delle cose sbagliate urlate. E volete sapere cos’è che non mi piace?
 
 Non mi piace chi alza la voce. Perché sono convinto che le cose giuste
 dette sotto voce
 
 facciano molto più rumore
 delle cose sbagliate urlate. 00:11:19,820 --> 00:11:21,711 E volete sapere cos’è che non mi piace? 00:11:21,711 --> 00:11:24,520 Non mi piace chi alza la voce. 00:11:24,520 --> 00:11:29,520 Perché sono convinto che le cose giuste dette sotto voce 00:11:29,520 --> 00:11:35,020 facciano molto più rumore delle cose sbagliate urlate.
  • 18.
  • 19.
  • 20.
    Speech-to-text Un set ditools “intelligenti” Segmentazione Allineamento Pulizia
  • 21.
  • 22.
  • 23.
    …we have cookies! Università della Svizzera italian a Software Institute
  • 24.
    Un editor “onsteroids” 💪
  • 25.
  • 26.
    Un editor “onsteroids” 💪
  • 27.
    Un editor “onsteroids” 💪
  • 28.
    Un editor “onsteroids” 💪
  • 29.
    Un editor “onsteroids” 💪 Lachesis
 Subsegmenter
  • 30.
    Un editor “onsteroids” 💪 Lachesis
 Subsegmenter Aeneas Subfixer
  • 31.
  • 32.
    We need yourhelp! PHP JavaScript Python NLP ML
  • 33.
    We need yourhelp! Michele Gianella Roberto Minelli gianella.michele@gmail.com roberto.minelli@usi.ch
  • 34.
    RINGRAZIAMENTI IMAGES COURTESY OF Università della Svizzera italian a Software Institute