Curso urgente de traducci´n autom´tica
                          o       a

                Mikel L. Forcada
 Departament ...
´
Indice


1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones
      e               o       a

2. Formatos de texto

3...
´
Indice


1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones
      e               o       a

2. Formatos de texto

3...
´
Indice


1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones
      e               o       a

2. Formatos de texto

3...
´
Indice


1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones
      e               o       a

2. Formatos de texto

3...
´
Indice


1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones
      e               o       a

2. Formatos de texto

3...
´
Indice


1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones
      e               o       a

2. Formatos de texto

3...
´
Indice


1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones
      e               o       a

2. Formatos de texto

3...
´
Indice


1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones
      e               o       a

2. Formatos de texto

3...
¿Qu´ es la traducci´n autom´tica (TA)? [1]
   e               o       a

La traducci´n, . . .
           o

. . . mediante...
¿Qu´ es la traducci´n autom´tica (TA)? [1]
   e               o       a

La traducci´n, . . .
           o

. . . mediante...
¿Qu´ es la traducci´n autom´tica (TA)? [1]
   e               o       a

La traducci´n, . . .
           o

. . . mediante...
¿Qu´ es la traducci´n autom´tica (TA)? [1]
   e               o       a

La traducci´n, . . .
           o

. . . mediante...
¿Qu´ es la traducci´n autom´tica (TA)? [1]
   e               o       a

La traducci´n, . . .
           o

. . . mediante...
¿Qu´ es la traducci´n autom´tica (TA)? [1]
   e               o       a

La traducci´n, . . .
           o

. . . mediante...
¿Qu´ es la traducci´n autom´tica (TA)? [1]
   e               o       a

La traducci´n, . . .
           o

. . . mediante...
¿Qu´ es la traducci´n autom´tica (TA)? [2]
   e               o       a

Esquem´ticamente:
      a

                      ...
Aplicaciones de la TA [1]

Dos grandes grupos:


   Asimilaci´n: traducci´n ef´
            o           o    ımera, idealm...
Aplicaciones de la TA [1]

Dos grandes grupos:


   Asimilaci´n: traducci´n ef´
            o           o    ımera, idealm...
Aplicaciones de la TA [1]

Dos grandes grupos:


   Asimilaci´n: traducci´n ef´
            o           o    ımera, idealm...
Aplicaciones de la TA [1]

Dos grandes grupos:


   Asimilaci´n: traducci´n ef´
            o           o    ımera, idealm...
Aplicaciones de la TA [2]

Preedici´n y postedici´n: los profesionales colaboran con el sistema
        o             o
de...
Aplicaciones de la TA [2]

Preedici´n y postedici´n: los profesionales colaboran con el sistema
        o             o
de...
Aplicaciones de la TA [2]

Preedici´n y postedici´n: los profesionales colaboran con el sistema
        o             o
de...
Aplicaciones de la TA [2]

Preedici´n y postedici´n: los profesionales colaboran con el sistema
        o             o
de...
Aplicaciones de la TA [2]

Preedici´n y postedici´n: los profesionales colaboran con el sistema
        o             o
de...
Aplicaciones de la TA [3]

Alternativa a la preedici´n: lenguaje controlado.
                         o


   Los autores e...
Aplicaciones de la TA [3]

Alternativa a la preedici´n: lenguaje controlado.
                         o


   Los autores e...
Aplicaciones de la TA [3]

Alternativa a la preedici´n: lenguaje controlado.
                         o


   Los autores e...
Aplicaciones de la TA [3]

Alternativa a la preedici´n: lenguaje controlado.
                         o


   Los autores e...
Aplicaciones de la TA [3]

Alternativa a la preedici´n: lenguaje controlado.
                         o


   Los autores e...
Aplicaciones de la TA [3]

Alternativa a la preedici´n: lenguaje controlado.
                         o


   Los autores e...
Aplicaciones de la TA [3]

Alternativa a la preedici´n: lenguaje controlado.
                         o


   Los autores e...
Aplicaciones de la TA [3]

Alternativa a la preedici´n: lenguaje controlado.
                         o


   Los autores e...
Aplicaciones de la TA [4]
La postedici´n es conveniente cuando
            o
                               
          t...
Aplicaciones de la TA [4]
La postedici´n es conveniente cuando
            o
                               
          t...
Aplicaciones de la TA [4]
La postedici´n es conveniente cuando
            o
                               
          t...
Aplicaciones de la TA [4]
La postedici´n es conveniente cuando
            o
                               
          t...
Aplicaciones de la TA [4]
La postedici´n es conveniente cuando
            o
                               
          t...
Formatos de texto [1]

Un texto informatizado es, como cualquier porci´n de datos informa-
                               ...
Formatos de texto [1]

Un texto informatizado es, como cualquier porci´n de datos informa-
                               ...
Formatos de texto [1]

Un texto informatizado es, como cualquier porci´n de datos informa-
                               ...
Formatos de texto [1]

Un texto informatizado es, como cualquier porci´n de datos informa-
                               ...
Formatos de texto [1]

Un texto informatizado es, como cualquier porci´n de datos informa-
                               ...
Formatos de texto [1]

Un texto informatizado es, como cualquier porci´n de datos informa-
                               ...
Formatos de texto [1]

Un texto informatizado es, como cualquier porci´n de datos informa-
                               ...
Formatos de texto [1]

Un texto informatizado es, como cualquier porci´n de datos informa-
                               ...
Formatos de texto [1]

Un texto informatizado es, como cualquier porci´n de datos informa-
                               ...
Formatos de texto [1]

Un texto informatizado es, como cualquier porci´n de datos informa-
                               ...
Formatos de texto [2]

Dos aspectos importantes: codificaci´n y formato propiamente dicho.
                                ...
Formatos de texto [2]

Dos aspectos importantes: codificaci´n y formato propiamente dicho.
                                ...
Formatos de texto [2]

Dos aspectos importantes: codificaci´n y formato propiamente dicho.
                                ...
Formatos de texto [3]

  Formato propiamente dicho: Los textos, adem´s de caracteres,
                                    ...
Formatos de texto [3]

  Formato propiamente dicho: Los textos, adem´s de caracteres,
                                    ...
Formatos de texto [3]

  Formato propiamente dicho: Los textos, adem´s de caracteres,
                                    ...
Formatos de texto [3]

  Formato propiamente dicho: Los textos, adem´s de caracteres,
                                    ...
Formatos de texto [3]

  Formato propiamente dicho: Los textos, adem´s de caracteres,
                                    ...
Formatos de texto [4]
Codificacions de 1 byte (“unibyte”):


   ASCII: Asigna c´digos de 7 bits, del 0000000 (0) al 1111111...
Formatos de texto [4]
Codificacions de 1 byte (“unibyte”):


   ASCII: Asigna c´digos de 7 bits, del 0000000 (0) al 1111111...
Formatos de texto [4]
Codificacions de 1 byte (“unibyte”):


   ASCII: Asigna c´digos de 7 bits, del 0000000 (0) al 1111111...
Formatos de texto [4]
Codificacions de 1 byte (“unibyte”):


   ASCII: Asigna c´digos de 7 bits, del 0000000 (0) al 1111111...
Formatos de texto [4]
Codificacions de 1 byte (“unibyte”):


   ASCII: Asigna c´digos de 7 bits, del 0000000 (0) al 1111111...
Formatos de texto [5]

Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano,
                   a          ...
Formatos de texto [5]

Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano,
                   a          ...
Formatos de texto [5]

Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano,
                   a          ...
Formatos de texto [5]

Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano,
                   a          ...
Formatos de texto [5]

Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano,
                   a          ...
Formatos de texto [5]

Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano,
                   a          ...
Formatos de texto [5]

Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano,
                   a          ...
Formatos de texto [6]
Necesidad de formato (estructural o presentacional) m´s all´ de la
                                 ...
Formatos de texto [6]
Necesidad de formato (estructural o presentacional) m´s all´ de la
                                 ...
Formatos de texto [6]
Necesidad de formato (estructural o presentacional) m´s all´ de la
                                 ...
Formatos de texto [6]
Necesidad de formato (estructural o presentacional) m´s all´ de la
                                 ...
Formatos de texto [7]


  Con c´digos no interpretables como caracteres: (no visibles a
        o
  trav´s de un editor de...
Formatos de texto [7]


  Con c´digos no interpretables como caracteres: (no visibles a
        o
  trav´s de un editor de...
Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves
es lo que obtendr´s”):
           ...
Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves
es lo que obtendr´s”):
           ...
Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves
es lo que obtendr´s”):
           ...
Formatos de texto [8]

El problema wysiwyg (“what you see is what you get”: “lo que ves
es lo que obtendr´s”):
           ...
Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y m´s adelante queremos cambiar el tipo de letra
           ...
Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y m´s adelante queremos cambiar el tipo de letra
           ...
Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y m´s adelante queremos cambiar el tipo de letra
           ...
Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y m´s adelante queremos cambiar el tipo de letra
           ...
Formatos de texto [9]

El problema wysiwyg:

Si hacemos esto, y m´s adelante queremos cambiar el tipo de letra
           ...
Formatos de texto [10]

¿C´mo? Usando estilos.
  o

Marcamos estructuralmente las partes (elementos): t´
                 ...
Formatos de texto [10]

¿C´mo? Usando estilos.
  o

Marcamos estructuralmente las partes (elementos): t´
                 ...
Formatos de texto [10]

¿C´mo? Usando estilos.
  o

Marcamos estructuralmente las partes (elementos): t´
                 ...
Formatos de texto [10]

¿C´mo? Usando estilos.
  o

Marcamos estructuralmente las partes (elementos): t´
                 ...
Formatos de texto [10]

¿C´mo? Usando estilos.
  o

Marcamos estructuralmente las partes (elementos): t´
                 ...
Formatos de texto [11]

En aplicaciones de internet, la separaci´n estructura–presentaci´n se
                            ...
Formatos de texto [11]

En aplicaciones de internet, la separaci´n estructura–presentaci´n se
                            ...
Formatos de texto [11]

En aplicaciones de internet, la separaci´n estructura–presentaci´n se
                            ...
Formatos de texto [11]

En aplicaciones de internet, la separaci´n estructura–presentaci´n se
                            ...
Formatos de texto [12]


                                Procesador
  documento (XML o HTML) →
                           ...
Formatos de texto [13]

     Accesibilidad (no todos los receptores son videntes):
                       Documento XML


...
Formatos de texto [14]

Los sistemas de TA deben ser capaces:


   De separar del texto a traducir la informaci´n de forma...
Formatos de texto [14]

Los sistemas de TA deben ser capaces:


   De separar del texto a traducir la informaci´n de forma...
Formatos de texto [14]

Los sistemas de TA deben ser capaces:


   De separar del texto a traducir la informaci´n de forma...
Formatos de texto [14]

Los sistemas de TA deben ser capaces:


   De separar del texto a traducir la informaci´n de forma...
Formatos de texto [14]

Los sistemas de TA deben ser capaces:


   De separar del texto a traducir la informaci´n de forma...
Formatos de texto [14]

Los sistemas de TA deben ser capaces:


   De separar del texto a traducir la informaci´n de forma...
¿C´mo funciona la TA? [1]
  o

Primera aproximaci´n [!!]: Traducir textos es traduir oraciones.
                  o

Tradu...
¿C´mo funciona la TA? [1]
  o

Primera aproximaci´n [!!]: Traducir textos es traduir oraciones.
                  o

Tradu...
¿C´mo funciona la TA? [1]
  o

Primera aproximaci´n [!!]: Traducir textos es traduir oraciones.
                  o

Tradu...
¿C´mo funciona la TA? [2]
  o

Principio de composicionalidad [sem´ntica]:
                                   a

La interp...
¿C´mo funciona la TA? [2]
  o

Principio de composicionalidad [sem´ntica]:
                                   a

La interp...
¿C´mo funciona la TA? [2]
  o

Principio de composicionalidad [sem´ntica]:
                                   a

La interp...
¿C´mo funciona la TA? [2]
  o

Principio de composicionalidad [sem´ntica]:
                                   a

La interp...
¿C´mo funciona la TA? [2]
  o

Principio de composicionalidad [sem´ntica]:
                                   a

La interp...
¿C´mo funciona la TA? [2]
  o

Principio de composicionalidad [sem´ntica]:
                                   a

La interp...
¿C´mo funciona la TA? [3]
  o

Pero, ¡atenci´n! Las oraciones pueden ser ambiguas (es decir, tener
             o
m´s de u...
¿C´mo funciona la TA? [3]
  o

Pero, ¡atenci´n! Las oraciones pueden ser ambiguas (es decir, tener
             o
m´s de u...
¿C´mo funciona la TA? [3]
  o

Pero, ¡atenci´n! Las oraciones pueden ser ambiguas (es decir, tener
             o
m´s de u...
¿C´mo funciona la TA? [3]
  o

Pero, ¡atenci´n! Las oraciones pueden ser ambiguas (es decir, tener
             o
m´s de u...
¿C´mo funciona la TA? [3]
  o

Pero, ¡atenci´n! Las oraciones pueden ser ambiguas (es decir, tener
             o
m´s de u...
¿C´mo funciona la TA? [4]
  o

Esquem´ticamente:
      a

                Oraci´n
                     o                  ...
¿C´mo funciona la TA? [4]
  o

Esquem´ticamente:
      a

                Oraci´n
                     o                  ...
¿C´mo funciona la TA? [4]
  o

Esquem´ticamente:
      a

                Oraci´n
                     o                  ...
¿C´mo funciona la TA? [5]
  o

Pero. . . los traductores profesionales ¿realmente necesitan interpretar
o comprender compl...
¿C´mo funciona la TA? [5]
  o

Pero. . . los traductores profesionales ¿realmente necesitan interpretar
o comprender compl...
¿C´mo funciona la TA? [5]
  o

Pero. . . los traductores profesionales ¿realmente necesitan interpretar
o comprender compl...
¿C´mo funciona la TA? [5]
  o

Pero. . . los traductores profesionales ¿realmente necesitan interpretar
o comprender compl...
¿C´mo funciona la TA? [5]
  o

Pero. . . los traductores profesionales ¿realmente necesitan interpretar
o comprender compl...
¿C´mo funciona la TA? [6]
  o

Esto nos permite hacer la segunda aproximaci´n [!!]:
                                      ...
¿C´mo funciona la TA? [6]
  o

Esto nos permite hacer la segunda aproximaci´n [!!]:
                                      ...
¿C´mo funciona la TA? [6]
  o

Esto nos permite hacer la segunda aproximaci´n [!!]:
                                      ...
¿C´mo funciona la TA? [6]
  o

Esto nos permite hacer la segunda aproximaci´n [!!]:
                                      ...
¿C´mo funciona la TA? [6]
  o

Esto nos permite hacer la segunda aproximaci´n [!!]:
                                      ...
¿C´mo funciona la TA? [6]
  o

Esto nos permite hacer la segunda aproximaci´n [!!]:
                                      ...
¿C´mo funciona la TA? [7]
  o

Para programar un sistema de TA es preciso formular todos los proce-
sos de traducci´n de f...
¿C´mo funciona la TA? [7]
  o

Para programar un sistema de TA es preciso formular todos los proce-
sos de traducci´n de f...
¿C´mo funciona la TA? [7]
  o

Para programar un sistema de TA es preciso formular todos los proce-
sos de traducci´n de f...
¿C´mo funciona la TA? [7]
  o

Para programar un sistema de TA es preciso formular todos los proce-
sos de traducci´n de f...
¿C´mo funciona la TA? [7]
  o

Para programar un sistema de TA es preciso formular todos los proce-
sos de traducci´n de f...
¿C´mo funciona la TA? [7]
  o

Para programar un sistema de TA es preciso formular todos los proce-
sos de traducci´n de f...
¿C´mo funciona la TA? [8]
  o

Por tanto...

Podemos esperar que un buen sistema de TA nos libere de la parte
m´s mec´nica...
¿C´mo funciona la TA? [8]
  o

Por tanto...

Podemos esperar que un buen sistema de TA nos libere de la parte
m´s mec´nica...
¿C´mo funciona la TA? [8]
  o

Por tanto...

Podemos esperar que un buen sistema de TA nos libere de la parte
m´s mec´nica...
¿Por qu´ es dif´ la TA? [1]
       e       ıcil

Los cuatro problemas de la traducci´n autom´tica (Arnold 2003):
         ...
¿Por qu´ es dif´ la TA? [1]
       e       ıcil

Los cuatro problemas de la traducci´n autom´tica (Arnold 2003):
         ...
¿Por qu´ es dif´ la TA? [1]
       e       ıcil

Los cuatro problemas de la traducci´n autom´tica (Arnold 2003):
         ...
¿Por qu´ es dif´ la TA? [1]
       e       ıcil

Los cuatro problemas de la traducci´n autom´tica (Arnold 2003):
         ...
¿Por qu´ es dif´ la TA? [1]
       e       ıcil

Los cuatro problemas de la traducci´n autom´tica (Arnold 2003):
         ...
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Curso urgente de traducción automática
Upcoming SlideShare
Loading in …5
×

Curso urgente de traducción automática

1,155 views

Published on

Published in: Technology
0 Comments
11 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,155
On SlideShare
0
From Embeds
0
Number of Embeds
17
Actions
Shares
0
Downloads
51
Comments
0
Likes
11
Embeds 0
No embeds

No notes for slide

Curso urgente de traducción automática

  1. 1. Curso urgente de traducci´n autom´tica o a Mikel L. Forcada Departament de Llenguatges i Sistemes Inform`tics a Universitat d’Alacant E-03071 Alacant, Spain TI aplicadas al uso de las lenguas para fines espec´ ıficos Universitat d’Alacant, 2007 1
  2. 2. ´ Indice 1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones e o a 2. Formatos de texto 3. ¿C´mo funciona la TA? o 4. ¿Por qu´ es dif´ la TA? e ıcil 5. Evaluaci´n de la traducci´n autom´tica o o a 6. TA de p´ginas web a 7. Memorias de traducci´n o 2
  3. 3. ´ Indice 1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones e o a 2. Formatos de texto 3. ¿C´mo funciona la TA? o 4. ¿Por qu´ es dif´ la TA? e ıcil 5. Evaluaci´n de la traducci´n autom´tica o o a 6. TA de p´ginas web a 7. Memorias de traducci´n o 2
  4. 4. ´ Indice 1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones e o a 2. Formatos de texto 3. ¿C´mo funciona la TA? o 4. ¿Por qu´ es dif´ la TA? e ıcil 5. Evaluaci´n de la traducci´n autom´tica o o a 6. TA de p´ginas web a 7. Memorias de traducci´n o 2
  5. 5. ´ Indice 1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones e o a 2. Formatos de texto 3. ¿C´mo funciona la TA? o 4. ¿Por qu´ es dif´ la TA? e ıcil 5. Evaluaci´n de la traducci´n autom´tica o o a 6. TA de p´ginas web a 7. Memorias de traducci´n o 2
  6. 6. ´ Indice 1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones e o a 2. Formatos de texto 3. ¿C´mo funciona la TA? o 4. ¿Por qu´ es dif´ la TA? e ıcil 5. Evaluaci´n de la traducci´n autom´tica o o a 6. TA de p´ginas web a 7. Memorias de traducci´n o 2
  7. 7. ´ Indice 1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones e o a 2. Formatos de texto 3. ¿C´mo funciona la TA? o 4. ¿Por qu´ es dif´ la TA? e ıcil 5. Evaluaci´n de la traducci´n autom´tica o o a 6. TA de p´ginas web a 7. Memorias de traducci´n o 2
  8. 8. ´ Indice 1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones e o a 2. Formatos de texto 3. ¿C´mo funciona la TA? o 4. ¿Por qu´ es dif´ la TA? e ıcil 5. Evaluaci´n de la traducci´n autom´tica o o a 6. TA de p´ginas web a 7. Memorias de traducci´n o 2
  9. 9. ´ Indice 1. ¿Qu´ es la traducci´n autom´tica (TA)? Aplicaciones e o a 2. Formatos de texto 3. ¿C´mo funciona la TA? o 4. ¿Por qu´ es dif´ la TA? e ıcil 5. Evaluaci´n de la traducci´n autom´tica o o a 6. TA de p´ginas web a 7. Memorias de traducci´n o 2
  10. 10. ¿Qu´ es la traducci´n autom´tica (TA)? [1] e o a La traducci´n, . . . o . . . mediante un sistema inform´tico . . . a . . . (ordenador(es) + programas) . . . . . . de textos informatizados en la lengua origen (LO). . . . . . a textos informatizados en la la lengua meta (LM). ¡¡Atenci´n al formato de los textos!! o 3
  11. 11. ¿Qu´ es la traducci´n autom´tica (TA)? [1] e o a La traducci´n, . . . o . . . mediante un sistema inform´tico . . . a . . . (ordenador(es) + programas) . . . . . . de textos informatizados en la lengua origen (LO). . . . . . a textos informatizados en la la lengua meta (LM). ¡¡Atenci´n al formato de los textos!! o 3
  12. 12. ¿Qu´ es la traducci´n autom´tica (TA)? [1] e o a La traducci´n, . . . o . . . mediante un sistema inform´tico . . . a . . . (ordenador(es) + programas) . . . . . . de textos informatizados en la lengua origen (LO). . . . . . a textos informatizados en la la lengua meta (LM). ¡¡Atenci´n al formato de los textos!! o 3
  13. 13. ¿Qu´ es la traducci´n autom´tica (TA)? [1] e o a La traducci´n, . . . o . . . mediante un sistema inform´tico . . . a . . . (ordenador(es) + programas) . . . . . . de textos informatizados en la lengua origen (LO). . . . . . a textos informatizados en la la lengua meta (LM). ¡¡Atenci´n al formato de los textos!! o 3
  14. 14. ¿Qu´ es la traducci´n autom´tica (TA)? [1] e o a La traducci´n, . . . o . . . mediante un sistema inform´tico . . . a . . . (ordenador(es) + programas) . . . . . . de textos informatizados en la lengua origen (LO). . . . . . a textos informatizados en la la lengua meta (LM). ¡¡Atenci´n al formato de los textos!! o 3
  15. 15. ¿Qu´ es la traducci´n autom´tica (TA)? [1] e o a La traducci´n, . . . o . . . mediante un sistema inform´tico . . . a . . . (ordenador(es) + programas) . . . . . . de textos informatizados en la lengua origen (LO). . . . . . a textos informatizados en la la lengua meta (LM). ¡¡Atenci´n al formato de los textos!! o 3
  16. 16. ¿Qu´ es la traducci´n autom´tica (TA)? [1] e o a La traducci´n, . . . o . . . mediante un sistema inform´tico . . . a . . . (ordenador(es) + programas) . . . . . . de textos informatizados en la lengua origen (LO). . . . . . a textos informatizados en la la lengua meta (LM). ¡¡Atenci´n al formato de los textos!! o 3
  17. 17. ¿Qu´ es la traducci´n autom´tica (TA)? [2] e o a Esquem´ticamente: a Sistema de Texto LM Texto LO → traducci´n o → (en bru- autom´tica a to) 4
  18. 18. Aplicaciones de la TA [1] Dos grandes grupos: Asimilaci´n: traducci´n ef´ o o ımera, idealmente instant´nea, para la a revisi´n o la comprensi´n de documentos en otra lengua. P.e., o o navegaci´n por internet, chat, etc. o Diseminaci´n: traducci´n permanente, idealmente con pocos erro- o o res, para su publicaci´n. P.e., producci´n de borradores para pos- o o teditar . 5
  19. 19. Aplicaciones de la TA [1] Dos grandes grupos: Asimilaci´n: traducci´n ef´ o o ımera, idealmente instant´nea, para la a revisi´n o la comprensi´n de documentos en otra lengua. P.e., o o navegaci´n por internet, chat, etc. o Diseminaci´n: traducci´n permanente, idealmente con pocos erro- o o res, para su publicaci´n. P.e., producci´n de borradores para pos- o o teditar . 5
  20. 20. Aplicaciones de la TA [1] Dos grandes grupos: Asimilaci´n: traducci´n ef´ o o ımera, idealmente instant´nea, para la a revisi´n o la comprensi´n de documentos en otra lengua. P.e., o o navegaci´n por internet, chat, etc. o Diseminaci´n: traducci´n permanente, idealmente con pocos erro- o o res, para su publicaci´n. P.e., producci´n de borradores para pos- o o teditar . 5
  21. 21. Aplicaciones de la TA [1] Dos grandes grupos: Asimilaci´n: traducci´n ef´ o o ımera, idealmente instant´nea, para la a revisi´n o la comprensi´n de documentos en otra lengua. P.e., o o navegaci´n por internet, chat, etc. o Diseminaci´n: traducci´n permanente, idealmente con pocos erro- o o res, para su publicaci´n. P.e., producci´n de borradores para pos- o o teditar . 5
  22. 22. Aplicaciones de la TA [2] Preedici´n y postedici´n: los profesionales colaboran con el sistema o o de TA en aplicaciones de diseminaci´n: o Preedici´n: preparaci´n del texto para evitar l´xico o construccio- o o e nes que dan problemas de traducci´n con un sistema de traducci´n o o autom´tica. a Postedici´n: correcci´n del texto traducido en sucio para hacerlo o o adecuado al prop´sito previsto. o Conocer bien c´mo funciona el sistema de TA ayuda mucho en ambas o tareas. 6
  23. 23. Aplicaciones de la TA [2] Preedici´n y postedici´n: los profesionales colaboran con el sistema o o de TA en aplicaciones de diseminaci´n: o Preedici´n: preparaci´n del texto para evitar l´xico o construccio- o o e nes que dan problemas de traducci´n con un sistema de traducci´n o o autom´tica. a Postedici´n: correcci´n del texto traducido en sucio para hacerlo o o adecuado al prop´sito previsto. o Conocer bien c´mo funciona el sistema de TA ayuda mucho en ambas o tareas. 6
  24. 24. Aplicaciones de la TA [2] Preedici´n y postedici´n: los profesionales colaboran con el sistema o o de TA en aplicaciones de diseminaci´n: o Preedici´n: preparaci´n del texto para evitar l´xico o construccio- o o e nes que dan problemas de traducci´n con un sistema de traducci´n o o autom´tica. a Postedici´n: correcci´n del texto traducido en sucio para hacerlo o o adecuado al prop´sito previsto. o Conocer bien c´mo funciona el sistema de TA ayuda mucho en ambas o tareas. 6
  25. 25. Aplicaciones de la TA [2] Preedici´n y postedici´n: los profesionales colaboran con el sistema o o de TA en aplicaciones de diseminaci´n: o Preedici´n: preparaci´n del texto para evitar l´xico o construccio- o o e nes que dan problemas de traducci´n con un sistema de traducci´n o o autom´tica. a Postedici´n: correcci´n del texto traducido en sucio para hacerlo o o adecuado al prop´sito previsto. o Conocer bien c´mo funciona el sistema de TA ayuda mucho en ambas o tareas. 6
  26. 26. Aplicaciones de la TA [2] Preedici´n y postedici´n: los profesionales colaboran con el sistema o o de TA en aplicaciones de diseminaci´n: o Preedici´n: preparaci´n del texto para evitar l´xico o construccio- o o e nes que dan problemas de traducci´n con un sistema de traducci´n o o autom´tica. a Postedici´n: correcci´n del texto traducido en sucio para hacerlo o o adecuado al prop´sito previsto. o Conocer bien c´mo funciona el sistema de TA ayuda mucho en ambas o tareas. 6
  27. 27. Aplicaciones de la TA [3] Alternativa a la preedici´n: lenguaje controlado. o Los autores escriben ya pensando en el tratamiento automatizado del texto. Se evitan l´xico y construcciones problem´ticas. e a Se minimiza la postedici´n. o Consistencia de estilo, comprensibilidad, mantenibilidad. Pero. . . ¡los autores lo deben conocer y aplicar! Se les puede ayudar con herramientas inform´ticas. a 7
  28. 28. Aplicaciones de la TA [3] Alternativa a la preedici´n: lenguaje controlado. o Los autores escriben ya pensando en el tratamiento automatizado del texto. Se evitan l´xico y construcciones problem´ticas. e a Se minimiza la postedici´n. o Consistencia de estilo, comprensibilidad, mantenibilidad. Pero. . . ¡los autores lo deben conocer y aplicar! Se les puede ayudar con herramientas inform´ticas. a 7
  29. 29. Aplicaciones de la TA [3] Alternativa a la preedici´n: lenguaje controlado. o Los autores escriben ya pensando en el tratamiento automatizado del texto. Se evitan l´xico y construcciones problem´ticas. e a Se minimiza la postedici´n. o Consistencia de estilo, comprensibilidad, mantenibilidad. Pero. . . ¡los autores lo deben conocer y aplicar! Se les puede ayudar con herramientas inform´ticas. a 7
  30. 30. Aplicaciones de la TA [3] Alternativa a la preedici´n: lenguaje controlado. o Los autores escriben ya pensando en el tratamiento automatizado del texto. Se evitan l´xico y construcciones problem´ticas. e a Se minimiza la postedici´n. o Consistencia de estilo, comprensibilidad, mantenibilidad. Pero. . . ¡los autores lo deben conocer y aplicar! Se les puede ayudar con herramientas inform´ticas. a 7
  31. 31. Aplicaciones de la TA [3] Alternativa a la preedici´n: lenguaje controlado. o Los autores escriben ya pensando en el tratamiento automatizado del texto. Se evitan l´xico y construcciones problem´ticas. e a Se minimiza la postedici´n. o Consistencia de estilo, comprensibilidad, mantenibilidad. Pero. . . ¡los autores lo deben conocer y aplicar! Se les puede ayudar con herramientas inform´ticas. a 7
  32. 32. Aplicaciones de la TA [3] Alternativa a la preedici´n: lenguaje controlado. o Los autores escriben ya pensando en el tratamiento automatizado del texto. Se evitan l´xico y construcciones problem´ticas. e a Se minimiza la postedici´n. o Consistencia de estilo, comprensibilidad, mantenibilidad. Pero. . . ¡los autores lo deben conocer y aplicar! Se les puede ayudar con herramientas inform´ticas. a 7
  33. 33. Aplicaciones de la TA [3] Alternativa a la preedici´n: lenguaje controlado. o Los autores escriben ya pensando en el tratamiento automatizado del texto. Se evitan l´xico y construcciones problem´ticas. e a Se minimiza la postedici´n. o Consistencia de estilo, comprensibilidad, mantenibilidad. Pero. . . ¡los autores lo deben conocer y aplicar! Se les puede ayudar con herramientas inform´ticas. a 7
  34. 34. Aplicaciones de la TA [3] Alternativa a la preedici´n: lenguaje controlado. o Los autores escriben ya pensando en el tratamiento automatizado del texto. Se evitan l´xico y construcciones problem´ticas. e a Se minimiza la postedici´n. o Consistencia de estilo, comprensibilidad, mantenibilidad. Pero. . . ¡los autores lo deben conocer y aplicar! Se les puede ayudar con herramientas inform´ticas. a 7
  35. 35. Aplicaciones de la TA [4] La postedici´n es conveniente cuando o   traducci´n autom´tica o a coste  +  < coste(traducci´n humana). o   postedici´n o Para que sea eficiente: se debe ser competente en la lengua meta → generar un texto genuino a partir del texto en sucio se debe conocer el sistema de TA → reconocer el origen de los errores, predecir el comportamiento 8
  36. 36. Aplicaciones de la TA [4] La postedici´n es conveniente cuando o   traducci´n autom´tica o a coste  +  < coste(traducci´n humana). o   postedici´n o Para que sea eficiente: se debe ser competente en la lengua meta → generar un texto genuino a partir del texto en sucio se debe conocer el sistema de TA → reconocer el origen de los errores, predecir el comportamiento 8
  37. 37. Aplicaciones de la TA [4] La postedici´n es conveniente cuando o   traducci´n autom´tica o a coste  +  < coste(traducci´n humana). o   postedici´n o Para que sea eficiente: se debe ser competente en la lengua meta → generar un texto genuino a partir del texto en sucio se debe conocer el sistema de TA → reconocer el origen de los errores, predecir el comportamiento 8
  38. 38. Aplicaciones de la TA [4] La postedici´n es conveniente cuando o   traducci´n autom´tica o a coste  +  < coste(traducci´n humana). o   postedici´n o Para que sea eficiente: se debe ser competente en la lengua meta → generar un texto genuino a partir del texto en sucio se debe conocer el sistema de TA → reconocer el origen de los errores, predecir el comportamiento 8
  39. 39. Aplicaciones de la TA [4] La postedici´n es conveniente cuando o   traducci´n autom´tica o a coste  +  < coste(traducci´n humana). o   postedici´n o Para que sea eficiente: se debe ser competente en la lengua meta → generar un texto genuino a partir del texto en sucio se debe conocer el sistema de TA → reconocer el origen de los errores, predecir el comportamiento 8
  40. 40. Formatos de texto [1] Un texto informatizado es, como cualquier porci´n de datos informa- o tizada, una secuencia de bits, es decir, de unos y ceros: 000101010010100111101001010010.... Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se pueden hacer 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2= 28= 256 combinaciones: 00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255). Hay muchas maneras de organizar los bytes para almacenar textos. Muchos problemas provienen de discrepancias en cuanto a la manera de hacerlo. 9
  41. 41. Formatos de texto [1] Un texto informatizado es, como cualquier porci´n de datos informa- o tizada, una secuencia de bits, es decir, de unos y ceros: 000101010010100111101001010010.... Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se pueden hacer 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2= 28= 256 combinaciones: 00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255). Hay muchas maneras de organizar los bytes para almacenar textos. Muchos problemas provienen de discrepancias en cuanto a la manera de hacerlo. 9
  42. 42. Formatos de texto [1] Un texto informatizado es, como cualquier porci´n de datos informa- o tizada, una secuencia de bits, es decir, de unos y ceros: 000101010010100111101001010010.... Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se pueden hacer 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2= 28= 256 combinaciones: 00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255). Hay muchas maneras de organizar los bytes para almacenar textos. Muchos problemas provienen de discrepancias en cuanto a la manera de hacerlo. 9
  43. 43. Formatos de texto [1] Un texto informatizado es, como cualquier porci´n de datos informa- o tizada, una secuencia de bits, es decir, de unos y ceros: 000101010010100111101001010010.... Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se pueden hacer 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2= 28= 256 combinaciones: 00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255). Hay muchas maneras de organizar los bytes para almacenar textos. Muchos problemas provienen de discrepancias en cuanto a la manera de hacerlo. 9
  44. 44. Formatos de texto [1] Un texto informatizado es, como cualquier porci´n de datos informa- o tizada, una secuencia de bits, es decir, de unos y ceros: 000101010010100111101001010010.... Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se pueden hacer 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2= 28= 256 combinaciones: 00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255). Hay muchas maneras de organizar los bytes para almacenar textos. Muchos problemas provienen de discrepancias en cuanto a la manera de hacerlo. 9
  45. 45. Formatos de texto [1] Un texto informatizado es, como cualquier porci´n de datos informa- o tizada, una secuencia de bits, es decir, de unos y ceros: 000101010010100111101001010010.... Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se pueden hacer 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2= 28= 256 combinaciones: 00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255). Hay muchas maneras de organizar los bytes para almacenar textos. Muchos problemas provienen de discrepancias en cuanto a la manera de hacerlo. 9
  46. 46. Formatos de texto [1] Un texto informatizado es, como cualquier porci´n de datos informa- o tizada, una secuencia de bits, es decir, de unos y ceros: 000101010010100111101001010010.... Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se pueden hacer 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2= 28= 256 combinaciones: 00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255). Hay muchas maneras de organizar los bytes para almacenar textos. Muchos problemas provienen de discrepancias en cuanto a la manera de hacerlo. 9
  47. 47. Formatos de texto [1] Un texto informatizado es, como cualquier porci´n de datos informa- o tizada, una secuencia de bits, es decir, de unos y ceros: 000101010010100111101001010010.... Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se pueden hacer 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2= 28= 256 combinaciones: 00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255). Hay muchas maneras de organizar los bytes para almacenar textos. Muchos problemas provienen de discrepancias en cuanto a la manera de hacerlo. 9
  48. 48. Formatos de texto [1] Un texto informatizado es, como cualquier porci´n de datos informa- o tizada, una secuencia de bits, es decir, de unos y ceros: 000101010010100111101001010010.... Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se pueden hacer 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2= 28= 256 combinaciones: 00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255). Hay muchas maneras de organizar los bytes para almacenar textos. Muchos problemas provienen de discrepancias en cuanto a la manera de hacerlo. 9
  49. 49. Formatos de texto [1] Un texto informatizado es, como cualquier porci´n de datos informa- o tizada, una secuencia de bits, es decir, de unos y ceros: 000101010010100111101001010010.... Los bits van normalmente en grupos de 8 (bytes). Con 8 bits se pueden hacer 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2= 28= 256 combinaciones: 00000000 (0), 00000001 (1), 00000010 (2), . . . , 11111111 (255). Hay muchas maneras de organizar los bytes para almacenar textos. Muchos problemas provienen de discrepancias en cuanto a la manera de hacerlo. 9
  50. 50. Formatos de texto [2] Dos aspectos importantes: codificaci´n y formato propiamente dicho. o Codificaci´n: Asignaci´n de un c´digo (una secuencia de uno o o o o m´s bytes concreta) a cada car´cter posible de la lengua corres- a a pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111” (63), etc.) 10
  51. 51. Formatos de texto [2] Dos aspectos importantes: codificaci´n y formato propiamente dicho. o Codificaci´n: Asignaci´n de un c´digo (una secuencia de uno o o o o m´s bytes concreta) a cada car´cter posible de la lengua corres- a a pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111” (63), etc.) 10
  52. 52. Formatos de texto [2] Dos aspectos importantes: codificaci´n y formato propiamente dicho. o Codificaci´n: Asignaci´n de un c´digo (una secuencia de uno o o o o m´s bytes concreta) a cada car´cter posible de la lengua corres- a a pondiente (por ejemplo: “a” → 01100001 (97); “?” → “00111111” (63), etc.) 10
  53. 53. Formatos de texto [3] Formato propiamente dicho: Los textos, adem´s de caracteres, a contienen informaci´n de formato. o Es precisa la asignaci´n de c´digos para regular otras caracter´ o o ısti- cas del texto: • Para codificar la apariencia visual o de presentaci´n, por ejem- o plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”), o • para codificar la estructura (es decir, la organizaci´n del conte- o nido, por ejemplo, “t´ ıtulo de secci´n”, “lista numerada”, “nota o a pie de p´gina”, “fila de una tabla”, etc.). a 11
  54. 54. Formatos de texto [3] Formato propiamente dicho: Los textos, adem´s de caracteres, a contienen informaci´n de formato. o Es precisa la asignaci´n de c´digos para regular otras caracter´ o o ısti- cas del texto: • Para codificar la apariencia visual o de presentaci´n, por ejem- o plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”), o • para codificar la estructura (es decir, la organizaci´n del conte- o nido, por ejemplo, “t´ ıtulo de secci´n”, “lista numerada”, “nota o a pie de p´gina”, “fila de una tabla”, etc.). a 11
  55. 55. Formatos de texto [3] Formato propiamente dicho: Los textos, adem´s de caracteres, a contienen informaci´n de formato. o Es precisa la asignaci´n de c´digos para regular otras caracter´ o o ısti- cas del texto: • Para codificar la apariencia visual o de presentaci´n, por ejem- o plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”), o • para codificar la estructura (es decir, la organizaci´n del conte- o nido, por ejemplo, “t´ ıtulo de secci´n”, “lista numerada”, “nota o a pie de p´gina”, “fila de una tabla”, etc.). a 11
  56. 56. Formatos de texto [3] Formato propiamente dicho: Los textos, adem´s de caracteres, a contienen informaci´n de formato. o Es precisa la asignaci´n de c´digos para regular otras caracter´ o o ısti- cas del texto: • Para codificar la apariencia visual o de presentaci´n, por ejem- o plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”), o • para codificar la estructura (es decir, la organizaci´n del conte- o nido, por ejemplo, “t´ ıtulo de secci´n”, “lista numerada”, “nota o a pie de p´gina”, “fila de una tabla”, etc.). a 11
  57. 57. Formatos de texto [3] Formato propiamente dicho: Los textos, adem´s de caracteres, a contienen informaci´n de formato. o Es precisa la asignaci´n de c´digos para regular otras caracter´ o o ısti- cas del texto: • Para codificar la apariencia visual o de presentaci´n, por ejem- o plo, “inicio cursivas”, “final negritas”, “letra de 16 puntos”), o • para codificar la estructura (es decir, la organizaci´n del conte- o nido, por ejemplo, “t´ ıtulo de secci´n”, “lista numerada”, “nota o a pie de p´gina”, “fila de una tabla”, etc.). a 11
  58. 58. Formatos de texto [4] Codificacions de 1 byte (“unibyte”): ASCII: Asigna c´digos de 7 bits, del 0000000 (0) al 1111111 (127), o (sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.) ANSI o ISO: familia de codificaciones que aprovechan los c´digos o del 128 al 255 para caracteres internacionales. En Europa occidental: ISO-8859-1 (o Latin-1); m´s recientemen- a te, ISO-8859-15 (o Latin-9; contiene el s´ ımbolo del euro) En Windows se usa CP-1252 que es muy similar (pero no id´ntico) e al ISO-8859-1. 12
  59. 59. Formatos de texto [4] Codificacions de 1 byte (“unibyte”): ASCII: Asigna c´digos de 7 bits, del 0000000 (0) al 1111111 (127), o (sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.) ANSI o ISO: familia de codificaciones que aprovechan los c´digos o del 128 al 255 para caracteres internacionales. En Europa occidental: ISO-8859-1 (o Latin-1); m´s recientemen- a te, ISO-8859-15 (o Latin-9; contiene el s´ ımbolo del euro) En Windows se usa CP-1252 que es muy similar (pero no id´ntico) e al ISO-8859-1. 12
  60. 60. Formatos de texto [4] Codificacions de 1 byte (“unibyte”): ASCII: Asigna c´digos de 7 bits, del 0000000 (0) al 1111111 (127), o (sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.) ANSI o ISO: familia de codificaciones que aprovechan los c´digos o del 128 al 255 para caracteres internacionales. En Europa occidental: ISO-8859-1 (o Latin-1); m´s recientemen- a te, ISO-8859-15 (o Latin-9; contiene el s´ ımbolo del euro) En Windows se usa CP-1252 que es muy similar (pero no id´ntico) e al ISO-8859-1. 12
  61. 61. Formatos de texto [4] Codificacions de 1 byte (“unibyte”): ASCII: Asigna c´digos de 7 bits, del 0000000 (0) al 1111111 (127), o (sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.) ANSI o ISO: familia de codificaciones que aprovechan los c´digos o del 128 al 255 para caracteres internacionales. En Europa occidental: ISO-8859-1 (o Latin-1); m´s recientemen- a te, ISO-8859-15 (o Latin-9; contiene el s´ ımbolo del euro) En Windows se usa CP-1252 que es muy similar (pero no id´ntico) e al ISO-8859-1. 12
  62. 62. Formatos de texto [4] Codificacions de 1 byte (“unibyte”): ASCII: Asigna c´digos de 7 bits, del 0000000 (0) al 1111111 (127), o (sobra un bit del byte) a los caracteres ingleses (sin acentos, etc.) ANSI o ISO: familia de codificaciones que aprovechan los c´digos o del 128 al 255 para caracteres internacionales. En Europa occidental: ISO-8859-1 (o Latin-1); m´s recientemen- a te, ISO-8859-15 (o Latin-9; contiene el s´ ımbolo del euro) En Windows se usa CP-1252 que es muy similar (pero no id´ntico) e al ISO-8859-1. 12
  63. 63. Formatos de texto [5] Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano, a e devanagari. . . ): Unicode (ISO-10646): Asigna c´digos de 31 bits (4 bytes) y per- o mite codificar 231 = 2147483648 caracteres. UTF-8: Versi´n de Unicode que s´lo usa m´s de un byte cuando o o a hace falta: • c´digos del 0 al 127: 1 byte (compatible con ASCII); o • c´digos del 128 al 2047: 2 bytes; o • c´digos del 2048 al 65535: 3 bytes, etc. o 13
  64. 64. Formatos de texto [5] Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano, a e devanagari. . . ): Unicode (ISO-10646): Asigna c´digos de 31 bits (4 bytes) y per- o mite codificar 231 = 2147483648 caracteres. UTF-8: Versi´n de Unicode que s´lo usa m´s de un byte cuando o o a hace falta: • c´digos del 0 al 127: 1 byte (compatible con ASCII); o • c´digos del 128 al 2047: 2 bytes; o • c´digos del 2048 al 65535: 3 bytes, etc. o 13
  65. 65. Formatos de texto [5] Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano, a e devanagari. . . ): Unicode (ISO-10646): Asigna c´digos de 31 bits (4 bytes) y per- o mite codificar 231 = 2147483648 caracteres. UTF-8: Versi´n de Unicode que s´lo usa m´s de un byte cuando o o a hace falta: • c´digos del 0 al 127: 1 byte (compatible con ASCII); o • c´digos del 128 al 2047: 2 bytes; o • c´digos del 2048 al 65535: 3 bytes, etc. o 13
  66. 66. Formatos de texto [5] Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano, a e devanagari. . . ): Unicode (ISO-10646): Asigna c´digos de 31 bits (4 bytes) y per- o mite codificar 231 = 2147483648 caracteres. UTF-8: Versi´n de Unicode que s´lo usa m´s de un byte cuando o o a hace falta: • c´digos del 0 al 127: 1 byte (compatible con ASCII); o • c´digos del 128 al 2047: 2 bytes; o • c´digos del 2048 al 65535: 3 bytes, etc. o 13
  67. 67. Formatos de texto [5] Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano, a e devanagari. . . ): Unicode (ISO-10646): Asigna c´digos de 31 bits (4 bytes) y per- o mite codificar 231 = 2147483648 caracteres. UTF-8: Versi´n de Unicode que s´lo usa m´s de un byte cuando o o a hace falta: • c´digos del 0 al 127: 1 byte (compatible con ASCII); o • c´digos del 128 al 2047: 2 bytes; o • c´digos del 2048 al 65535: 3 bytes, etc. o 13
  68. 68. Formatos de texto [5] Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano, a e devanagari. . . ): Unicode (ISO-10646): Asigna c´digos de 31 bits (4 bytes) y per- o mite codificar 231 = 2147483648 caracteres. UTF-8: Versi´n de Unicode que s´lo usa m´s de un byte cuando o o a hace falta: • c´digos del 0 al 127: 1 byte (compatible con ASCII); o • c´digos del 128 al 2047: 2 bytes; o • c´digos del 2048 al 65535: 3 bytes, etc. o 13
  69. 69. Formatos de texto [5] Codificacions de m´s de 1 byte (“multibyte”: japon´s, chino, coreano, a e devanagari. . . ): Unicode (ISO-10646): Asigna c´digos de 31 bits (4 bytes) y per- o mite codificar 231 = 2147483648 caracteres. UTF-8: Versi´n de Unicode que s´lo usa m´s de un byte cuando o o a hace falta: • c´digos del 0 al 127: 1 byte (compatible con ASCII); o • c´digos del 128 al 2047: 2 bytes; o • c´digos del 2048 al 65535: 3 bytes, etc. o 13
  70. 70. Formatos de texto [6] Necesidad de formato (estructural o presentacional) m´s all´ de la a a codificaci´n de caracteres. La informaci´n de formato se puede codi- o o ficar: Como secuencias de caracteres (llamadas marcas) que se pueden leer con un editor sencillo de texto como el Bloc de notas: La familia SGML (ahora XML): HTML y XHTML (p´ginas web), a NewsML (noticias), etc.; RTF, TeX (procesadores de textos); Postscript (impresoras), etc. Un ejemplo: <p>Un p´rrafo corto con una palabra <em>enfatizada</em><p> a (HTML visto a trav´s de un editor de texto) e 14
  71. 71. Formatos de texto [6] Necesidad de formato (estructural o presentacional) m´s all´ de la a a codificaci´n de caracteres. La informaci´n de formato se puede codi- o o ficar: Como secuencias de caracteres (llamadas marcas) que se pueden leer con un editor sencillo de texto como el Bloc de notas: La familia SGML (ahora XML): HTML y XHTML (p´ginas web), a NewsML (noticias), etc.; RTF, TeX (procesadores de textos); Postscript (impresoras), etc. Un ejemplo: <p>Un p´rrafo corto con una palabra <em>enfatizada</em><p> a (HTML visto a trav´s de un editor de texto) e 14
  72. 72. Formatos de texto [6] Necesidad de formato (estructural o presentacional) m´s all´ de la a a codificaci´n de caracteres. La informaci´n de formato se puede codi- o o ficar: Como secuencias de caracteres (llamadas marcas) que se pueden leer con un editor sencillo de texto como el Bloc de notas: La familia SGML (ahora XML): HTML y XHTML (p´ginas web), a NewsML (noticias), etc.; RTF, TeX (procesadores de textos); Postscript (impresoras), etc. Un ejemplo: <p>Un p´rrafo corto con una palabra <em>enfatizada</em><p> a (HTML visto a trav´s de un editor de texto) e 14
  73. 73. Formatos de texto [6] Necesidad de formato (estructural o presentacional) m´s all´ de la a a codificaci´n de caracteres. La informaci´n de formato se puede codi- o o ficar: Como secuencias de caracteres (llamadas marcas) que se pueden leer con un editor sencillo de texto como el Bloc de notas: La familia SGML (ahora XML): HTML y XHTML (p´ginas web), a NewsML (noticias), etc.; RTF, TeX (procesadores de textos); Postscript (impresoras), etc. Un ejemplo: <p>Un p´rrafo corto con una palabra <em>enfatizada</em><p> a (HTML visto a trav´s de un editor de texto) e 14
  74. 74. Formatos de texto [7] Con c´digos no interpretables como caracteres: (no visibles a o trav´s de un editor de texto sencillo) Adobe PDF (impresi´n, e o presentaci´n), formatos semisecretos de procesadores de textos o comerciales como .doc de Microsoft, etc. 15
  75. 75. Formatos de texto [7] Con c´digos no interpretables como caracteres: (no visibles a o trav´s de un editor de texto sencillo) Adobe PDF (impresi´n, e o presentaci´n), formatos semisecretos de procesadores de textos o comerciales como .doc de Microsoft, etc. 15
  76. 76. Formatos de texto [8] El problema wysiwyg (“what you see is what you get”: “lo que ves es lo que obtendr´s”): a Las personas usan la presentaci´n visual para comunicar la estructura o l´gica de los documentos (¡a personas videntes!). o Los procesadores de textos actuales nos muestran el documento tal como quedar´ impreso mientras lo estamos editando. a Sucumbimos a la tentaci´n de trabajar directamente sobre la presen- o taci´n (negritas, m´rgenes, tipos) en vez de sobre la estructura l´gica o a o (secciones, t´ ıtulos, etc.) 16
  77. 77. Formatos de texto [8] El problema wysiwyg (“what you see is what you get”: “lo que ves es lo que obtendr´s”): a Las personas usan la presentaci´n visual para comunicar la estructura o l´gica de los documentos (¡a personas videntes!). o Los procesadores de textos actuales nos muestran el documento tal como quedar´ impreso mientras lo estamos editando. a Sucumbimos a la tentaci´n de trabajar directamente sobre la presen- o taci´n (negritas, m´rgenes, tipos) en vez de sobre la estructura l´gica o a o (secciones, t´ ıtulos, etc.) 16
  78. 78. Formatos de texto [8] El problema wysiwyg (“what you see is what you get”: “lo que ves es lo que obtendr´s”): a Las personas usan la presentaci´n visual para comunicar la estructura o l´gica de los documentos (¡a personas videntes!). o Los procesadores de textos actuales nos muestran el documento tal como quedar´ impreso mientras lo estamos editando. a Sucumbimos a la tentaci´n de trabajar directamente sobre la presen- o taci´n (negritas, m´rgenes, tipos) en vez de sobre la estructura l´gica o a o (secciones, t´ ıtulos, etc.) 16
  79. 79. Formatos de texto [8] El problema wysiwyg (“what you see is what you get”: “lo que ves es lo que obtendr´s”): a Las personas usan la presentaci´n visual para comunicar la estructura o l´gica de los documentos (¡a personas videntes!). o Los procesadores de textos actuales nos muestran el documento tal como quedar´ impreso mientras lo estamos editando. a Sucumbimos a la tentaci´n de trabajar directamente sobre la presen- o taci´n (negritas, m´rgenes, tipos) en vez de sobre la estructura l´gica o a o (secciones, t´ ıtulos, etc.) 16
  80. 80. Formatos de texto [9] El problema wysiwyg: Si hacemos esto, y m´s adelante queremos cambiar el tipo de letra a de los t´ ıtulos de secci´n o de las palabras extranjeras. . . o . . . ¡nos toca cambiarlos uno por uno! Resultado: “lo que ves es todo lo que tienes” ¿Podemos evitarlo? S´ ı. 17
  81. 81. Formatos de texto [9] El problema wysiwyg: Si hacemos esto, y m´s adelante queremos cambiar el tipo de letra a de los t´ ıtulos de secci´n o de las palabras extranjeras. . . o . . . ¡nos toca cambiarlos uno por uno! Resultado: “lo que ves es todo lo que tienes” ¿Podemos evitarlo? S´ ı. 17
  82. 82. Formatos de texto [9] El problema wysiwyg: Si hacemos esto, y m´s adelante queremos cambiar el tipo de letra a de los t´ ıtulos de secci´n o de las palabras extranjeras. . . o . . . ¡nos toca cambiarlos uno por uno! Resultado: “lo que ves es todo lo que tienes” ¿Podemos evitarlo? S´ ı. 17
  83. 83. Formatos de texto [9] El problema wysiwyg: Si hacemos esto, y m´s adelante queremos cambiar el tipo de letra a de los t´ ıtulos de secci´n o de las palabras extranjeras. . . o . . . ¡nos toca cambiarlos uno por uno! Resultado: “lo que ves es todo lo que tienes” ¿Podemos evitarlo? S´ ı. 17
  84. 84. Formatos de texto [9] El problema wysiwyg: Si hacemos esto, y m´s adelante queremos cambiar el tipo de letra a de los t´ ıtulos de secci´n o de las palabras extranjeras. . . o . . . ¡nos toca cambiarlos uno por uno! Resultado: “lo que ves es todo lo que tienes” ¿Podemos evitarlo? S´ ı. 17
  85. 85. Formatos de texto [10] ¿C´mo? Usando estilos. o Marcamos estructuralmente las partes (elementos): t´ ıtulo de segundo nivel, texto enfatizado, ejemplo, etc. Y despu´s asignamos un estilo de presentaci´n a cada parte (por e o ejemplo, los t´ ıtulos de segundo nivel pueden ir numerados autom´ti- a camente y en Helv´tica de 14 puntos, el ´nfasis puede ser en negrita e e y el ejemplo en cursiva) Cambiar la presentaci´n de todas las apariciones de un elemento es o f´cil: basta con cambiar el estilo asociado al elemento. a 18
  86. 86. Formatos de texto [10] ¿C´mo? Usando estilos. o Marcamos estructuralmente las partes (elementos): t´ ıtulo de segundo nivel, texto enfatizado, ejemplo, etc. Y despu´s asignamos un estilo de presentaci´n a cada parte (por e o ejemplo, los t´ ıtulos de segundo nivel pueden ir numerados autom´ti- a camente y en Helv´tica de 14 puntos, el ´nfasis puede ser en negrita e e y el ejemplo en cursiva) Cambiar la presentaci´n de todas las apariciones de un elemento es o f´cil: basta con cambiar el estilo asociado al elemento. a 18
  87. 87. Formatos de texto [10] ¿C´mo? Usando estilos. o Marcamos estructuralmente las partes (elementos): t´ ıtulo de segundo nivel, texto enfatizado, ejemplo, etc. Y despu´s asignamos un estilo de presentaci´n a cada parte (por e o ejemplo, los t´ ıtulos de segundo nivel pueden ir numerados autom´ti- a camente y en Helv´tica de 14 puntos, el ´nfasis puede ser en negrita e e y el ejemplo en cursiva) Cambiar la presentaci´n de todas las apariciones de un elemento es o f´cil: basta con cambiar el estilo asociado al elemento. a 18
  88. 88. Formatos de texto [10] ¿C´mo? Usando estilos. o Marcamos estructuralmente las partes (elementos): t´ ıtulo de segundo nivel, texto enfatizado, ejemplo, etc. Y despu´s asignamos un estilo de presentaci´n a cada parte (por e o ejemplo, los t´ ıtulos de segundo nivel pueden ir numerados autom´ti- a camente y en Helv´tica de 14 puntos, el ´nfasis puede ser en negrita e e y el ejemplo en cursiva) Cambiar la presentaci´n de todas las apariciones de un elemento es o f´cil: basta con cambiar el estilo asociado al elemento. a 18
  89. 89. Formatos de texto [10] ¿C´mo? Usando estilos. o Marcamos estructuralmente las partes (elementos): t´ ıtulo de segundo nivel, texto enfatizado, ejemplo, etc. Y despu´s asignamos un estilo de presentaci´n a cada parte (por e o ejemplo, los t´ ıtulos de segundo nivel pueden ir numerados autom´ti- a camente y en Helv´tica de 14 puntos, el ´nfasis puede ser en negrita e e y el ejemplo en cursiva) Cambiar la presentaci´n de todas las apariciones de un elemento es o f´cil: basta con cambiar el estilo asociado al elemento. a 18
  90. 90. Formatos de texto [11] En aplicaciones de internet, la separaci´n estructura–presentaci´n se o o hace as´ ı: La informaci´n —el contenido— se estructura usando XML o o HTML La presentaci´n se genera (en el servidor o en el navegador) usan- o do hojas de estilo escritos en CSS o en XSL 19
  91. 91. Formatos de texto [11] En aplicaciones de internet, la separaci´n estructura–presentaci´n se o o hace as´ ı: La informaci´n —el contenido— se estructura usando XML o o HTML La presentaci´n se genera (en el servidor o en el navegador) usan- o do hojas de estilo escritos en CSS o en XSL 19
  92. 92. Formatos de texto [11] En aplicaciones de internet, la separaci´n estructura–presentaci´n se o o hace as´ ı: La informaci´n —el contenido— se estructura usando XML o o HTML La presentaci´n se genera (en el servidor o en el navegador) usan- o do hojas de estilo escritos en CSS o en XSL 19
  93. 93. Formatos de texto [11] En aplicaciones de internet, la separaci´n estructura–presentaci´n se o o hace as´ ı: La informaci´n —el contenido— se estructura usando XML o o HTML La presentaci´n se genera (en el servidor o en el navegador) usan- o do hojas de estilo escritos en CSS o en XSL 19
  94. 94. Formatos de texto [12] Procesador documento (XML o HTML) → de hojas de → presentaci´n o hoja de estilo (XSL o CSS) → estilo 20
  95. 95. Formatos de texto [13] Accesibilidad (no todos los receptores son videntes): Documento XML ? ? ? Hoja de estilo 1 Hoja de estilo 2 Hoja de estilo 3 ? ? ? Ò H Fichero de sonido Docum. Braille Docum. para m´viles o 21
  96. 96. Formatos de texto [14] Los sistemas de TA deben ser capaces: De separar del texto a traducir la informaci´n de formato; o de reintegrar adecuadamente la informaci´n de formato al texto o tras traducirlo; y, idealmente, de usar la informaci´n de formato para decidir o qu´ partes se deben traducir. e La preservaci´n del formato ahorra tiempo a la persona traducto- o ra/correctora (que se concentra en la parte ling¨´ uıstica del trabajo). 22
  97. 97. Formatos de texto [14] Los sistemas de TA deben ser capaces: De separar del texto a traducir la informaci´n de formato; o de reintegrar adecuadamente la informaci´n de formato al texto o tras traducirlo; y, idealmente, de usar la informaci´n de formato para decidir o qu´ partes se deben traducir. e La preservaci´n del formato ahorra tiempo a la persona traducto- o ra/correctora (que se concentra en la parte ling¨´ uıstica del trabajo). 22
  98. 98. Formatos de texto [14] Los sistemas de TA deben ser capaces: De separar del texto a traducir la informaci´n de formato; o de reintegrar adecuadamente la informaci´n de formato al texto o tras traducirlo; y, idealmente, de usar la informaci´n de formato para decidir o qu´ partes se deben traducir. e La preservaci´n del formato ahorra tiempo a la persona traducto- o ra/correctora (que se concentra en la parte ling¨´ uıstica del trabajo). 22
  99. 99. Formatos de texto [14] Los sistemas de TA deben ser capaces: De separar del texto a traducir la informaci´n de formato; o de reintegrar adecuadamente la informaci´n de formato al texto o tras traducirlo; y, idealmente, de usar la informaci´n de formato para decidir o qu´ partes se deben traducir. e La preservaci´n del formato ahorra tiempo a la persona traducto- o ra/correctora (que se concentra en la parte ling¨´ uıstica del trabajo). 22
  100. 100. Formatos de texto [14] Los sistemas de TA deben ser capaces: De separar del texto a traducir la informaci´n de formato; o de reintegrar adecuadamente la informaci´n de formato al texto o tras traducirlo; y, idealmente, de usar la informaci´n de formato para decidir o qu´ partes se deben traducir. e La preservaci´n del formato ahorra tiempo a la persona traducto- o ra/correctora (que se concentra en la parte ling¨´ uıstica del trabajo). 22
  101. 101. Formatos de texto [14] Los sistemas de TA deben ser capaces: De separar del texto a traducir la informaci´n de formato; o de reintegrar adecuadamente la informaci´n de formato al texto o tras traducirlo; y, idealmente, de usar la informaci´n de formato para decidir o qu´ partes se deben traducir. e La preservaci´n del formato ahorra tiempo a la persona traducto- o ra/correctora (que se concentra en la parte ling¨´ uıstica del trabajo). 22
  102. 102. ¿C´mo funciona la TA? [1] o Primera aproximaci´n [!!]: Traducir textos es traduir oraciones. o Traducir oraciones supone: Construir una interpretaci´n (un significado) a partir de la oraci´n o o en LO. Construir una oraci´n en LM a partir de la interpretaci´n. o o 23
  103. 103. ¿C´mo funciona la TA? [1] o Primera aproximaci´n [!!]: Traducir textos es traduir oraciones. o Traducir oraciones supone: Construir una interpretaci´n (un significado) a partir de la oraci´n o o en LO. Construir una oraci´n en LM a partir de la interpretaci´n. o o 23
  104. 104. ¿C´mo funciona la TA? [1] o Primera aproximaci´n [!!]: Traducir textos es traduir oraciones. o Traducir oraciones supone: Construir una interpretaci´n (un significado) a partir de la oraci´n o o en LO. Construir una oraci´n en LM a partir de la interpretaci´n. o o 23
  105. 105. ¿C´mo funciona la TA? [2] o Principio de composicionalidad [sem´ntica]: a La interpretaci´n de una oraci´n se construye . . . o o . . . a partir de las interpretaciones de las palabras . . . Escriben cartas = Escriben art´ ıculos . . . componi´ndolas siguiendo las agrupaciones indicadas por la es- e tructura sint´ctica de la oraci´n. a o Israel amenaza a Palestina = Palestina amenaza a Israel 25
  106. 106. ¿C´mo funciona la TA? [2] o Principio de composicionalidad [sem´ntica]: a La interpretaci´n de una oraci´n se construye . . . o o . . . a partir de las interpretaciones de las palabras . . . Escriben cartas = Escriben art´ ıculos . . . componi´ndolas siguiendo las agrupaciones indicadas por la es- e tructura sint´ctica de la oraci´n. a o Israel amenaza a Palestina = Palestina amenaza a Israel 25
  107. 107. ¿C´mo funciona la TA? [2] o Principio de composicionalidad [sem´ntica]: a La interpretaci´n de una oraci´n se construye . . . o o . . . a partir de las interpretaciones de las palabras . . . Escriben cartas = Escriben art´ ıculos . . . componi´ndolas siguiendo las agrupaciones indicadas por la es- e tructura sint´ctica de la oraci´n. a o Israel amenaza a Palestina = Palestina amenaza a Israel 25
  108. 108. ¿C´mo funciona la TA? [2] o Principio de composicionalidad [sem´ntica]: a La interpretaci´n de una oraci´n se construye . . . o o . . . a partir de las interpretaciones de las palabras . . . Escriben cartas = Escriben art´ ıculos . . . componi´ndolas siguiendo las agrupaciones indicadas por la es- e tructura sint´ctica de la oraci´n. a o Israel amenaza a Palestina = Palestina amenaza a Israel 25
  109. 109. ¿C´mo funciona la TA? [2] o Principio de composicionalidad [sem´ntica]: a La interpretaci´n de una oraci´n se construye . . . o o . . . a partir de las interpretaciones de las palabras . . . Escriben cartas = Escriben art´ ıculos . . . componi´ndolas siguiendo las agrupaciones indicadas por la es- e tructura sint´ctica de la oraci´n. a o Israel amenaza a Palestina = Palestina amenaza a Israel 25
  110. 110. ¿C´mo funciona la TA? [2] o Principio de composicionalidad [sem´ntica]: a La interpretaci´n de una oraci´n se construye . . . o o . . . a partir de las interpretaciones de las palabras . . . Escriben cartas = Escriben art´ ıculos . . . componi´ndolas siguiendo las agrupaciones indicadas por la es- e tructura sint´ctica de la oraci´n. a o Israel amenaza a Palestina = Palestina amenaza a Israel 25
  111. 111. ¿C´mo funciona la TA? [3] o Pero, ¡atenci´n! Las oraciones pueden ser ambiguas (es decir, tener o m´s de una interpretaci´n): a o porque las palabras tienen m´s de una interpretaci´n (ambig¨edad a o u l´xica) e porque la oraci´n tiene m´s de un posible an´lisis sint´ctico (am- o a a a big¨edad sint´ctica) u a por ambas cosas a la vez. Elegir la interpretaci´n correcta no es trivial para un sistema inform´ti- o a co (normalmente s´lo puede usar parte del cotexto). o 25
  112. 112. ¿C´mo funciona la TA? [3] o Pero, ¡atenci´n! Las oraciones pueden ser ambiguas (es decir, tener o m´s de una interpretaci´n): a o porque las palabras tienen m´s de una interpretaci´n (ambig¨edad a o u l´xica) e porque la oraci´n tiene m´s de un posible an´lisis sint´ctico (am- o a a a big¨edad sint´ctica) u a por ambas cosas a la vez. Elegir la interpretaci´n correcta no es trivial para un sistema inform´ti- o a co (normalmente s´lo puede usar parte del cotexto). o 25
  113. 113. ¿C´mo funciona la TA? [3] o Pero, ¡atenci´n! Las oraciones pueden ser ambiguas (es decir, tener o m´s de una interpretaci´n): a o porque las palabras tienen m´s de una interpretaci´n (ambig¨edad a o u l´xica) e porque la oraci´n tiene m´s de un posible an´lisis sint´ctico (am- o a a a big¨edad sint´ctica) u a por ambas cosas a la vez. Elegir la interpretaci´n correcta no es trivial para un sistema inform´ti- o a co (normalmente s´lo puede usar parte del cotexto). o 25
  114. 114. ¿C´mo funciona la TA? [3] o Pero, ¡atenci´n! Las oraciones pueden ser ambiguas (es decir, tener o m´s de una interpretaci´n): a o porque las palabras tienen m´s de una interpretaci´n (ambig¨edad a o u l´xica) e porque la oraci´n tiene m´s de un posible an´lisis sint´ctico (am- o a a a big¨edad sint´ctica) u a por ambas cosas a la vez. Elegir la interpretaci´n correcta no es trivial para un sistema inform´ti- o a co (normalmente s´lo puede usar parte del cotexto). o 25
  115. 115. ¿C´mo funciona la TA? [3] o Pero, ¡atenci´n! Las oraciones pueden ser ambiguas (es decir, tener o m´s de una interpretaci´n): a o porque las palabras tienen m´s de una interpretaci´n (ambig¨edad a o u l´xica) e porque la oraci´n tiene m´s de un posible an´lisis sint´ctico (am- o a a a big¨edad sint´ctica) u a por ambas cosas a la vez. Elegir la interpretaci´n correcta no es trivial para un sistema inform´ti- o a co (normalmente s´lo puede usar parte del cotexto). o 25
  116. 116. ¿C´mo funciona la TA? [4] o Esquem´ticamente: a Oraci´n o Oraci´n o → interpretaci´n o → LO LM En algunos sistemas de TA se intenta representar directamente las interpretaciones con una interlingua (un lenguaje estructurado artifi- cial). 26
  117. 117. ¿C´mo funciona la TA? [4] o Esquem´ticamente: a Oraci´n o Oraci´n o → interpretaci´n o → LO LM En algunos sistemas de TA se intenta representar directamente las interpretaciones con una interlingua (un lenguaje estructurado artifi- cial). 26
  118. 118. ¿C´mo funciona la TA? [4] o Esquem´ticamente: a Oraci´n o Oraci´n o → interpretaci´n o → LO LM En algunos sistemas de TA se intenta representar directamente las interpretaciones con una interlingua (un lenguaje estructurado artifi- cial). 26
  119. 119. ¿C´mo funciona la TA? [5] o Pero. . . los traductores profesionales ¿realmente necesitan interpretar o comprender completamente una oraci´n para traducirla? o “... spin-independent interactions in units of the Dirac neutrino cross section. . . ” → “... interacciones independientes del esp´ en unidades de la secci´n ın o eficaz del neutrino de Dirac...” “. . . bolts joining the flywheel to the crankshaft. . . → “. . . tornillos que unen el volante de inercia al ´rbol de levas . . . ” a No: Transforman estructuras o patrones y subsituyen el l´xico (pres- e tando especial atenci´n al terminol´gico). o o 27
  120. 120. ¿C´mo funciona la TA? [5] o Pero. . . los traductores profesionales ¿realmente necesitan interpretar o comprender completamente una oraci´n para traducirla? o “... spin-independent interactions in units of the Dirac neutrino cross section. . . ” → “... interacciones independientes del esp´ en unidades de la secci´n ın o eficaz del neutrino de Dirac...” “. . . bolts joining the flywheel to the crankshaft. . . → “. . . tornillos que unen el volante de inercia al ´rbol de levas . . . ” a No: Transforman estructuras o patrones y subsituyen el l´xico (pres- e tando especial atenci´n al terminol´gico). o o 27
  121. 121. ¿C´mo funciona la TA? [5] o Pero. . . los traductores profesionales ¿realmente necesitan interpretar o comprender completamente una oraci´n para traducirla? o “... spin-independent interactions in units of the Dirac neutrino cross section. . . ” → “... interacciones independientes del esp´ en unidades de la secci´n ın o eficaz del neutrino de Dirac...” “. . . bolts joining the flywheel to the crankshaft. . . → “. . . tornillos que unen el volante de inercia al ´rbol de levas . . . ” a No: Transforman estructuras o patrones y subsituyen el l´xico (pres- e tando especial atenci´n al terminol´gico). o o 27
  122. 122. ¿C´mo funciona la TA? [5] o Pero. . . los traductores profesionales ¿realmente necesitan interpretar o comprender completamente una oraci´n para traducirla? o “... spin-independent interactions in units of the Dirac neutrino cross section. . . ” → “... interacciones independientes del esp´ en unidades de la secci´n ın o eficaz del neutrino de Dirac...” “. . . bolts joining the flywheel to the crankshaft. . . → “. . . tornillos que unen el volante de inercia al ´rbol de levas . . . ” a No: Transforman estructuras o patrones y subsituyen el l´xico (pres- e tando especial atenci´n al terminol´gico). o o 27
  123. 123. ¿C´mo funciona la TA? [5] o Pero. . . los traductores profesionales ¿realmente necesitan interpretar o comprender completamente una oraci´n para traducirla? o “... spin-independent interactions in units of the Dirac neutrino cross section. . . ” → “... interacciones independientes del esp´ en unidades de la secci´n ın o eficaz del neutrino de Dirac...” “. . . bolts joining the flywheel to the crankshaft. . . → “. . . tornillos que unen el volante de inercia al ´rbol de levas . . . ” a No: Transforman estructuras o patrones y subsituyen el l´xico (pres- e tando especial atenci´n al terminol´gico). o o 27
  124. 124. ¿C´mo funciona la TA? [6] o Esto nos permite hacer la segunda aproximaci´n [!!]: o La mayor´ de los sistemas de TA no construyen completamente ıa la interpretaci´n, . . . o . . . sino que transforman la estructura sint´ctica de la oraci´n en a o LO en una estructura sint´ctica v´lida para la oraci´n en LM y a a o ... . . . substituyen las palabras de la oraci´n en LO por equivalentes o adecuados en LM. . . . . . haciendo las dos operaciones bastante independientemente. 28
  125. 125. ¿C´mo funciona la TA? [6] o Esto nos permite hacer la segunda aproximaci´n [!!]: o La mayor´ de los sistemas de TA no construyen completamente ıa la interpretaci´n, . . . o . . . sino que transforman la estructura sint´ctica de la oraci´n en a o LO en una estructura sint´ctica v´lida para la oraci´n en LM y a a o ... . . . substituyen las palabras de la oraci´n en LO por equivalentes o adecuados en LM. . . . . . haciendo las dos operaciones bastante independientemente. 28
  126. 126. ¿C´mo funciona la TA? [6] o Esto nos permite hacer la segunda aproximaci´n [!!]: o La mayor´ de los sistemas de TA no construyen completamente ıa la interpretaci´n, . . . o . . . sino que transforman la estructura sint´ctica de la oraci´n en a o LO en una estructura sint´ctica v´lida para la oraci´n en LM y a a o ... . . . substituyen las palabras de la oraci´n en LO por equivalentes o adecuados en LM. . . . . . haciendo las dos operaciones bastante independientemente. 28
  127. 127. ¿C´mo funciona la TA? [6] o Esto nos permite hacer la segunda aproximaci´n [!!]: o La mayor´ de los sistemas de TA no construyen completamente ıa la interpretaci´n, . . . o . . . sino que transforman la estructura sint´ctica de la oraci´n en a o LO en una estructura sint´ctica v´lida para la oraci´n en LM y a a o ... . . . substituyen las palabras de la oraci´n en LO por equivalentes o adecuados en LM. . . . . . haciendo las dos operaciones bastante independientemente. 28
  128. 128. ¿C´mo funciona la TA? [6] o Esto nos permite hacer la segunda aproximaci´n [!!]: o La mayor´ de los sistemas de TA no construyen completamente ıa la interpretaci´n, . . . o . . . sino que transforman la estructura sint´ctica de la oraci´n en a o LO en una estructura sint´ctica v´lida para la oraci´n en LM y a a o ... . . . substituyen las palabras de la oraci´n en LO por equivalentes o adecuados en LM. . . . . . haciendo las dos operaciones bastante independientemente. 28
  129. 129. ¿C´mo funciona la TA? [6] o Esto nos permite hacer la segunda aproximaci´n [!!]: o La mayor´ de los sistemas de TA no construyen completamente ıa la interpretaci´n, . . . o . . . sino que transforman la estructura sint´ctica de la oraci´n en a o LO en una estructura sint´ctica v´lida para la oraci´n en LM y a a o ... . . . substituyen las palabras de la oraci´n en LO por equivalentes o adecuados en LM. . . . . . haciendo las dos operaciones bastante independientemente. 28
  130. 130. ¿C´mo funciona la TA? [7] o Para programar un sistema de TA es preciso formular todos los proce- sos de traducci´n de forma expl´ o ıcita y mecanizable (¡adi´s “intuici´n o o ling¨´ uıstica”!). Adem´s, la mecanizaci´n debe ser eficiente (programas r´pidos y a o a compactos) y se debe llevar a cabo en un tiempo razonable: Esto exige una reflexi´n ling¨´ o uıstica (traductol´gica) sobre los pro- o cesos de traducci´n por parte de los dise˜adores del sistema. o n Adem´s, puede comportar m´s aproximaciones, simplificaciones, a a compromisos y sacrificios. 29
  131. 131. ¿C´mo funciona la TA? [7] o Para programar un sistema de TA es preciso formular todos los proce- sos de traducci´n de forma expl´ o ıcita y mecanizable (¡adi´s “intuici´n o o ling¨´ uıstica”!). Adem´s, la mecanizaci´n debe ser eficiente (programas r´pidos y a o a compactos) y se debe llevar a cabo en un tiempo razonable: Esto exige una reflexi´n ling¨´ o uıstica (traductol´gica) sobre los pro- o cesos de traducci´n por parte de los dise˜adores del sistema. o n Adem´s, puede comportar m´s aproximaciones, simplificaciones, a a compromisos y sacrificios. 29
  132. 132. ¿C´mo funciona la TA? [7] o Para programar un sistema de TA es preciso formular todos los proce- sos de traducci´n de forma expl´ o ıcita y mecanizable (¡adi´s “intuici´n o o ling¨´ uıstica”!). Adem´s, la mecanizaci´n debe ser eficiente (programas r´pidos y a o a compactos) y se debe llevar a cabo en un tiempo razonable: Esto exige una reflexi´n ling¨´ o uıstica (traductol´gica) sobre los pro- o cesos de traducci´n por parte de los dise˜adores del sistema. o n Adem´s, puede comportar m´s aproximaciones, simplificaciones, a a compromisos y sacrificios. 29
  133. 133. ¿C´mo funciona la TA? [7] o Para programar un sistema de TA es preciso formular todos los proce- sos de traducci´n de forma expl´ o ıcita y mecanizable (¡adi´s “intuici´n o o ling¨´ uıstica”!). Adem´s, la mecanizaci´n debe ser eficiente (programas r´pidos y a o a compactos) y se debe llevar a cabo en un tiempo razonable: Esto exige una reflexi´n ling¨´ o uıstica (traductol´gica) sobre los pro- o cesos de traducci´n por parte de los dise˜adores del sistema. o n Adem´s, puede comportar m´s aproximaciones, simplificaciones, a a compromisos y sacrificios. 29
  134. 134. ¿C´mo funciona la TA? [7] o Para programar un sistema de TA es preciso formular todos los proce- sos de traducci´n de forma expl´ o ıcita y mecanizable (¡adi´s “intuici´n o o ling¨´ uıstica”!). Adem´s, la mecanizaci´n debe ser eficiente (programas r´pidos y a o a compactos) y se debe llevar a cabo en un tiempo razonable: Esto exige una reflexi´n ling¨´ o uıstica (traductol´gica) sobre los pro- o cesos de traducci´n por parte de los dise˜adores del sistema. o n Adem´s, puede comportar m´s aproximaciones, simplificaciones, a a compromisos y sacrificios. 29
  135. 135. ¿C´mo funciona la TA? [7] o Para programar un sistema de TA es preciso formular todos los proce- sos de traducci´n de forma expl´ o ıcita y mecanizable (¡adi´s “intuici´n o o ling¨´ uıstica”!). Adem´s, la mecanizaci´n debe ser eficiente (programas r´pidos y a o a compactos) y se debe llevar a cabo en un tiempo razonable: Esto exige una reflexi´n ling¨´ o uıstica (traductol´gica) sobre los pro- o cesos de traducci´n por parte de los dise˜adores del sistema. o n Adem´s, puede comportar m´s aproximaciones, simplificaciones, a a compromisos y sacrificios. 29
  136. 136. ¿C´mo funciona la TA? [8] o Por tanto... Podemos esperar que un buen sistema de TA nos libere de la parte m´s mec´nica (mecanizable) de la tarea de traducci´n. a a o Pero no podemos esperar —por bueno que sea— que comprenda el texto, resuelva las ambig¨edades siempre correctamente y produzca u textos en una variante genuina de la lengua meta. 30
  137. 137. ¿C´mo funciona la TA? [8] o Por tanto... Podemos esperar que un buen sistema de TA nos libere de la parte m´s mec´nica (mecanizable) de la tarea de traducci´n. a a o Pero no podemos esperar —por bueno que sea— que comprenda el texto, resuelva las ambig¨edades siempre correctamente y produzca u textos en una variante genuina de la lengua meta. 30
  138. 138. ¿C´mo funciona la TA? [8] o Por tanto... Podemos esperar que un buen sistema de TA nos libere de la parte m´s mec´nica (mecanizable) de la tarea de traducci´n. a a o Pero no podemos esperar —por bueno que sea— que comprenda el texto, resuelva las ambig¨edades siempre correctamente y produzca u textos en una variante genuina de la lengua meta. 30
  139. 139. ¿Por qu´ es dif´ la TA? [1] e ıcil Los cuatro problemas de la traducci´n autom´tica (Arnold 2003): o a 1. El problema del an´lisis a 2. El problema de la s´ ıntesis 3. El problema de la transferencia 4. El problema de la descripci´n o 31
  140. 140. ¿Por qu´ es dif´ la TA? [1] e ıcil Los cuatro problemas de la traducci´n autom´tica (Arnold 2003): o a 1. El problema del an´lisis a 2. El problema de la s´ ıntesis 3. El problema de la transferencia 4. El problema de la descripci´n o 31
  141. 141. ¿Por qu´ es dif´ la TA? [1] e ıcil Los cuatro problemas de la traducci´n autom´tica (Arnold 2003): o a 1. El problema del an´lisis a 2. El problema de la s´ ıntesis 3. El problema de la transferencia 4. El problema de la descripci´n o 31
  142. 142. ¿Por qu´ es dif´ la TA? [1] e ıcil Los cuatro problemas de la traducci´n autom´tica (Arnold 2003): o a 1. El problema del an´lisis a 2. El problema de la s´ ıntesis 3. El problema de la transferencia 4. El problema de la descripci´n o 31
  143. 143. ¿Por qu´ es dif´ la TA? [1] e ıcil Los cuatro problemas de la traducci´n autom´tica (Arnold 2003): o a 1. El problema del an´lisis a 2. El problema de la s´ ıntesis 3. El problema de la transferencia 4. El problema de la descripci´n o 31

×