AT-eus Prueba viabilidad  traducción automática euskara
índice Alcance y objetivos de la prueba Metodología utilizada Equipo de trabajo: personas y funciones Casos resueltos para...
alcance y objetivos <ul><li>Boletines Oficiales / Aldizkari Ofizialak </li></ul><ul><ul><ul><li>BAO (± 80Mb) </li></ul></u...
alcance y objetivos: contrato Objetivos de la prueba <ul><li>Subcorpus (año 2000) </li></ul><ul><li>Vocabulario  2.000 tér...
alcance y objetivos: procesado Material procesado <ul><ul><li>Corpus  depurado de 100MB reales de texto   </li></ul></ul><...
alcance y objetivos: validado Material validado para la prueba <ul><ul><li>Subcorpus  de 736 KB.   </li></ul></ul><ul><ul>...
enfoque: explicación <ul><ul><li>equivalencia por reglas  (transferencia, interlingua) </li></ul></ul><ul><ul><ul><li>cobe...
enfoque: cobertura  calidad perfecta utilizable ilustrativa CAT MT cobertura comprensible
enfoque: ATS híbrida ATS, estrategia híbrida: corpus + reglas (álgebra) <ul><ul><li>Integración de reglas y ejemplos en mi...
enfoque: fórmulas “ Cuando exista una diferencia de altura entre las rasantes del perímetro del edificio tal que permita i...
enfoque: fórmulas “ Eraikinaren perimetroko sestren arteko altuera diferentzia dagoenean, eta diferentzia horrek erdisotok...
<ul><li>“ Eraikinaren perimetroko sestren artean, erdisotoko lokalak argitu edo aparteko sarbidea emateko bestekoa den alt...
<ul><li>“ Eraikinaren perimetroko sestren artean, erdisotoko lokalak argitu edo aparteko sarbidea emateko bestekoa den alt...
enfoque: gramática <ul><ul><ul><li>SN    (COMP_N) + N’ + (Det) </li></ul></ul></ul><ul><ul><ul><li>N’    N + ( (grad) + ...
enfoque: ejemplo1a <ul><ul><ul><li>“ el saldo máximo que se ha alcanzado durante el plazo para comunicar el número de iden...
enfoque: ejemplo1b <ul><ul><ul><li>La naturaleza o clase y número de cuenta u operación, así como el saldo o importe máxim...
enfoque: ejemplo2a <ul><ul><ul><li>Justificación  de  que  la Entidad solicitante se halla al corriente en el cumplimiento...
enfoque: ejemplo2b <ul><ul><ul><li>Justificación  de  que  la Entidad solicitante se halla al corriente en el cumplimiento...
enfoque: ejemplo3a <ul><ul><ul><li>La planificación y ejecución de actuaciones, generales o selectivas, de obtención de in...
enfoque: ejemplo3b <ul><ul><ul><li>La planificación y ejecución de  actuaciones , generales o selectivas,  de obtención de...
enfoque: ejemplo 3c <ul><ul><ul><li>La planificación y ejecución  de  actuaciones ,  generales o selectivas ,  de obtenció...
ejemplos: plantillas Ejemplos de segmentos variables, plantillas:    Ver texto ejemplo “conceder...”
ejemplos: reducción Ejemplos de segmentos variables, plantillas: Conceder a X la deducción por importe de $ por las invers...
ejemplos: nombres propios Reconocimiento de variables     ver texto muestra de nombres propios
enfoque: plantillas y reglas Interacción de plantillas y reglas: “ Se ha constatado, por la presencia en ferias, que las p...
enfoque: plantillas y reglas Interacción de plantillas y reglas: no sólo X sino también Y X ez ezik, baita Y ere X ez ezik...
enfoque: plantillas y reglas Interacción de plantillas y reglas: Los certificados de Hacienda y Seguridad Social deberán s...
enfoque: plantillas y reglas Interacción de plantillas y reglas: tanto X como Y X zein Y bai X bai Y X bezala Y ere X nahi...
metodología aplicada Tratamiento de diccionario y corpus  Análisis de construcciones y “comportamientos” Definición de est...
metodología: tareas Tratamiento de diccionario y corpus  <ul><ul><li>Alineación </li></ul></ul><ul><ul><ul><li>-  recurso:...
metodología: análisis Revisión del corpus para detectar los casos Identificación de construcciones Agrupación por estructu...
metodología: reglas Estrategia de etiquetado Asignación de rasgos y atributos Definición de reglas Comprobación y correcci...
equipo de trabajo Dirección del proyecto Coordinación de recursos Tecnología y estrategia de desarrollo Procesado de corpu...
casos resueltos Concordancia de SSNN + V Sintagma nominal Sintagma postposicionales y adverbiales Cláusulas de relativo y ...
casos resueltos: sn1 Sintagma nominal <ul><ul><li>“ ... la decisión estratégica del secretario...” </li></ul></ul><ul><ul>...
casos resueltos: sn1 Sintagma nominal <ul><ul><li>“ ... el alcalde de Bilbao...” </li></ul></ul><ul><ul><li>“ ... Bilboko ...
casos resueltos: sn1 Sintagma nominal <ul><ul><li>“ ... La planificación de Bilbao..” </li></ul></ul><ul><ul><li>“ ... Bil...
casos resueltos: sn2 Sintagma nominal <ul><ul><li>“ ... alguna decisión contradictoria del secretario general de la junta....
casos resueltos: concordancia1 Concordancia de SSNN + V <ul><ul><li>“ ... los facultativos pagaron las tasas a los secreta...
casos resueltos: concordancia2 Concordancia de SSNN + V <ul><ul><li>“ ... aquella decisión comercial del secretario genera...
casos resueltos: sp y adv Sintagma postposicionales y adverbiales <ul><ul><li>“ ... los beneficiarios evitaron algunos err...
casos resueltos: relativo Cláusulas de relativo y completivas <ul><ul><li>“ ... el boletín que publicó el secretario infor...
casos resueltos: completiva Cláusulas de relativo y completivas <ul><ul><li>“ ... algunos aficionados destacaron que super...
casos resueltos: conjuntivas Conjuntivas y adversativas <ul><ul><li>“ ... el secretario rectificó la presentación y el dir...
control de calidad Revisión acepciones del diccionario Funcionamiento de las tablas y reglas Definición del subcorpus de t...
pruebas AT.eus Acceso por internet al servicio interactivo    Automatic Translation Server. Euskara.
fase2, desarrollo definitivo 1 1.- Determinación de dominios (edu, legal, banca, info) <ul><li>2.- Ampliación de </li></ul...
fase2, desarrollo definitivo 2 <ul><li>4.- Aspectos tecnológicos </li></ul><ul><ul><ul><li>categorizador de textos </li></...
AT-eus fin Gracias por vuestra atención
Upcoming SlideShare
Loading in …5
×

AutomaticTrans: Resultados del estudio de viabilidad ESP-EUS (28-02-2003)

1,468
-1

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,468
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • Bienvenidos a la presentación de las pruebas realizadas para demostrar la viabilidad de AT como plataforma de desarrollo de un traductor automático de español a euskara y de euskara a español utilizando la tecnología registrada por AT, Automatic Translation Server. Las pruebas realizadas en estos tres meses han abordado la traducción español-euskara. Al final, cuando presentemos las conclusiones, haremos algunas estimaciones en cuanto la continuación del desarrollo y la posible reversibilidad de los procesos para cubrir el euskara-español .
  • AutomaticTrans: Resultados del estudio de viabilidad ESP-EUS (28-02-2003)

    1. 1. AT-eus Prueba viabilidad traducción automática euskara
    2. 2. índice Alcance y objetivos de la prueba Metodología utilizada Equipo de trabajo: personas y funciones Casos resueltos para la prueba Validación y control de calidad Pruebas de traducción Fase2. Plazos y objetivos Enfoque
    3. 3. alcance y objetivos <ul><li>Boletines Oficiales / Aldizkari Ofizialak </li></ul><ul><ul><ul><li>BAO (± 80Mb) </li></ul></ul></ul><ul><ul><ul><li>GAO (± 20Mb) </li></ul></ul></ul><ul><ul><ul><li>Años 1996-2000 </li></ul></ul></ul><ul><li>Datos cuantitativos </li></ul><ul><ul><li>823.368 elementos alineados (párrafos, oraciones, etc.) </li></ul></ul><ul><ul><li>447.746 elementos repetidos </li></ul></ul><ul><ul><li>277.712 palabras (± 50.000 lexemas) </li></ul></ul><ul><ul><li>± 20 % entidades con nombre propio : pers, org, doc, top, etc . </li></ul></ul><ul><ul><li>342.492 segmentos (fórmulas, plantillas, términos de especialidad) </li></ul></ul><ul><ul><li>2 a 30 variantes (en la traducción) </li></ul></ul><ul><ul><li>± 20 categorías textuales (géneros) </li></ul></ul>Material disponible (fondos)
    4. 4. alcance y objetivos: contrato Objetivos de la prueba <ul><li>Subcorpus (año 2000) </li></ul><ul><li>Vocabulario 2.000 términos </li></ul><ul><li>Construcciones : 200 segmentos </li></ul><ul><li>Reglas : 25 reglas </li></ul>
    5. 5. alcance y objetivos: procesado Material procesado <ul><ul><li>Corpus depurado de 100MB reales de texto </li></ul></ul><ul><ul><li>823.368 e lementos alineados </li></ul></ul><ul><ul><li>62.582 palabras d iccionario El h uyar </li></ul></ul><ul><ul><li>342.492 s egmentación de BAO </li></ul></ul>
    6. 6. alcance y objetivos: validado Material validado para la prueba <ul><ul><li>Subcorpus de 736 KB. </li></ul></ul><ul><ul><li>4.370 palabras de Elhuyar reetiquetadas </li></ul></ul><ul><ul><li>4.738 palabras e tiquetad as </li></ul></ul><ul><ul><li>3.841 segmentos etiquetados </li></ul></ul><ul><ul><li>435 tablas </li></ul></ul><ul><ul><li>245 reglas </li></ul></ul><ul><li>Subcorpus (año 2000) </li></ul><ul><li>Vocabulario 2.000 términos </li></ul><ul><li>Construcciones : 200 segmentos </li></ul><ul><li>Reglas : 25 reglas </li></ul>
    7. 7. enfoque: explicación <ul><ul><li>equivalencia por reglas (transferencia, interlingua) </li></ul></ul><ul><ul><ul><li>cobertura amplia </li></ul></ul></ul><ul><ul><ul><li>calidad impredecible (traducciones más “literales”) </li></ul></ul></ul><ul><ul><ul><li>baja homogeneidad (léxico) </li></ul></ul></ul>Estrategias de mercado: reglas / analogías <ul><ul><li>equivalencia por analogías (corpora bilingües, ejemplos, MT) </li></ul></ul><ul><ul><ul><li>cobertura limitada: textos de especialidad </li></ul></ul></ul><ul><ul><ul><li>traducciones validadas </li></ul></ul></ul><ul><ul><ul><li>alta homogeneidad (estilo y terminología) </li></ul></ul></ul>
    8. 8. enfoque: cobertura calidad perfecta utilizable ilustrativa CAT MT cobertura comprensible
    9. 9. enfoque: ATS híbrida ATS, estrategia híbrida: corpus + reglas (álgebra) <ul><ul><li>Integración de reglas y ejemplos en misma BBDD (UDB) </li></ul></ul><ul><ul><li>Algoritmo de aplicación: </li></ul></ul><ul><ul><ul><li>Fórmulas </li></ul></ul></ul><ul><ul><ul><li>Plantillas </li></ul></ul></ul><ul><ul><ul><li>Categorías gramaticales </li></ul></ul></ul><ul><ul><li>Clave: estrategia, segmentación y etiquetado </li></ul></ul>
    10. 10. enfoque: fórmulas “ Cuando exista una diferencia de altura entre las rasantes del perímetro del edificio tal que permita iluminar o dar acceso independiente a locales de semisótano, éstos contabilizarán en el cómputo de la superficie construida en una proporción igual a la relación entre la superficie de su fachada sobre rasante respecto a la superficie de su cerramiento perimetral, se halle enterrado o no, computado desde el plano horizontal definido por la rasante de menos cota.” Ejemplos de segmentos uniformes, fórmulas :
    11. 11. enfoque: fórmulas “ Eraikinaren perimetroko sestren arteko altuera diferentzia dagoenean, eta diferentzia horrek erdisotoko lokalak argitu edo horiei sarbide independientea ematen badie, horiek azalera eraikian kontabilizatuko dira, sestra gaineko fatxadaren azaleraren eta perimetroko itxiduraren azaleraren arteko erlazioaren proportzio berean, itxidura hori lurperaturik egon ala ez, eta kota txikieneko sestrak definituriko plano horizontaletik konputaturik.” Ejemplos de segmentos uniformes, fórmulas :
    12. 12. <ul><li>“ Eraikinaren perimetroko sestren artean, erdisotoko lokalak argitu edo aparteko sarbidea emateko bestekoa den altuerako tarte bat dagoenean, hauek, eraikitako azaleraren konputuan kontabilizatuko dira, sestraren gaineko euren fatxadaren azaleraren pareko proportzioan, perimetrozko euren zarraketaren azalerari dagokionean, hau lurraren azpian hala gainean dagoela, kotarik txikiena duen sestrak definitutako plano horizontaletik konputatua.” </li></ul><ul><li>“ Eraikinaren perimetroko lerrokaduren artean dagoen altuera-diferentziak erdisotoak argitzeko edo bertako lokaletara sartzeko modua ematen badu, erdisoto horiek eraikitako azaleraren konputoan sartuko dira, eta sartu ere sestra gainean duten fatxadaren azaleraren eta perimetroaren -zorupekoa zein ez- azaleraren arteko proportzio berean sartuko da.” </li></ul>Variantes en la traducción de fórmulas : enfoque
    13. 13. <ul><li>“ Eraikinaren perimetroko sestren artean, erdisotoko lokalak argitu edo aparteko sarbidea emateko bestekoa den altuerako tarte bat dagoenean, hauek, eraikitako azaleraren konputuan kontabilizatuko dira, sestraren gaineko euren fatxadaren azaleraren pareko proportzioan, perimetrozko euren zarraketaren azalerari dagokionean, hau lurraren azpian hala gainean dagoela, kotarik txikiena duen sestrak definitutako plano horizontaletik konputatua.” </li></ul><ul><li>“ Eraikinaren perimetroko lerrokaduren artean dagoen altuera-diferentziak erdisotoak argitzeko edo bertako lokaletara sartzeko modua ematen badu, erdisoto horiek eraikitako azaleraren konputoan sartuko dira, eta sartu ere sestra gainean duten fatxadaren azaleraren eta perimetroaren -zorupekoa zein ez- azaleraren arteko proportzio berean sartuko da.” </li></ul><ul><li>“ Eraikinaren perimetroaren sestren arteko altueran, erdisotoko lokalak argitzea edo sarrera bananduak ahalbideratzeko aldea dagoenean, hauek eraikitako azaleraren zenbatekoan sartuko dira, bere sestraren gaineko fatxadaren azalera bere itxitura perimetralaren azalerarekiko proportzio batean, lurperaturik egon edo ez, eta kota txikienak definituriko plano horizontaletik zenbatua.” </li></ul><ul><li>“ Eraikinaren perimetroko sestren arteko altuera diferentzia dagoenean, eta diferentzia horrek erdisotoko lokalak argitu edo horiei sarbide independientea ematen badie, horiek azalera eraikian kontabilizatuko dira, sestra gaineko fatxadaren azaleraren eta perimetroko itxiduraren azaleraren arteko erlazioaren proportzio berean, itxidura hori lurperaturik egon ala ez, eta kota txikieneko sestrak definituriko plano horizontaletik konputaturik.” </li></ul>enfoque Variantes en la traducción de fórmulas :
    14. 14. enfoque: gramática <ul><ul><ul><li>SN  (COMP_N) + N’ + (Det) </li></ul></ul></ul><ul><ul><ul><li>N’  N + ( (grad) + A) </li></ul></ul></ul><ul><ul><ul><li>Det  (num) + (def) </li></ul></ul></ul><ul><ul><ul><li>COMP_N  SN + rel </li></ul></ul></ul><ul><ul><ul><li>COMP_N  SP + rel </li></ul></ul></ul><ul><ul><ul><li>COMP_N  O + rel </li></ul></ul></ul>Reglas SN para euskara (Goenaga, 1978) :
    15. 15. enfoque: ejemplo1a <ul><ul><ul><li>“ el saldo máximo que se ha alcanzado durante el plazo para comunicar el número de identificación fiscal” </li></ul></ul></ul>Estructura de SN prevista por las reglas: <ul><ul><ul><li>“ identifikazio fiskaleko zenbakiaren berri emateko epearen barruan lortu denaren gehienezko saldoa” </li></ul></ul></ul>
    16. 16. enfoque: ejemplo1b <ul><ul><ul><li>La naturaleza o clase y número de cuenta u operación, así como el saldo o importe máximo alcanzado durante el plazo para comunicar el número de identificación fiscal. </li></ul></ul></ul>SN reales que aparece en los textos: <ul><ul><ul><li>Kontu edo eragiketaren izaera edo mota eta zenbakia, baita ere identifikazio fiskaleko zenbakiaren berri emateko epearen barruan lortutako gehienezko saldoa edo zenbatekoa. </li></ul></ul></ul>
    17. 17. enfoque: ejemplo2a <ul><ul><ul><li>Justificación de que la Entidad solicitante se halla al corriente en el cumplimiento de sus obligaciones con la Seguridad Social, así como en las tributarias. </li></ul></ul></ul>SN reales que aparece en los textos: <ul><ul><ul><li>Erakunde eskatzaileak Gizarte Segurantzarekin dituen bete-beharrak eta, baita ere, zergari dagozkionak ordainduta dituela agertarazten duen frogagiria. </li></ul></ul></ul>
    18. 18. enfoque: ejemplo2b <ul><ul><ul><li>Justificación de que la Entidad solicitante se halla al corriente en el cumplimiento de sus obligaciones con la Seguridad Social, así como en las tributarias. </li></ul></ul></ul>SN reales que aparece en los textos: <ul><ul><ul><li>Erakunde eskatzaileak Gizarte Segurantzarekin dituen bete-beharrak eta, baita ere, zergari dagozkionak ordainduta dituela agertarazten duen frogagiria. </li></ul></ul></ul>
    19. 19. enfoque: ejemplo3a <ul><ul><ul><li>La planificación y ejecución de actuaciones, generales o selectivas, de obtención de información, así como las relaciones con otras Administraciones a los mismos efectos. </li></ul></ul></ul>SN reales que aparece en los textos: Informazioa lortzeko jarduketak, orokorrak nahiz hautatzezkoak, eta gainerako administrazioarekiko informazio jarduketetako hartuemanak, planifikatu eta burutzea.
    20. 20. enfoque: ejemplo3b <ul><ul><ul><li>La planificación y ejecución de actuaciones , generales o selectivas, de obtención de información , así como las relaciones con otras Administraciones a los mismos efectos. </li></ul></ul></ul>SN reales que aparece en los textos: Informazioa lortzeko jarduketak , orokorrak nahiz hautatzezkoak, eta gainerako administrazioarekiko informazio jarduketetako hartuemanak, planifikatu eta burutzea.
    21. 21. enfoque: ejemplo 3c <ul><ul><ul><li>La planificación y ejecución de actuaciones , generales o selectivas , de obtención de información , así como las relaciones con otras Administraciones a los mismos efectos. </li></ul></ul></ul>Solución: combinar reglas con “plantillas” Informazioa lortzeko jarduketak , orokorrak nahiz hautatzezkoak , eta gainerako administrazioarekiko informazio jarduketetako hartuemanak , planifikatu eta burutzea .
    22. 22. ejemplos: plantillas Ejemplos de segmentos variables, plantillas:  Ver texto ejemplo “conceder...”
    23. 23. ejemplos: reducción Ejemplos de segmentos variables, plantillas: Conceder a X la deducción por importe de $ por las inversiones realizadas en activos fijos materiales nuevos mencionados en el artículo &art.{204} X-ari, &art artikuluan adierazitako gauzazko aktibo finko berrietan egin izandako inbertsioengatik, $ko zenbatekoko kenkaria ematea.{204}
    24. 24. ejemplos: nombres propios Reconocimiento de variables  ver texto muestra de nombres propios
    25. 25. enfoque: plantillas y reglas Interacción de plantillas y reglas: “ Se ha constatado, por la presencia en ferias, que las prendas confeccionadas aquí tienen una gran demanda, [ no sólo en otras comunidades autónomas , sino también en mercados tan dispares como los europeos, Oriente Medio y América ]” “ Hainbat azoketan ikusi ahal izan denez,, hemen eginiko jantziek eskari handia sortarazten dute eta, [beste autonomi elkarte batzutan ez ezik, bai eta arras ezberdinak diren Europako, Ekialde Ertaineko edota Amerikako beste hainbat merkatutan ere]”
    26. 26. enfoque: plantillas y reglas Interacción de plantillas y reglas: no sólo X sino también Y X ez ezik, baita Y ere X ez ezik, Y ere ez bakarrik X, baita Y ere ez bakarrik X, baizik eta Y ere
    27. 27. enfoque: plantillas y reglas Interacción de plantillas y reglas: Los certificados de Hacienda y Seguridad Social deberán ser aportados [tanto por Entidades públicas como privadas ] Ogasun eta Gizarte Segurantzaren ziurtagiriak [ Erakunde publikoek zein pribatuek ] aurkeztu behar izango dituzte
    28. 28. enfoque: plantillas y reglas Interacción de plantillas y reglas: tanto X como Y X zein Y bai X bai Y X bezala Y ere X nahiz Y bai X bai eta Y hala X nola Y X, Y  {sn, sp} tanto <sn> como <sn> ==> <sn>
    29. 29. metodología aplicada Tratamiento de diccionario y corpus Análisis de construcciones y “comportamientos” Definición de estrategia a partir del análisis Tareas operativas Recursos y herramientas
    30. 30. metodología: tareas Tratamiento de diccionario y corpus <ul><ul><li>Alineación </li></ul></ul><ul><ul><ul><li>- recurso: corpus bilingüe paralelo </li></ul></ul></ul><ul><ul><ul><li>- identificar equivalencias </li></ul></ul></ul><ul><ul><li>Segmentación </li></ul></ul><ul><ul><ul><li>- afinar la granularidad de las equivalencias </li></ul></ul></ul><ul><ul><ul><li>- mayor economía / productividad </li></ul></ul></ul><ul><ul><li>Etiquetado para integrar el corpus en la gramática: </li></ul></ul><ul><ul><ul><li>1. generaliza parcialmente los segmentos en plantillas </li></ul></ul></ul><ul><ul><ul><li>2. los segmentos entr a n en el juego de las reglas sintácticas </li></ul></ul></ul><ul><ul><ul><li>3. revisión y validación de categorías y atributos del diccionario </li></ul></ul></ul>
    31. 31. metodología: análisis Revisión del corpus para detectar los casos Identificación de construcciones Agrupación por estructuras Síntesis de comportamientos
    32. 32. metodología: reglas Estrategia de etiquetado Asignación de rasgos y atributos Definición de reglas Comprobación y correcciones
    33. 33. equipo de trabajo Dirección del proyecto Coordinación de recursos Tecnología y estrategia de desarrollo Procesado de corpus Segmentación y análisis Diccionarios y equivalencias Etiquetado Joseba Abaitua coordinar las cuestiones de norma y estilo, definir la estrategia de traducción con tecnología y recursos, seguir el cumplimiento de los objetivos marcados verificar el control de calidad, cumplir con los plazos e hitos trazados Jone Etxeberria, Joan Vilarnau coordinar uso y relaciones del corpus, tecnología y recursos aplicados a etiquetado y segmentación, metodología de trabajo de los lingüistas, desarrollo de tablas y reglas, validación y pruebas. tecnología y recursos aplicados a etiquetado. Úrbez Santana desarrollo especializado segmentador, adaptación generador de plantillas y reglas (ATS-query) adaptación módulos UDB, adatación núcleo ATS Aziz Khalifi desarrollo de rutinas de comparación, extracción selectiva, reformato de recursos al estándar de tratamiento, alimentación y soporte a las pruebas, administración del corpus y de los resultados Ainhoa Sánchez, Joan Vilarnau procesado de ELHUYAR, selección de equivalencias, Etiquetado con atributos especializados ATS. Amaia Santamaría, Joseba Abaitua revisión y análisis de corpus, extracción comportamientos, preparación de estructuras, validación y pruebas Miren Pérez, Olatz de Andrés, Ainhoa Sánchez segmentado de textos en distintos rangos, etiquetado de segmentos de pruebas, validación y corrección
    34. 34. casos resueltos Concordancia de SSNN + V Sintagma nominal Sintagma postposicionales y adverbiales Cláusulas de relativo y completivas Conjuntivas y adversativas
    35. 35. casos resueltos: sn1 Sintagma nominal <ul><ul><li>“ ... la decisión estratégica del secretario...” </li></ul></ul><ul><ul><li>“ ... idazkariaren erabaki estrategikoa...” </li></ul></ul>
    36. 36. casos resueltos: sn1 Sintagma nominal <ul><ul><li>“ ... el alcalde de Bilbao...” </li></ul></ul><ul><ul><li>“ ... Bilboko alkatea...” </li></ul></ul>
    37. 37. casos resueltos: sn1 Sintagma nominal <ul><ul><li>“ ... La planificación de Bilbao..” </li></ul></ul><ul><ul><li>“ ... Bilboren plangintzaa...” </li></ul></ul>
    38. 38. casos resueltos: sn2 Sintagma nominal <ul><ul><li>“ ... alguna decisión contradictoria del secretario general de la junta...” </li></ul></ul><ul><ul><li>“ ... batzordearen idazkari orokoraren erabaki kontraesankorren bat...” </li></ul></ul>
    39. 39. casos resueltos: concordancia1 Concordancia de SSNN + V <ul><ul><li>“ ... los facultativos pagaron las tasas a los secretarios...” </li></ul></ul><ul><ul><li>“ ... goi-mailako teknikariek tasaak idazkariakri ordaindu zizkieten... ” </li></ul></ul>
    40. 40. casos resueltos: concordancia2 Concordancia de SSNN + V <ul><ul><li>“ ... aquella decisión comercial del secretario general de las empresas de nueva creación de Vitoria especificó las rentas de los minusválidos...” </li></ul></ul><ul><ul><li>“ ... Gasteizko enpresa sortuberriakakren idazkari orokoraren erabaki komertzial hurak minusbaliatuakren errentaak zehaztu zituen... ” </li></ul></ul>
    41. 41. casos resueltos: sp y adv Sintagma postposicionales y adverbiales <ul><ul><li>“ ... los beneficiarios evitaron algunos errores en enero...” </li></ul></ul><ul><ul><li>“ ... onuradunek akats batzuk urtarrilan ekidin zituzten...” </li></ul></ul>
    42. 42. casos resueltos: relativo Cláusulas de relativo y completivas <ul><ul><li>“ ... el boletín que publicó el secretario informó a los ayudantes...” </li></ul></ul><ul><ul><li>“ ... idazkariak argitaratu zuenn buletinak laguntzaileakri informatu zien...” </li></ul></ul>
    43. 43. casos resueltos: completiva Cláusulas de relativo y completivas <ul><ul><li>“ ... algunos aficionados destacaron que supervisaron el trabajo del vecindario...” </li></ul></ul><ul><ul><li>“ ... zale batzukk auzoteriaaren lana gainbegiratu zutenla azpimarratu zuten...” </li></ul></ul>
    44. 44. casos resueltos: conjuntivas Conjuntivas y adversativas <ul><ul><li>“ ... el secretario rectificó la presentación y el director supervisó el trabajo...” </li></ul></ul><ul><ul><li>“ ... idazkariak aurkezpena zuzendu zuen eta zuzendariak lana gainbegiratu zuen...” </li></ul></ul>
    45. 45. control de calidad Revisión acepciones del diccionario Funcionamiento de las tablas y reglas Definición del subcorpus de trabajo Revisión de traducciones Pruebas de segmentos (casos) Realimentación del ATeus
    46. 46. pruebas AT.eus Acceso por internet al servicio interactivo  Automatic Translation Server. Euskara.
    47. 47. fase2, desarrollo definitivo 1 1.- Determinación de dominios (edu, legal, banca, info) <ul><li>2.- Ampliación de </li></ul><ul><ul><ul><li>cobertura (gramatical, léxica, estilística) </li></ul></ul></ul><ul><ul><ul><li>géneros y dominios (disponibilidad corpora) </li></ul></ul></ul><ul><li>3.- control de calidad </li></ul><ul><ul><ul><li>diccionario de equivalencias (ambigüedades, polisemias) </li></ul></ul></ul><ul><ul><ul><li>homogeneidad (terminológica, estilística) </li></ul></ul></ul><ul><ul><ul><li>normalización de variantes </li></ul></ul></ul>
    48. 48. fase2, desarrollo definitivo 2 <ul><li>4.- Aspectos tecnológicos </li></ul><ul><ul><ul><li>categorizador de textos </li></ul></ul></ul><ul><ul><ul><li>reconocedor de nombres propios </li></ul></ul></ul><ul><ul><ul><li>adaptaciones necesarias </li></ul></ul></ul><ul><li>5.- estudios lingüísticos </li></ul><ul><ul><ul><li>subcategorización </li></ul></ul></ul><ul><ul><ul><li>asimetrías (léxicas, estructurales, estilísticas) </li></ul></ul></ul><ul><ul><ul><li>modismos </li></ul></ul></ul><ul><ul><ul><li>unidades semiológicas </li></ul></ul></ul>6.- reversibilidad (eus-esp)
    49. 49. AT-eus fin Gracias por vuestra atención

    ×