Anabela Barreiro - Hibridização de TA

487 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
487
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
13
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Anabela Barreiro - Hibridização de TA

  1. 1. 1Como Transformar um Sistema de TraduçãoAutomática por Regras num Sistema Híbrido?Anabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  2. 2. 2 Estado da Arte em Tradução Automática– Sistemas por regras versus sistemas estatísticos OpenLogos – Plataforma para Sistema Híbrido– Descrição do sistema, arquitetura, características, etc. Como Transformar OpenLogos num Sistema Híbrido– Trabalho futuro Exploração do OpenLogos– criação de novos recursos e aplicações Divulgação, esforços, apoio– Disponibilidade dos recursos gratuitos do OpenLogosSumárioAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  3. 3. 3 Investigadores e criadores de sistemas de TA têm um objetivo principal: criarsistemas que produzam tradução de alta qualidade comparável à que éproduzida por tradutores humanos. Décadas de investigação resultaram na invenção e aperfeiçoamento de métodosestatísticos que aceleram o processo de tradução Desenvolveram-se recursos linguísticos de melhor qualidade, em maiorquantidade e para mais línguas Os avanços alcançados em diferentes aproximações e técnicas de TA tornam-se umcampo fértil para o desenvolvimento de uma nova geração de sistemas de TAlinguisticamente mais avançada: os sistemas híbridos Reunir métodos diferentes, com os seus pontos fortes, fortificará e melhorará a TAEstado da Arte em Tradução Automáticavisão otimista…Anabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  4. 4. 4 A TA não é um problema resolvido – há erros que perduram depois dedécadas de investigação na área Sistemas por regras envolvem um grande investimento de tempo erecursos humanos (= dinheiro) Sistemas estatísticos precisam de enormes quantidades de corporaparalelos, que para algumas línguas não existem e para outras línguasexistem mas são de má qualidade. A hibridização de sistemas de TA é uma linha de investigaçãopromissoraAnabela Barreiro I Conferência Internacional de Tradução e TecnologiaEstado da Arte em Tradução Automáticaa realidade…
  5. 5. 5 Não precisam de corpora paralelos Produzem tradução de boa qualidade compoucos dados e poucas regras Funcionam bem em domínios especializados, com bons dicionários eterminologias De construção morosa E muito cara… Envolvem recursos humanos muito especializados Conhecimentos linguísticos avançados para cada par de línguasAnabela Barreiro I Conferência Internacional de Tradução e TecnologiaVantagens e Desvantagens dos Sistemas por Regras
  6. 6. 6 Cometem erros linguísticos crassos resolvidos há 20 anos por sistemaspor regras. Mesmo com muitos dados, é necessário fazerpós-edição de erros muito simples (ex: concordância entre substantivo eadjetivo qualificativo; concordância entre sujeito e verbo, etc.) É possível desenvolver um sistema estatístico muito rapidamente, bastaque existam alguns corpora paralelos Muito mais barato Não são necessários muitos recursos humanos(especializados)Vantagens e Desvantagens dos Sistemas EstatísticosAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  7. 7. 7Frase original em inglês Tradução do OpenLogos(RBMT)Tradução do Google Translate(SMT)Kennedy works. Kennedy trabalha. Kennedy funciona.Kennedy showed the office to Wayne. Kennedy mostrou o escritório a Wayne. Kennedy mostrou o escritório para Wayne.Kennedy showed Wayne the office. Kennedy mostrou o escritório a Wayne. Kennedy mostrou Wayne no escritório.Kennedy became a manager. Kennedy tornou-se gerente. Kennedy se tornou um gerente.Kennedy is working. Kennedy está trabalhando. Kennedy está funcionando.She hired him. Ela contratou-o. Ela o contratou.He hired her. Ele contratou-a. Ele a contratou.He showed it to her. Ele mostrou-o a ela. Ele mostrou a ela.He showed it to Mary. Ele mostrou-o a Mary. Ele mostrou a Maria.He interviewed them. Ele entrevistou-os. Ele entrevistou-los.They interviewed him. Eles entrevistaram-na. Eles entrevistaram ele.Kennedy interviewed me. Kennedy entrevistou-me. Kennedy me entrevistou.We interviewed Kennedy. Entrevistámos Kennedy. Entrevistamos Kennedy.Kennedy interviewed us. Kennedy entrevistou-nos. Kennedy nos entrevistaram.You interviewed Kennedy. Você entrevistou Kennedy. Você entrevistou Kennedy.Kennedy interviewed you. Kennedy entrevistou-o. Kennedy entrevistei.She and I interviewed Kennedy. Ela e eu entrevistámos Kennedy. Ela e eu entrevistei Kennedy.I and she interviewed Kennedy. Eu e ela entrevistámos Kennedy. Eu e ela entrevistou Kennedy.Me and her interviewed Kennedy. Eu e ela entrevistámos Kennedy. Eu e ela entrevistou Kennedy.Her and me interviewed Kennedy. Ela e eu entrevistámos Kennedy. Ela e me entrevistou Kennedy.Kennedy interviewed her and me. Kennedy entrevistou a ela e a mim. Kennedy entrevistou ela e eu.Kennedy interviewed me and her. Kennedy entrevistou a mim e a ela. Kennedy me e seu entrevistado.Anabela Barreiro I Conferência Internacional de Tradução e TecnologiaSistema por Regras versus Sistema Estatísticoevidência empírica
  8. 8. 8Frase original em inglês Tradução do OpenLogos(RBMT)Tradução do Google Translate(SMT)She manages whom? Ela dirige quem? Ela consegue quem?She manages who? Ela dirige quem? Ela consegue quem?She showed whom an office? Ela mostrou quem um escritório? Ela mostrou que um escritório?She showed who an office? Ela mostrou quem um escritório? Ela mostrou que um escritório?Whom does she work for? Quem trabalha ela para? Quem ela trabalha?Who does she work for? Quem trabalha ela para? Quem é que ela trabalha?It is time for an interview. É o tempo para uma entrevista. Está na hora de uma entrevista.It is true that Kennedy hired Wayne. É verdadeiro que Kennedy contratou Wayne. É verdade que Kennedy contratou Wayne.There are programmers. Há programadores. Existem programadores.There are programmers working for Michael. Há programadores que trabalham para Michael. Existem programadores que trabalham para Michael.There are programmers older than Michael. Há programadores mais velhos que Michael. Há programadores mais velhos do que Michael.There stands in the office a bookcase. Está de pé uma estante no escritório aí. Não está no escritório uma estante.A manager works. Um gerente trabalha. A gerente funciona.Managers work. Os gerentes trabalham. Gerentes de trabalho.Kennedy hired this employee. Kennedy contratou este empregado. Kennedy contratou este funcionário.Kennedy hired these employees. Kennedy contratou estes empregados. Kennedy contratado esses funcionários.List women who have bookcases. Enumere mulheres que têm estantes. Lista de mulheres que têm estantes.List bookcases which women have. Enumere estantes que as mulheres têm. Lista de estantes que as mulheres têm.The woman evaluated herself. A mulher avaliou-se. A mulher avaliou a si mesma.The women evaluated themselves. As mulheres avaliaram-se. As mulheres avaliadas si.Anabela Barreiro I Conferência Internacional de Tradução e TecnologiaSistema por Regras versus Sistema Estatísticoevidência empírica
  9. 9. 9Frase original em inglês Tradução do OpenLogos(RBMT)Tradução do Google Translate(SMT)Kennedy hired women who were competent.Kennedy contratou mulheres que foramcompetentes.Kennedy contratou mulheres que estavamcompetente.Kennedy hired a woman who Wayne interviewed.Kennedy contratou uma mulher quem Wayneentrevistou.Kennedy contratou uma mulher que Wayneentrevistado.Kennedy hired a woman who Wayne approved of.Kennedy contratou uma mulher que Wayneaprovou.Kennedy contratou uma mulher que aprovado deWayne.Kennedy has a bookcase which is heavy. Kennedy tem uma estante que é pesada. Kennedy tem uma estante que é pesado.Kennedy has a bookcase that is heavy. Kennedy tem uma estante que é pesada. Kennedy tem uma estante que é pesado.Kennedy has an office that Wayne showed Mary.Kennedy tem um escritório que Wayne mostrou aMary.Kennedy tem um escritório que Wayne mostrouMary.Kennedy has an office Wayne showed Mary.Kennedy tem um escritório que Wayne mostrou aMary. Kennedy tem um escritório Wayne mostrou Mary.Kennedy hired a woman Wayne interviewed.Kennedy contratou uma mulher que Wayneentrevistou.Kennedy contratou uma mulher Wayneentrevistado.Kennedy hired a woman Wayne approved of.Kennedy contratou uma mulher que Wayneaprovou. Kennedy contratou uma mulher Wayne aprovado.List managers of projects who work for Kennedy.Enumere gerentes de projectos que trabalham paraKennedy.Gerentes lista de projetos que trabalham paraKennedy.Kennedy hired anyone competent to work on theproject.Kennedy contratou qualquer um competente detrabalhar no projecto.Kennedy contratou ninguém competente paratrabalhar no projeto.Kennedy approved of who Mary hired. Kennedy aprovou quem Mary contratou. Kennedy aprovou que Mary contratado.Kennedy approved of where Mary worked. Kennedy aprovou de onde Mary trabalhou. Kennedy aprovado de onde Mary trabalhou.Kennedy hired a woman of whom Mary approved. Kennedy contratou uma mulher que Mary aprovou.Kennedy contratou uma mulher de quem Maryaprovado.Is Kennedy competent? É competente Kennedy? Kennedy é competente?Anabela Barreiro I Conferência Internacional de Tradução e TecnologiaSistema por Regras versus Sistema Estatísticoevidência empírica
  10. 10. 10 Integração de conhecimento linguístico em sistemas de traduçãoautomática estatística (SMT) Aplicação de técnicas estatísticas de alinhamento a sistemas detradução automática baseados em regras (RBMT)Hibridização em Tradução AutomáticaAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  11. 11. 11 Estado da Arte em Tradução Automática– Sistemas por regras versus sistemas estatísticos OpenLogos – Plataforma para Sistema Híbrido– Descrição do sistema, arquitetura, características, etc. Como Transformar OpenLogos num Sistema Híbrido– Trabalho futuro Exploração do OpenLogos– criação de novos recursos e aplicações Divulgação, esforços, apoio– Disponibilidade dos recursos gratuitos do OpenLogosSumárioAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  12. 12. 12 Legado Logos - um dos primeiros sistemas de TA no mundo – 1970-2001– Considerado de alta qualidade, com grande ênfase na semântica – aproximação atravésda análise da língua de forma a que esta seja “entendida” pelo sistema computacional.– A aproximação Logos assemelha-se em espírito à aproximação estatística na medida emque as regras são aplicadas a padões em contexto (semântico-sintáticos)– O conhecimento linguístico envolvido no sistema permite complementar a TA estatísticacolmatando dificuldades e fraquezas apresentadas pelos métodos estatísticos. Produto comercial – desenvolvido pela empresa norte-americana Logos Corporation– Estados Unidos, Alemanha e Itália– 25-100 empregados - 30 anos– Investimento de 80 milhões de dólares– 8 pares de línguas: EN-GE, EN-FR, EN-ES, EN-IT, EN-PT e GR-EN, GE-FR, GE-IT– Clientes em 12 países incluiram: Ericsson of Sweden, the Canadian Secretary of State,SAP, Siemens-Nixdorg, Oce Netherlands, and Union FenosaOpenLogos – Plataforma para Sistema HíbridoAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  13. 13. 13 Disponível em código aberto– adaptado pelo DFKI e no SourceForge– Qualquer utilizador pode ter acesso à tecnologia– Disponível para uso comercial e privado Adaptável às necessidades do utilizador– Desenvolvimento de novos recursos linguísticos (bases de dados de regras,vocabulários, dicionários bilingues, corpora, etc.) Oportunidade para a prestação de serviços– Serviços linguísticos e técnicos e/ou apoio ao cliente– Integração do sistema/dados noutros pacotes (incluir OpenLogos nos 5maiores distribuidores de Linux pode representar uma fonte de rendimentossignificativa)OpenLogos – Plataforma para Sistema HíbridoAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  14. 14. 14 Investigação e uso académico– Dar vida a uma tecnologia hibernada (metáfora de Fénix)– Componente de regras e representação linguística - plataforma ideal para umsistema híbrido de TA linguisticamente mais sofisticado– TA para universidades, unidades de investigação e institutos governamentais Línguas minoritárias, negligenciadas e em vias de extinção– Criação de novos sistemas de TA que contemplem estas línguas– Não contempladas em programas comerciais– Resposta a programas de administrações e ONGs para a promoção eressurgência destas línguas Avanços científicos para a comunidade de PLN/LCOpenLogos – Plataforma para Sistema HíbridoAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  15. 15.  Sistema multi-alvo– A análise numa língua-fonte pode gerar qualquer número de línguas-alvo Análise linguística completa– Dicionários extensíveis com alicerces semântico-sintáticos subjacentes– Morfologia– Significado (semântica)– Estrutura e função gramatical (sintaxe)– A análise sintática é específica apenas da língua-fonte; a geração é específica dalíngua-alvo.– A análise abrangente permite construir uma tradução completa e idiomaticamentecorreta na língua-alvo. Arquitetura em forma de oleoduto Software de língua neutra– Todo o conhecimento linguístico está numa base de dados relacional15Caraterísticas do OpenLogosAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  16. 16.  Linguagem de Abstração Semântico-Sintática (representação SAL)– Taxonomia hierárquica com características ontológicas– Todas as frases da língua natural (LN) que entram no sistema são imediatamenteconvertidas para frases SAL– SAL é a força motriz do processo de tradução no sistema OpenLogos– O parser (analisador sintático) consegue melhores resultados devido à SAL do que umanalisador puramente sintático conseguiria Processamento semântico– Tabela Semântica (= SEMTAB) contém milhares de regras transformacionais Características de interlíngua– Inicialmente um sistema por transferência, evoluiu para um sistema com característicasde interlíngua, que são inerentes ao sistema.16Características do OpenLogosAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  17. 17. 17FormatoRES1RES2P1P2P3P4ST4T3T1T2GENFormatoSEMTABRegras-alvo SEMTABSEMTABRegras SALRegras-alvoRegras-alvo• Modular• Processamento incremental• Sistema multi-alvo• Análise de baixo para cima• DeterminísticoEntradaSaída SEMTABArquiteturaAnabela Barreiro I Conferência Internacional de Tradução e TecnologiaL2F – INESC-ID FLUP, Porto, 13-14 de Maio de 2013
  18. 18. 18Segmentação em orações ways of cooking lentils - VResolução de homógrafos types of [cooking utensils] - ADJA análise determinística obriga a que todas as ambiguidades POS sejam resolvidas(98% precisão)FormatoRES2RES1Regras SALSEMTABEntradanosistemaAnálise Incremental da Língua-FonteAnabela Barreiro I Conferência Internacional de Tradução e TecnologiaL2F – INESC-ID FLUP, Porto, 13-14 de Maio de 2013
  19. 19. 19Parse1Parse3Parse4SParse2• SN simples• resoluçãosemântica• SN Prep SN• oraçõesrelativas•resoluçãosemântica• semânticados verbos•SNcomplexos• oraçõessimples•resoluçãosemântica•Ordem emfrasescomplexas• resoluçãosemânticaRegras SALSEMTABEx.: a book on the presidencyon = about; concerning≠ a book on the tableon = over19Análise Incremental da Língua-FonteAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  20. 20. SAL - Semantico-syntactic Abstraction Language SAL Taxonomy: 3 levels organized hierarchically– Superconjuntos (supersets)/ Conjuntos (sets)/ Subconjuntos (subsets) Continuum semântico-sintáctico da palavra da LN até à categoria gramatical(POS)– Palavra literal: airport– Morfema raíz: port– SAL Subset: Agfunc (agentive functional location)– SAL Set: func (functional location)– SAL Superset: PL (place)– Categoria: NTanto o fluxo de entrada, como as regras são expressas em SAL20Linguagem de Representação SALAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  21. 21. 21Ex.: two pieces of cakeAnálise do SN:- morfologia plural de pieces- semântica de cakeDesenvolvido:- indutivamente- por tentativa-erro- ao longo dos anos- pela equipa de desenvolvimentoSuperconjuntos SAL: SubstantivosAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  22. 22. 22Superconjunto dosSubstantivos Abstratos Conjunto dos SubstantivosAbstratos Não-Verbais Sub-conjuntosNão-VerbaisConjunto dos SubstantivosAbstratos Verbais ConjuntosVerbaisClassificationsMethods / ProceduresTaxonomia para os Substantivos Abstratos
  23. 23. 23A palavra cooking é um verbo ou um adjetivo?ways of cooking lentilstypes of cooking utensilsways  N(AB/method)  tendência verbotypes  N(AB/class)  tendência não-verboSAL contribui para aresolução do homógrafoO código SAL N(AB/method) na regraemparelha com um código SALsemelhante na sequência de entradaO efeito deste emparelhamento é resolvercooking como um verboUso de SAL na Resolução de HomógrafosAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  24. 24. As regras SAL têm 5 Components Padrão SAL– PARSE2 exemplo: N(IN/data;u) Prep(“on”;u) N(u;u) (a book on the presidency) Restrição– Emparelha apenas se as condições são verdadeiras ou falsas Ação-Fonte– Regras RES: Resolve ambiguidade sintática– Regras PARSE: Cria uma árvore sintática– Regras SEMTAB : Resolve ambiguidade semântica Ação-Alvo (opcional)– Leva a efeito a transferência sintática e/ou semântica Linha de Comentário– PARSE2 exemplo: NP(info) Prep(“on”) NP  N1 “about” N2E.g., book on political satire  book about ....24Componentes das Regras SALAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  25. 25.  Complexidade– Saturação lógica– A base de dados torna-se demasiado grande– Há degradação na performance– Difícil manutenção– Inércia na melhoria do sistema Ambiguidade– Qualidade/precisão do output – depende de uma desambiguação eficaz– Desambiguação eficaz provoca um crescimento da base de dados Dilema clássico– A redução da base de dados que permite aliviar a complexidade provoca umenfraquecimento na desambiguação– Um aumento do tamanho da base de dados de forma a ajudar a resolverambiguidades aumenta a complexidade25Problema Clássico dos Sistemas por RegrasAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  26. 26. 26 Complexidade– Regras e fluxo de entrada são expressos como padrões SAL– Mapeamento homogéneo– As regras são padrões SAL patterns armazenados e organizados num dicionário depadrões indexado– O fluxo de entrada SAL serve de argumento de pesquisa para as regras SAL– Não existe limite quanto ao tamanho das bases de regras e não existe impacto naperformance– As regras são ordenáveis e fáceis de manter Ambiguidade– Resolução de homógrafos sintáticos– Escopo de adjetivos, preposições– PolissemiaAmbiguidade e Complexidade para o OpenLogosAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  27. 27. 27metáfora: rede neural biológica– Vectores V1-V6 = fluxo SAL– Células nos vectores de entrada = elementos/palavras SAL nos quais o fluxo deentrada em LN foi convertido– Nesta rede, R1 a P4 = camadas escondidas que contêm as regras SAL– R1 prepresenta RES1, P1 representa Parse1 e assim sucessivamente.– Cada camada escondida contém entre 2-4 mil regras, organizadas pelo seu padrãoSAL, como num dicionário.À medida em quea análise evolui:1- células tornam-se mais escassas(natureza abstratada análisesintática)2- vectorestornam-se maisclaros(desambiguaçãosemântica)Aplicação das RegrasAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  28. 28. 28 Principal semelhança– Interação eficaz entre o fluxo de entrada SAL e as regras das camadasescondidas– Apenas as regras que devem ser aplicadas são acedidas– Não é necessário desenvolver metaregras ou redes de discriminação paraalcançar eficácia no mapeamento de regras– Mapeamento eficaz de regras é uma característica do design do sistemametáfora: rede neural biológicaAplicação das RegrasAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  29. 29. 29Linguagem de representação SAL em interação com SEMTABSEMTAB fornece uma tradução que se sobrepõe à tradução do dicionáriopara o verbo “raise”Sequência LN Regra SEMTAB Tradução em Portuguêsraise a child  V(‘raise’) N(ANdes)  criar. . .raise corn  V(‘raise’) N(MAedib)  cultivar. . .raise the rent  V(‘raise’) N(MEabs)  aumentar. . .Resolução da Polissemia no OpenLogosAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  30. 30. 30Uma única regra em estrutura profundareconhece múltiplas estruturas de superfíciee produz traduções corretas na língua-alvohe raised the rent  ele aumentou a renda V+Objectothe raising of the rent  o aumento da renda Gerúndiothe rent, raised by …  a renda, aumentada por… ADJ Part.a rent raise  um aumento de renda SubstantivoRegras de SEMTAB em Estrutura ProfundaAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  31. 31. 31 Aplicar estatística e cálculo de probabilidades na resolução de homógrafos(RES) Aplicar estatística em padrões semântico-sintáticos (SAL), em vez de em n-gramas Métodos de aquisição automática de alinhamentos de unidades semantico-sintáticas e multipalavras baseadas em alinhamentos supervisionados´-aprendizagem automática Integrar recursos ontológicos e um módulo de parafraseamento alimentado porum tesauro para reconhecer e integrar paráfrases no fluxo de trabalho datraduçãoComo Transformar OpenLogos num Sistema HíbridoAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  32. 32. 32 Novas tecnologias, recursos e técnicas, que contribuem para umdesenvolvimento mais fácil e rápido de novos pares de línguas.– computação em nuvem– big data– técnicas avançadas de alinhamento (aprendizagem)– crowdsourcing especializado para aumentar a qualidade da TATrabalho FuturoAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  33. 33. 33 Estado da Arte em Tradução Automática– Sistemas por regras versus sistemas estatísticos OpenLogos – Plataforma para Sistema Híbrido– Descrição do sistema, arquitetura, características, etc. Como Transformar OpenLogos num Sistema Híbrido– Trabalho futuro Exploração do OpenLogos– criação de novos recursos e aplicações Divulgação, esforços, apoio– Disponibilidade dos recursos gratuitos do OpenLogosSumárioAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  34. 34. 34 SPIDER– System for Paraphrasing In Document Editing and Revision.– Baseado em tecnologia NooJ (http://ww.nooj4nlp.net/)– Disponível em: http://www.linguateca.pt/ReEscreve/– Optimização da escrita, aplicável à pré-edição para a TA. 1ª versão – ReEscreve (Português) e ReWriter (Inglês) 2ª versão – eSPERTo (Português)Integração num projeto ciberescola no âmbito de uma programaeducacional para ensinar alunos a melhorar as suas capacidades deescrita em Português EXPERT (protótipo) – Escrita de textos em domínios especializadosRecursos OpenLogos Usados em Novas AplicaçõesAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  35. 35. 35 ParaMT– Parafraseador bilíngue/multilíngue (protótipo de tradutor)– Utiliza uma metodologia semelhante à empregue pelo SPIDER– Utiliza dados bilíngues– Diretamente aplicável à TA Corpógrafo– Ferramenta de gestão de corpora multilingue– Disponível em: http://www.linguateca.pt/corpografo/Recursos OpenLogos Usados em Novas AplicaçõesAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  36. 36. 36ReEscreve: Sugestões de Reescrita
  37. 37. 37Texto Reescrito pelo ReEscreve
  38. 38. 38SPIDER: Sugestões de ReescritaSugestões de reescrita parafenómenos linguísticos geraisAdvérbios compostos >advérbios simplesConstruções com verbos-suporte> verbos simplesRelativas> particípiospassados adjectivaisAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  39. 39. 39EXPERT: Seleção de Dicionários de DomínioIdentificação de termos jurídicos numtextoSugestões para o termo “breach oflaw”O utilizador pode selecionar um termo de uma lista de sugestões ouapresentar a sua própria sugestãoO utilizador pode selecionar entre dicionários gerais e técnicos e gramáticas paratransformações linguísticas específicasTexto jurídico
  40. 40. 40Reconhecimentode CVS em PT etradução porverbos em ENTraduçãoAutomática$ENVerbos - ENConstrução com com verbosuporte - PT>ParaMT: um Parafraseador para a TA
  41. 41. 41 Estado da Arte em Tradução Automática– Sistemas por regras versus sistemas estatísticos OpenLogos – Plataforma para Sistema Híbrido– Descrição do sistema, arquitetura, características, etc. Como Transformar OpenLogos num Sistema Híbrido– Trabalho futuro Exploração do OpenLogos– criação de novos recursos e aplicações Divulgação, esforços, apoio– Disponibilidade dos recursos gratuitos do OpenLogosSumárioAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  42. 42. 42 Anusaaraka LTRC, IIIT-Hyderabad– Protótipo de um sistema de TA Inglês-HindúChaudhury, S.; Rao, A.; Sharma, D. M. (2010). "Anusaaraka: An Expert System basedMachine Translation System". In Proceedings of 2010 IEEE International Conference onNatural Language Processing and Knowledge Engineering (IEEE NLP-KE2010), Beijing,China, Aug 21- 23, 2010. Kalinga Institute of Industrial Technology, KIIT– Criação de um laboratório de investigação com tecnologia OpenLogosOpenLogos para Línguas MinoritáriasAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  43. 43. 43 Departmento de Ciências Políticas, Sociais e Comunicação,Universidade de Salerno– Tese de doutoramento onde foram aplicadas metodologia e regrasSEMTAB do sistema inglês-italiano do OpenLogos, apoiadas pelatecnologia NooJ na representação dos princípios teóricos emetodológicos da Teoria Léxico-GramáticaMonti, Johanna (2013). Multi-word unit processing in Machine Translation. Developing andusing linguistic resources for multi-word unit processing in Machine Translation Principais universidades da África Austral– Esforços iniciais para usar OpenLogos como plataforma para a TA entreInglês e Línguas Africanas (recursos escassos, falta de corporaparalelos, etc.) numa iniciativa semlhante à que foi tomada para aslínguas da ÍndiaOutros Esforços com OpenLogosAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  44. 44. 44 DFKI adaptou o OpenLogos do sistema comercial Logos Também disponível em Sourceforge, com a licença GPL OpenLogos usa apenas componentes em código aberto:– Ferramentas e compiladores, tais como GCC– Código e bibliotecas abertas (APITest, logos_batch)– Bases de dados de código aberto. Os recursos foram convertidos paraPostgreSQL– Uso de normas abertas em vez de protocolos comerciais– Platforma Linux Recursos, tais como gramáticas para análise (RES) e transferência (TRAN) para aslínguas-fonte e alvo, e bases de dados com dicionários multilíngues Ferramentas: LogosTermBuilder, LogosAdmin, linha de comandos (APITest,openlogos), e interface para começar e monitorizar as traduções(LogosTransCenter)Recursos do OpenLogos na DFKIAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  45. 45.  Lista de e-mails OpenLogos (DFKI) dedicada a discussão e troca deinformação no que diz respeito ao desenvolvimento do sistema ediscussão de problemas:http://www.dfki.de/mailman/listinfo/openlogos-list Grupo de Discussão no LinkedIn: OpenLogos Machine Translation Página no Facebook: OpenLogos45Apoio para o OpenLogosAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  46. 46. 46 LearnLogoshttp://www.l2f.inesc-id.pt/~abarreiro/openlogos-tutorial/newbase_for_learnlogos.htm Tutorial SALhttp://www.l2f.inesc-id.pt/~abarreiro/openlogos-tutorial/new_A2menu.htmLearnLogos e Tutorial SALAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  47. 47. 47Publicações e artigos técnicos com a descrição de: Linguagem de representação SAL Arquitetura do sistema e fluxo de trabalhoAnabela Barreiro, Bernard Scott, Walter Kasper and Bernd Kiefer. OpenLogos Rule-BasedMachine Translation: Philosophy, Model, Resources, and Customization. In MachineTranslation, volume 25 number 2, Pages 107-126, Springer, Heidelberg, 2011. ISSN: 0922-6567. DOI: 10.1007/s10590-011-9091-zBernard Scott and Anabela Barreiro. OpenLogos MT and the SAL Representation Language.In Proceedings of the First International Workshop on Free/Open-Source Rule-BasedMachine Translation. Edited by Juan Antonio Pérez-Ortiz, Felipe Sánchez-Martínez, FrancisM. Tyers. Alicante, Spain: Universidad de Alicante. Departamento de Lenguajes y SistemasInformáticos. 2–3 November 2009, pp. 19–26Bernard Scott. The Logos Model: an Historical Perspective. In Machine Translation, vol. 18(2003), pp. 1–72.Publicações Mais RelevantesAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  48. 48. 48Anabela Barreiro. "SPIDER: a System for Paraphrasing In Document Editing and Revision -Applicability in Machine Translation Pre-Editing". Computational Linguistics andIntelligent Text Processing. Proceedings of the 12th International Conference 6609 (2011),pp. 365-376. Springer. ISSN: 0302-9743. e-ISSN: 1611-3349. DOI: 10.1007/978-3-642-19400-9. Part II, Lecture Notes in Computer ScienceAnabela Barreiro. "ParaMT: a Paraphraser for Machine Translation". In António Teixeira, VeraLúcia Strube de Lima, Luís Caldas de Oliveira & Paulo Quaresma (eds.), ComputationalProcessing of the Portuguese Language, 8th International Conference, Proceedings(PROPOR 2008) Vol. 5190, (Aveiro, Portugal, 8-10 de Setembro de 2008), Springer Verlag.Lecture Notes in Computer Science,pp. 202-211.Anabela Barreiro & Luís Miguel Cabral. "ReEscreve: a translator-friendly multi-purposeparaphrasing software tool". In Marie-Josée Goulet, Christiane Melançon, Alain Désilets &Elliott Macklovitch (eds.),Proceedings of the Workshop Beyond Translation Memories: NewTools for Translators, The Twelfth Machine Translation Summit (Château Laurier, Ottawa,Ontario, Canada, 29 August 2009), pp. 1-8.Publicações sobre as Aplicações de Paráfrase eReescritaAnabela Barreiro I Conferência Internacional de Tradução e Tecnologia
  49. 49. 49Como Transformar um Sistema de TraduçãoAutomática por Regras num Sistema Híbrido?Anabela Barreiro I Conferência Internacional de Tradução e Tecnologia

×