Belinda Maia - Introdução à tradução automática
Upcoming SlideShare
Loading in...5
×
 

Belinda Maia - Introdução à tradução automática

on

  • 394 views

Apresentação da Dra. Belinda Maia na I Conferência Internacional de Tradução e Tecnologia, 13 e 14 de Maio, Faculdade de Letras do Porto.

Apresentação da Dra. Belinda Maia na I Conferência Internacional de Tradução e Tecnologia, 13 e 14 de Maio, Faculdade de Letras do Porto.

Statistics

Views

Total Views
394
Views on SlideShare
394
Embed Views
0

Actions

Likes
1
Downloads
13
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Belinda Maia - Introdução à tradução automática Belinda Maia - Introdução à tradução automática Presentation Transcript

  • Belinda MaiaFLUP13 de Maio 20131
  •  A importância da Tradução Automática (TA) O fascínio da TA O meu interesse em TA Um pouco de história A Linguística, a Engenharia e a TA Possibilidades e limitações da TA ‘State-of-the-art’ em TA2
  •  Razões políticas Multilinguismo como política europeia Razões sociais Relações culturais Importância comercial3
  •  Interesse científico Um desafio científico para:◦ A Linguística◦ A Engenharia Informática◦ A Inteligência Artificial Interesse filosófico◦ Será possível criar ‘Comunicação’ entre o Homem ea Máquina?◦ Ou será que nunca haverá inteligência na máquina,como na ‘Chinese Room’ de John Searle (1980)?4
  • Como: Falante nativa de Inglês Formadora de tradutores profissionais Adepta da teoria da Linguística Sistémico-Funcional… Podem achar que sou a pessoa menosindicada para estar fascinada com a TA!5
  •  O Inglês, mesmo sendo a ‘língua franca’ entrecertos grupos, não substitui as outraslínguas/culturas A TA contribui para o multilinguismo Os bons tradutores usam a TA comoferramenta A TA pode acabar com os maus tradutores... A Linguística Sistémico-Funcional ajuda amostrar as limitações (pelo menos atuais) daInteligência Artificial…6
  •  Fonética Fonologia Morfologia Morfo-sintaxe Semântica O léxico geral – e os léxicos de especialidade O texto O contexto O mundo real7
  •  A história da TA é longa e complexa – verHutchins (2010) Depois da 2ª Guerra Mundial… Percepção de que a linguagem humana éigual a um código◦ O objetivo é descodificar a linguagem◦ É tudo uma questão de tempo Mas não só muito tempo .... Muito dinheiro e muito esforço8
  •  Linguística estruturalista◦ Foca a estrutura das línguas◦ Favorece a ‘langue’ a custa da ‘parole’ Estudo das regras de sintaxe◦ Verbos e a sua complementação Transformação: Sub + Adj (PT) >> Adj + Sub (EN)◦ Estrutura básica das frases◦ Etc. Léxico geral – sentido denotativo das palavras9
  •  O sonho de uma estrutura universal dalinguagem◦ Descobrir a estrutura comum◦ Descobrir as regras das línguas individuais◦ Descobrir as regras de conversão Língua A <> estrutura universal <> Língua B MAS◦ A ‘estrutura universal’ é sintática ou semântica?◦ ‘Sentido denotativo’ vs ‘sentido conotativo?◦ A metáfora? E a palavra em contexto? E o texto?10
  •  A relação morfologia <> sintaxe? A relação sintaxe <> léxico? A relação frase <> texto? A relação <> texto <> contexto <> mundoreal? Necessidade de criar muitas regras Regras baseadas em normas qualitativas – ouna intuição de ‘bons’ linguistas11
  •  RBMT - Linguistas > intuições e muitas regras Melhorias possíveis com◦ Bons dicionários◦ Bases de dados terminológicas para domíniosespecíficos – exemplo: METEO◦ Mais informação quantitativa Grande problema – difícil conversão de umsistema RBMT entre as línguas A<>B para umsistema entre as línguas C<>D12
  •  A disponibilidade de textos em formatodigital > estudo quantitativo das línguas Corpora Wordnets Framenets Treebanks Dicionários, Thesauri Corretores ortográficos / gramaticais Dedução de regras com base em análisedeste material...13
  •  Os linguistas e os engenheiros trabalhamjuntos para produzir corpora e ferramentas Os engenheiros compreenderam que oestudo da linguagem oferece a base para:◦ A Internet GOOGLE – motor de pesquisa baseado emprocessamento de linguagem◦ Data mining◦ Information retrieval◦ Knowledge management◦ Inteligência artificial .....14
  •  ‘Working with translators’ (Hoft 1995 –Chapter 8) Memórias de Tradução Bases de dados TA baseada na extração de informação dememórias de tradução/corpora paralelos-oure-aproveitamento de Tradução Humana Não é tão fácil como isto, mas...15
  •  TA baseada em Regras (RBMT)◦ Exemplos: Systran, Logos, etc◦ Exige muita mão-de-obra (sem falar em ‘que teoriade base?’...) TA baseada em Estatística (SBMT)◦ Exemplos: Google Translate e Bing Translator◦ Existem muito textos paralelos, mas há limites noprogresso◦ Importa más traduções16
  •  MAS entre RBMT e SBMT - há um lequeenorme de teorias e metodologias...17
  •  Fonética Fonologia Morfologia Morfo-sintaxe Semântica O léxico geral – e os léxicos de especialidade O texto O contexto O mundo real18
  •  Fonética e Fonologia Conhecimentos necessários1. Reconhecimento da fala > texto2. Texto > TA > tradução3. Tradução > fala19
  •  Morfologia Morfo-sintaxe Semântica Léxico geral Áreas básicas para TA baseada em RegrasEventualmente + léxicos específicos numdomínio especificado...20
  •  SBMT precisa de:◦ Grandes quantidades de texto◦ Grandes memórias de tradução◦ Corpora anotados SBMT procura:◦ Palavras◦ N-grams ou multipalavras◦ Entidades Nomeadas◦ Números, pontuação, etc◦ Ontologias (para distinguir domínios)◦ Eventualmente... padrões sintáticos, etc.21
  •  Opinião geral > Hibridização◦ RBMT + SBMT Os resultados do motor de regras são seleccionados porestatística◦ SBMT + RBMT Os resultados da estatística são corrigidos por regras Regras extraídas de corpora anotados Mais e melhores corpora e memórias detradução Correcção humana de TA + ‘machine learning’22
  • OBRIGADA!23
  •  Halliday, M.A.K. 2004. “Introduction: How Big is a Language?On the Power of Language.” In The Language of Science:Volume 5 in the Collected Works of M.A.K. Edited byJ.J.Webster. London and New York: Continuum. p. xi. Hoft, Nancy 1995. International Technical Communication.New York: John Wiley and Sons. Hutchins, John. Várias Publicações -http://www.hutchinsweb.me.uk/ MT-Archive - http://www.mt-archive.info/ Searle, John. 1980. “Minds, Brains, and Programs.” Behavioraland Brain Sciences 3, 417-424.24