Linguística de Corpus, Terminologia e Tradução
Upcoming SlideShare
Loading in...5
×
 

Linguística de Corpus, Terminologia e Tradução

on

  • 1,179 views

 

Statistics

Views

Total Views
1,179
Views on SlideShare
1,179
Embed Views
0

Actions

Likes
0
Downloads
22
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • Um corpus é um conjunto de textos. Pode ser escrito ou oral, representa o uso que se faz de uma língua, assume a forma eletrônica.

Linguística de Corpus, Terminologia e Tradução Linguística de Corpus, Terminologia e Tradução Presentation Transcript

  • UGF – Profa. Ms. Simone Vieira Resende
  •  Linguística de corpus (ou córpus) é uma área da Linguística que se ocupa da coleta e análise de corpus, que é um conjunto de dados linguísticos.  A LC surgiu com a necessidade que estudiosos da língua sentiram de se apoiar em usos reais para fazerem generalizações ou esboçarem teorias a respeito do funcionamento linguístico.  Atualmente, a LC está intimamente ligada ao uso do computador, visto que os corpora/córpora (plural de corpus) são eletrônicos.  O corpus deve ser constituído de dados autênticos (não inventados), legíveis por computador e representativos de uma língua ou variedade da língua da qual se deseja estudar.
  •  As ferramentas computacionais mais comuns são:  Programas para listar palavras - fazem a contagem das palavras em um corpus;  Concordanciadores - programas que permitem que o usuário procure por palavras específicas em um corpus, fornecendo exaustivas listas para as ocorrências da palavra em contexto;  Etiquetadores - fazem análises automáticas do corpus e inserem etiquetas (códigos) de ordem  morfossintática, sintática, semântica oudiscursiva.
  •  É fato que o fazer terminológico é laborioso, principalmente se dependermos da nossa atenção para observarmos a recorrência de certas combinações.  O que geralmente ocorre é que, ao notarmos uma combinação que já vimos antes, não nos lembramos de onde a vimos, e provavelmente não somos capazes de localizá-la novamente se quisermos, por exemplo, compilar uma lista de espressões consagradas ou montar um glossário.
  •  Com o advento do computador, tornou-se possível construir grandes bancos de textos e consultá-los com ferramentas computacionais apropriadas para detectar essas ocorrências, co-ocorrências e recorrências.  A LC oferece uma metodologia que veio facilitar muito a identificação das unidades convencionais de uma língua, assim como os termos técnicos de uma área de especialidade.
  •  Os corpus eletronicos nos permitem notar as ocorrências das unidades fixas.  Para a LC, um corpus é uma coletânea de textos  Um exemplo de aplicação: o Vocabulário para Culinária SBS (série 1001 Termos)  Glossário de Gastronomia da Disal
  •  Slide baseado no item 2 da bibliografia comentada.  Corpara e Ensino de tradução  Linguística de Corpus  Exemplo do artigo: elaboração de um glossário técnico com base em corpus.
  •  Conhecer palavras da área de pesquisa: sementes.  Fazer uma limpeza do corpus.  Fotos – figuras – tabelas
  •  Corpus comparável: conteúdo similar nas duas línguas.  Número de palavras (texto jurídico)  Número de textos
  •  Extrair os termos, colocações e fraseologias.  3 etapas:  Gera-se uma lista de palavras mais frequentes no corpus.  Compara-se com outra de um corpus mais geral, ou seja, não específico do tema investigado, para identificar as palavras peculiares, essas seriam as candidatas.  Finalmente produzem-se as listas de concordância para validar as candidatas.  A frequência leva à identificação de padrões fraseológicos (colocações).
  •  A identificação é feita pela observação dos termos e suas colocações.  Exemplo da pimenta / gol contra / fazer cera  A quinta e última etapa seria a compilação de um glossário.
  •  Links sobre pesquisa com corpora.  http://www2.lael.pucsp.br/corpora/  http://www2.lael.pucsp.br/corpora/bp/conc/  http://www2.lael.pucsp.br/corpora/bricle/  http://www.corpusdoportugues.org/  http://www.termium.com/ (Canadense)  http://www.geterm.ufscar.br/ (blog sobre terminologia)  http://www.geltra.ibilce.unesp.br/grupo.php (GELTRA)  http://www6.ufrgs.br/termisul/ (UFRGS)  http://www6.ufrgs.br/textquim/ (TextQuim)  http://www.fflch.usp.br/citrat/citrat.htm (CITRAT)  http://www.nilc.icmc.usp.br/nilc/tools/pagina-visualtca/visualtca/tca.htm# (VISUAL TCA frases)  http://www.nilc.icmc.usp.br/nilc/index.html  http://www2.lael.pucsp.br/corpora/index.htm  http://corpus.byu.edu/bnc/  http://corpus.byu.edu/coca/  http://www.linguateca.pt/  http://www.linguateca.pt/COMPARA/  http://www.nilc.icmc.usp.br/nilc/tools/visuallihla/lihla.htm (VISUAL TCA - palavras)  http://www.termcat.cat/es (Centro de Terminologia em Catalão)  http://www.corpusdelespanol.org/  www.webcorp.org.uk  http://davies-linguistics.byu.edu/  http://www.natcorp.ox.ac.uk/