UGF – Profa. Ms. Simone Vieira Resende
 Linguística de corpus (ou córpus) é uma área da Linguística que
se ocupa da coleta e análise de corpus, que é um conjunt...
 As ferramentas computacionais mais comuns são:
 Programas para listar palavras - fazem a
contagem das palavras em um co...
 É fato que o fazer terminológico é laborioso,
principalmente se dependermos da nossa atenção
para observarmos a recorrên...
 Com o advento do computador, tornou-se
possível construir grandes bancos de textos e
consultá-los com ferramentas comput...
 Os corpus eletronicos nos permitem notar as
ocorrências das unidades fixas.
 Para a LC, um corpus é uma coletânea de
te...
 Slide baseado no item 2 da bibliografia
comentada.
 Corpara e Ensino de tradução
 Linguística de Corpus
 Exemplo do a...
 Conhecer palavras da área de pesquisa:
sementes.
 Fazer uma limpeza do corpus.
 Fotos – figuras – tabelas
 Corpus comparável: conteúdo similar nas duas
línguas.
 Número de palavras (texto jurídico)
 Número de textos
 Extrair os termos, colocações e fraseologias.
 3 etapas:
 Gera-se uma lista de palavras mais frequentes no
corpus.
 C...
 A identificação é feita pela observação dos
termos e suas colocações.
 Exemplo da pimenta / gol contra / fazer cera
 A...
 Links sobre pesquisa com corpora.
 http://www2.lael.pucsp.br/corpora/
 http://www2.lael.pucsp.br/corpora/bp/conc/
 ht...
Linguística de Corpus, Terminologia e Tradução
Linguística de Corpus, Terminologia e Tradução
Linguística de Corpus, Terminologia e Tradução
Upcoming SlideShare
Loading in...5
×

Linguística de Corpus, Terminologia e Tradução

1,925

Published on

0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,925
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
72
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide
  • Um corpus é um conjunto de textos. Pode ser escrito ou oral, representa o uso que se faz de uma língua, assume a forma eletrônica.
  • Linguística de Corpus, Terminologia e Tradução

    1. 1. UGF – Profa. Ms. Simone Vieira Resende
    2. 2.  Linguística de corpus (ou córpus) é uma área da Linguística que se ocupa da coleta e análise de corpus, que é um conjunto de dados linguísticos.  A LC surgiu com a necessidade que estudiosos da língua sentiram de se apoiar em usos reais para fazerem generalizações ou esboçarem teorias a respeito do funcionamento linguístico.  Atualmente, a LC está intimamente ligada ao uso do computador, visto que os corpora/córpora (plural de corpus) são eletrônicos.  O corpus deve ser constituído de dados autênticos (não inventados), legíveis por computador e representativos de uma língua ou variedade da língua da qual se deseja estudar.
    3. 3.  As ferramentas computacionais mais comuns são:  Programas para listar palavras - fazem a contagem das palavras em um corpus;  Concordanciadores - programas que permitem que o usuário procure por palavras específicas em um corpus, fornecendo exaustivas listas para as ocorrências da palavra em contexto;  Etiquetadores - fazem análises automáticas do corpus e inserem etiquetas (códigos) de ordem  morfossintática, sintática, semântica oudiscursiva.
    4. 4.  É fato que o fazer terminológico é laborioso, principalmente se dependermos da nossa atenção para observarmos a recorrência de certas combinações.  O que geralmente ocorre é que, ao notarmos uma combinação que já vimos antes, não nos lembramos de onde a vimos, e provavelmente não somos capazes de localizá-la novamente se quisermos, por exemplo, compilar uma lista de espressões consagradas ou montar um glossário.
    5. 5.  Com o advento do computador, tornou-se possível construir grandes bancos de textos e consultá-los com ferramentas computacionais apropriadas para detectar essas ocorrências, co-ocorrências e recorrências.  A LC oferece uma metodologia que veio facilitar muito a identificação das unidades convencionais de uma língua, assim como os termos técnicos de uma área de especialidade.
    6. 6.  Os corpus eletronicos nos permitem notar as ocorrências das unidades fixas.  Para a LC, um corpus é uma coletânea de textos  Um exemplo de aplicação: o Vocabulário para Culinária SBS (série 1001 Termos)  Glossário de Gastronomia da Disal
    7. 7.  Slide baseado no item 2 da bibliografia comentada.  Corpara e Ensino de tradução  Linguística de Corpus  Exemplo do artigo: elaboração de um glossário técnico com base em corpus.
    8. 8.  Conhecer palavras da área de pesquisa: sementes.  Fazer uma limpeza do corpus.  Fotos – figuras – tabelas
    9. 9.  Corpus comparável: conteúdo similar nas duas línguas.  Número de palavras (texto jurídico)  Número de textos
    10. 10.  Extrair os termos, colocações e fraseologias.  3 etapas:  Gera-se uma lista de palavras mais frequentes no corpus.  Compara-se com outra de um corpus mais geral, ou seja, não específico do tema investigado, para identificar as palavras peculiares, essas seriam as candidatas.  Finalmente produzem-se as listas de concordância para validar as candidatas.  A frequência leva à identificação de padrões fraseológicos (colocações).
    11. 11.  A identificação é feita pela observação dos termos e suas colocações.  Exemplo da pimenta / gol contra / fazer cera  A quinta e última etapa seria a compilação de um glossário.
    12. 12.  Links sobre pesquisa com corpora.  http://www2.lael.pucsp.br/corpora/  http://www2.lael.pucsp.br/corpora/bp/conc/  http://www2.lael.pucsp.br/corpora/bricle/  http://www.corpusdoportugues.org/  http://www.termium.com/ (Canadense)  http://www.geterm.ufscar.br/ (blog sobre terminologia)  http://www.geltra.ibilce.unesp.br/grupo.php (GELTRA)  http://www6.ufrgs.br/termisul/ (UFRGS)  http://www6.ufrgs.br/textquim/ (TextQuim)  http://www.fflch.usp.br/citrat/citrat.htm (CITRAT)  http://www.nilc.icmc.usp.br/nilc/tools/pagina-visualtca/visualtca/tca.htm# (VISUAL TCA frases)  http://www.nilc.icmc.usp.br/nilc/index.html  http://www2.lael.pucsp.br/corpora/index.htm  http://corpus.byu.edu/bnc/  http://corpus.byu.edu/coca/  http://www.linguateca.pt/  http://www.linguateca.pt/COMPARA/  http://www.nilc.icmc.usp.br/nilc/tools/visuallihla/lihla.htm (VISUAL TCA - palavras)  http://www.termcat.cat/es (Centro de Terminologia em Catalão)  http://www.corpusdelespanol.org/  www.webcorp.org.uk  http://davies-linguistics.byu.edu/  http://www.natcorp.ox.ac.uk/
    1. A particular slide catching your eye?

      Clipping is a handy way to collect important slides you want to go back to later.

    ×