Corpus de texto 2012

674 views

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
674
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
12
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Corpus de texto 2012

  1. 1. Claudia Solórzano HunterIntroducciónUn corpus es un método empírico en el que se intenta describir las regularidades de los contextos queconforman las lenguas y así simular los usos reales de ellas. Asimismo, es utilizada como herramienta porcualquier disciplina lingüística y ha cambiado los enfoques lingüísticos gracias a la complementación deprogramas computacionales.El conjunto de datos está formado por textos sobre la economía. Los cuales se compilarán mediante elprograma Antconc, donde se mostrarán las palabras con mayor frecuencia mediante tablas y figuras.AntconcEsta compuesto de herramientas, Concordance, Clusters, Collocates y Wordlist. Dentro de cada herramientahay una serie de instrumentos de análisis y de funciones que permiten elaborar listados de palabrasmonoléxicas, poliléxicas o polilexemáticas, de agrupamientos léxicos.Al compilar un corpus se identifican las características de un texto, el idioma y su campo. Antconc, permiteextraer diversos datos en forma de listados de palabras frecuentes, concordancias (listados de palabras clavecontextualizadas, que pueden ordenarse o expandirse según las necesidades del análisis), colocaciones (otraspalabras que aparecen inesperadamente con más frecuencia alrededor de palabras clave) y por último los n-gramas (listados de secuencias de palabras más frecuentes).ConcordanciasLa concordancias permiten observar cualquier ítem aparecido en los listados de palabras frecuentes, tal comoaparece en los textos, con los contextos que le rodean. Se trata del nivel de análisis más detallado, y permiteinvestigar cada palabra en cada texto. Con ellas es posible identificar clases de palabras, significados, usos,colocaciones y fraseologismos, patrones gramaticales, usos pragmáticos y características especificas de losgéneros textuales.
  2. 2. En la tabla siguiente, podremos ver las concordancias de la palabra ¨crisis¨.
  3. 3. Como acabamos de apreciar, las concordancias pueden ayudarnos a obtener diferentes informaciones sobrelas características y comportamientos de una palabra. También existen otras herramientas que puedenacelerar los procedimientos iniciales de detección de información. Se trata de las colocaciones, unaherramienta de mayor complejidad, la cual ofrece un análisis cuantitativo de las palabras que aparecen en lasproximidades del núcleo o palabra clave.En la tabla 2. observamos que la palabra crisis se emplea en diferentes contextos a través delas colocaciones.
  4. 4. Ahora que ya tenemos la lista de concordancia, indicamos a Antconc que ordene teniendo en cuentan número de palabras a la derecha o a la izquierda del núcleo o palabra base de la concordancia.Como se observa en este listado, lo primero que aparece ordenado alfabéticamente son las palabrasque ocurren inmediatamente antes de la palabra base.

×