Minería y visualización de texto
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Minería y visualización de texto

on

  • 1,693 views

La representación visual del texto debe ser fácil de entender por parte del usuario en un lenguaje natural, pero que de hecho requiere de algunos parámetro o requisitos como son: el dominio, la ...

La representación visual del texto debe ser fácil de entender por parte del usuario en un lenguaje natural, pero que de hecho requiere de algunos parámetro o requisitos como son: el dominio, la especialización, la preferencia del usuario, el contexto del trabajo con respecto al resultado, pero que ya existen algunas técnicas para cubrir estos, como es la clasificación y construcción de grupos comunes

Statistics

Views

Total Views
1,693
Views on SlideShare
1,691
Embed Views
2

Actions

Likes
0
Downloads
15
Comments
0

1 Embed 2

http://word.innovacompu.net 2

Accessibility

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Minería y visualización de texto Presentation Transcript

  • 1. MINERÍA Y VISUALIZACIÓN DE TEXTO
    Edwin Fabián Maza S.
    Estudiante de la UTPL
    ISUMMIT 2010
  • 2. INTRODUCCIÓN
    En la actualidad se busca analizar el texto existente en todo su ámbito y para ello se requiere de procedimientos automáticos para: extraer los temas, determinar en el texto la localización de las rupturas, visualizar la proximidad entre documentos y/o entre términos, indexar los documentos, construir bases de documentos para una interrogación automática a lo posterior.
  • 3. Búsqueda de información VS Extracción de información
    Búsqueda de información: Es un tratamiento global de un gran nuero de documentos, búsqueda de temas, construcción de una tipología de los documentos.
    Extracción de información: consiste en la búsqueda de información “ciblada”, para alimentar una base de datos estructurada (relleno automático de los campos de la base).
  • 4. Tipos de textos analizados
    Los tipos de textos analizados se pueden realizar entre:
    Encuestas de opinión
    Encuestas de satisfacción de clientela
    Entrevistas semi-abiertas en estudios de clientela
    Revistas de prensa
    Vigilia tecnológica: resúmenes de artículos contenidos en las bases científicas, patentes, entre otras.
  • 5. Métodos de análisis
    Para ello se pueden identificar dos puntos importantes como son:
    La codificación: se debe conocer como se codifica el corpus, esta transforma el corpus en una tabla que se puede analizar mediante métodos estadísticos
    La distancia: el papel fundamental de la distancia escogida en el análisis estadístico de textos. Distancia entre elementos (entrevistados, categorías de entrevistados, palabras, entre otros.)
  • 6. ¿Porquéesdificil?
    La minería de textos se ve compleja o difícil para su análisis debido a la conformación de:
    Títulos
    Imágenes
    Tablas
    Graficas
    Texto seguro
    Es difícil la visualización del texto como por ejemplo: la presencia de un objeto extraño se puede interpretar de varias formas como: alucinación, nave extraterrestre, platillo volador, OVNI
  • 7. Lingüística computacional y procesamiento de textos
    Esta ciencia ha ayudado para tratar de aplicar métodos computacionales en el estudio del lenguaje natural. Por lo que es ha combinado dos importantes ciencias, la lingüística que el estudio de leyes del lenguaje humano, y la inteligencia artificial que investiga métodos computacionales para el manejo de sistemas complejos.
  • 8. La solución tradicional de este problema consiste en construir un procesador lingüístico construido por diferentes módulos independientes.
  • 9. Tipos de minería de textos Web (Web Mining)
    La Web Mining nos ayuda a descubrir información, encontrar documentados relacionados, mostrar temáticas, averiguar el grado de satisfacción de recursos web, etc. Según el fin deseado, la actividad de excavar en la web se desglosa en tres dominios de extracción de conocimiento de acuerdo con la naturaleza de los datos.
  • 10. Tipos de minería de textos Web (Web Mining)
    Web contentmining (minería de contenido web)
    Web structuremining (minería de estructura web)
    Web usagemining (minería de uso web)
  • 11. HERRAMIENTAS DE MINERÍA DE TEXTO
    Weka
    RapidMiner
    Lenguaje R
    Pentaho
    GATE
    Bases de datos de artículos técnicos.
    biotech
    medline
    chemicalabstractregistry
  • 12. REFERENCIAS
    [1] Minería de Textos Web Recuperación y organización de la información Disponible en http://mineria-textos-web.awardspace.com/
    [2] Explotación minera del texto Disponible en http://enciclopediaespana.com/Explotación_minera_del_texto.html
    [3] Explotación minera del texto http://www.worldlingo.com/ma/enwiki/es/Text_mining
    [4] Minería de textos y datos para-textuales Universitat Autónoma de Barcelona SEA 2 de febrero 2007 Mónica BécueBertaut
    [5] Minería de texto: Un nuevo reto computacional Manuel Montes-y-Gómez Centro de Investigación en Computación, Instituto Politécnico Nacional.