Variantes a la extracción de vecinos semánticos y al algoritmo de predicacción (Kintsch, 2001), en corpus científicos

Loading...

Flash Player 9 (or above) is needed to view presentations.
We have detected that you do not have it on your computer. To install it, go here.

0 comments

Post a comment

    Post a comment
    Embed Video
    Edit your comment Cancel

    Favorites, Groups & Events

    Variantes a la extracción de vecinos semánticos y al algoritmo de predicacción (Kintsch, 2001), en corpus científicos - Presentation Transcript

    1. VARIANTES A LA EXTRACCIÓN DE VECINOS SEMÁNTICOS Y AL ALGORITMO DE PREDICACIÓN EN CORPUS CIENTÍFICOS Guillermo Jorge-Botana Ricardo Olmos Albacete José A. León Francisco Molinero 7º Congreso de la Sociedad Española de Psicología Experimental, San Sebastián 3-5 Abril. 2008 SEPEX 2008
    2. 1. ¿Qué hace LSA?
      • LSA puede:
      +simular como puede estar representado el conocimiento
    3. 2. ¿Qué no hace LSA?
      • Pero:
      • +No es una teoría de procesamiento ( Burguess, 2000)
      +Es una representación estática de cómo se distribuye el conocimiento +Para simular cualquier proceso: Como: Juicios de semejanzas Comprensión de estructuras textuales Constricciones del contexto +Es necesario formalizar algún tipo de operación sobre lo que LSA representa.
    4. 3. Objetivos +Extraer términos vecinos de algunas palabras aisladas (estructura simple) y grupos de palabras (estructura compleja). +Aplicar el algoritmo de predicación (Kintsch, 2001) a ciertas estructuras frecuentes en corpus científicos.
    5. 4. Extracción de contenidos
      • Una forma:
      • + Tomar el vector de una palabra y extraer una lista de sus n primeros vecinos semánticos.
      + Lista: se compara el vector de dicha palabra con todos los demás vectores-términos del espacio semántico. + Comparación: coseno del ángulo Semejanza = Cos(A,I) A I µ
    6. 5. Extracción de contenidos
      • Un posible problema:
      • + En ocasiones, los primeros términos de la lista son:
      Términos de poca relevancia Que sólo concurren con el término de referencia Ejemplo: (A) Ciudad (I) Deportiva (I)Condal (I) Real (A)Ciudad (I)País (I)Transporte (I)Alcalde Y quizás también queremos
    7. 6. Extracción de contenidos
      • Una posible solución:
      • + Ponderar el coseno del ángulo con la longitud de vector
      Semejanza = Cos(A,I) x log (1 + longitudVector (I)) Longitud de Vector-término: puede denotar la importancia de un término dentro del dominio semántico.
    8. Nuestro corpus: psicopatología .
    9. 7. Lista de “fobia” “ Fobia” Longitud de vector Semejanza con “fobia” 21 primeros vecinos Coseno Coseno + long.vector
    10. 8. Lista de “tormentas” Longitud de vector Semejanza con “tormentas” 21 primeros vecinos “ Tormentas” Coseno Coseno + long.vector
    11. ESTRUCTURAS COMPLEJAS (estructuras de dos términos)
    12. 9. Extracción del sentido de estructuras complejas + Estructuras complejas: formadas por más de una palabra. + Estructuras predicativas: “Este partido es de centro ” + Estructuras predicativas <<taxonómicas>>: “Este pájaro es un pelícano ”
    13. 10. Extracción del sentido de estructuras complejas “ Fobia a las tormentas ” “ Personalidad de la pistola ” + Estructuras predicativas “taxonómicas” en corpus científicos : P(A) Personalidad (Pistola) Fobia (Tormentas)
    14. 11. Suma centroide
      • Un forma: el centroide o la suma
      • Vector Predicado( Fobia) + Vector Argumento ( tormentas)
    15. 12. Suma centroide
      • Problema: el centroide
      Gente Social Timidez Precipicios
    16. 13. Algoritmo de predicación
      • Necesitamos
    17. 14. Algoritmo de predicación
      • LSA + Algoritmo de predicación (Kintsch, 2001)
      El sentido final de la predicación se forma sumando el predicado, el argumento y los n primeros vecinos del predicado pertinentes para el argumento.
    18. 15. “Fobia a las tormentas” (LSA + Algoritmo de predicación + Corrección con la longitud de vector) Coseno + long.vector Coseno Con Predicación Sin Predicación Sin Predicación Con Predicación 21 primeros vecinos “ fobia a las tormentas”: un fenómeno natural designa una fobia específica Social Público Timidez Precipicios Serpientes Específica Social Sociales Específica Social Serpientes Subtipo Específica Timidez
    19. 16. “Personalidad de la pistola” “ personalidad de la pistola”: un objeto designa personalidad antisocial 21 primeros vecinos Con Predicación Sin Predicación Sin Predicación Con Predicación (LSA + Algoritmo de predicación + Corrección con la longitud de vector) Antisocial Disocial Navaja Esquizoide Esquizotípico Límite evitación Antisocial Esquizotípico Esquizoide Narcisista Antisocial Disocial Robos Violencia Coseno + long.vector Coseno
    20. 16. Conclusiones +LSA proporciona una representación objetiva y mensurable de conocimiento estático. +LSA es una buena base para simular procesos mediante algoritmos que tengan en cuenta las constricciones del contexto. +LSA y los algoritmos que provienen de la psicolingúística tiene muchas aplicaciones en el ámbito de la industria lingüística (buscadores, interpretadores de intenciones del usuario, web semántica, indexadores de información diagnóstica, visualización, etc) .
    21. 18. Muchas gracias
    22. VARIANTES A LA EXTRACCIÓN DE VECINOS SEMÁNTICOS Y AL ALGORITMO DE PREDICACIÓN EN CORPUS CIENTÍFICOS Guillermo Jorge-Botana Ricardo Olmos Albacete José A. León
    23. Aux. Listados vs. definiciones reales Comparación de los listados con textos reales Similitud de cada uno de los métodos con muestras de definiciones reales basados en DSM-IV ( Concepto general d fobia, Fobia social, Fobia específica Ansiedad generalizada)
    24. Aux. Listados vs. definiciones reales Comparación de los listados con textos reales Similitud de cada uno de los métodos con muestras de definiciones reales basados en DSM-IV ( Concepto general d fobia, Fobia social, Fobia específica Ansiedad generalizada)

    + jorgeybotanajorgeybotana, 2 years ago

    custom

    1097 views, 0 favs, 0 embeds more stats

    El algoritmo de predicación [2] trata de dar cuent more

    More info about this document

    © All Rights Reserved

    Go to text version

    • Total Views 1097
      • 1097 on SlideShare
      • 0 from embeds
    • Comments 0
    • Favorites 0
    • Downloads 11
    Most viewed embeds

    more

    All embeds

    less

    Flagged as inappropriate Flag as inappropriate
    Flag as inappropriate

    Select your reason for flagging this presentation as inappropriate. If needed, use the feedback form to let us know more details.

    Cancel
    File a copyright complaint
    Having problems? Go to our helpdesk?

    Categories