Your SlideShare is downloading. ×
1
Sistemas Híbridos centrados en la Lógica Difusa
para el Diagnóstico de la enfermedad Coronaria
John Sprockel
Maestría de...
2
En el siguiente artículo se exponen tres modelos representativos de sistemas híbridos centrados en la lógica difusa,
ori...
3
Dentro de la metodología empleada, primero se generaron reglas por los expertos, a cada una de ellas se dividió en
tres ...
4
Figura 3. Representación de un cromosoma de la segunda fase.
Con n como el número de variables de entrada, m el número d...
5
Figura 5. Pasos de un AG.
Como resultado de éste proceso, se crean diez modelos, de los cuales, los dos mejores se compa...
6
Figura 6. Pasos de un PSO
Cada una de las cuales tienen un vector de dirección y una velocidad, asociada con un fitness ...
7
A. B.
Tabla 3. A. Parámetros del PSO. B. Ecuaciones para el ajuste de las funciones de pertenencia. Siendo k y w los
coe...
8
Referencias
[1] Negnevitsky, M. (2005). Hybrid intelligent systems. In Artificial intelligence: a guide to intelligent s...
Upcoming SlideShare
Loading in...5
×

Sistemas Híbridos centrados en la Lógica Difusa para el Diagnóstico de la enfermedad Coronaria

281

Published on

Los sistemas híbridos basados en la lógica difusa representan una forma de solucionar las dificultades de aprendizaje y adaptabilidad de la lógica difusa mientras se preserva la participación de los expertos y la capacidad de explicar. En el presente artículo presentan tres publicaciones que sirven para ejemplificar el aporte de la combinación de estrategias en la solución del problema diagnóstico que representa el infarto agudo del miocardio.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
281
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
7
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Transcript of "Sistemas Híbridos centrados en la Lógica Difusa para el Diagnóstico de la enfermedad Coronaria"

  1. 1. 1 Sistemas Híbridos centrados en la Lógica Difusa para el Diagnóstico de la enfermedad Coronaria John Sprockel Maestría de Ingeniería de Sistemas y Computación, Universidad Javeriana jsprockel@javeriana.edu.co Resumen. Los sistemas híbridos basados en la lógica difusa representan una forma de solucionar las dificultades de aprendizaje y adaptabilidad de la lógica difusa mientras se preserva la participación de los expertos y la capacidad de explicar. En el presente artículo presentan tres publicaciones que sirven para ejemplificar el aporte de la combinación de estrategias en la solución del problema diagnóstico que representa el infarto agudo del miocardio. Palabras Clave: inteligencia artificial, lógica difusa, sistemas fuzzy evolutivos, modelos neuro-fuzzy, aprendizaje fuzzy, enfermedad coronaria. 1 Introducción La lógica difusa fue propuesta por Lotfi A. Zadeh en 19651 como una extensión de uno de los conceptos subyacentes fundamentales de la Lógica Clásica proposicional: la dicotomización [1]. La creación de reglas difusas presentan dos ventajas frente a las reglas nítidas (crisp) [2]: a) contienen información adicional y b) pueden definir más fácilmente las fronteras de decisión en un eje no paralelo. La lógica difusa puede ser vista como una teoría para manejar la incertidumbre de los sistemas complejos. En la tabla 1 podemos identificar los principales puntos fuertes y falencias de cada una de las herramientas de la inteligencia artificial. Los sistemas híbridos buscan, complementar sus características en pos de optimizar algún aspecto de su desempeño. --: malo, -: más bien mal, +: más bien bueno, ++: bueno SBR: Sistemas Basados en Reglas, LD: Sistemas Difusos, ANN: Redes Neuronales y AG: Algoritmos Genéticos *Modificado de Negnevitsky [1]. 1. L.A. Zadeh. Fuzzy Sets, Information and Control, 8:338–353. 1965. SBR LD ANN AG Representación del conocimiento + ++ -- Tolerancia a la incertidumbre + ++ ++ ++ Tolerancia a la imprecisión -- ++ ++ ++ Adaptabilidad -- - ++ ++ Habilidad de aprendizaje -- -- ++ ++ Habilidad de explicación ++ ++ -- - Descubrimiento del conocimiento y mineria de datos -- - ++ + Mantenibilidad -- + ++ + TABLA 1. Comparación entre: Sistemas Basados en Reglas, Sistemas Difusos, Redes Neuronales y Algoritmos Genéticos
  2. 2. 2 En el siguiente artículo se exponen tres modelos representativos de sistemas híbridos centrados en la lógica difusa, orientados al diagnóstico de la enfermedad coronaria. 2 Presentación de un artículo de ejemplo de neuro-fuzzy El artículo titulado “An adaptive fuzzy model for ECG interpretation”, escrito por Xue et al en 1998 [5], describe cómo abordar el problema del diagnóstico del infarto y su localización, a partir de la medición de la amplitud del segmento ST (infra o supradesnivel) en distintas derivaciones, observar la figura 2. Figura 2. El punto M hace referencia al sitio donde se mide la amplitud del Segmento ST (localizada a un dieciseisava parte del RR alejada del punto J). Se usó una base de datos de dolor torácico de un estudio comunitario, con un registro de 1161 pacientes, de los cuales 285 tenían infarto (123 anterior, 123 inferior y 50 lateral) y 322 tuvieron angina. El 70% fue usado para entrenamiento y el 30% para pruebas. Los modelos ANFIS (Adaptative Neuro-Fuzzy Inference System), constan de cinco capas [1], las funciones de cada una de ellas pueden observarse en la figura 1. Figura 1. Funciones de cada una de las capas en un modelo ANFIS.
  3. 3. 3 Dentro de la metodología empleada, primero se generaron reglas por los expertos, a cada una de ellas se dividió en tres grupos (bajo, alto y muy alto) y posteriormente se utilizó un modelo ANFIS para optimizar las funciones de pertenencia de cada una de las variables de entrada. Sus características fueron: a) número de capas 4, b) uso de Backpropagatión y LMS, c) ejemplos ya descritos, d) número de iteraciones: 100, e) Función de pertenencia en campana, f) La regla de salida fue tipo Sugeno, con diez variables fijas entre 0 y 1, así que el consecuente se daba en probabilidad. Y sus resultados demostraron que se mejoraba la sensibilidad sin comprometer la especificidad en el diagnóstico del infarto a partir del electrocardiograma. Tabla 2. Resultados de cada modelo. Concluye que las desventajas de las ANN es que les hace falta una base de conocimiento estructural y no utilizan el conocimiento previo de los expertos. El sistema mixto preserva las ventajas de cada uno de los dos modelos 3 Presentación de un artículo de ejemplo de Fuzzy Genético La publicación de Ainon et al de 2012 [6], titulada “AMI Screening Using Linguistic Fuzzy Rules”, hace uso de un algoritmo genético multiobjetivo para disminuir la cantidad de variables de entrada y mejorar la precisión de un sistema experto basado en lógica difusa. Se tomaron datos de 887 pacientes con dolor torácico en urgencias del hospital de Selayang en Malasia. Se contaba con una base de datos con 48 variables de entrada y una salida. Características de la solución: Herramientas de Lógica Difusa: a) Tipos de reglas: Mandani b) Inicialización del sistema inicial: se generaron las regla mediante el método de Fuzzy C-means clustering. c) Descripción de las reglas generadas: Regla Rj: SI x1 es Aj1 y … y xn es Ajn ENTONCES y es Cj j es el número de la regla difusa, Ajn es un conjunto difuso antecedente definido sobre la entrada xi, y Cj es un conjunto difuso que representa al consecuente. d) Representación de los conjunto difusos: Función Gaussiana. e) No indican cómo se efectúa la defuzicación. f) Reemplazo de los conjunto difusos: por los valores lingüísticos bajo, promedio y alto. Se incluyó “no importa”. Algoritmo genético: a) Representación de los individuos: Fase 1: los cromosomas estaban representados por una cadena binaria con longitud igual al número de variables (0 ó 1 según si se tenía en cuenta o no). Fase 2: SENSIBILIDAD ESPECIFICIDAD 50 99 Entrenamiento 60 99 Pruebas 54 99 38 98 Después de la adaptación Antes de la adaptación MODELO Red Neuronal
  4. 4. 4 Figura 3. Representación de un cromosoma de la segunda fase. Con n como el número de variables de entrada, m el número de reglas difusas. Aji el antecedente lingüístico para el atributo i. Y Cj el consecuente. Por ejemplo: un cromosoma con tres entradas y dos reglas. Figura 4. Ejemplo de un cromosoma de la segunda fase. b) Función de Fitness: Fase 1: consiste en dos componentes, minimizar el número de entradas y maximizar la precisión. Donde es la precisión de la clasificación por el sistema experto y es el número de variables de entrada. Fase 2: también dos componentes, ambos de maximización, uno para la precisión (usan el área bajo la curva ROC) y otro para la trasparencia, medido por el número de conjuntos difusos “no importa” en la base de reglas. c) Proceso del AG: Generar población inicial Generar desendencia • Escoger los padres • Aplicar operadores genéticos Seleccionar las mejores soluciones Verificar la condición de terminación o volver al paso 2.
  5. 5. 5 Figura 5. Pasos de un AG. Como resultado de éste proceso, se crean diez modelos, de los cuales, los dos mejores se comparan con una red neuronal previamente elaborada. Se logra un mejoramiento de la precisión desde el 0.56 hasta un máximo de 0.75 de AUC, resultando en 79 el de la ANN. En conclusión se logra una mejoría de la trasparencia a costa de una leve disminución de la precisión. 4 Presentación de un artículo de ejemplo de Aprendizaje Fuzzy Swarm En el siguiente ejemplo, titulado “A hybrid particle swarm optimization based fuzzy expert system for the diagnosis of coronary artery disease”, Muthukaruppan et al en el 2012 presentan un modelo en el que se utilizó la combinación de un modelo de optimización de partículas de enjambre (particle swarm optimization o PSO) con un sistema experto basado en reglas difusas. Usaron una base de datos del Instituto Húngaro de Cardiología y de las Cleveland Clinic, compuesa de 597 datos con 13 atributos clínicos, se realizó el entrenamiento con 478 (278 sanos y 200 con enfermedad coronaria), y las pruebas con 119 (74 y 45). El desenlace fue angiográfico. La metodología inicial consistió en utilizar un mecanismo para imputación de los datos perdidos en la base de datos, llamado Heterogeneous Euclidean Overlap Metric (HEOP). Herramienta de Aprendizaje Máquina: Se diseñó un árbol de decisiones que se representa luego como un conjunto de reglas. Se eligió el Índice de Diversidad de Gini como criterio de división al momento de la generación del árbol. La medida del la impureza Gini i(t) en el nodo t se calculó de la siguiente forma: S es el criterio de impureza j es el número de clases existente en ese nodo y denota la frecuencia relativa de la clase j en el nodo t. El índice Gini obtiene su máximo valor cuando todas las clases en el nodo ocurren con igual probabilidad y es mínimo cuando contiene solo una clase. El control de la complejidad del árbol se realizó mediante la técnica de reducción del error por poda (reduced error pruning o REP). Consiste en examinar el cambio en el error de mal-clasificación sobre el conjunto de pruebas para cada sub-árbol T sin nodos terminales en el árbol original. Dicho error aparece si el sub-árbol es reemplazado por la clase más frecuente. Este proceso se continúa hasta que la poda comprometa la precisión. Herramientas de Lógica Difusa: a) Tipos de reglas: Mandani b) Representación de los conjuntos difusos: Función Triangular. c) La defuzicación se realizó mediante la técnica del centro de gravedad. d) Reemplazo de los conjunto difusos: por los valores lingüísticos de manera diferencial para cada variable. Particle Swarm Optimization: Se continuó con un proceso PSO para la optimización de las funciones de pertenencia de las reglas. Éste es un algoritmo evolutivo parecido al AG en el que se cambian los operadores genéticos (mutación y recombinación) por poblaciones de partículas [3].
  6. 6. 6 Figura 6. Pasos de un PSO Cada una de las cuales tienen un vector de dirección y una velocidad, asociada con un fitness y la memoria de su mejor posición (ver figura 3). Figura 7. Anatomía de cada partícula (tomado de Jones [3]). En éste caso cada partícula está representado por los parámetros de la figura 8 y en la tabla 3 se presentan sus rangos y las ecuaciones. Los coeficientes de ajuste funcionan desplazando los rangos de la función de pertenencia sin cambiar la forma (k) y otro que la disminuye o expande (w). Figura 8. Parámetros de la función de pertenencia. Generar población inicial de partículas Generar el movimiento de las partículas •Asociado con la memoria de la mejor ubicación. Seleccionar las mejores soluciones una vez cumplido el criterio de terminación
  7. 7. 7 A. B. Tabla 3. A. Parámetros del PSO. B. Ecuaciones para el ajuste de las funciones de pertenencia. Siendo k y w los coeficientes de ajuste. En la figura 9 podemos observar un ejemplo del resultado de la optimización de los conjuntos difusos de la variable pico de edad. Como resultado se obtuvo una precisión y una especificidad del 93.3% con una sensibilidad del 93.2%. Al ser comparado con otros experimentos similares (con redes de creencia Bayesianas, Bayes nativo, Neuro-fuzzy, ANFIS, entre otros), éste obtuvo el mejor rendimiento. Figura 9. Ejemplo de la optimización de los conjuntos difusos con el PSO aplicado. Concluye que Las principales ventajas de la FES como una herramienta de adquisición de conocimiento son los siguientes: a) se obtiene un pequeño número de reglas y b) las reglas obtenidas pueden ser fácilmente interpretados. Estos resultados implican áreas de investigación prometedoras que emplean árboles de decisión y el sistema experto difuso en varios problemas de clasificación. 5. CONCLUSIONES La inteligencia artificial intenta emular la inteligencia humana: SBR por reglas e inferencia lógica, ANN por procesamiento paralelo de datos. Mientras los SBR no pueden aprender si logran explicar su razonamiento, las ANN operan de manera contraria. La interacción de herramientas logra mejorar el desempeño de estos aspectos. Los sistemas híbridos combinan al menos dos tecnologías inteligentes. Estos sistemas favorecen el razonamiento y aprendizaje en ambientes inciertos o imprecisos. Los sistemas híbridos fuzzy se pueden estar orientados a la disminución de las variables de entrada, encontrar las reglas a partir de un conjunto de ejemplos (aprendizaje), disminuir el número de reglas o para optimizar los conjuntos difusos como se demuestra en los ejemplos.
  8. 8. 8 Referencias [1] Negnevitsky, M. (2005). Hybrid intelligent systems. In Artificial intelligence: a guide to intelligent systems (Second., pp. 259 – 298). Tazmania, Australia: Pearson Education Limited. [2] Muthukaruppan, S., & Er, M. J. (2012). A hybrid particle swarm optimization based fuzzy expert system for the diagnosis of coronary artery disease. Expert Systems with Applications, 39(14), 11657–11665. doi:10.1016/j.eswa.2012.04.036 [3] Jones MT. Artificial Intelligence: A Systems Approach, INFINITY SCIENCE PRESS LLC, 2008 [4] Dourado, A., Henriques, J., & Carvalho, P. de. (2008). Neural, Fuzzy, and Neurofuzzy Systems for Medical Applications. In Intelligent and adaptive systems in medicine (pp. 127 – 171). London, UK: Taylor & Francis Group. [5] Xue, Q., Taha, B., Reddy, S., & Aufderheide, T. (1998). An adaptive fuzzy model for ECG interpretation (Vol. 20, No. 1, pp. 131–134). Presented at the Proceedings of the 20th Annual International Conference of the ZEEE Engineering in Medicine and Biology Society, IEEE. doi:10.1109/IEMBS.1998.745847 [6] Ainon, R. N., Bulgiba, A. M., & Lahsasna, A. (2010). AMI Screening Using Linguistic Fuzzy Rules. Journal of Medical Systems, 36(2), 463–473. doi:10.1007/s10916-010-9491-2

×