Ejemplo de Arboles de decision aplicados a la Minería de Datos.

5,461 views

Published on

En el siguiente artículo, se pretende mostrar las características principales de la minería de datos (Data Mining) y ejemplificar con árboles de decisión (técnica de Data Mining) un caso de la vida real para comprender su uso más práctico, mostrando la información de manera gráfica y totalmente comprensible.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
5,461
On SlideShare
0
From Embeds
0
Number of Embeds
9
Actions
Shares
0
Downloads
159
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Ejemplo de Arboles de decision aplicados a la Minería de Datos.

  1. 1. ARBOLES DE DECISIÓN APLICADOS A LA MINERIA DE DATOS Miguel Ángel Bermeo Otavo Miguel.bermeo@outlook.com UNIVERSIDAD MANUELA BELTRAN – BOGOTA, COLOMBIA RESUMEN: En el siguiente artículo, se pretende mostrar las características principales de la minería de datos (Data Mining) y ejemplificar con árboles de decisión (técnica de Data Mining) un caso de la vida real para comprender su uso más práctico, mostrando la información de manera gráfica y totalmente comprensible. PALABRAS CLAVE: Arboles de decisión, Minería de datos, Data Mining y decision trees. ABSTRACT: In the following article, is to show the main characteristics of data mining (Data Mining) and exemplify with decision trees technique (Data Mining) a case of real life to understand more practical use, displaying the information in a graphic and completely understandable. KEY WORDS: Decision trees, Data Mining, Data Mining and decision trees. 1. INTRODUCCION La minería de datos o Data Mining en inglés, es un campo de estudio de las Ciencias computacionales, en donde también se encuentra como etapa del (KDD) en la inteligencia artificial (IA). La minería de datos básicamente es un proceso donde se pretende descubrir patrones en grandes volúmenes de datos prominentes de Bases de datos que aporten una influencia para la toma de decisiones. Esta de igual forma utiliza los métodos de la (IA), de forma automática o semiautomática para analizar las grandes cantidades de datos en busca de patrones interesantes que se desconocen. Los arboles de decisión son un modelo predictivo, que construye diagramas de construcciones lógicas a partir de una base de datos. Esta una técnica utilizada por la minería de datos para el análisis de datos con el fin de tomar decisiones convenientes. 2. ARBOLES DE DESICION Los arboles de decisión, son representaciones gráficas y analíticas de datos introducidos por medio de una base de datos ya establecida. Estos ayudan en la toma de decisiones, desde un punto de vista probabilístico con el fin de elegir la opción más conveniente. Los arboles de decisión se caracterizan por ser una técnica utilizada por la minería de datos, en donde se busca solucionar problemas de predicción, clasificación y segmentación, una vez analizados todos los datos. Existen algoritmos para realizar el análisis de los datos como; Algoritmo ID3 y C4.5 (evolución del ID3), de igual forma existen algoritmos que no son de decisión, sino utilizados para problemas de regresión, para este tipo se utiliza el algoritmo CART. 2.1 CARACTERTISTCAS Y VENTAJAS DE LOS ARBOLES DE DECISION: Terminología: - Nodo de decisión: indica que debe tomarse una decisión en ese punto del proceso y su re prestación se da por un cuadrado. - Nodo de probabilidad: indica que en ese punto del proceso ocurre un evento aleatorio. Representado por un círculo. - Rama: Indica distintos caminos por donde se puede emprender cuando se toma una decisión o sucede un evento aleatorio. - Ventajas de los árboles de decisión:     Facilitan la interpretación de la decisión tomada Facilita la comprensión del conocimiento utilizando la toma de decisiones. Reduce el número de variables independientes Explica el comportamiento respecto a una determinada decisión.  2.2 DEMOSTRACION DE ARBOL DE DECISIÓN Ejemplo: Préstamo de Crédito: Cliente 1 2 3 4 5 6 7 8 9 10 Moroso si no si no no si no no no si Antiguedad >5 <1 1−5 >5 <1 1−5 1−5 <1 >5 1−5 Ingresos 600 − 1200 600 − 1200 >1200 >1200 >1200 600 − 1200 >1200 <600 600 − 1200 <600 Trabajo Fijo si si si no si si si si no no Tabla 1. BD Préstamo de Crédito Conceder Credito? no si no si si no si no no no
  2. 2. En la tabla 1 se relacionan 10 clientes a los que se evaluara de acuerdo a unos factores establecido si se les puede o no conceder un crédito bancario. Árbol: 3. REFERENCIAS: [1] (2013, Febrero 5) Wikipedia [En línea]. Disponible en http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos [2] (2013, Junio) Slideshare [En línea]. Disponible en: http://www.slideshare.net/04071977/mineria-de-datos [3] (2012, Octubre 11) Diposit.ub.edu [En línea]. Disponible en: http://diposit.ub.edu/dspace/bitstream/2445/43762/1/61 8361.pdf [4] (2007) it.uc3m.es [En línea]. Disponible en: http://www.it.uc3m.es/jvillena/irc/practicas/0304/18.mem.pdf [5] (2012) utm.mx [En línea]. Disponible en: http://www.utm.mx/~jahdezp/archivos%20estructuras/D ESICION.pdf

×