UNIVERSIDAD TECNOLÓGICA EMILIANO ZAPATA DEL             ESTADO DE MORELOS        Data Mining                MINERÍA DE DAT...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosÍndiceIntroducci...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosIntroducciónEsta...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosDefinición e His...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosComo ya se ha me...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosProcesos para ap...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosExtracción de co...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosEstas técnicas s...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosReglas de inducc...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosUsos principales...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosEl DM nos permit...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosSoftware para ap...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de Morelos2. Selecciona au...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosRAP ANALISTAAnal...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de Moreloscerveza. Se dete...
Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de Moreloshttp://www.monog...
Upcoming SlideShare
Loading in...5
×

Data Mining

2,654

Published on

Published in: Technology
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
2,654
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
3
Embeds 0
No embeds

No notes for slide

Transcript of "Data Mining"

  1. 1. UNIVERSIDAD TECNOLÓGICA EMILIANO ZAPATA DEL ESTADO DE MORELOS Data Mining MINERÍA DE DATOS “Torturar a los datos hasta que confiesen” Ingeniería en Tecnologías de la Información Base de Datos para Aplicaciones I.S.C. Emmanuel Vázquez Gómez Elaboro: Felipe Gudiño Diego Alejandro Lobato Farias José Antonio Sotelo Colín Iván Jesús Raúl Villafán Baranda Sergio González Cruz Grupo 8°A
  2. 2. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosÍndiceIntroducción ................................................................................................................................................. 3Definición e Historia de la Minería de Datos .......................................................................................... 4Procesos para aplicar la Minería de Datos ............................................................................................. 6Técnicas y algoritmos de la Minería de Datos ....................................................................................... 7Usos principales de la Minería de Datos .............................................................................................. 10Software para aplicar la Minería de Datos............................................................................................ 12Ejemplo ...................................................................................................................................................... 14Conclusión ................................................................................................................................................. 15Bibliografía y Referencias en Internet ................................................................................................... 15 2
  3. 3. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosIntroducciónEstamos en una edad a menudo nombrada como la edad de la información. Nombradaasí porque se encuentra ligada a las tecnologías de la información y la comunicación yporque creemos que la información conduce al poder y al éxito. Gracias a la tecnologíasofisticada, hemos estado recogiendo enormes cantidades de información. Inicialmentecon la llegada de los ordenadores y los medios para el almacenamiento digital masivo,comenzamos a coleccionar y almacenar todo tipo de datos. Desafortunadamente, estascolecciones masivas de datos almacenados en estructuras diferentes rápidamente seconvirtieron en algo abrumador. Este caos inicial ha llevado a la creación de Bases deDatos Estructuradas y Sistemas de Gestión de Base de Datos (DBMS).Los sistemas eficientes de gestión de base de datos han sido activos muy importantespara la gestión de una amplia recopilación de datos y especialmente para larecuperación efectiva y eficiente de la información en particular de una gran colecciónsiempre que sea necesario. La proliferación de sistemas de gestión de bases de datostambién ha contribuido a la reciente reunión masiva de todo tipo de información. Hoy endía, tenemos mucho más información que podemos manejar. La recopilación de lainformación simplemente no alcanza para la toma de decisiones. Frente a enormescolecciones de datos, tenemos nuevas necesidades.Las nuevas aplicaciones más complejas o sofisticadas difieren en gran medida de lasaplicaciones de gestión y modelos de base de datos tradicionales. Las bases de datosorientadas a objetos se crearon para satisfacer las necesidades de las nuevasaplicaciones. Ofreciendo flexibilidad para manejar algunos de estos requisitos, sinembargo eso no ha sido suficiente. La gran cantidad de datos almacenados en unióncon el gran desarrollo tecnológico de los ordenadores, ha supuesto la aparición de unatecnología emergente conocida como ―Data Mining‖ (DM), surgiendo básicamente paraintentar ayudar a comprender el contenido de un repositorio de datos.La ―minería de datos‖ o ―Data Mining‖ se ha convertido en una herramienta detecnología de la información de gran alcance en el mundo empresarial competitivo dehoy. Siendo un conjunto de técnicas y tecnologías que permiten explorar y analizargrandes volúmenes de datos para hacerlos más comprensibles y en segundo lugar paraencontrar correlaciones significativas, es decir, las normas de clasificación y predecir deforma automatizada tendencias y comportamientos. 3
  4. 4. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosDefinición e Historia de la Minería de DatosRecientemente, la minería de datos ha sido objeto de numerosos artículos en revistasde negocios y software. Sin embargo, sólo unos pocos años atrás, pocas personashabían escuchado el término ―Data Mining‖. En la década de los años 60’s, losestadísticos utilizaban términos como ―Data Fishing‖ (Pesca de datos), ―Data Dredging‖(Filtración de datos), ―Data Archaelogy‖ (Arqueología de datos), ―Information Harvesting‖(Recolección de Información), ―Information Discovery‖ (Descubrimiento de Información),Knowledge Extraction (Extracción de conocimiento), entre otros.El origen de la minería de datos se remonta a lo largo de tres principales conceptos: 1. La estadística clásica Sin estadística, no habría minería de datos, ya que las estadísticas son el fundamento de la mayoría de las tecnologías en que se asienta la minería de datos. La estadística clásica incluye conceptos tales como el análisis de regresión, la distribución estándar, desviación estándar, varianza estándar, análisis discriminante, análisis de conglomerados y los intervalos de confianza. Los cuales se utilizan para estudiar los datos y las relaciones de datos. 2. La inteligencia artificial (AI) Esta disciplina basa en la heurística en comparación con las estadísticas, intenta aplicar el pensamiento humano como el procesamiento de los problemas estadísticos. 3. La Máquina de aprendizaje El aprendizaje automático, combina la heurística de la inteligencia artificial con el análisis estadístico avanzado, que permite a los ordenadores aprender acerca de los datos que estudian, de tal manera que sean capaces de tomar decisiones diferentes en función de las cualidades de los datos estudiados, utilizando algoritmos para lograr sus objetivos.La minería de datos es un proceso de exploración y análisis de grandes volúmenes dedatos para hacerlos más comprensibles. La minería de datos prepara, sondea y exploralos datos para sacar la información oculta en ellos, es un método para descubrir―pepitas de oro‖ en una mina de carbón. 4
  5. 5. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosComo ya se ha mencionado la minería de datos no es nueva. El concepto de ―Mineríade Datos‖ (DM, Data Mining) fue introducido aproximadamente en 1990, posiblementese remota a 1989, durante el primer taller KDD (Knowledge Discovery in Databases),siendo mencionado por Gregory Platetsky-Shapiro.En otros términos, la minería de datos es un proceso de descubrir nuevas o útilescorrelaciones, los patrones y las tendencias en grandes cantidades de datosalmacenados en los repositorios, utilizando la tecnología de reconocimiento de patronesy técnicas matemáticas y estadísticas.La minería de datos es el análisis de conjuntos de datos de observaciones paraencontrar relaciones inesperadas y presentar datos de una manera comprensible y útilpara el propietario de la información. También es un campo inter-disciplinado quecombina diferentes técnicas de reconocimiento de patrones de inteligencia artificial,estadísticas, bases de datos y la visualización de extracción de la información degrandes cantidades de datos.Data Mining igualmente representa a un conjunto de técnicas y herramientas usadaspara encontrar y entender relaciones en una gran cantidad de datos y presentarlas enuna forma útil y ventajosa. Es decir, cuando una empresa ha acumulado una grancantidad de datos en su interacción con los clientes, podría usar estos datos paraconocer mejor a los clientes y tomar mejores decisiones. Y ¿Cómo harían esto? Lamejor manera, sobre todo si la cantidad de datos es grande, sería usar programasespeciales que le permitan no solo obtener promedios y sumas, sino también que seancapaces de encontrar relaciones útiles. Por ejemplo, si el porcentaje de clientes que secambia a la competencia es preocupante, sería conveniente conocer cuáles son losfactores que influyen es sus decisiones para poder actuar de manera que se logredisminuir las bajas.Al conjunto de programas, técnicas y métodos que posibilitan conocer este tipo deinformación, se lo llama Data Mining. 5
  6. 6. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosProcesos para aplicar la Minería de DatosPara implementar un Data Mining se deben seguir ciertos procesos. Esto permitirá serealice de manera adecuada y se puede obtener la información que se necesita. Acontinuación de muestra de manera detallada los procesos requeridos para la minería.Selección del conjunto de datosComo primer paso, es determinar qué es lo que se quiere obtener del DM, es decir, unabase puede estar compuesta por diferente información, pero solamente porciones sonrequeridas. Se debe determinar si se requieren patrones, asociaciones, o realizarpredicciones.Determinar si la base de datos se encuentra distribuida, o se necesita clusterizar paraobtener mejores resultados en el DM.Análisis de los datos En este paso, los datos que se han sido seleccionados para ser procesador por el DM,deben ser refinados, es decir, eliminar cualquier tipo de incoherencia sobre estos, comolos valores nulos. De igual forma se debe verificar que la integridad de los datos seencuentre intacta. Puesto que durante el DM pueden surgir errores, o incluso, lainformación resultante puede tener inconsistencias y no ser fiable.Transformación del conjunto de datos de entradaUna vez que los datos han sido ―refinados‖, estos se deben comprender para podertomar las decisiones correctas al momento de crear el modelo y seleccionar la técnicaadecuada de DM. A los datos se les aplican diferentes tipos de análisis, esto incluyecalcular los valores mínimos y máximos, calcular la media y las desviaciones estándar yexaminar la distribución de los datos. Una vez analizados los datos, se puede decidir siel conjunto de datos contiene datos con errores y, a continuación, crear una estrategiapara solucionar los problemas.Seleccionar y aplicar la técnica de minería de datosUna vez que los datos han sido preparados, se construyen modelo, ya sea predictivo,de clasificación o de segmentación, según sea la necesidad.A continuación, el modelo con la información es pasado a una técnica de minería dedatos. Dentro de las técnicas existen variedades, por lo cual, se deberá tomar la técnicaque mejor se adapte a nuestro modelo. 6
  7. 7. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosExtracción de conocimientoUna vez que se ha utilizado la técnica seleccionada, se puede obtener patrones decomportamientos en los datos, esta información puede ser analizada, en caso que lainformación obtenida no es la esperada, se puede volver a realizar los procedimientos,cambiar de modelo, e incluso utilizar otras técnicas para obtener otros resultados.Interpretación y evaluación de datosUna vez obtenido los resultados de las técnicas, se debe analizar y validardeterminando si los resultados fueron satisfactorios. En cambio si los resultados no sonlos esperados, se debe de regresar a pasos anteriores para corroborar que se realizotodo de manera correcta. Así hasta que el experto lo crea oportuno el modelo final.Una vez que se obtiene el modelo final, puede ser incorporado a diferentes ámbitos detrabajo para poder ser explotado. Esto gracias a que el Data Mining Group,estandarizo el lenguaje PMML (Predictive Model Markup Language), que permiteque los modelos sean independientes a las plataformas de donde fueronconstruidos. Los fabricantes de sistemas de base de datos y programas deanálisis utilizan el estándar.Técnicas y algoritmos de la Minería de DatosLas técnicas de la Minería de Datos son provenientes de la Inteligencia Artificial (La cualse refiere a la ciencia e ingeniería de hacer máquinas inteligentes, especialmenteprogramas de cómputo.) y la Estadística (Es una ciencia que estudia la recolección,análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones). 7
  8. 8. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosEstas técnicas son algoritmos con cierto grado de sofisticación, aplicados a un conjuntode datos, con la finalidad de obtener una cantidad de resultados deseados.Clustering o clasificación, Reglas de asociación y Análisis de Secuencias: 1. ―En el Clustering o Clasificación se analizan los datos y se generan conjuntos de reglas que agrupen y clasifiquen los datos futuros. Debe tenerse en cuenta que en la Minería de Datos se busca obtener reglas que partición en los datos.‖ 2. ―Una regla de asociación es una regla que implica o presenta ciertas relaciones entre un grupo de objetos en una base de datos. En el proceso de la Minería de Datos se obtienen varias reglas de este tipo con distintos niveles de abstracción.‖ 3. ―El análisis de secuencias trata de encontrar patrones que ocurren con una secuencia determinada.‖Dentro de la Minería de Datos, existen algunas técnicas representativas que permitendesarrollar dicha búsqueda de datos, las cuales son:Redes NeuronalesSon un paradigma de aprendizaje y procesamiento automático inspirado en la forma enque funciona el sistema nervioso de los animales. Se trata de un sistema deinterconexión de neuronas en una red que colabora para producir un estímulo de salida.Algunos ejemplos de red neuronal son: El Perceptrón. El Perceptrón multicapa. Los Mapas Auto-organizados, también conocidos como redes de Kohonen.Algoritmos genéticosTécnicas de optimización que utilizan procesos como el entrecruzamiento genético, lamutación y la selección natural en un diseño basado en los conceptos de la evoluciónnatural.Método del vecino más cercanoEs una técnica que clasifica cada registro de un conjunto de datos en base a lacombinación de las clases de los k registros más similares. Generalmente se utiliza enbases de datos históricas. 8
  9. 9. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosReglas de inducciónLa extracción de reglas si-entonces a partir de datos de importancia estadística.Visualización de los datosLa interpretación visual de las relaciones entre datos multidimensionalesÁrboles de decisiónUn árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligenciaartificial, dada una base de datos se construyen estos diagramas de construccioneslógicas, muy similares a los sistemas de predicción basados en reglas, que sirven pararepresentar y categorizar una serie de condiciones que suceden de forma sucesiva,para la resolución de un problema. Algoritmo ID3 Algoritmo C4.5Modelos estadísticosEs una expresión simbólica en forma de igualdad o ecuación que se emplea en todoslos diseños experimentales y en la regresión para indicar los diferentes factores quemodifican la variable de respuesta.Agrupamiento o ClusteringEs un procedimiento de agrupación de una serie de vectores según criterioshabitualmente de distancia; se tratará de disponer los vectores de entrada de forma queestén más cercanos aquellos que tengan características comunes. Algoritmo K-means. Algoritmo K-medoids.Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican ensupervisados y no supervisados: Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de ellos) desconocido a partir de otros conocidos. Algoritmos no supervisados (o del descubrimiento del conocimiento): se descubren patrones y tendencias en los datos. 9
  10. 10. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosUsos principales de la Minería de DatosLa minería de datos es ampliamente utilizada en nuestra época por diversas áreas,donde principalmente necesitan predecir patrones de comportamiento.Dentro de las principales área donde el DM es utilizado encontramos a los siguientes:Negocios y ComercioConocer el patrón de compras del cliente para, por ejemplo, diseñar mejores campañasde publicidad y aumentar las ventas. También se puede utilizar para localizar patronesde fuga de dinero, fraudes en bancos, comportamiento en el área de recursos humanos,así como una gran herramienta para la alta dirección y la elaboración de estrategias.EmpleoCuantificar las habilidades y desempeño de los trabajadores para aprovecharlas almáximo. Localizar trabajadores descontentos. Tasa de desempleo.EleccionesComparar grandes bases de datos sobre hábitos de consumo y encuestas para conocercon detalle las inquietudes y los intereses del votante y así perfilar mejores campañas.MedicinaReunir grandes bases de datos biológicos para emplearlas en la detección a tiempo detumores, demencias o alzhéimer, entre otras enfermedades.Lucha contra el terrorismoLocalización de relaciones, transacciones económicas y movimientos de sospechosos.Ciencia e IngenieríaEn el estudio de la secuencia del ADN, monitoreo de instalaciones de alta tensión,análisis de gases disueltos.Comportamiento de InternetVisitas a sitio, propaganda de acuerdo al perfil. 10
  11. 11. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosEl DM nos permite localizar patrones, incluso en la actividades cotidianas de unapersona, podemos analizarlo y determinar que va a hacer, que va a comprar, que va atomar. Incluso extender la aplicación a un grupo de personas, a una ciudad.Vivimos en un tiempo, donde la mayoría de las personas se encuentran conectadas dealguna manera a internet, y la mayoría de las actividades que realizamos, desde ir a unsupermercado, utilizar el celular, entrar a un sitio, buscar por internet, se guarda en unabase de datos. Estas bases de datos pueden tener un millón de entradas, sin embargo,pueden ser estudiados y así determinar comportamientos.El DM es utilizado por un amplio abanico de empresas, que dependen totalmente de lasacciones de sus usuarios, o clientes. Un gran ejemplo es Google. Google es unaempresa que la mayoría de sus ingresos es por medio de la publicidad, cada vez queuna persona realiza una búsqueda deja un rastro, con lo cual mediante el DM, puedeofrecerte publicidad de productos determinado por medio de las búsqueda que unorealiza.Los usos comerciales del DM son abundantes. Por ejemplo; Los supermercados y lasgrandes cadenas, como Wal-Mart o Ikea, crean grandes bases de datos en los quecada entrada es un ticket, de esta manera ellos saben qué has comprado y, si tienestarjeta de fidelidad e incluso tienen tus datos personales. Es información es fundamentalpara determinar los patrones de compra y poder estimular las ventas. Localizan porejemplo dos productos que siempre se compran juntos y los colocan en dos pasillosseparados para que tengas que pasar por un tercero y compres otros que no teníasprevisto adquirir.En la elaboración de los modelos de predicción se emplean desde la estadísticatradicional hasta las reglas de asociación ("si este producto se compra junto a unsegundo y un tercero, entonces es probable que se compre un cuarto"). También losbancos suelen invertir en el desarrollo de sistemas de predicción de impagos depréstamos.Las líneas aéreas en Internet cuentan con un registro de millones de entradas. Si seanaliza el registro de clics se puede saber, por ejemplo, en qué momento un cliente hadejado de comprar un boleto de vuelo y cuales fueron esas causas que obligaron alcliente a abandonar la compra; quizás sea porque ha recibido un cargo sorpresivo, porejemplo. Toda esa información les interesa saberlo a las grandes compañías. 11
  12. 12. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosSoftware para aplicar la Minería de DatosLa palabra software se refiere a los programas o conjunto de programas que realizantareas especificas. Estos programas ofrecen un soporte y facilitan la toma dedecisiones. Existen muchas herramientas de software para el desarrollo de modelos deminería de datos tanto libres como comerciales, por ejemplo: KXEN Powerhouse SAS Enterprise Miner KNIME Quiterian STATISTICA Data Orange RapidMiner Miner Lenguaje R Weka SPSS Clementine KEELKNIMEKnime está desarrollado en la plataforma de eclipse y programado, esencialmente, enjava. Es una herramientas grafica y dispone de una serie de nodos (que encapsulandistintos tipos de algoritmos) y con flechas (que en ellas representan flujo de datos) quese despliegan y combinan de manera grafica e interactiva.Knime ofrece: Manipulación de filas, columnas, etc. Visualización (histogramas etc.) Creación de modelos estadísticos y de minería de datos, como arboles de decisión. Creación de informes a medida de gracias a su integración con birt.PowerhouseDesarrollado por Dataxplore, Powerhouse™ es una herramienta de análisis de datosque el permitirá obtener información de sus datos en pocos segundos:Prepara las variables automáticamente1. Una sola ventana con un resúmen estadístico de todas las variables 12
  13. 13. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de Morelos2. Selecciona automáticamente de las variables más importantes3. Crea rápidamente modelos para explicar o predecir4. Exporta los modelos a Excel5. Genera reportes en PowerPointORANGE (Aprendizaje Automático)Orange es un programa informático para realizar minería de datos y análisis predictivos.Conformado de una serie de componentes desarrollado en C++ que implementaalgoritmos de minera de datos así como operaciones de pre-procesamiento yrepresentación grafica de datos.RAPIDMINERRapidminer es un programa informático para el análisis y minería de datos. Permite eldesarrollo de procesos de análisis mediante el encadenamiento de operadores a travésde un entorno grafico.Las principales características son las siguientes: Esta desarrollado en java. Es multiplataforma Incluye gráficos y herramientas de visualización de datos. Permite el desarrollo de programas a través de un lenguaje de script. Representación interna de los procesos de análisis de datos en ficheros XML. 13
  14. 14. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de MorelosRAP ANALISTAAnalista RAP es una aplicación de software de escritorio que utiliza el modelado dedatos de minería, el análisis y la predicción para ayudar a los profesionalesempresariales, de forma rápida busca las tendencias de datos y las relaciones entreellos. También tiene el poder de simplificar y mejorar la forma de como las empresaspueden interpretar y analizar los datos.R (Lenguaje de programación)R es un lenguaje de programación y entorno de programación para el análisisestadístico y grafico. Y se trata de un programa de software libre, que proporciona unamplio abanico de herramientas estadísticas (modelos lineales y no lineales, pruebasestadísticas, análisis de series temporales, algoritmos de clasificación y agrupamiento,etc.) y graficas.EjemploEl ejemplo clásico de aplicación de la minería de datos tiene que ver con la detecciónde hábitos de compra en supermercados. Un estudio muy citado detectó que los vierneshabía una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y 14
  15. 15. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de Moreloscerveza. Se detectó que se debía a que dicho día solían acudir al supermercado padresjóvenes cuya perspectiva para el fin de semana consistía en quedarse en casacuidando de su hijo y viendo la televisión con una cerveza en la mano. El supermercadopudo incrementar sus ventas de cerveza colocándolas próximas a los pañales parafomentar las ventas compulsivas.También es un área en popularidad el del análisis del comportamiento de los visitantes—sobre todo, cuando son clientes potenciales— en una página de Internet. O lautilización de la información —obtenida por medios más o menos legítimos— sobreellos para ofrecerles propaganda adaptada específicamente a su perfil. O para, una vezque adquieren un determinado producto, saber inmediatamente qué otro ofrecerleteniendo en cuenta la información histórica disponible acerca de los clientes que hancomprado el primero.ConclusiónEn conclusión, la aplicación del Data Mining en diferentes ámbitos, permite tener unavisión a grande escala de los patrones que la información oculta. Permitiendo tomardecisiones asertivas a problemas, o para formular estrategias de mejora.Es importante tener en cuenta el Data Mining para cualquier estudio de información, asícomo estar en constante evolución, ya que la información varia con el transcurso deltiempo, y los patrones pueden cambiar.Bibliografía y Referencias en InternetPrincipios de Data Mining, D.J. Hand,Heikki Mannila, Padhraic Smyth.Introducción a la minería de datos. Michel Jambu. Eyrolles, 1999.http://www.minas.upm.es/fundacion/fgp/index.php/es/la-fundacion-gomez-pardo/actualidad/156-ique-es-la-mineria-de-datosdata-mining 15
  16. 16. Data Mining – Base de datos para AplicacionesUniversidad Tecnológica Emiliano Zapata del Estado de Moreloshttp://www.monografias.com/trabajos81/5-ejemplos-aplicacion-mineria-datos/5-ejemplos-aplicacion-mineria-datos.shtmlhttp://msdn.microsoft.com/es-es/library/ms174949(v=sql.90).aspx#BuildingModelshttp://www.answermath.com/data-mining/mineria-de-datos-6-herramientas.htmhttp://www.mitecnologico.com/Main/TecnicasHerramientasDeMineriaDeDatoshttp://lular.es/a/Internet/2010/09/Que-es-la-Web-de-miner-a-de-datos.htmlhttp://es.wikipedia.org/wiki/Data_mining#Herramientas_de_softwarehttp://datamining.typepad.com/data_mining/2007/06/blogbelt.htmlhttp://es.wikipedia.org/wiki/Predictive_Model_Markup_Languagehttp://foros.emagister.com/foro-foro_de_datamining-12768.htmhttp://www.ecured.cu/index.php/Miner%C3%ADa_de_Datoshttp://www.dei.uc.edu.py/tai2001/datamining/Dataminig.htmhttp://www.portalhacker.net/index.php/topic,143003.0.htmlhttp://es.wikipedia.org/wiki/Miner%C3%ADa_de_datoshttp://www.asine.cl/mainproyserdatamining.htmlhttp://www.pti.com/espanol/Datamining.htm 16

×