Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

La Minería de Datos en la Analítica Predictiva

23 views

Published on

La Minería de Datos en la Analítica Predictiva

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

La Minería de Datos en la Analítica Predictiva

  1. 1. Elaborado por: Pedro Ch�vez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Miner�a de Datos en la Anal�tica Predictiva La Miner�a de Datos en la Anal�tica Predictiva La Miner�a de Datos es el proceso de descubrimiento de patrones, tendencias y comportamientos de los datos en grandes vol�menes con la ayuda de las computadoras y aplicaciones de Inteligencia Artificial, Aprendizaje de M�quina, Estad�stica y Sistemas de Administraci�n de Datos. El prop�sito de la Miner�a de Datos tambi�n conocida como KDD (Knowledge Discovery in Database) es convertir grandes vol�menes de datos desorganizadas en informaci�n estructurada para an�lisis posteriores. El proceso de Miner�a de Datos es un proceso de an�lisis multidisciplinario que debe ser realizadopor matem�ticos, estad�sticos y programadores de computadoras. La profesi�n del analista de datos es una de las m�s buscadas en los portales de empleo y no en vano, fue definida en 2012 por �HarvardBusiness Review� como �la m�s sexi del siglo XXI�. Grandes compa��as como Google, IBM, Facebook, HP, Oracle, Amazon o LinkedIn utilizan a diario las ventajas que ofrece el �Big Data�y en consecuencia, destacan la importancia de este nuevo perfil profesional.
  2. 2. Elaborado por: Pedro Ch�vez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Miner�a de Datos en la Anal�tica Predictiva La miner�a de datos tambi�n se conoce con el nombre de Data Discovery, y engloba diversos procesos entre los cuales est�n: recolecci�n, extracci�n, almacenamiento o datawarehousing, limpieza y estandarizaci�n, transformaci�n, an�lisis, estad�stica, inteligencia artificial, aprendizaje de maquina y business intelligence. Antes que los datos sean explorados es decir sometidos al proceso de an�lisis estadistico requieren ser limpiados y transformados, para eliminar los errores e inconsistencias. La estad�stica proporciona herramientas para el an�lisis y establece patrones y tendencias en los datos y el aprendizaje de maquina administra las diferentes metodolog�as de aprendizaje.
  3. 3. Elaborado por: Pedro Ch�vez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Miner�a de Datos en la Anal�tica Predictiva Las t�cnicas de an�lisis estad�stico son procedimientos matem�ticos que buscan establecer patrones, tendencias o relaciones individuales o grupales en los datos de una poblaci�n o muestra. Diversos son los m�todos o t�cnicas estad�sticas de an�lisis de miner�a de datos; entre los mas importantes se encuentran: generalizaci�n, caracterizaci�n, clasificaci�n, clustering, asociaci�n, evoluci�n, secuencia de patrones, arboles de decisi�n, visualizaci�n de datos y miner�a guiada por reglas. Los proyectos de miner�a de datos comprenden un esfuerzo enorme de an�lisis que es apoyado por diversos est�ndares metodol�gicos. Una de las metodolog�as mas usadas para proyectos de miner�a de datos es CRISP-DM (Cross Industry Standard Process for Data Mining) que es un modelo de procesos est�ndares que describe m�todos generales usados por expertos en miner�a de datos. CRISP-DM fue concebido en 1996 y se convirti� en un proyecto de la Uni�n Europea bajo la iniciativa de financiamiento ESPRIT en 1997. El proyecto estaba liderado por 5 empresas: Integral Solutions Ltd (ISL), Teradata, Daimler AG, NCR Corporation y OHRA, una compa��a de seguros. CRISP-DM divide el proceso de miner�a de datos en 6 grandes etapas: Entendimiento del negocio, entendimiento de los datos, preparaci�n de los datos, modelamiento, evaluaci�n e implementaci�n.
  4. 4. Elaborado por: Pedro Ch�vez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Miner�a de Datos en la Anal�tica Predictiva Estas etapas se desarrollan de una manera no necesariamente secuencial y que se implementan seg�n las condiciones y necesidades del modelo en particular. Las flechas en el diagrama muestran las m�s importantes dependencias entre las fases del modelo y el circulo exterior muestra el ciclo natural de desarrollo del proceso de miner�a de datos. El proceso de miner�a de datos no se detiene y continua despu�s de que se ha obtenido una soluci�n. La lecci�n aprendida durante el proceso puede disparar un nuevo proceso de miner�a de datos frecuentemente con preguntas m�s enfocadas en el negocio y consiguientemente una nueva soluci�n de miner�a que ha aprovechado las experiencias anteriores.
  5. 5. Elaborado por: Pedro Ch�vez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Miner�a de Datos en la Anal�tica Predictiva T�cnicas de an�lisis en miner�a dedatos Las tareas de an�lisis de grandes vol�menes en miner�a de datos pueden ser realizadas en forma autom�tica o semiautom�tica y buscan encontrar patrones interesantes en los datos anteriormente desconocidos. Estas t�cnicas de an�lisis en forma general pueden describirse como: an�lisis de cluster, detecci�n de anomal�as y registros no usuales y an�lisis de dependencias utilizando reglas de asociaci�n. Los patrones detectados pueden ser entonces utilizados en an�lisis mas avanzados empleando aplicaciones de inteligencia artificial, aprendizaje de m�quina y anal�tica predictiva. Las t�cnicas de miner�a de datos se emplean en diferentes tipos de bases de datos que incluyen bases de datos relacionales, transaccionales, espaciales, orientadas a objetos, etc. La miner�a de datos en forma general involucra 6 tipos de t�cnicas de an�lisis: 1. Detecci�n de anomal�as: es la detecci�n de desviaciones o valores at�picos, que requieren ser identificados y verificados. 2. Aprendizaje basado en reglas de asociaci�n: Tambi�n denominado modelamiento dependiente debido a que busca relaciones entre las variables. Tambi�n se le conoce como An�lisis de la Canasta de Mercado. 3. Clustering: Es el proceso de descubrimiento de grupos y estructuras en los datos que son de alguna manera similares sin usar estructuras conocidas en los datos. 4. Clasificaciones: Es la tarea de generalizaruna estructura de datos conocida para aplicarla a nuevos datos. 5. Regresiones: Es la b�squeda de una funci�n de representaci�n que modelo los datos con el m�nimo de error. 6. Res�menes y visualizaciones: Proporciona una representaci�n consolidada de los datos a trav�s de graficas y reportes.
  6. 6. Elaborado por: Pedro Ch�vez F. Limitless Power of Information Business Analytics Society https://addkw.com/ La Miner�a de Datos en la Anal�tica Predictiva

×