SlideShare a Scribd company logo
1 of 12
Instituto universitario de Tecnología
  y Administración Industrial IUTA
       Decreto 771 del 15-02-90
Región capital Ampliación Guarenas
      Especialidad Informática
           Sección 203 A1
     Asignatura: Base de Datos




                                   Alumnos:

                                   Guajari Vallenilla

                                   Carlos Garcés

                                   Hector Gonzales

         Caracas, Enero 2012
Es el conjunto de técnicas y tecnologías que permiten
explorar grandes bases de datos, de manera automática o
semiautomática, con el objetivo de encontrar patrones
repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un determinado contexto.

       Básicamente, el datamining surge para intentar ayudar
a comprender el contenido de un repositorio de datos. Con
este fin, hace uso de prácticas estadísticas y, en algunos
casos, de algoritmos de búsqueda próximos a la Inteligencia
Artificial y a las redes neuronales.
La idea de Minería de Datos no es nueva. Ya desde los
años sesenta los estadísticos manejaban términos como
Data Fishing, Data Mining (DM) o Data Archaeology con la
idea de encontrar correlaciones sin una hipótesis previa en
bases de datos
       A principios de los años ochenta, Rakesh Agrawal,
GioWiederhold, Robert Blum y Gregory Piatetsky-Shapiro
entre otros, empezaron a consolidar los términos de Minería
de Datos y KDD.
Esta tecnología ha sido un buen punto de encuentro entre
personas pertenecientes al ámbito académico y al de los
negocios.
La evolución de sus herramientas en el transcurso del
tiempo puede dividirse en cuatro etapas principales:


•Colección de Datos (1960).


•Acceso de Datos (1980).


• Almacén de Datos y Apoyo a las Decisiones (principios de
la década de 1990).


• Minería de Datos Inteligente. (finales de la década de 1990).
Las líneas de desarrollo en el ámbito de
minería de datos tienen sus orígenes en tres
conceptos importantes:

•Estadística clásica.

•Inteligencia Artificial.

•Aprendizaje humano.
•Determinación de los objetivos: Trata de la delimitación de los objetivos que el
cliente desea bajo la orientación del especialista en data minina.

•Pre procesamiento de los datos: Se refiere a la selección, la limpieza, el
enriquecimiento, la reducción y la transformación de las bases de datos. Esta
etapa consume generalmente alrededor del setenta por ciento del tiempo total de
un proyecto de data minina.

•Determinación del modelo: Se comienza realizando unos análisis estadísticos de
los datos, y después se lleva a cabo una visualización gráfica de los mismos para
tener una primera aproximación. Según los objetivos planteados y la tarea que
debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes
áreas de la Inteligencia Artificial.

Análisis de los resultados: Verifica si los resultados obtenidos son coherentes y
los coteja con los obtenidos por los análisis estadísticos y de visualización
gráfica.
•Comercio: Conocer el patrón de compras del cliente para, por ejemplo,
diseñar mejores campañas de publicidad y aumentar las ventas.

•Empleo: Cuantificar las habilidades de los trabajadores para aprovecharlas
al máximo. Localizar trabajadores descontentos.

•Elecciones: Cotejar grandes bases de datos sobre hábitos de consumo y
encuestas para conocer con detalle las inquietudes y los intereses del
votante y así perfilar mejores campañas.

• Medicina: Reunir grandes bases de datos biológicos para emplearlas en la
detección a tiempo de tumores, demencias o alzhéimer.

•Lucha contra el terrorismo: Localización de relaciones, transacciones
económicas y movimientos de sospechosos.
•Explorar los datos que se encuentran en las profundidades de las bases de
datos, como los almacenes de datos, que algunas veces contienen información
almacenada durante varios años.

• En algunos casos, los datos se consolidan en un almacén de datos y en
mercados de datos; en otros, se mantienen en servidores de Internet e Intranet.

• El entorno de la minería de datos suele tener una arquitectura cliente -servidor.

• Las herramientas de la minería de datos ayudan a extraer el mineral de la
información enterrado en archivos corporativos o en registros públicos,
archivados.

• Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e
inesperados.
• El minero es, muchas veces un usuario final con poca o ninguna habilidad de
programación, facultado por barrenadoras de datos y otras poderosas
herramientas indagatorias para efectuar preguntas adhoc y obtener rápidamente
respuestas.

• Las herramientas de la minería de datos se combinan fácilmente y pueden
analizarse y procesarse rápidamente.

• Debido a la gran cantidad de datos, algunas veces resulta necesario usar
procesamiento en paralelo para la minería de datos.

• La minería de datos produce cinco tipos de información:

— Asociaciones.
— Secuencias.
— Clasificaciones.
— Agrupamientos.
— Pronósticos.

• Los mineros de datos usan varias herramientas y técnicas. La minería de datos
es un proceso que invierte la dinámica del método científico.
El nombre de Data Mining deriva de las similitudes entre buscar
valiosa información de negocios en grandes bases de datos, las técnicas
pueden redituar los beneficios de automatización en las plataformas
de hardware y software existentes y puede ser implementadas en
sistemas nuevos a medida que las plataformas existentes se actualicen y
nuevos productos sean desarrollados.

        Cuando las herramientas de data Mining son empleadas en
sistemas de procesamiento paralelo de alta performance, pueden analizar
bases de datos masivas en minutos. Procesamientos mas rápidos
significan que los usuarios pueden automáticamente experimentar con
mas modelos para entender datos complejos.
Para aplicar mejor técnicas avanzadas, estas deben estar
totalmente integradas con la data warehouse así como herramientas
flexibles e interactivas para el análisis de negocios.

        Varias herramientas de data Mining actualmente operan fuera del
warehouse, requiriendo pasos extra para extraer, importar y analizar los
datos. Además, cuando nuevos conceptos requieren implementación
operacional la integración con el warehouse simplifica la aplicación de
los resultados desde data Mining.
El Data warehouse analítico resultante puede ser aplicado para
mejorar procesos de negocios en toda la organización, en áreas tales
como manejo de campañas promocionales, detección de fraudes,
lanzamientos de nuevos
productos, etc.

        El punto de inicio ideal es un data warehouse que contenga una
combinación de datos de seguimiento e todos los clientes juntos con
datos externos de mercado acerca
de la actividad de los competidores.

       Información histórica sobre potenciales clientes también provee
una excelente base. Este warehouse puede ser implementado en una
variedad de sistemas bases relacionales y debe ser optimizado para un
acceso a los datos flexibles y rápido.

More Related Content

What's hot

Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
edmaga
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
ufrj
 

What's hot (19)

Data mining
Data miningData mining
Data mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos en sql server 2012
Mineria de datos en sql server 2012Mineria de datos en sql server 2012
Mineria de datos en sql server 2012
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Almacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datosAlmacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datos
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 

Similar to Mineria de Datos

Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
guest10616d
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
perezparga
 

Similar to Mineria de Datos (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Manejo De Datos
Manejo De DatosManejo De Datos
Manejo De Datos
 
Capitulo5
Capitulo5Capitulo5
Capitulo5
 
Capitulo5
Capitulo5Capitulo5
Capitulo5
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
Data
DataData
Data
 
IN Unidad 3: Minería de datos
IN Unidad 3: Minería de datosIN Unidad 3: Minería de datos
IN Unidad 3: Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Big data
Big dataBig data
Big data
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdf
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
ppt inteligencia de trabajo.pdf
ppt inteligencia de trabajo.pdfppt inteligencia de trabajo.pdf
ppt inteligencia de trabajo.pdf
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De Desiciones
 
Inteligencia de Negocios BI
Inteligencia de Negocios BIInteligencia de Negocios BI
Inteligencia de Negocios BI
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Entregable final
Entregable finalEntregable final
Entregable final
 

Recently uploaded

Tema Identificar Relaciones y Casos de Uso 19-05-24.pdf
Tema Identificar Relaciones y Casos de Uso 19-05-24.pdfTema Identificar Relaciones y Casos de Uso 19-05-24.pdf
Tema Identificar Relaciones y Casos de Uso 19-05-24.pdf
Noe Castillo
 
SISTEMA RESPIRATORIO DEL CUERPO HUMANO triptico.docx
SISTEMA RESPIRATORIO DEL CUERPO HUMANO triptico.docxSISTEMA RESPIRATORIO DEL CUERPO HUMANO triptico.docx
SISTEMA RESPIRATORIO DEL CUERPO HUMANO triptico.docx
gesicavillanuevaqf
 

Recently uploaded (20)

Seguridad y virus informáticos 12°B 2024
Seguridad y virus informáticos 12°B 2024Seguridad y virus informáticos 12°B 2024
Seguridad y virus informáticos 12°B 2024
 
DESCRIPCIÓN-LOS-DILEMAS-DEL-CONOCIMIENTO.pptx
DESCRIPCIÓN-LOS-DILEMAS-DEL-CONOCIMIENTO.pptxDESCRIPCIÓN-LOS-DILEMAS-DEL-CONOCIMIENTO.pptx
DESCRIPCIÓN-LOS-DILEMAS-DEL-CONOCIMIENTO.pptx
 
Revista Faro Normalista 6, 18 de mayo 2024
Revista Faro Normalista 6, 18 de mayo 2024Revista Faro Normalista 6, 18 de mayo 2024
Revista Faro Normalista 6, 18 de mayo 2024
 
proyecto semana de los Jardines, actividades a realizar para resaltar esta fecha
proyecto semana de los Jardines, actividades a realizar para resaltar esta fechaproyecto semana de los Jardines, actividades a realizar para resaltar esta fecha
proyecto semana de los Jardines, actividades a realizar para resaltar esta fecha
 
CONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocx
CONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocxCONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocx
CONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocx
 
cuadernillo_cuentos_de_los_valores_elprofe20 (1).docx
cuadernillo_cuentos_de_los_valores_elprofe20 (1).docxcuadernillo_cuentos_de_los_valores_elprofe20 (1).docx
cuadernillo_cuentos_de_los_valores_elprofe20 (1).docx
 
4ª SESION la misión santificadora del Espíritu Santo en la vida de la Iglesi...
4ª SESION  la misión santificadora del Espíritu Santo en la vida de la Iglesi...4ª SESION  la misión santificadora del Espíritu Santo en la vida de la Iglesi...
4ª SESION la misión santificadora del Espíritu Santo en la vida de la Iglesi...
 
La historia de la vida estudiantil a 102 años de la fundación de las Normales...
La historia de la vida estudiantil a 102 años de la fundación de las Normales...La historia de la vida estudiantil a 102 años de la fundación de las Normales...
La historia de la vida estudiantil a 102 años de la fundación de las Normales...
 
Tipologías de vínculos afectivos (grupo)
Tipologías de vínculos afectivos (grupo)Tipologías de vínculos afectivos (grupo)
Tipologías de vínculos afectivos (grupo)
 
Época colonial: vestimenta, costumbres y juegos de la época
Época colonial: vestimenta, costumbres y juegos de la épocaÉpoca colonial: vestimenta, costumbres y juegos de la época
Época colonial: vestimenta, costumbres y juegos de la época
 
Como construir los vínculos afectivos (Grupal)
Como construir los vínculos afectivos (Grupal)Como construir los vínculos afectivos (Grupal)
Como construir los vínculos afectivos (Grupal)
 
el poder del estado en el siglo XXI.pptx
el poder del estado en el siglo XXI.pptxel poder del estado en el siglo XXI.pptx
el poder del estado en el siglo XXI.pptx
 
2.15. Calendario Civico Escolar 2024.docx
2.15. Calendario Civico Escolar 2024.docx2.15. Calendario Civico Escolar 2024.docx
2.15. Calendario Civico Escolar 2024.docx
 
Tema Identificar Relaciones y Casos de Uso 19-05-24.pdf
Tema Identificar Relaciones y Casos de Uso 19-05-24.pdfTema Identificar Relaciones y Casos de Uso 19-05-24.pdf
Tema Identificar Relaciones y Casos de Uso 19-05-24.pdf
 
SISTEMA RESPIRATORIO DEL CUERPO HUMANO triptico.docx
SISTEMA RESPIRATORIO DEL CUERPO HUMANO triptico.docxSISTEMA RESPIRATORIO DEL CUERPO HUMANO triptico.docx
SISTEMA RESPIRATORIO DEL CUERPO HUMANO triptico.docx
 
TEMA EGIPTO.pdf. Presentación civilización
TEMA EGIPTO.pdf. Presentación civilizaciónTEMA EGIPTO.pdf. Presentación civilización
TEMA EGIPTO.pdf. Presentación civilización
 
Power Point: Luz desde el santuario.pptx
Power Point: Luz desde el santuario.pptxPower Point: Luz desde el santuario.pptx
Power Point: Luz desde el santuario.pptx
 
a propósito del estado su relevancia y definiciones
a propósito del estado su relevancia y definicionesa propósito del estado su relevancia y definiciones
a propósito del estado su relevancia y definiciones
 
Luz desde el santuario. Escuela Sabática
Luz desde el santuario. Escuela SabáticaLuz desde el santuario. Escuela Sabática
Luz desde el santuario. Escuela Sabática
 
RESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdf
RESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdfRESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdf
RESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdf
 

Mineria de Datos

  • 1. Instituto universitario de Tecnología y Administración Industrial IUTA Decreto 771 del 15-02-90 Región capital Ampliación Guarenas Especialidad Informática Sección 203 A1 Asignatura: Base de Datos Alumnos: Guajari Vallenilla Carlos Garcés Hector Gonzales Caracas, Enero 2012
  • 2. Es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Básicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
  • 3. La idea de Minería de Datos no es nueva. Ya desde los años sesenta los estadísticos manejaban términos como Data Fishing, Data Mining (DM) o Data Archaeology con la idea de encontrar correlaciones sin una hipótesis previa en bases de datos A principios de los años ochenta, Rakesh Agrawal, GioWiederhold, Robert Blum y Gregory Piatetsky-Shapiro entre otros, empezaron a consolidar los términos de Minería de Datos y KDD. Esta tecnología ha sido un buen punto de encuentro entre personas pertenecientes al ámbito académico y al de los negocios.
  • 4. La evolución de sus herramientas en el transcurso del tiempo puede dividirse en cuatro etapas principales: •Colección de Datos (1960). •Acceso de Datos (1980). • Almacén de Datos y Apoyo a las Decisiones (principios de la década de 1990). • Minería de Datos Inteligente. (finales de la década de 1990).
  • 5. Las líneas de desarrollo en el ámbito de minería de datos tienen sus orígenes en tres conceptos importantes: •Estadística clásica. •Inteligencia Artificial. •Aprendizaje humano.
  • 6. •Determinación de los objetivos: Trata de la delimitación de los objetivos que el cliente desea bajo la orientación del especialista en data minina. •Pre procesamiento de los datos: Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data minina. •Determinación del modelo: Se comienza realizando unos análisis estadísticos de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial. Análisis de los resultados: Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica.
  • 7. •Comercio: Conocer el patrón de compras del cliente para, por ejemplo, diseñar mejores campañas de publicidad y aumentar las ventas. •Empleo: Cuantificar las habilidades de los trabajadores para aprovecharlas al máximo. Localizar trabajadores descontentos. •Elecciones: Cotejar grandes bases de datos sobre hábitos de consumo y encuestas para conocer con detalle las inquietudes y los intereses del votante y así perfilar mejores campañas. • Medicina: Reunir grandes bases de datos biológicos para emplearlas en la detección a tiempo de tumores, demencias o alzhéimer. •Lucha contra el terrorismo: Localización de relaciones, transacciones económicas y movimientos de sospechosos.
  • 8. •Explorar los datos que se encuentran en las profundidades de las bases de datos, como los almacenes de datos, que algunas veces contienen información almacenada durante varios años. • En algunos casos, los datos se consolidan en un almacén de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet. • El entorno de la minería de datos suele tener una arquitectura cliente -servidor. • Las herramientas de la minería de datos ayudan a extraer el mineral de la información enterrado en archivos corporativos o en registros públicos, archivados. • Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados.
  • 9. • El minero es, muchas veces un usuario final con poca o ninguna habilidad de programación, facultado por barrenadoras de datos y otras poderosas herramientas indagatorias para efectuar preguntas adhoc y obtener rápidamente respuestas. • Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse rápidamente. • Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minería de datos. • La minería de datos produce cinco tipos de información: — Asociaciones. — Secuencias. — Clasificaciones. — Agrupamientos. — Pronósticos. • Los mineros de datos usan varias herramientas y técnicas. La minería de datos es un proceso que invierte la dinámica del método científico.
  • 10. El nombre de Data Mining deriva de las similitudes entre buscar valiosa información de negocios en grandes bases de datos, las técnicas pueden redituar los beneficios de automatización en las plataformas de hardware y software existentes y puede ser implementadas en sistemas nuevos a medida que las plataformas existentes se actualicen y nuevos productos sean desarrollados. Cuando las herramientas de data Mining son empleadas en sistemas de procesamiento paralelo de alta performance, pueden analizar bases de datos masivas en minutos. Procesamientos mas rápidos significan que los usuarios pueden automáticamente experimentar con mas modelos para entender datos complejos.
  • 11. Para aplicar mejor técnicas avanzadas, estas deben estar totalmente integradas con la data warehouse así como herramientas flexibles e interactivas para el análisis de negocios. Varias herramientas de data Mining actualmente operan fuera del warehouse, requiriendo pasos extra para extraer, importar y analizar los datos. Además, cuando nuevos conceptos requieren implementación operacional la integración con el warehouse simplifica la aplicación de los resultados desde data Mining.
  • 12. El Data warehouse analítico resultante puede ser aplicado para mejorar procesos de negocios en toda la organización, en áreas tales como manejo de campañas promocionales, detección de fraudes, lanzamientos de nuevos productos, etc. El punto de inicio ideal es un data warehouse que contenga una combinación de datos de seguimiento e todos los clientes juntos con datos externos de mercado acerca de la actividad de los competidores. Información histórica sobre potenciales clientes también provee una excelente base. Este warehouse puede ser implementado en una variedad de sistemas bases relacionales y debe ser optimizado para un acceso a los datos flexibles y rápido.