SlideShare a Scribd company logo
1 of 12
Instituto universitario de Tecnología
  y Administración Industrial IUTA
       Decreto 771 del 15-02-90
Región capital Ampliación Guarenas
      Especialidad Informática
           Sección 203 A1
     Asignatura: Base de Datos




                                   Alumnos:

                                   Guajari Vallenilla

                                   Carlos Garcés

                                   Hector Gonzales

         Caracas, Enero 2012
Es el conjunto de técnicas y tecnologías que permiten
explorar grandes bases de datos, de manera automática o
semiautomática, con el objetivo de encontrar patrones
repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un determinado contexto.

       Básicamente, el datamining surge para intentar ayudar
a comprender el contenido de un repositorio de datos. Con
este fin, hace uso de prácticas estadísticas y, en algunos
casos, de algoritmos de búsqueda próximos a la Inteligencia
Artificial y a las redes neuronales.
La idea de Minería de Datos no es nueva. Ya desde los
años sesenta los estadísticos manejaban términos como
Data Fishing, Data Mining (DM) o Data Archaeology con la
idea de encontrar correlaciones sin una hipótesis previa en
bases de datos
       A principios de los años ochenta, Rakesh Agrawal,
GioWiederhold, Robert Blum y Gregory Piatetsky-Shapiro
entre otros, empezaron a consolidar los términos de Minería
de Datos y KDD.
Esta tecnología ha sido un buen punto de encuentro entre
personas pertenecientes al ámbito académico y al de los
negocios.
La evolución de sus herramientas en el transcurso del
tiempo puede dividirse en cuatro etapas principales:


•Colección de Datos (1960).


•Acceso de Datos (1980).


• Almacén de Datos y Apoyo a las Decisiones (principios de
la década de 1990).


• Minería de Datos Inteligente. (finales de la década de 1990).
Las líneas de desarrollo en el ámbito de
minería de datos tienen sus orígenes en tres
conceptos importantes:

•Estadística clásica.

•Inteligencia Artificial.

•Aprendizaje humano.
•Determinación de los objetivos: Trata de la delimitación de los objetivos que el
cliente desea bajo la orientación del especialista en data minina.

•Pre procesamiento de los datos: Se refiere a la selección, la limpieza, el
enriquecimiento, la reducción y la transformación de las bases de datos. Esta
etapa consume generalmente alrededor del setenta por ciento del tiempo total de
un proyecto de data minina.

•Determinación del modelo: Se comienza realizando unos análisis estadísticos de
los datos, y después se lleva a cabo una visualización gráfica de los mismos para
tener una primera aproximación. Según los objetivos planteados y la tarea que
debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes
áreas de la Inteligencia Artificial.

Análisis de los resultados: Verifica si los resultados obtenidos son coherentes y
los coteja con los obtenidos por los análisis estadísticos y de visualización
gráfica.
•Comercio: Conocer el patrón de compras del cliente para, por ejemplo,
diseñar mejores campañas de publicidad y aumentar las ventas.

•Empleo: Cuantificar las habilidades de los trabajadores para aprovecharlas
al máximo. Localizar trabajadores descontentos.

•Elecciones: Cotejar grandes bases de datos sobre hábitos de consumo y
encuestas para conocer con detalle las inquietudes y los intereses del
votante y así perfilar mejores campañas.

• Medicina: Reunir grandes bases de datos biológicos para emplearlas en la
detección a tiempo de tumores, demencias o alzhéimer.

•Lucha contra el terrorismo: Localización de relaciones, transacciones
económicas y movimientos de sospechosos.
•Explorar los datos que se encuentran en las profundidades de las bases de
datos, como los almacenes de datos, que algunas veces contienen información
almacenada durante varios años.

• En algunos casos, los datos se consolidan en un almacén de datos y en
mercados de datos; en otros, se mantienen en servidores de Internet e Intranet.

• El entorno de la minería de datos suele tener una arquitectura cliente -servidor.

• Las herramientas de la minería de datos ayudan a extraer el mineral de la
información enterrado en archivos corporativos o en registros públicos,
archivados.

• Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e
inesperados.
• El minero es, muchas veces un usuario final con poca o ninguna habilidad de
programación, facultado por barrenadoras de datos y otras poderosas
herramientas indagatorias para efectuar preguntas adhoc y obtener rápidamente
respuestas.

• Las herramientas de la minería de datos se combinan fácilmente y pueden
analizarse y procesarse rápidamente.

• Debido a la gran cantidad de datos, algunas veces resulta necesario usar
procesamiento en paralelo para la minería de datos.

• La minería de datos produce cinco tipos de información:

— Asociaciones.
— Secuencias.
— Clasificaciones.
— Agrupamientos.
— Pronósticos.

• Los mineros de datos usan varias herramientas y técnicas. La minería de datos
es un proceso que invierte la dinámica del método científico.
El nombre de Data Mining deriva de las similitudes entre buscar
valiosa información de negocios en grandes bases de datos, las técnicas
pueden redituar los beneficios de automatización en las plataformas
de hardware y software existentes y puede ser implementadas en
sistemas nuevos a medida que las plataformas existentes se actualicen y
nuevos productos sean desarrollados.

        Cuando las herramientas de data Mining son empleadas en
sistemas de procesamiento paralelo de alta performance, pueden analizar
bases de datos masivas en minutos. Procesamientos mas rápidos
significan que los usuarios pueden automáticamente experimentar con
mas modelos para entender datos complejos.
Para aplicar mejor técnicas avanzadas, estas deben estar
totalmente integradas con la data warehouse así como herramientas
flexibles e interactivas para el análisis de negocios.

        Varias herramientas de data Mining actualmente operan fuera del
warehouse, requiriendo pasos extra para extraer, importar y analizar los
datos. Además, cuando nuevos conceptos requieren implementación
operacional la integración con el warehouse simplifica la aplicación de
los resultados desde data Mining.
El Data warehouse analítico resultante puede ser aplicado para
mejorar procesos de negocios en toda la organización, en áreas tales
como manejo de campañas promocionales, detección de fraudes,
lanzamientos de nuevos
productos, etc.

        El punto de inicio ideal es un data warehouse que contenga una
combinación de datos de seguimiento e todos los clientes juntos con
datos externos de mercado acerca
de la actividad de los competidores.

       Información histórica sobre potenciales clientes también provee
una excelente base. Este warehouse puede ser implementado en una
variedad de sistemas bases relacionales y debe ser optimizado para un
acceso a los datos flexibles y rápido.

More Related Content

What's hot

Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
edmaga
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
ufrj
 

What's hot (19)

Data mining
Data miningData mining
Data mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos en sql server 2012
Mineria de datos en sql server 2012Mineria de datos en sql server 2012
Mineria de datos en sql server 2012
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Almacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datosAlmacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datos
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 

Similar to Mineria de Datos

Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
guest10616d
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
perezparga
 

Similar to Mineria de Datos (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Manejo De Datos
Manejo De DatosManejo De Datos
Manejo De Datos
 
Capitulo5
Capitulo5Capitulo5
Capitulo5
 
Capitulo5
Capitulo5Capitulo5
Capitulo5
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
Data
DataData
Data
 
IN Unidad 3: Minería de datos
IN Unidad 3: Minería de datosIN Unidad 3: Minería de datos
IN Unidad 3: Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Big data
Big dataBig data
Big data
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdf
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
ppt inteligencia de trabajo.pdf
ppt inteligencia de trabajo.pdfppt inteligencia de trabajo.pdf
ppt inteligencia de trabajo.pdf
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De Desiciones
 
Inteligencia de Negocios BI
Inteligencia de Negocios BIInteligencia de Negocios BI
Inteligencia de Negocios BI
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Entregable final
Entregable finalEntregable final
Entregable final
 

Recently uploaded

6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
Wilian24
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
UPTAIDELTACHIRA
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
patriciaines1993
 

Recently uploaded (20)

Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
 
Usos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicasUsos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicas
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
activ4-bloque4 transversal doctorado.pdf
activ4-bloque4 transversal doctorado.pdfactiv4-bloque4 transversal doctorado.pdf
activ4-bloque4 transversal doctorado.pdf
 
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADOTIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
Factores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdfFactores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdf
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración Ambiental
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
Infografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdfInfografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdf
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 

Mineria de Datos

  • 1. Instituto universitario de Tecnología y Administración Industrial IUTA Decreto 771 del 15-02-90 Región capital Ampliación Guarenas Especialidad Informática Sección 203 A1 Asignatura: Base de Datos Alumnos: Guajari Vallenilla Carlos Garcés Hector Gonzales Caracas, Enero 2012
  • 2. Es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Básicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
  • 3. La idea de Minería de Datos no es nueva. Ya desde los años sesenta los estadísticos manejaban términos como Data Fishing, Data Mining (DM) o Data Archaeology con la idea de encontrar correlaciones sin una hipótesis previa en bases de datos A principios de los años ochenta, Rakesh Agrawal, GioWiederhold, Robert Blum y Gregory Piatetsky-Shapiro entre otros, empezaron a consolidar los términos de Minería de Datos y KDD. Esta tecnología ha sido un buen punto de encuentro entre personas pertenecientes al ámbito académico y al de los negocios.
  • 4. La evolución de sus herramientas en el transcurso del tiempo puede dividirse en cuatro etapas principales: •Colección de Datos (1960). •Acceso de Datos (1980). • Almacén de Datos y Apoyo a las Decisiones (principios de la década de 1990). • Minería de Datos Inteligente. (finales de la década de 1990).
  • 5. Las líneas de desarrollo en el ámbito de minería de datos tienen sus orígenes en tres conceptos importantes: •Estadística clásica. •Inteligencia Artificial. •Aprendizaje humano.
  • 6. •Determinación de los objetivos: Trata de la delimitación de los objetivos que el cliente desea bajo la orientación del especialista en data minina. •Pre procesamiento de los datos: Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data minina. •Determinación del modelo: Se comienza realizando unos análisis estadísticos de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial. Análisis de los resultados: Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica.
  • 7. •Comercio: Conocer el patrón de compras del cliente para, por ejemplo, diseñar mejores campañas de publicidad y aumentar las ventas. •Empleo: Cuantificar las habilidades de los trabajadores para aprovecharlas al máximo. Localizar trabajadores descontentos. •Elecciones: Cotejar grandes bases de datos sobre hábitos de consumo y encuestas para conocer con detalle las inquietudes y los intereses del votante y así perfilar mejores campañas. • Medicina: Reunir grandes bases de datos biológicos para emplearlas en la detección a tiempo de tumores, demencias o alzhéimer. •Lucha contra el terrorismo: Localización de relaciones, transacciones económicas y movimientos de sospechosos.
  • 8. •Explorar los datos que se encuentran en las profundidades de las bases de datos, como los almacenes de datos, que algunas veces contienen información almacenada durante varios años. • En algunos casos, los datos se consolidan en un almacén de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet. • El entorno de la minería de datos suele tener una arquitectura cliente -servidor. • Las herramientas de la minería de datos ayudan a extraer el mineral de la información enterrado en archivos corporativos o en registros públicos, archivados. • Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados.
  • 9. • El minero es, muchas veces un usuario final con poca o ninguna habilidad de programación, facultado por barrenadoras de datos y otras poderosas herramientas indagatorias para efectuar preguntas adhoc y obtener rápidamente respuestas. • Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse rápidamente. • Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minería de datos. • La minería de datos produce cinco tipos de información: — Asociaciones. — Secuencias. — Clasificaciones. — Agrupamientos. — Pronósticos. • Los mineros de datos usan varias herramientas y técnicas. La minería de datos es un proceso que invierte la dinámica del método científico.
  • 10. El nombre de Data Mining deriva de las similitudes entre buscar valiosa información de negocios en grandes bases de datos, las técnicas pueden redituar los beneficios de automatización en las plataformas de hardware y software existentes y puede ser implementadas en sistemas nuevos a medida que las plataformas existentes se actualicen y nuevos productos sean desarrollados. Cuando las herramientas de data Mining son empleadas en sistemas de procesamiento paralelo de alta performance, pueden analizar bases de datos masivas en minutos. Procesamientos mas rápidos significan que los usuarios pueden automáticamente experimentar con mas modelos para entender datos complejos.
  • 11. Para aplicar mejor técnicas avanzadas, estas deben estar totalmente integradas con la data warehouse así como herramientas flexibles e interactivas para el análisis de negocios. Varias herramientas de data Mining actualmente operan fuera del warehouse, requiriendo pasos extra para extraer, importar y analizar los datos. Además, cuando nuevos conceptos requieren implementación operacional la integración con el warehouse simplifica la aplicación de los resultados desde data Mining.
  • 12. El Data warehouse analítico resultante puede ser aplicado para mejorar procesos de negocios en toda la organización, en áreas tales como manejo de campañas promocionales, detección de fraudes, lanzamientos de nuevos productos, etc. El punto de inicio ideal es un data warehouse que contenga una combinación de datos de seguimiento e todos los clientes juntos con datos externos de mercado acerca de la actividad de los competidores. Información histórica sobre potenciales clientes también provee una excelente base. Este warehouse puede ser implementado en una variedad de sistemas bases relacionales y debe ser optimizado para un acceso a los datos flexibles y rápido.