• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Minería de datos Presentación
 

Minería de datos Presentación

on

  • 31,635 views

 

Statistics

Views

Total Views
31,635
Views on SlideShare
29,170
Embed Views
2,465

Actions

Likes
10
Downloads
1,278
Comments
2

14 Embeds 2,465

http://dataminingsenatics.blogspot.com 1449
http://dataminingsenatics.blogspot.mx 605
http://www.slideshare.net 163
http://dataminingsenatics.blogspot.com.es 106
http://dataminingsenatics.blogspot.com.ar 99
http://javiersanmartin87.wordpress.com 24
http://webcache.googleusercontent.com 4
http://dataminingsenatics.blogspot.com.br 4
http://translate.googleusercontent.com 4
http://us-w1.rockmelt.com 3
http://uptvirtual.upt.pe 1
http://www.google.com 1
http://www.google.cl 1
http://dataminingsenatics.blogspot.it 1
More...

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel

12 of 2 previous next

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
  • Me parece un buen material, actual y muy pertinente para las tareas de conocer a los clientes desde herramientas sofisticadas para entender su comportamiento, intereses y expectativas.
    Are you sure you want to
    Your message goes here
    Processing…
  • muy interesante, gracias por el material, me ayuda mucho en mis estudios
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Minería de datos Presentación Minería de datos Presentación Presentation Transcript

  • Inteligencia de negocios Introducción a Business Intelligence
  • INTELIGENCIA DE NEGOCIOS
    • ¿Qué es la Inteligencia de Negocios?
  • ¿Qué es la Inteligencia de Negocios?
    • La Inteligencia de Negocio (IN) o Business Intelligence (BI) es el conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.
  • Objetivos de la Inteligencia de Negocios Accesibilidad a la información Las herramientas y técnicas de BI permiten a los usuarios un acceso a los datos apropiado. Apoyo en la toma de decisiones Los usuarios tienen acceso a herramientas de análisis y de presentación de la información que facilitan la importante tarea de decidir ciertas situaciones. Orientación al usuario final Se busca independencia entre los conocimientos técnicos de los usuarios y su capacidad para utilizar estas herramientas.
  • Ventajas que aporta la Inteligencia de Negocios en su empresa. Controlar los gastos de TI Posee un único entorno para administrar. Mejorar la colaboración y la calidad de las decisiones La información queda a disposición del personal de la empresa en todos los niveles. Reducir el número de sesiones de aprendizaje para los empleados Interfaz sencilla e intuitiva. Proporcionar al personal una visión detallada de las operaciones empresariales Posee un conjunto de aplicaciones analíticas, cálculos, escritorios digitales, informes, análisis, minería de almacenamiento de datos y otras tecnologías. Asistir a los directivos en la organización y previsión del trabajo Proporciona una visión general única y común de todos los procesos empresariales en los distintos departamentos.
  • Herramientas para la Inteligencia de Negocios
  • Conceptos básicos Business Intelligence UDM (Modelo unidimensional unificado) Estandarización de los orígenes de datos. Almacén de datos Colección de orígenes de datos orientados a la ayuda de toma de decisiones empresariales. Cubo Un cubo OLAP es una vista lógica de los datos y representan un conjunto de datos relacionados con un tema en particular como Ventas, Operaciones, Recursos Humanos, etc., y están a disposición de los "clientes" a quienes les pueden interesar. Dimensión Son catálogos de información complementaria necesaria para la presentación de los datos a los usuarios. Descripciones, Nombres, Zonas, Rangos de tiempo, etc. Medidas Aspectos cuantificables o medibles de los objetos o eventos a analizar. Importes ventas, recuento empleados, etc.
  • Almacén de datos frente a ERP o base de datos convencional.
    • Los orígenes de datos están diseñados por desarrolladores . Un almacén de datos tiene la finalidad de facilitar la comprensión de usuarios finales .
    • La información interesante para el usuario se distribuye generalmente en varios orígenes de datos heterogéneos . En almacenes de datos se pueden unificar.
    • Aunque muchos orígenes de datos están concebidos para contener una gran cantidad de detalles de los niveles de transacción, con frecuencia las consultas necesarias para tomar las decisiones corporativas precisan información agregada y de resumen . Al aumentar el volumen de datos, el tiempo necesario para recuperar los valores de resumen para un análisis de un usuario final interactivo es a menudo prohibitivo.
    • Por lo general, las reglas de negocios no están encapsuladas en los orígenes de datos. Los usuarios deben realizar su propia interpretación de los datos .
  • Almacén de datos
    • Es posible un análisis de datos en cualquier base de datos o ERP, con cubos, informes, etc.
    • El objetivo de un almacén de datos es preparar la información existente en la base de datos o ERP, para el análisis y toma de decisiones.
    • Un almacén de datos se prepara para admitir:
      • Procesamiento analítico en línea
      • Minería de datos
  • Elementos de un almacén de datos
    • Tablas de hecho
    • Tablas de dimensión
  • Tablas de hecho
    • Las tablas de hecho son colecciones de tablas que contienen columnas para cada expresión medible.
    • Almacenan sucesos medibles:
      • Transacciones de Ventas,
      • Compras
      • Balances de inventarios, y otros hechos
      • (ingresos en la clínica, importes, etc.)
  • Tablas de dimensión
    • Las tablas de dimensiones almacenan los valores que se utilizan en las tablas de hechos.
    • Almacenan información de
      • Clientes
      • Proveedores
      • Empleados
      • Geográfica
      • Tiempos
  • Dimensión de Tiempo.
    • La dimensión de tiempo permite a los usuarios resumir información de las tablas de hecho en períodos de tiempo .
    • Permite conocer:
      • Totales de calendarios anuales,
      • Comparar porcentajes respectos de periodos fiscales anteriores,
      • Conocer información en calendarios de fabricación.
      • Organizar la información según jerarquías de tiempo específicas.
    • Sus atributos son horas , semestres , trimestres , meses y días. Las jerarquías permiten analizar los datos con mayor granularidad, por ejemplo, año – semestre – trimestres – meses.
  • Microsoft SQL Server ( Motor de base de datos)
    • Entornos que proporciona Microsoft SQL Server para trabajar con almacén de datos:
    • SQL Server Management Studio. Administrar y configurar objetos existentes en Almacén de datos.
    • (Definición de tablas de dimensión y tablas de hecho, índices, restricciones, usuarios, inicios de sesión, etc.)
  • Estructura del almacén de datos
  • Microsoft SQL Server Análysis Services (SSAS)
    • Entornos que proporciona Microsoft SQL Server para trabajar con SSAS:
    • SQL Server Management Studio. Administrar y configurar objetos existentes Analysis Services.
    • (Acceso de usuarios a datos de clínica)
    • Business Intelligence Development Studio. Desarrollar soluciones de Business Intelligence que incluyen funciones de Analysis Services, Integration Services y Reporting Services.
      • (Realizar consultas sobre enfermedades, tiempo, etc)
  • Elementos de Analysis Services Orígenes de datos Vistas de orígenes de datos Cubos Dimensiones Estructuras de minería Funciones Ensamblados
  • Origen de datos
    • Es una conexión a un origen de datos y contiene la cadena de conexión que define el modo en que Analysis Services conectará con un almacén de datos físico mediante un proveedor Microsoft .NET Framework o un proveedor OLE DB nativo.
      • (Tenemos que conectarnos a los datos que nos proporciona en el almacén de datos)
  • Vista de origen de datos
    • Es la definición de los metadatos (información de los datos). Contiene el modelo lógico del esquema que utilizan los objetos de bases de datos: cubos, dimensiones y estructuras de minería de datos.
      • (DimEnfermedades, DimEspecialidad, DimMedicos, DimPacientes, Tablahecho, cubo, etc )
  • Cubos
    • Es un conjunto de medidas (hechos) y dimensiones (áreas de interés tales como tiempo, producto y cliente).
      • Las consultas que realizaremos en los datos
      • Filas y columnas: enfermedades por trimestre
      • Área de datos: Número pacientes
  • Dimensiones
    • Las dimensiones organizan los datos en función de un área de interés para los usuarios: Clientes, almacenes o empleados. Contienen atributos que corresponden a las columnas de las tablas de dimensiones.
    • Los atributos se pueden organizar en estructuras jerárquicas o jerarquías.
  • Inteligencia de negocios Data Mining
  • Minería de Datos
    • La minería de datos trabaja con los datos con el objetivo de encontrar patrones de comportamiento ocultos en los mismos con el fin de crear nuevas asociaciones, predecir resultados futuros, etc.
    • Las organizaciones se han convertido en entidades sumamente ricas en datos pero pobre en conocimiento. De modo que el objetivo principal de la minería de datos es generar patrones de comportamiento en los datos y a partir de ellos generar conocimiento útil.
  • Importancia de la Minería de Datos
    • Disponemos de una cantidad inmensa de datos en nuestra organizaciones: Gracias a los programas de gestión empresarial, y al descenso del hardware, especialmente de los sistemas de almacenamiento ha llevado a las empresas a disponer de bases de datos con gigas de datos.
    • Incremento de la competitividad. El incremento de la competitividad es en gran medida resultado de marketing actual, de los nuevos canales de distribución que dispone como Internet y de las telecomunicaciones y la aplicación de las TIC a la actividad empresarial. Las empresas se enfrentan a una economía globalizada, y el éxito empresarial depende de la capacidad de mantener a los clientes actuales y conseguir nuevos. La minería de datos contiene tecnologías que permiten a las empresas analizar los factures que influyen decisivamente en estos temas.
  • Ciclo de un Proyecto de Minería de Datos
    • PASO 1. RECOLECCIÓN DE DATOS
    • El primer paso en un proyecto de minería de datos es la recolección de datos. Los datos de una organización habitualmente están almacenados en muchos sitios: base de datos de un ERP, de un CRM, hojas de cálculo de los comerciales y/o de los contables, una pequeña aplicación para controlar el stock en el almacén, etc. Por este motivo, la primera tarea que debemos emprender es determinar cuáles son los datos más relevantes y almacenarlos de modo adecuado en un almacén de datos o datawarehouse
  • Ciclo de un Proyecto de Minería de Datos
    • PASO 2. DEPURACIÓN Y TRANSFORMCIÓN DE LOS DATOS
    • Este es el paso más importante en un proyecto de minería de datos. La depuración y transformación de los datos tiene como objetivo eliminar el ruido y la información irrelevante. El proceso de transformación consiste en modificar los datos originales en diferentes formatos en términos de tipos de datos y valores.
  • Ciclo de un Proyecto de Minería de Datos
    • PASO 2. DEPURACIÓN Y TRANSFORMCIÓN DE LOS DATOS
    • Técnicas.
      • Transformación tipos de datos. Convertir valores continuos en discretos.
      • Suprimir casos atípicos. Eliminar aquellos datos que pueden falsear los datos, por ejemplo, un cliente que haga un pedido excepcional que supera en 10 veces el importe habitual.
      • Utilizando el modelo de clustering incluido en Microsoft SQL 2005 podemos generar un modelo que agrupe los casos atípicos para posteriormente eliminarlos a través de la combinación de Data Mining e Integration Services.
  • Ciclo de un Proyecto de Minería de Datos
    • PASO 3. GENEAR EL MODELO DE MINERIA DE DATOS.
    • Una vez que hemos limpiado y transformado los datos, podemos comenzar la tarea de crear los modelos de minería de datos. Antes de generar cualquier tipo de modelo, es fundamental entender cuál es la meta del proyecto de minería de datos. ¿Vamos a crear un proyecto para clasificar, para generar una asociación, para establecer una segmentación, o para pronosticar y planificar las ventas del próximo año?
    • El modelo es el corazón de cualquier proyecto de minería de datos. No obstante, una vez que uno tiene claro cual es el objetivo del proyecto, seleccionar el algoritmo que genere el modelo es una tarea relativamente sencilla.
  • Ciclo de un Proyecto de Minería de Datos
    • PASO 4. EVALUACIÓN DEL MODELO
    • Existen unas pocas herramientas para evaluar la calidad de un modelo de minería de datos. La más conocida es el gráfico de rendimiento Esta herramienta utiliza los datos de un modelo entrenado para predecir los valores de una conjunto de datos de evaluación.
    • No sólo se evalúa la precisión del modelo sino que se trata de comprender el significado de los patrones de comportamiento que los algoritmos han generado.
    • En ocasiones, los patrones hallados no contienen información útil. Esto se pude deber a diferentes factores: a) los datos utilizados son totalmente aleatorios; b) que las variables utilizadas en el modelo no son las más precisas; c) la limpieza de datos no ha sido suficiente, y se ha de volver a la fase anterior.
  • Ciclo de un Proyecto de Minería de Datos
    • PASO 5. REPORTING
    • Reporting es una de las tareas claves en la minería de datos. En muchas organizaciones, la meta final de la minería de datos es generar informes para los responsables de los diferentes departamentos.
  • Ciclo de un Proyecto de Minería de Datos
    • PASO 6. PREDICCIÓN
    • Muchos de los proyectos de minería de datos, la búsqueda de patrones ocultos entre los datos responde a la necesidad de generar predicciones, por ejemplo de las ventas del próximo trimestre. La predicción se convierte por tanto en una de las tareas claves de la minería de datos.