• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Ejercicio 2, parte II
 

Ejercicio 2, parte II

on

  • 824 views

Basado en el libro de Luis Torgo. Desarrollado por Luis Ivan Valencia en la Universidad Nacional de Ingenieria.

Basado en el libro de Luis Torgo. Desarrollado por Luis Ivan Valencia en la Universidad Nacional de Ingenieria.

Statistics

Views

Total Views
824
Views on SlideShare
824
Embed Views
0

Actions

Likes
0
Downloads
0
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Ejercicio 2, parte II Ejercicio 2, parte II Presentation Transcript

    • Aplicación“Predicción de florecimiento de algas”
      Luis Paulo Vieira Braga
      Luis Iván Ortiz Valencia
    • Objetivos
      Introducción a la Minería de Datos
    • Descripción del problema
      Introducción a la Minería de Datos
    • Justificación 1
      Un factor importante es el tiempo de respuesta de los análisis para proceder a las acciones preventivas.
      Introducción a la Minería de Datos
    • Justificación 2
      Mayores las frecuencias de algas, mayor la contaminación.
      Introducción a la Minería de Datos
    • Bibliotecas en R
      Bibliotecas (packages) en R almacenan funciones y conjuntos de dados.
      DMwR
      car
      lattice
      Hmisc

      Introducción a la Minería de Datos
    • Conjuntos de datos
      Un conjunto de datos de entrenamiento.
      (algae_entrenamiento_regressionlineal.txt.txt)
      Un conjunto de datos de test (Validación).
      (algae_validacion_regressionlineal.txt.txt)
      Un conjunto de datos solución.
      (algae_validacion_regressionlinealsols.txt.txt)
      Introducción a la Minería de Datos
    • Conjunto de datos de entrenamiento
      Introducción a la Minería de Datos
    • Conjunto de datos de entrenamiento
      8 variables continuas
      Máximo valor de pH (acidez)
      Valor medio de O2 (oxígeno)
      Valor medio de Cl_ (cloruro )
      Valor medio de NO3_ (nitrato)
      Valor medio de NH4_(amonio )
      Valor medio de PO43_ (ortofosfato)
      Valor medio de PO4 (fosfato)
      valor medio de clorofila
      7 variables continuas
      Frecuencias de 7 algas.
      Introducción a la Minería de Datos
    • Conjunto de datos de test (validación)
      Consiste de un conjunto de datos de 140 registros con la misma estructura del conjunto de entrenamiento pero sin la información de la frecuencia de las algas.
      Introducción a la Minería de Datos
    • Conjunto de datos solución
      Introducción a la Minería de Datos
    • Etapas
      5Modelo de Predicción: Regresión Múltiple
      6 Modelo de Predicción: Árbol de Regresión
      7Selección y evaluación de modelos
      8Predicción del florecimiento de las algas
      Introducción a la Minería de Datos
    • 1Preparando una sesión de trabajo en R
      Introducción a la Minería de Datos
    • 1Preparando una sesión de trabajo en R
      Introducción a la Minería de Datos
    • 2Cargando los datos en R
      Introducción a la Minería de Datos
    • 2Cargando los datos en R
      Introducción a la Minería de Datos
    • 2Cargando los datos en R
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 3Visualización y descripción de los datos
      Introducción a la Minería de Datos
    • 4Análisis de valores faltantes
      Introducción a la Minería de Datos
    • 4Removiendo los registros con NA
      Introducción a la Minería de Datos
    • 4Removiendo los registros con NA
      Introducción a la Minería de Datos
    • 4Removiendo los registros con NA
      Introducción a la Minería de Datos
    • 4Removiendo los registros con valores faltantes
      Introducción a la Minería de Datos
    • 4Removiendo los registros con valores faltantes
      Introducción a la Minería de Datos
    • 4 Completando los NA con el valor mas representativo
      Introducción a la Minería de Datos
    • 4Completando los NA con el valor mas representativo
      Introducción a la Minería de Datos
    • 4Completando los NA con el valor mas representativo
      Introducción a la Minería de Datos
    • 4Completando los NA con el valor mas representativo
      Introducción a la Minería de Datos
    • 4 Completando los NA usando la correlación
      Introducción a la Minería de Datos
    • 4Completando los NA usando la correlación
      Introducción a la Minería de Datos
    • 4Completando los NA usando correlación
      Introducción a la Minería de Datos
    • 4Completando los NA usando correlación
      Introducción a la Minería de Datos
    • 4Completando los NA usando correlación
      Introducción a la Minería de Datos
    • 4Completando los NA usando correlación
      Introducción a la Minería de Datos
    • 4Completando los NA usando correlación
      Introducción a la Minería de Datos
    • 4Completando los NA usando correlación
      Introducción a la Minería de Datos
    • 4Completando los NA usando correlación
      Introducción a la Minería de Datos
    • 4Completar los NA con valores semejantes de otros registros
      Introducción a la Minería de Datos
    • 4Completar los NA con valores semejantes de otros registros
      Introducción a la Minería de Datos
    • 4Completar los NA con valores semejantes de otros registros
      Este enfoque esta implementado en la función knnImputation() disponible en la biblioteca DMwR.
      Introducción a la Minería de Datos
    • 4Completar los NA con valores semejantes de otros registros
      Introducción a la Minería de Datos