Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Estadística descriptiva por Bioq. José Luis Soto Velásquez (2)

3,103 views

Published on

TAMBIÉN ESTOY EN: Youtube: https://bit.ly/2TCUoiR y Facebook: https://bit.ly/2QYxWPf
Como "Bioestadística con JL Soto"

Estudios univariados y bivariados

Published in: Health & Medicine
  • Login to see the comments

Estadística descriptiva por Bioq. José Luis Soto Velásquez (2)

  1. 1. Estadística Descriptiva Organiza, presenta y describe un conjunto de datos con el propósito de facilitar su uso generalmente con el apoyo de tablas, medidas numéricas o gráficas. Unidad N° 2 Dr. José Luis Soto Velásquez investigacionjls@gmail.com Agosto del 2018
  2. 2. Estadística Descriptiva https://youtu.be/OPkGxnEXLsI
  3. 3. Estadística Descriptiva RESUMIR GENERALIZAR
  4. 4. RESUMIR Univariable o Unidimensional (1 variable) CUANTITATIVA CUALITATIVA Tipo VARIABLES CATEGÓRICAS Naturaleza CUALITATIVAS Escala (0) NOMINAL (1) ORDINAL Ningún atributo Un atributo Características Posee categorías a las que se asigna un nombre sin que exista ningún orden implícito entre ellas. Posee las categorías ordenadas, pero no permite cuantificar la distancia entre una categoría y otra. Atributos de la escala Orden Distancia Origen Orden Distancia Origen Clasificación de Escala Nominal Ordinal Nombre Domicilios Estado Civil Nacionalidad Sexo Función Lugar de Nacimiento Marca de un microscopio Servicio de un hospital *Grado de Escolaridad: 1ro, 2do, 3ro, 4to, etc. *Grado de anemia: +Leve;++moderado;+++severo Agudo , crónico *Lugar que ocupa en la familia 1ro, 2do, 3ro, 4to, etc. *Clase social: Indigente, Pobre, media, alta Ejemplo Género Estado civil Instrucción Intensidad Valor Final Masculino Femenino Soltero Casado Conviviente Primaria Secundaria Superior Leve Moderado Grave Observaciones (NOMINAL) Dicotómicas o binarias : Tienen solamente dos categorías Ejemplo de ordinal Dicotómica: - Nuevo – Continuador - Vivo – Fallecido - Sano – Enfermo Politómicas: Tienen más de dos categorías (Color de ojos, grupo sanguíneo, profesión, etc.)
  5. 5. 7. DEFINICIÓN DEL MÉTODO ESTADÍSTICO • Análisis de la ESTADÍSTICA DESCRIPTIVA de los datos 1 VARIABLE 2 VARIABLE P VARIABLE Datos CUANTITATIVOS • Estadígrafos: Promedios, Media, Mediana, Moda, Desviación Estándar, Varianza, Coeficiente de Variación, Error Estándar • Cuartiles, Deciles, Percentiles • Coeficientes de asimetría y Curtosis de Fisher • Gráficas: Histogramas, Box Plot (Diagramas de Cajas). • Diagrama de Dispersión • Coeficiente de correlación de Pearson • Regresión lineal y no lineal • Coeficiente de determinación • Varianza residuales • Análisis de los componentes principales • Análisis Factorial de Correspondencia • Correlación canónica Datos CUALITATIVOS • Distribución de frecuencia: Tablas de frecuencia, Tablas de contingencias. • Gráficos de barra, diagrama de sectores. • Distribución de frecuencia bidimensional • Coeficiente de correlación Spearman • Coeficiente de contingencia • Análisis Factorial de Correspondencia • Modelo log-lineal Datos MIXTOS NO CORRESPONDE • Box Plot • Diagrama de error • Coeficiente biserial de punto • Regresión múltiple • Regresión Logística
  6. 6. Estadística Descriptiva univariante: Variables Categóricas o Cualitativas La estadística descriptiva resume un conjunto de datos proporcionando información mediante tablas, parámetros y/o gráficos. En cualquier análisis estadístico, la estadística descriptiva es la primera parte y más importante, pues permite conocer el comportamiento de las variables, consideradas una a una, o la posible relación existente entre ellas.
  7. 7. Frecuencias absolutas. Se definen las frecuencias absolutas (fa) de una variable cualitativa como el número de ocasiones en las que se ha dado cada una de las categorías de la variable que queramos resumir. Frecuencias relativas. Por otro lado las frecuencias relativas (fr) se definen como la proporción de veces que se ha dado cada uno de las categorías de la variable. Por tanto las frecuencias absolutas y relativas de una variable cumplen la siguiente relación: serimentaleunidadesdeNúmero fa fr exp  Estadística Descriptiva univariante: Variables Categóricas o Cualitativas
  8. 8. Estadística Descriptiva univariante: Frecuencias absolutas y relativas Variables CATEGÓRICAS
  9. 9. Estadística Descriptiva univariante: Frecuencias absolutas y relativas Variables CATEGÓRICAS
  10. 10. Tablas según los niveles de investigación 05 04 03 02 01 05 Aplicativo Tratamiento 04 Predictivo Pronóstico 03 Explicativo Causalidad 01 Descriptivo Univariado 02 Relacional Bivariado
  11. 11. a. Tablas de Frecuencias Absolutas y Relativas Sexo Frecuencia Absoluta Frecuencia Relativa (%) Masculino 110 55% Femenino 90 45% Total 200 100% Sexo Frecuencia (n) Porcentaje (%) Masculino 110 55% Femenino 90 45% Total 200 100% Sexo Cantidad Porcentaje (%) Masculino 110 55% Femenino 90 45% Total 200 100% Aplicativo Predictivo Explicativo Relacional Descriptivo Estadístico Presentación De investigaciones Capacitación Univariado Variables CATEGÓRICAS
  12. 12. Variables Categóricas Nominales Ordinales Dicotómicas Politómicas 1. Caso único 2. Cerradas 3. Semicerradas 4. Abiertas 5. Mixtas 6. No excluyentes 7. Caso único a. Tablas de Frecuencias Absolutas y Relativas Nivel de investigación DESCRIPTIVO
  13. 13. Variables Categóricas Nominales Ordinales Dicotómicas Politómicas 1. Caso único 2. Cerradas 3. Semicerradas 4. Abiertas 5. Mixtas 6. No excluyentes 7. Caso único a. Tablas de Frecuencias Absolutas y Relativas Nivel de investigación DESCRIPTIVO
  14. 14. Variables nominal dicotómica: CASO ÚNICO: Sexo Tabla n° 1.- Distribución según sexo (Población, lugar y tiempo) Sexo Frecuencia (n) Porcentaje (%) Masculino 11 55 Femenino 9 45 Total 20 100 Fuente.- Elaboración propia, 2018. a. Tablas de Frecuencias Absolutas y Relativas Nivel de investigación DESCRIPTIVO
  15. 15. Variables Categóricas Nominales Ordinales Dicotómicas Politómicas 1. Caso único 2. Cerradas 3. Semicerradas 4. Abiertas 5. Mixtas 6. No excluyentes 7. Caso único a. Tablas de Frecuencias Absolutas y Relativas Nivel de investigación DESCRIPTIVO
  16. 16. Variables nominal Politómica: CERRADAS: Lugar de almuerzo Tabla n° 2.- Distribución según el lugar de almuerzo (Población, lugar y tiempo) Fuente.- Elaboración propia, 2018. a. Tablas de Frecuencias Absolutas y Relativas Análisis de Datos Aplicado a la Investigación Científica 2. Usted almuerza con mayor frecuencia en: (Variable nominal politómica-Cerradas) (X) Casa ( ) Mercado ( ) Pensión ( ) En el trabajo Lugar de almuerzo Frecuencia (n) Porcentajes (%) Casa 169 77,5 Mercado 14 6,4 Pensión 22 10,1 En el trabajo 13 6,0 Total 218 100,0
  17. 17. Variables Categóricas Nominales Ordinales Dicotómicas Politómicas 1. Caso único 2. Cerradas 3. Semicerradas 4. Abiertas 5. Mixtas 6. No excluyentes 7. Caso único a. Tablas de Frecuencias Absolutas y Relativas Nivel de investigación DESCRIPTIVO
  18. 18. Variables nominal Politómica: SEMICERRADAS: Consumo cuanto tiene Sed Tabla n° 3.- Distribución según ¿Qué prefiere consumir cuándo tiene sed? (Población, lugar y tiempo) Fuente.- Elaboración propia, 2018. a. Tablas de Frecuencias Absolutas y Relativas ¿Qué prefiere consumir cuándo tiene sed? (Variable nominal politómica-semicerradas) ( ) Gaseosa ( ) Jugos embotellados ( ) Bebidas hipertónicas (X) Agua ( ) Otros………………………………. Consumo cuando tienen sed Frecuencia (n) Porcentajes (%) Gaseosas 37 17,0 Jugos Embotellados 48 22,0 Bebida hipertónicas 5 2,3 Agua 57 26,1 Refresco 71 32,6 Total 218 100,0
  19. 19. Variables Categóricas Nominales Ordinales Dicotómicas Politómicas 1. Caso único 2. Cerradas 3. Semicerradas 4. Abiertas 5. Mixtas 6. No excluyentes 7. Caso único a. Tablas de Frecuencias Absolutas y Relativas Nivel de investigación DESCRIPTIVO
  20. 20. Variables nominal Politómica: ABIERTAS: Ciudad Tabla n° 4.- Distribución según la ciudad de residencia (Población, lugar y tiempo) Fuente.- Elaboración propia, 2018. a. Tablas de Frecuencias Absolutas y Relativas ¿Cuál es su ciudad de Origen? ……Santa Cruz de la Sierra..……. Ciudad Frecuencia (n) Porcentajes (%) Santa Cruz de la Sierra 133 61,0 Montero 28 12,8 Trinidad 11 5,0 Camiri 9 4,1 Otros 37 17,1 Total 218 100,0
  21. 21. Variables Categóricas Nominales Ordinales Dicotómicas Politómicas 1. Caso único 2. Cerradas 3. Semicerradas 4. Abiertas 5. Mixtas 6. No excluyentes 7. Caso único a. Tablas de Frecuencias Absolutas y Relativas Nivel de investigación DESCRIPTIVO
  22. 22. Variables nominal Politómica: MIXTAS: Medicamento para adelgazar Tabla n° 5.- Distribución según ¿Actualmente toma algún medicamento para adelgazar? (Población, lugar y tiempo) Fuente.- Elaboración propia, 2018. ¿Actualmente toma algún medicamento para adelgazar? ( ) Ninguno (X) Si ¿Cuál? ….Sibutramina… Medicamento para adelgazar Frecuencia (n) Porcentajes (%) Ninguno 206 94,5 Sibutramina 3 1,4 Garcinia 2 0,9 Xenical 2 0,9 Thermofem 2 0,9 PhenQ 1 0,5 Green Coffee 2 0,9 Total 218 100,0 a. Tablas de Frecuencias Absolutas y Relativas
  23. 23. Variables Categóricas Nominales Ordinales Dicotómicas Politómicas 1. Caso único 2. Cerradas 3. Semicerradas 4. Abiertas 5. Mixtas 6. No excluyentes 7. Caso único a. Tablas de Frecuencias Absolutas y Relativas Nivel de investigación DESCRIPTIVO
  24. 24. Variables nominal Politómica: NO EXCLUYENTE: Enfermedad Tabla n° 6.- Distribución según ¿Usted padece alguna de estas enfermedades? (Población, lugar y tiempo) Fuente.- Elaboración propia, 2018. ¿Usted padece alguna de estas enfermedades? ( ) Diabetes ( ) Hipertensión arterial (X) Dislipidemia (X) Dolor articular ( ) Otros………………………….……. a. Tablas de Frecuencias Absolutas y Relativas Enfermedades Frecuencia (n) Porcentajes (%) Diabetes 40 18,3 Hipertensión Arterial 77 35,3 Dislipidemia 15 6,9 Dolor articular 137 62,8
  25. 25. Variables Categóricas Nominales Ordinales Dicotómicas Politómicas 1. Caso único 2. Cerradas 3. Semicerradas 4. Abiertas 5. Mixtas 6. No excluyentes 7. Caso único a. Tablas de Frecuencias Absolutas y Relativas Nivel de investigación DESCRIPTIVO
  26. 26. Variables ordinal: CASO UNICO: Frecuencia de consumo de alimentos Tabla n° 7.- Distribución de la frecuencia de consumo de alimentos (Población, lugar y tiempo) Fuente.- Elaboración propia, 2018. a. Tablas de Frecuencias Absolutas y Relativas Alimento (1) (2) (3) (4) (5) Punteo Menos de 1 vez al mes 2 a 3 veces al mes 1 a 2 veces por semana 3 a 4 veces por semana 5 o más veces por semana Hamburguesa X Pollo frito X Choripán /panchito/ salchipapa X Embutidos (jamón, mortadela, chorizo) X Pizza X
  27. 27. Tablas según los niveles de investigación 05 04 03 02 01 05 Aplicativo Tratamiento 04 Predictivo Pronóstico 03 Explicativo Causalidad 01 Descriptivo Univariado 02 Relacional Bivariado
  28. 28. Tablas del Nivel de investigación RELACIONAL Tablas del Nivel Relacional Tablas Cruzadas Tablas de Cruces de Variables Tablas Tetracóricas Tablas de contingencia Masculino Porcentaje (%) Femenino Porcentaje (%) Desnutrición 2 1% 14 6% 16 7% Normal (Eutrófico) 62 28% 64 29% 126 57% Sobrepeso 53 24% 12 5% 65 29% Obesidad 8 4% 4 2% 12 5% Obesidad mórbida 2 1% 2 1% 4 2% Total 127 57% 96 43% 223 100% Porcentaje (%) Estado Nutricional Sexo Total Tabla N° 2.- Distribución del Estado Nutricional según Sexo Bivariado Tablas de doble entrada
  29. 29. Tablas 2x2 del Nivel de investigación RELACIONAL a.- Tablas de contingencia (Objetivo es COMPARAR) Cáncer de Pulmón Si No Total Hábito de Fumar N % N % N % Si 14 63,6 9 32,1 23 46,0 No 8 36,4 19 67,9 27 54,0 Total 22 100,0 28 100,0 50 100,0 Cáncer de Pulmón Si No Total Hábito de Fumar N % N % N % Si 14 60,9 9 39,1 23 100,0 No 8 29,6 19 70,4 27 100,0 Total 22 44,0 28 56,0 50 100,0 Consumo de alcohol Si No Total Hábito de fumar N % N % N % Si 14 28,0 9 18,0 23 46,0 No 8 16,0 19 38,0 27 54,0 Total 22 44,0 28 56,0 50 100,0 a.- Tablas de contingencia (Objetivo es ASOCIAR)
  30. 30. Tablas 2x2 del Nivel de investigación RELACIONAL N % N % N % Si 9 50 41 35 50 37 No 9 50 75 65 84 63 Total 18 100 116 100 134 100 Si No Totales Obesidad Diabetes Tabla N° 1.- Distribución de la diabetes según la obesidad de (Población, Lugar y Tiempo) (Objetivo estadístico COMPARAR) Fuente.- Elaboración propia, 2018. En la tabla N° 1, se presenta que el 50% de la población diabética presenta obesidad, mientras que el 35% de los diabéticos no presenta obesidad. Gráfica N° 1.- Distribución de la diabetes según la obesidad de (Población, Lugar y Tiempo) 50 35 50 65 SI NO DI ABETES PORCENTAJES(%) Obesidad Si Obesidad No
  31. 31. Tablas 2x2 del Nivel de investigación RELACIONAL Tabla N° 2.- Distribución de Obesidad según la diabetes de (Población, Lugar y Tiempo) (Objetivo estadístico COMPARAR) Fuente.- Elaboración propia, 2018. En la tabla N° 2, se presenta que el 18% de la población obesa presenta diabetes, mientras que el 82% de los obesos no presenta diabetes. Gráfica N° 2.- Distribución de Obesidad según la diabetes de (Población, Lugar y Tiempo) N % N % N % Si 9 18 41 82 50 100 No 9 11 75 89 84 100 Total 18 13 116 87 134 100 Obesidad Diabetes Totales Si No 18 11 82 89 SI NO OBESIDAD PORCENTAJES(%) Diabetes Si Diabetes No
  32. 32. Tablas 2x2 del Nivel de investigación RELACIONAL Tabla N° 3.- Distribución de la diabetes asociado a la Obesidad (Población, Lugar y Tiempo) (Objetivo estadístico ASOCIAR) Fuente.- Elaboración propia, 2018. En la tabla N° 3, se presenta que el 13% de la población presenta diabetes, de los cuales el 7% de los diabéticos son obesos, mientras que la otra proporción de diabéticos (7%) no presenta obesidad. Gráfica N° 3.- Distribución de la diabetes asociado a la Obesidad (Población, Lugar y Tiempo) 7 31 7 56 SI NO DI ABETES PORCENTAJES(%) Obesidad Si Obesidad No N % N % N % Si 9 7 41 31 50 37 No 9 7 75 56 84 63 Total 18 13 116 87 134 100 Obesidad Diabetes Totales Si No
  33. 33. Tablas 2x3 del Nivel de investigación RELACIONAL Área académica CS Salud CS Sociales Ingenierías Total Estrés laboral N % N % N % N % Si 18 90 8 53 8 53 18 90 No 2 10 7 46 7 47 2 10 Total 20 100 15 100 15 100 20 100 a.- Tablas de contingencia (Objetivo es COMPARAR)
  34. 34. Tablas según los niveles de investigación 05 04 03 02 01 05 Aplicativo Tratamiento 04 Predictivo Pronóstico 03 Explicativo Causalidad 01 Descriptivo Univariado 02 Relacional Bivariado
  35. 35. Tablas del Nivel de investigación EXPLICATIVO a.- Tablas de contingencia (Efecto de 4 tratamientos para retardar el peso en gramos de papayas de exportación) Tratamientos Días después de la aplicación del tratamiento 3 6 9 12 15 1 250 242 225 215 205 2 252 225 205 190 183 3 251 235 217 203 195 4 250 242 238 230 225 (5) Testigo 255 210 200 185 164
  36. 36. Tablas del Nivel de investigación EXPLICATIVO a.- Tablas de contingencia: Elevación de la Frecuencia Cardiaca “EFC” por el uso de Broncodilatadores en las ciudades de Bolivia según las edades. Salbutamol Fenoterol Terbutalina Salbutamol Fenoterol Terbutalina Salbutamol Fenoterol Terbutalina De 10 a 25 25 17 13 12 19 26 23 29 17 De 25 a 40 16 11 15 15 21 18 26 22 16 De 40 a 55 14 11 9 19 17 22 15 18 13 Total 55 39 37 46 57 66 64 69 46 Edades Ciudades de Bolivia Santa Cruz de la Sierra (416 msnm) Cochabamba (2558 msnm) La Paz (3625 msnm)
  37. 37. Diagrama de sectores. Se utiliza para visualizar de forma sencilla las frecuencias relativas de las variables. En los gráficos de sectores se divide una figura, habitualmente de forma circular, de forma que el área correspondiente a cada posible respuesta de la variable será proporcional a la frecuencia relativa de la variable. Estadística Descriptiva univariante: Representación gráfica Variables CUALITATIVAS
  38. 38. Gráfico de barras. Se representa una barra vertical (u horizontal si se desea) para cada una de las categorías de la variable de altura proporcional a su frecuencia, bien absoluta o relativa. Estadística Descriptiva univariante: Representación gráfica Variables CUALITATIVAS
  39. 39. Tabla de Frecuencia y Gráfico de Barras Variables CATEGÓRICAS HTA Frecuencia (n) Porcentaje (%) Si 110 55 No 90 45 Total 200 100 Tabla N° 1.- Distribución de la prevalencia de Hipertensión arterial sistólica (Población, lugar y tiempo) Fuente.- Elaboración propia, 2018. Con HTA 55% Sin HTA 45% Grafico N° 1.- Distribución de la prevalencia de Hipertensión arterial sistólica (Población, lugar y tiempo) Según la tabla n° 1, la prevalencia de Hipertensión arterial fue del 55%, lo cual significa que aproximadamente 5 de cada 10 personas presentan la presión arterial sistólica elevada.
  40. 40. Tabla de Frecuencia y Gráfico de Barras Variables CATEGÓRICAS Tabla N° 2.- Distribución del Estado Nutricional (Población, lugar y tiempo) Fuente.- Elaboración propia, 2018. Grafico N° 2.- Distribución del Estado Nutricional (Población, lugar y tiempo) Estado Nutricional Frecuencia (n) Porcentaje (%) Desnutrición 16 7 Normal (Eutrófico) 126 57 Sobrepeso 65 29 Obesidad 12 5 Obesidad mórbida 4 2 Total 223 100 7% 57% 29% 5% 2% 0% 10% 20% 30% 40% 50% 60% Desnutrición Normal (Eutrófico) Sobrepeso Obesidad Obesidad mórbida Porcentaje(%) Estado Nutricional Según la tabla n° 2, se pudo evidenciar que el 29% de la población de estudio presenta Sobrepeso, mientras que el 7% tiene Obesidad y desnutrición.
  41. 41. CASOS PRACTICOS N° 7 Tablas de frecuencias absolutas y relativas
  42. 42. CASOS PRACTICOS N° 8 Diagrama de sectores y gráfico de barras
  43. 43. Estadística Descriptiva RESUMIR GENERALIZAR
  44. 44. RESUMIR Univariable o Unidimensional (1 variable) CUANTITATIVA CUALITATIVA Tipo VARIABLES NUMÉRICAS Naturaleza CUANTITATIVAS Escala (2) INTERVALO (3) RAZÓN Dos atributos Tres atributos Características Tiene intervalos iguales y medibles. No tiene un origen real, por lo que puede asumir valores negativos. Tiene intervalos constantes entre valores; además de un origen real. El cero significa la ausencia del individuo. Atributos de la escala Orden Distancia Origen Orden Distancia Origen Clasificación de Escala Intervalo Continuas Discretas Edades: 1 a 5 años 6 a 10 años Ingreso: < 1000 1000 a 2000 2000 a 3000 > 3000 Temperatura Peso Kg Talla cm % Grasa corp. Hb (g/dl) Glucosa (mg/dl) Calorías pH N° hijos N° partos N° Leucocitos N° huesos N° dientes N° Familias Ejemplo Temperatura Hora del día Peso Hijos Valor Final -10 °C 0°C 20°C 00 Horas 10 Horas 20 Horas 00,00 Kg 10,24 kg 10,00 Kg Uno Dos Tres Observaciones (RAZÓN) Continuas: Provienen de medir y los valores poseen decimales Se pueden representar con números enteros o fraccionados Entre dos valores siempre existe un valor intermedio. Discretas: Provienen de contar y los valores no tienen decimales Solamente pueden ser representados con números enteros
  45. 45. 7. DEFINICIÓN DEL MÉTODO ESTADÍSTICO • Análisis de la ESTADÍSTICA DESCRIPTIVA de los datos 1 VARIABLE 2 VARIABLE P VARIABLE Datos CUANTITATIVOS • Estadígrafos: Promedios, Media, Mediana, Moda, Desviación Estándar, Varianza, Coeficiente de Variación, Error Estándar • Cuartiles, Deciles, Percentiles • Coeficientes de asimetría y Curtosis de Fisher • Gráficas: Histogramas, Box Plot. • Diagrama de Dispersión • Coeficiente de correlación de Pearson • Regresión lineal y no lineal • Coeficiente de determinación • Varianza residuales • Análisis de los componentes principales • Análisis Factorial de Correspondencia • Correlación canónica Datos CUALITATIVOS • Distribución de frecuencia: Tablas de frecuencia, Tablas de contingencias. • Diagrama de sectores, gráficos de barra, • Moda • Distribución de frecuencia bidimensional • Coeficiente de correlación Spearman • Coeficiente de contingencia • Análisis Factorial de Correspondencia • Modelo log-lineal Datos MIXTOS NO CORRESPONDE • Box Plot • Diagrama de error • Coeficiente biserial de punto • Regresión múltiple • Regresión Logística
  46. 46. Tabla de agrupación de intervalos (variables Numérica-DISCRETA) Estadística Descriptiva univariante: Variables NUMÉRICAS de INTERVALOS Variable Indicador Valor Final Escala Grupo Etáreo Número de años biológicos cumplidos a la fecha de la entrevista Menor de 2 años De 2 a 5 años De 15 a 47 años Embarazadas Ordinal
  47. 47. Tabla de agrupación de intervalos (variables Numérica-DISCRETA) Estadística Descriptiva univariante: Variables NUMÉRICAS de INTERVALOS Grupo etáreo (Años) Frecuencia (n) Porcentaje (%) Menor de 2 349 39 De 2 a 5 487 54 15 a 47 Embarazadas 61 7 Total 897 100
  48. 48. Tabla de agrupación de intervalos (variables cuantitativa-CONTINUA) Variable Indicador Valor Final Escala Estado nutricional Índice de Masa Corporal Desnutrido Normal (Eutrófico) Sobrepeso Obesidad Obesidad Mórbida Ordinal 2 )( )( mTalla KgPeso Estadística Descriptiva univariante: Variables NUMÉRICAS de INTERVALOS
  49. 49. Tabla de agrupación de intervalos (variables numérica-CONTINUA) Estadística Descriptiva univariante: Variables NUMÉRICAS de INTERVALOS Estado Nutricional Frecuencia (n) Porcentaje (%) Desnutrido 4 4 Eutrófico (Normal) 19 19 Sobrepeso 67 67 Obesidad 9 9 Obesidad mórbida 1 1 Total 100 100
  50. 50. 7. DEFINICIÓN DEL MÉTODO ESTADÍSTICO • Análisis de la ESTADÍSTICA DESCRIPTIVA de los datos 1 VARIABLE 2 VARIABLE P VARIABLE Datos CUANTITATIVOS • Estadígrafos: Promedios, Media, Mediana, Moda, Desviación Estándar, Varianza, Coeficiente de Variación, Error Estándar • Cuartiles, Deciles, Percentiles • Coeficientes de asimetría y Curtosis de Fisher • Gráficas: Histogramas, Box Plot. • Diagrama de Dispersión • Coeficiente de correlación de Pearson • Regresión lineal y no lineal • Coeficiente de determinación • Varianza residuales • Análisis de los componentes principales • Análisis Factorial de Correspondencia • Correlación canónica Datos CUALITATIVOS • Distribución de frecuencia: Tablas de frecuencia, Tablas de contingencias. • Diagrama de sectores, gráficos de barra, • Moda • Distribución de frecuencia bidimensional • Coeficiente de correlación Spearman • Coeficiente de contingencia • Análisis Factorial de Correspondencia • Modelo log-lineal Datos MIXTOS NO CORRESPONDE • Box Plot • Diagrama de error • Coeficiente biserial de punto • Regresión múltiple • Regresión Logística
  51. 51. 01 02 03 04 Tendencia Central Media, Mediana, Moda Dispersión Rango, Desviación Estándar, Varianza, Coeficiente de Variación, Error Estándar Posición Cuartiles, Deciles, Percentiles Forma Asimetría: Derecha (+), Simétrica (0), Izquierda (-) Curtosis: Lectocúrtica(+), Mesocurtica(0), Platicurtica(0) MEDIDAS UNIVARIANTES Variables NUMÉRICAS - CONTINUAS
  52. 52. 01 Tendencia Central Media, Mediana, Moda MEDIDAS UNIVARIANTES Variables NUMÉRICAS - CONTINUAS
  53. 53. Son indicadores estadísticos que muestran hacia que valor se agrupan los datos y nos ayudan a saber sobre que datos se agrupa toda la distribución. Media Mediana Moda Valor que representa a la población ó a un grupo de datos. Es un dato que divide a la población en 2 grupos iguales. Es el dato que más se repite. MEDIDAS DE TENDENCIA CENTRAL
  54. 54. Media Valor que representa a la población ó a un grupo de datos. MEDIDAS DE TENDENCIA CENTRAL n x x n i i   1 Media Aritmética o Promedio x 1x 2x  nx Datos Cuantitativos Ventajas : • Fácil de calcular e interpretar. • En su cálculo intervienen todos los datos disponibles. • Su valor es único para una serie de datos. • Es el punto de equilibrio de la información. Desventajas : • No es representativa con pocos datos • Se ve afectada por el grado de dispersión • Es poco útil con datos muy heterogéneos • No todos los valores contribuyen de igual forma ,los mayores tienen más peso
  55. 55. MEDIDAS DE TENDENCIA CENTRAL Mediana Es un dato que divide a la población en 2 grupos iguales. Mediana )(EM kx 2 M )1()( E   kk xx Datos Cuantitativos ordenados de menor a mayor Si n es par Si n es impar centrodeldato)( kx Ventajas : • Valor único que no se ve afectado por los extremos por ser equidistante de ellos. • Se localiza a la mitad de los datos , dejando el 50 % por arriba y el 50 % por debajo de su valor. • Es menos sensible a las variaciones de los datos. • No se ve afectada por la dispersión de los datos. Desventajas : • No se emplea para hacer cálculos • Utiliza muy poca información de los datos • Cuanto más grande es la serie de datos , más complicado se vuelve su determinación.
  56. 56. Moda Es el dato que más se repite. MEDIDAS DE TENDENCIA CENTRAL • La moda de un conjunto de observaciones es el valor que más se repite, aquel cuya frecuencia absoluta es máxima. • Puede ser única, que haya más de una, o que no exista. • Cuando hay más de una , la distribución de los datos se denomina acorde : bimodal , trimodal, polimodal, etc.
  57. 57. Aplicativo Predictivo Explicativo Relacional Descriptivo Tabla N° 1.- Medidas de tendencia central (Edad) (Población, lugar y tiempo) Univariado Estadístico Años Media = 43,420 Mediana = 43 Moda = 42 Fuente.- Elaboración propia, 2018. Tablas de Medidas de tendencia Central Variables Numéricas
  58. 58. 01 02 Tendencia Central Media, Mediana, Moda Dispersión Rango, Desviación Estándar, Varianza, Coeficiente de Variación, Error Estándar MEDIDAS UNIVARIANTES Variables NUMÉRICAS - CONTINUAS
  59. 59. Son datos estadísticos que sirven para medir la intensidad de alejamiento entre datos. Desviación estándar Amplitud de rango Coeficiente de variación Varianza MEDIDAS DE DISPERSIÓN Error estándar de la media
  60. 60. Amplitud de rango MEDIDAS DE DISPERSIÓN Indica el ancho, recorrido o amplitud de valores . Se define como la diferencia entre la observación más grande y la más pequeña : minmax vvr  Ventajas : • Fácil de determinar e interpretar. • Nos indica los límites de nuestra información. • Nos permite visualizar la amplitud de dispersión de los valores de forma sencilla. Desventajas : • Ignora toda la información de la muestra • No mide el grado de dispersión , solo su ancho • No nos da una idea detallada de la información de las observaciones.
  61. 61. MEDIDAS DE DISPERSIÓN Es una medida significativa de la dispersión de las observaciones alrededor de la media. Se define como el promedio de las desviaciones respecto a su media , elevadas al cuadrado : Ventajas : • Fácil de calcular mediante su fórmula. • Indica el grado y forma de dispersión de los datos con respecto a la media. • Depende de todas las mediciones. Desventajas : • Es impráctica por ser un término cuadrático de poco sentido en la realidad. • Es un número muy grande de referencia matemática , pero sin valor concreto y de difícil manejo comparativo. Varianza 1 )( 1 2 2     n xx s n i i
  62. 62. MEDIDAS DE DISPERSIÓN Se define como la raíz cuadrada del promedio las desviaciones respecto a su media , elevadas al cuadrado , es decir la raíz cuadrada de la varianza : Ventajas : • Fácil de calcular mediante su fórmula y particularmente en hojas de cálculo como Excel que lo hacen de forma automática. • Indica el grado y forma de dispersión de los datos con respecto a la media. • Depende de todas las mediciones. • Muy práctica por usar los mismos valores de las unidades que se analizan. • Un valor grande indica que los datos se alejan mucho de la media y un valor pequeño indica que se acercan a la media. Desventajas : • Si hacemos el cálculo manual , es complicado. Desviación estándar 1 )( 1 2     n xx n i i 
  63. 63. Coeficiente de variación MEDIDAS DE DISPERSIÓN Indica el porcentaje de variación que existe con respecto al Valor promedio de la distribución: Ventajas : • Sirve para comparar la variabilidad en un conjunto de datos con la de otro. • Permite la comparación de la variabilidad de variables medidas en escalas o unidades distintas. • Emplea toda la información disponible para su cálculo. • Fácil de calcular Desventajas : • No es una medida de dispersión con respecto al centro de la distribución de los datos. • Arrastra las limitaciones que tiene la media como medida de tendencia central. 100* x s cv 
  64. 64. MEDIDAS DE DISPERSIÓN O Error típicos, mide el grado de dispersión de las medias de todas las posibles muestras que pudieran extraerse de la población. Mide el grado de dispersión de las medias muéstrales respecto a la media poblacional (desconocida) : Error estándar de la media n s EE  DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES Sigma σ: desviación estándar de los individuos de la población general
  65. 65. Fuente.- Elaboración propia, 2018. Tabla N° 1.- Medidas de dispersión (Hemoglobina en g/dl) (Población, lugar y tiempo) Estadístico g/dl Rango = 13,7 Desviación Estándar = 1,478 La varianza = 2,186 Coef. de Variación (%) = 13,05 Error estándar = 0,0494 Tablas de Medidas de Dispersión Variables Numéricas
  66. 66. Grafico N° 1.- Histograma Un histograma es una representación gráfica de una variable en forma de barras agrupados mediante intervalos. Los datos provienen de una variables cuantitativas continuas. Sirve para tener una idea de la distribución de los datos o muestra. También cabe emplear variables cualitativas ordinales, siendo necesario que el número de datos sea alto. Graficas de Estadística descriptiva CUANTITATIVA Variables Numéricas
  67. 67. Grafico N° 1.- Histograma (Hemoglobina en g/dl) (Población, lugar y tiempo) Grafico de Medidas de Dispersión Variables Numéricas
  68. 68. Fuente.- Elaboración propia, 2018. Tabla N° 1.- Medidas de dispersión (Peso en embarazadas) (Población, lugar y tiempo) Estadístico Kilogramos Rango = 37 Desviación Estándar = 6,985 La varianza = 48,799 Coef. de Variación (%) = 11,80 Error estándar = 0,9596 Tablas de Medidas de Dispersión Variables Numéricas
  69. 69. Grafico de Medidas de Dispersión Variables Numéricas Gráfico N° 1.- Histograma (Peso en embarazadas) (Población, lugar y tiempo)
  70. 70. CASOS PRACTICOS N° 10 Estimación puntual e intervalos de confianza
  71. 71. Ejercicio: Se dispone del peso (en gramos) de dos grupos de niños, de 8 niños por grupo de un mes de edad. Los datos se muestran a continuación: Grupo A: 4123 4336 4160 4165 4422 3853 3281 3990 Grupo B: 4096 4166 3596 4127 4017 3769 4240 4194 Variables CUANTITATIVAS 1. Indica de qué tipo de variable se trata. 2. Calcular los siguientes estadísticos del Grupo A y B:  Media  Mediana  Moda  Rango  Varianza  Desviación típica  Coeficiente de variación  Error Estándar
  72. 72. Ejercicio: En un Centro de Salud se realiza seguimiento de la Hipertensión Arterial de algunos pacientes. Se dispone de 3 Grupos, cada uno con 10 mediciones de la tensión arterial sistólica (TAS) realizadas en el día de hoy, las cuales se muestran a continuación: Grupo A: 173,03 165,54 141,59 158,66 158,81 156,49 150,29 154,53 162,50 158,49 Grupo B: 151,11 166,13 147,47 152,83 166,99 135,62 138,77 168,11 162,04 176,77 Grupo C: 159,97 152,99 161,92 167,70 143,35 154,06 160,82 180,08 172,93 158,72 Variables CUANTITATIVAS 1. Indica de qué tipo de variable se trata. 2. Calcular los siguientes estadísticos para cada uno de los grupos:  Media  Mediana  Moda  Rango  Varianza  Desviación típica  Coeficiente de variación  Error Estándar
  73. 73. Grafica de Levey-Jennings para Control de Calidad Número Datos Colesterol mg/dl Estadísticos 1 249 248,33 Media = 248,33 2 247 5,35 Desviación Estándar = 5,35 3 244 253,68 + 1DS = 253,68 4 248 259,02 + 2DS = 259,02 5 249 264,37 + 3DS = 264,37 6 246 242,99 - 1DS = 242,99 7 252 237,64 - 2DS = 237,64 8 246 232,30 - 3DS = 232,30 9 239 Reglas 10 253 Media 11 243 0 248,33 12 252 31 248,33 13 249 (+1) Desviación Estándar 14 243 0 253,68 15 239 31 253,68 16 251 (-1) Desviación Estándar 17 247 0 242,99 18 255 31 242,99 19 244 (+2) Desviación Estándar 20 262 0 259,02 21 253 31 259,02 22 250 (-2) Desviación Estándar 23 242 0 237,64 24 256 31 237,64 25 242 (+3) Desviación Estándar 26 243 0 264,37 27 251 31 264,37 28 255 (-3) Desviación Estándar 29 248 232,30 30 252 232,30
  74. 74. Datos Media 1DS 2DS 3DS 1DS (-) 2DS (-) 3DS (-) 249 248,33 253,68 259,02 264,37 242,99 237,64 232,30 247 248,33 253,68 259,02 264,37 242,99 237,64 232,30 244 248,33 253,68 259,02 264,37 242,99 237,64 232,30 248 248,33 253,68 259,02 264,37 242,99 237,64 232,30 249 248,33 253,68 259,02 264,37 242,99 237,64 232,30 246 248,33 253,68 259,02 264,37 242,99 237,64 232,30 252 248,33 253,68 259,02 264,37 242,99 237,64 232,30 246 248,33 253,68 259,02 264,37 242,99 237,64 232,30 239 248,33 253,68 259,02 264,37 242,99 237,64 232,30 253 248,33 253,68 259,02 264,37 242,99 237,64 232,30 243 248,33 253,68 259,02 264,37 242,99 237,64 232,30 252 248,33 253,68 259,02 264,37 242,99 237,64 232,30 249 248,33 253,68 259,02 264,37 242,99 237,64 232,30 243 248,33 253,68 259,02 264,37 242,99 237,64 232,30 239 248,33 253,68 259,02 264,37 242,99 237,64 232,30 251 248,33 253,68 259,02 264,37 242,99 237,64 232,30 247 248,33 253,68 259,02 264,37 242,99 237,64 232,30 255 248,33 253,68 259,02 264,37 242,99 237,64 232,30 244 248,33 253,68 259,02 264,37 242,99 237,64 232,30 262 248,33 253,68 259,02 264,37 242,99 237,64 232,30 253 248,33 253,68 259,02 264,37 242,99 237,64 232,30 250 248,33 253,68 259,02 264,37 242,99 237,64 232,30 242 248,33 253,68 259,02 264,37 242,99 237,64 232,30 256 248,33 253,68 259,02 264,37 242,99 237,64 232,30 242 248,33 253,68 259,02 264,37 242,99 237,64 232,30 243 248,33 253,68 259,02 264,37 242,99 237,64 232,30 251 248,33 253,68 259,02 264,37 242,99 237,64 232,30 255 248,33 253,68 259,02 264,37 242,99 237,64 232,30 248 248,33 253,68 259,02 264,37 242,99 237,64 232,30 252 248,33 253,68 259,02 264,37 242,99 237,64 232,30 Grafica de Levey-Jennings para Control de Calidad
  75. 75. Grafica de Levey-Jennings para Control de Calidad 230 235 240 245 250 255 260 265 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Colesterolmg/dl Control de Colesterol mg/dl Datos Media 1DS 2DS 3DS 1DS (-) 2DS (-) 3DS (-)
  76. 76. Grafica de Levey-Jennings para Control de Calidad 230 235 240 245 250 255 260 265 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Colesterolmg/dl Control de Colesterol mg/dl Datos Colesterol mg/dl Media 1DS 2DS 3DS 1DS (-) 2DS (-) 3DS (-)
  77. 77. 01 02 03 Tendencia Central Media, Mediana, Moda Dispersión Rango, Desviación Estándar, Varianza, Coeficiente de Variación, Error Estándar Posición Cuartiles, Deciles, Percentiles MEDIDAS UNIVARIANTES Variables NUMÉRICAS - CONTINUAS
  78. 78. Sirven para dividir un conjunto de datos en grupos con la misma cantidad de unidades de estudio. Las medidas de posición más usadas son: Cuartiles Deciles Percentiles Son medidas de posición más usadas. MEDIDAS DE POSICIÓN/ORDEN/LOCALIZACIÓN
  79. 79. MEDIDAS DE POSICIÓN Percentiles: Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Cuartiles: Son tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular de percentiles. Deciles: Son nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles. 25% 25% 25% 25% Q1 Q2 Q3
  80. 80. MEDIDAS DE POSICIÓN Si los datos utilizados siguen una distribución normal los percentiles y la Desviaciones Estándar (DE) son comparables. Las medidas en el percentil 3 corresponde a - 2DE y las del percentil a 97 +2DE P3 P50 P97 -2DE Media +2DE
  81. 81. MEDIDAS DE POSICIÓN Grafico N° 1.- Diagrama de Caja y Bigotes Es un gráfico que está basado en cuartiles y mediante el cual se visualiza la distribución de un conjunto de datos. Está compuesto por un rectángulo (la caja) y dos brazos (los bigotes); suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.
  82. 82. MEDIDAS DE POSICIÓN Tabla N° 1.- Medidas de posición: (Talla) (Población, lugar y tiempo) Percentiles: Cuartiles: Deciles: p5= 1,57 D3= 1,64 p25= 1,63 Q1= 1,63 D4= 1,65 p50= 1,67 Q2= 1,67 D5= 1,67 p75= 1,71 Q3= 1,71 D6= 1,69 p95= 1,79 D7= 1,71 Fuente.- Elaboración propia, 2018.
  83. 83. MEDIDAS DE POSICIÓN Grafico N° 1.- Diagrama de Caja: (Talla) (Población, lugar y tiempo) Máximo 1,83 P75 = Q3 = 75 1,71 Mediana P50 = Q2 = 50 1,67 P25 = Q1 = 25 1,63 Mínimo 1,51
  84. 84. CASOS PRACTICOS N° 11 Los percentiles y los valores de normalidad
  85. 85. MEDIDAS DE POSICIÓN http://www.who.int/childgrowth/software/es/
  86. 86. MEDIDAS DE POSICIÓN http://www.who.int/childgrowth/software/es/
  87. 87. 01 02 03 04 Tendencia Central Media, Mediana, Moda Dispersión Rango, Desviación Estándar, Varianza, Coeficiente de Variación, Error Estándar Posición Cuartiles, Deciles, Percentiles Forma Asimetría: Derecha (+), Simétrica (0), Izquierda (-) Curtosis: Lectocúrtica(+), Mesocurtica(0), Platicurtica(0) MEDIDAS UNIVARIANTES Variables NUMÉRICAS - CONTINUAS
  88. 88. Coeficiente de asimetría Curtosis Evalúa la distribución de la frecuencia en sentido horizontal. Evalúa la distribución de la frecuencia en sentido Vertical. MEDIDAS DE FORMA
  89. 89. MEDIDAS DE FORMA Asimetría: El Coeficiente de Asimetría de Pearson. Apuntamiento o Curtosis: Se mide con el coeficiente de curtosis.
  90. 90. Dos variables Categóricas o Cualitativas Se describe la relación entre dos variables categóricas a partir de la construcción de una tabla de contingencia y gráficos de sectores o de barras. Dos variables Numéricas o Cuantitativas Las dos variables cuantitativas se lleva a cabo a partir de la obtención del coeficiente de covarianza y del coeficiente de correlación de Pearson y gráficos de nubes de puntos. Una V. Categórica y otra V. Numérica (MIXTAS) La descripción se reduce a la variable cuantitativa, tal y como se ha descrito en la sección de análisis univariante, para cada una de las categorías de la variable cualitativa. 01 02 03 Estadística Descriptiva Bivariante
  91. 91. Dos variables Categóricas o Cualitativas Se describe la relación entre dos variables categóricas a partir de la construcción de una tabla de contingencia y gráficos de sectores o de barras. 01 Estadística Descriptiva Bivariante N % N % N % Si 9 50 41 35 50 37 No 9 50 75 65 84 63 Total 18 100 116 100 134 100 Si No Totales Obesidad Diabetes 1.- Tabla de contingencia con Porcentajes por columnas (Objetivo estadístico comparar)
  92. 92. Dos variables Categóricas o Cualitativas Se describe la relación entre dos variables categóricas a partir de la construcción de una tabla de contingencia y gráficos de sectores o de barras. 01 Estadística Descriptiva Bivariante 50 35 50 65 SI NO DIABETES PORCENTAJES(%) Obesidad Si Obesidad No
  93. 93. Dos variables Categóricas o Cualitativas Se describe la relación entre dos variables categóricas a partir de la construcción de una tabla de contingencia y gráficos de sectores o de barras. 01 Estadística Descriptiva Bivariante N % N % N % Si 9 18 41 82 50 100 No 9 11 75 89 84 100 Total 18 13 116 87 134 100 Obesidad Diabetes Totales Si No 2.- Tabla de contingencia con Porcentajes por Filas (Objetivo estadístico comparar)
  94. 94. Dos variables Categóricas o Cualitativas Se describe la relación entre dos variables categóricas a partir de la construcción de una tabla de contingencia y gráficos de sectores o de barras. 01 Estadística Descriptiva Bivariante 18 11 82 89 SI NO OBESIDAD PORCENTAJES(%) Diabetes Si Diabetes No
  95. 95. N % N % N % Si 9 7 41 31 50 37 No 9 7 75 56 84 63 Total 18 13 116 87 134 100 Obesidad Diabetes Totales Si No Dos variables Categóricas o Cualitativas Se describe la relación entre dos variables categóricas a partir de la construcción de una tabla de contingencia y gráficos de sectores o de barras. 01 Estadística Descriptiva Bivariante 3.- Tabla de contingencia con Porcentajes Total (Objetivo estadístico asociar)
  96. 96. Dos variables Categóricas o Cualitativas Se describe la relación entre dos variables categóricas a partir de la construcción de una tabla de contingencia y gráficos de sectores o de barras. 01 Estadística Descriptiva Bivariante 7 31 7 56 SI NO DIABETES PORCENTAJES(%) Obesidad Si Obesidad No
  97. 97. Dos variables Numéricas o Cuantitativas Las dos variables cuantitativas se lleva a cabo a partir de la obtención del coeficiente de covarianza y del coeficiente de correlación de Pearson y gráficos de nubes de puntos. 02 Estadística Descriptiva Bivariante Un párrafo de nuestra introducción
  98. 98. Una V. Categórica y otra V. Numérica (MIXTAS) La descripción se reduce a la variable cuantitativa, tal y como se ha descrito en la sección de análisis univariante, para cada una de las categorías de la variable cualitativa. 03 Estadística Descriptiva Bivariante Tabla 1.- Medidas de Tendencia Central y de Dispersión (Peso en Kg) en pacientes Con y Sin HTA Estadísticos Con HTA Sin HTA Media = 67,49 64,90 Mediana = 66,55 64,50 Moda = 55,00 72,00 Rango = 55,30 58,40 Desv. Estandar = 12,58 13,13 Varianza = 158,23 172,32 Coef. Variación = 18,64 20,23 Error Estándar = 1,39 1,82 Peso en Kilogramos
  99. 99. Una V. Categórica y otra V. Numérica (MIXTAS) La descripción se reduce a la variable cuantitativa, tal y como se ha descrito en la sección de análisis univariante, para cada una de las categorías de la variable cualitativa. 03 Estadística Descriptiva Bivariante Grafica 1.- Diagrama de Cajas y bigotes de (Peso en Kg) en pacientes Con y Sin HTA
  100. 100. Outliers COMO DETECTAR EN EL SPSS: OUTLIERS o VALORES ATÍPICOS Es una observación que es numéricamente distante del resto de los datos, pueden ser indicativos de datos que pertenecen a una población diferente del resto de las muestras establecidas.
  101. 101. ¿Qué es un Outlier o Valores atípicos? Puntuación en una variable continua que es diferente a las demás. Puntuación extrema
  102. 102. ¿Porqué identificar un Outlier o Valores atípicos? ¿Estará relacionado el consumo de helado con el consumo de cerveza?
  103. 103. ¿Porqué identificar un Outlier o Valores atípicos? Rpta.- Existe correlación entre el consumo de helado y el consumo de cerveza.
  104. 104. ¿Porqué identificar un Outlier o Valores atípicos?
  105. 105. ¿Porqué identificar un Outlier o Valores atípicos? Rpta.- En realidad: No existe correlación entre el consumo de helado y el consumo de cerveza.
  106. 106. ¿Porqué identificar un Outlier o Valores atípicos?
  107. 107. ¿Cómo detectamos un Outliers? A través de las “Puntuaciones típicas” (Z): Miden la DISTANCIA de cada puntuación con respecto a la media de la variable en desviaciones típicas o estándar. Z Muestras Pequeñas (<80) 2,5 Muestras Grandes (>80) 3
  108. 108. ¿Cómo detectamos un Outliers en SPSS? Analizar/Estadísticos descriptivos/Descriptivos
  109. 109. ¿Cómo detectamos un Outliers en SPSS? Z Muestras Pequeñas (<80) 2,5 Muestras Grandes (>80) 3
  110. 110. ¿Cómo detectamos un Outliers en SPSS?
  111. 111. ¿Qué hacemos con los Outlier o Valores atípicos? 1. Identificarlos 2. Razones -> Error de codificación? 3. Resultados de los análisis estadísticos CON y SIN outliers

×