Bioestadística Aplicada I

NMRCD – Progr ama GEIS
UPCH – FASPA
ABE Perú
Sexta clase:
Métodos paramétricos y no
paramétricos
Medias, varianza y correlación
Pruebas para variables continuas

Bioes...
Porqué usamos pruebas no
paramétricas?:
Porque no siempre se cumplen todos los
supuestos requeridos por las pruebas de
hip...
Cómo se aplican estas pruebas:
Aplicar una transformación a los datos originales,
convertiéndolos en rangos, valores posit...
Transformaciones de datos
Si los datos tienen una distribución
sesgada, en ocasiones pueden
transformarse para eliminar lo...
Ejemplo:
Si trabajamos con parasitemia, con
frecuencia tendremos que aplicar una
transformación

Log

Bioestadística
Comando ‘gladder’:

Bioestadística
Análisis con variables numéricas:
Análisis

Paramétrico

No paramétrico

Describir un grupo

µ, σ2

Mediana, rango
intercu...
Comparación de una muestra
contra una constante
Se piensa que la edad de inicio del consumo
de cigarrillos es la adolescen...
0

.05

Fraction
.1

.15

.2

histogram p59, fraction

0

Bioestadística

20
40
¿qué edad tenía ud. cuando fumó cigarrillo...
Prueba T Student de una muestra

Bioestadística
Aunque no es necesario,
hagamos la prueba no
paramétrica:

Bioestadística
Prueba signrank (Wilcoxon):
Ho: Mediana de la diferencia = 0
p59 – 15 = 0
ó
p59 = 0
Asume una distribución uniforme
alrede...
Comparación entre dos muestras
independientes
Se piensa que la edad de inicio del consumo
de cigarrillos varía entre varon...
Prueba T Student (paramétrica):
Ho: µvarones = µ mujeres

Bioestadística

Ha: µvarones ≠ µ mujeres
Igualdad de varianzas:
La prueba T de Student de grupos
independientes difiere si las varianzas
difieren entre los grupos,...
Prueba de Varianzas (sdtest)
Ho: σ2varones = σ2mujeres

Bioestadística

Ha: σ2varones ≠ σ2mujeres
T Student con varianzas
diferentes:

Bioestadística
Prueba de Mann-Whitney:
Equivalente no paramétrico a una prueba de
hipótesis de promedios para dos muestras
Determina si u...
¿qué edad tenía ud. cuando fumó cigarrillos por primera vez?
0
20
40
60

Qué son los puntajes correlativos?

.5

1

Varone...
Prueba de Mann-Whitney:
Ho: Fumarvarones = Fumarmujeres

Bioestadística

Ha: Fumarvarones ≠ Fumarmujeres
Interpretación
Se están comparando “valores” o la
“distribución”, no los promedios
Si en un grupo los puntajes observados
...
Comparación de dos grupos
apareados
Es una sola muestra, en verdad, en la que se
han medido dos valores
Se puede calcular ...
Prueba T Student apareada:
Ho: μfumar = μtomar

Bioestadística

Ha: μfumar ≠ μtomar
Prueba signrank (Wilcoxon):

Bioestadística
Análisis de Varianza:
Prueba paramétrica para determinar si hay
diferencias en el promedio de una variable
cuantitativa (i...
Comparación de Varianzas:
Se usa en el ANOVA para determinar si hay
diferencias entre promedios de varias
muestras
También...
Las hipótesis:
Hipótesis nula, Ho:
X-inicioAlto = X-inicioMedio = X-inicioBajo
Hipótesis alternativa, Ha:
Existen diferenc...
Bioestadística
Prueba de Kruskal-Wallis:
Extensión de la prueba de Mann-Whitney a
mas de dos poblaciones
Equivalente no paramétrico del a...
¿qué edad tenía ud. cuando fumó cigarrillos por primera vez?
0
20
40
60

Los puntajes correlativos:

.5

1

Bioestadística...
En Stata:

Bioestadística
Determinando pares diferentes:

Bioestadística
Correlación r de Pearson
Mide el grado de asociación lineal entre dos
variables numéricas
-1 <= r <= 1, r = 0 indica indep...
Las hipótesis:
Hipótesis nula (Ho):
rfumar - tomar = 0
Hipótesis alternativa (Ha):
rfumar - tomar ≠ 0

Bioestadística
0

20

p59b

40

60

scatter p59 p89

0

Bioestadística

10

20

p89b

30

40

50
Resultados:

Bioestadística
Correlación de puntajes
(Spearman):
Equivalente no paramétrico a la prueba de
correlación lineal de Pearson. Se aplica cua...
Las hipótesis:
Hipótesis nula, Ho:
ρ-puntajesfumar - tomar = 0
Hipótesis alternativa, Ha:
ρ- puntajesfumar - tomar ≠ 0

Bi...
Resultados:

Bioestadística
Que debemos llevar a casa hoy:
Alternativas disponibles cuando no se
cumplen las condiciones para usar
pruebas parámetrica...
Upcoming SlideShare
Loading in …5
×

Prueba t

6,527 views

Published on

Published in: Education
  • Be the first to comment

Prueba t

  1. 1. Bioestadística Aplicada I NMRCD – Progr ama GEIS UPCH – FASPA ABE Perú
  2. 2. Sexta clase: Métodos paramétricos y no paramétricos Medias, varianza y correlación Pruebas para variables continuas Bioestadística
  3. 3. Porqué usamos pruebas no paramétricas?: Porque no siempre se cumplen todos los supuestos requeridos por las pruebas de hipótesis tradicionales (paramétricas): Distribución normal Tamaño de muestra “grande” Varianzas iguales (?) Si la distribucion de la poblacion es sesgada (Por lo que la media no es buen indicador de tendencia central) Bioestadística
  4. 4. Cómo se aplican estas pruebas: Aplicar una transformación a los datos originales, convertiéndolos en rangos, valores positivo o negativo, etc. Con los datos transformados, calcular un estadístico en base a los datos (a veces también se calcula su promedio y error estándar) Con el estadístico y los parámetros calculados, realizar una prueba de hipótesis de acuerdo a una cierta distribución paramétrica (Normal, Jicuadrado, Binomial, etc.) Bioestadística
  5. 5. Transformaciones de datos Si los datos tienen una distribución sesgada, en ocasiones pueden transformarse para eliminar los sesgos En algunos casos se puede emplear un test paramétrico después de la transformación Bioestadística
  6. 6. Ejemplo: Si trabajamos con parasitemia, con frecuencia tendremos que aplicar una transformación Log Bioestadística
  7. 7. Comando ‘gladder’: Bioestadística
  8. 8. Análisis con variables numéricas: Análisis Paramétrico No paramétrico Describir un grupo µ, σ2 Mediana, rango intercuartil Comparar un grupo T Student de una a un valor muestra Prueba Wilcoxon Comparar medias en 2 grupos T Student de dos muestras Mann-Whitney Comparar medias en 2 grupos apareados T Student apareada Prueba Wilcoxon Comparar medias en 3 o mas grupos ANOVA Kruskal-Wallis Correlación entre dos variables Pearson (lineal) Spearman (monotónica) Bioestadística
  9. 9. Comparación de una muestra contra una constante Se piensa que la edad de inicio del consumo de cigarrillos es la adolescencia Puntualmente se plantea que el consumo se inicia a los 15 años Si la distribución es sesgada o la muestra es pequeña, una prueba paramétrica sobre la media puede ser poco relevante Bioestadística
  10. 10. 0 .05 Fraction .1 .15 .2 histogram p59, fraction 0 Bioestadística 20 40 ¿qué edad tenía ud. cuando fumó cigarrillos por primera vez? 60
  11. 11. Prueba T Student de una muestra Bioestadística
  12. 12. Aunque no es necesario, hagamos la prueba no paramétrica: Bioestadística
  13. 13. Prueba signrank (Wilcoxon): Ho: Mediana de la diferencia = 0 p59 – 15 = 0 ó p59 = 0 Asume una distribución uniforme alrededor de cero Compara puntajes esperados con observados Bioestadística
  14. 14. Comparación entre dos muestras independientes Se piensa que la edad de inicio del consumo de cigarrillos varía entre varones y mujeres Si la distribución es sesgada, una prueba paramétrica sobre la media puede ser poco relevante Si los tamaños de muestra son pequeños (n < 30), el TLC no se cumplirá y la prueba T podría llevar a conclusiones erróneas Bioestadística
  15. 15. Prueba T Student (paramétrica): Ho: µvarones = µ mujeres Bioestadística Ha: µvarones ≠ µ mujeres
  16. 16. Igualdad de varianzas: La prueba T de Student de grupos independientes difiere si las varianzas difieren entre los grupos, debiendo agregarse la opción “unequal” Para evaluar si las varianzas son comparables o no se utiliza el comando sdtest Bioestadística
  17. 17. Prueba de Varianzas (sdtest) Ho: σ2varones = σ2mujeres Bioestadística Ha: σ2varones ≠ σ2mujeres
  18. 18. T Student con varianzas diferentes: Bioestadística
  19. 19. Prueba de Mann-Whitney: Equivalente no paramétrico a una prueba de hipótesis de promedios para dos muestras Determina si una variable tiene valores mas altos en una población que en otra. NO COMPARA LOS PROMEDIOS!!! Util si el tamaño de muestra es pequeño o la distribución es demasiado sesgada Bioestadística
  20. 20. ¿qué edad tenía ud. cuando fumó cigarrillos por primera vez? 0 20 40 60 Qué son los puntajes correlativos? .5 1 Varones Bioestadística 1.5 inf_sexo 2 Mujeres 2.5
  21. 21. Prueba de Mann-Whitney: Ho: Fumarvarones = Fumarmujeres Bioestadística Ha: Fumarvarones ≠ Fumarmujeres
  22. 22. Interpretación Se están comparando “valores” o la “distribución”, no los promedios Si en un grupo los puntajes observados son mayores a los esperados, ese grupo tiene mayores “valores” Bioestadística
  23. 23. Comparación de dos grupos apareados Es una sola muestra, en verdad, en la que se han medido dos valores Se puede calcular la diferencia entre los valores y sería una prueba de una sola muestra Qué comienza primero, alcohol o tabaco? Prueba no paramétrica útil si es muestra pequeña o distribución muy sesgada Bioestadística
  24. 24. Prueba T Student apareada: Ho: μfumar = μtomar Bioestadística Ha: μfumar ≠ μtomar
  25. 25. Prueba signrank (Wilcoxon): Bioestadística
  26. 26. Análisis de Varianza: Prueba paramétrica para determinar si hay diferencias en el promedio de una variable cuantitativa (inicio fumar) entre tres o más poblaciones (estratos sociales). Supuestos: Distribución normal en todas las poblaciones (no es necesario si el tamaño de muestra es “grande”) Varianzas comparables entre poblaciones Observaciones (muestras) independientes Bioestadística
  27. 27. Comparación de Varianzas: Se usa en el ANOVA para determinar si hay diferencias entre promedios de varias muestras También se usa ANOVA en el análisis de regresión, siendo un caso particular del ANOVA Utiliza la prueba estadística F Bioestadística
  28. 28. Las hipótesis: Hipótesis nula, Ho: X-inicioAlto = X-inicioMedio = X-inicioBajo Hipótesis alternativa, Ha: Existen diferencias en la edad de inicio de fumar promedios de al menos dos estratos sociales Bioestadística
  29. 29. Bioestadística
  30. 30. Prueba de Kruskal-Wallis: Extensión de la prueba de Mann-Whitney a mas de dos poblaciones Equivalente no paramétrico del análisis de varianza TAMPOCO COMPARA PROMEDIOS: determina si una población tiene valores diferentes (mas altos o mas bajos) que las otras poblaciones Bioestadística
  31. 31. ¿qué edad tenía ud. cuando fumó cigarrillos por primera vez? 0 20 40 60 Los puntajes correlativos: .5 1 Bioestadística 1.5 2 estrato social 2.5 3 3.5
  32. 32. En Stata: Bioestadística
  33. 33. Determinando pares diferentes: Bioestadística
  34. 34. Correlación r de Pearson Mide el grado de asociación lineal entre dos variables numéricas -1 <= r <= 1, r = 0 indica independencia Se calcula en stata con el comando “pwcorr” Requiere muestras “grandes”, distribuciones cruzadas no sesgadas Bioestadística
  35. 35. Las hipótesis: Hipótesis nula (Ho): rfumar - tomar = 0 Hipótesis alternativa (Ha): rfumar - tomar ≠ 0 Bioestadística
  36. 36. 0 20 p59b 40 60 scatter p59 p89 0 Bioestadística 10 20 p89b 30 40 50
  37. 37. Resultados: Bioestadística
  38. 38. Correlación de puntajes (Spearman): Equivalente no paramétrico a la prueba de correlación lineal de Pearson. Se aplica cuando la correlación no es lineal, la muestra es pequeña o existen valores muy extremos Determina si dos variables cuantitativa u cualitativa-ordinal están correlacionadas positiva (una crece y la otra también) o negativamente (una crece y la otra disminuye) Al igual que las pruebas de Mann-Whitney y Kruskal-Wallis, también utiliza datos por rangos Bioestadística
  39. 39. Las hipótesis: Hipótesis nula, Ho: ρ-puntajesfumar - tomar = 0 Hipótesis alternativa, Ha: ρ- puntajesfumar - tomar ≠ 0 Bioestadística
  40. 40. Resultados: Bioestadística
  41. 41. Que debemos llevar a casa hoy: Alternativas disponibles cuando no se cumplen las condiciones para usar pruebas parámetricas Como aplicar e interpretar las pruebas de Wilcoxon, Mann-Whitney, Kruskal-Wallis y Spearman Limitaciones de las pruebas no paramétricas Bioestadística

×