Tema 2 contrastes de significación (i)

4,236
-1

Published on

Published in: Education, Business, Sports
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
4,236
On Slideshare
0
From Embeds
0
Number of Embeds
14
Actions
Shares
0
Downloads
183
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Tema 2 contrastes de significación (i)

  1. 2. Carbón M aterial R eferencia C ertificado NIST 3,19 % S (p/p) Media-MRC= 0,07% ¿La diferencia es achacable exclusivamente al puro azar (o aleatoriedad) o existe un sesgo (bias) que causa dicha diferencia? ? Analizador S Análisis S (%) (p/p) 3,29 3,22 3,30 3,23 Media 3,26 s 0,04 Incertidumbre (errores aleatorios) Sesgo (errores sistemáticos)
  2. 3. ¿Son significativamente diferentes? Métodos A y B
  3. 4. HIPÓTESIS NULA (H 0 ) No hay diferencia significativa entre los valores comparados El punto centro de la diana y el promedio de nuestros lanzamientos no difieren HIPÓTESIS ALTERNATIVA (H 1 ) Si que hay diferencia significativa entre los valores comparados El punto centro de la diana y el promedio de nuestros lanzamientos difieren Coincide el centro de la diana y nuestros lanzamientos ?? Diferencia errores aleatorios Diferencia errores no aleatorios
  4. 5. Ser aleatoria (H 0 ) o no ser (H 1 ), esa es la cuestión ¿estás seguro? Se establece una probabilidad Habitualmente α = 0,05 -> 95 % Ser aleatoria al 95%(H 0 ) o no ser (H 1 ), esa es la cuestión Diferencia
  5. 6. ¿Tiene 3% Fósforo? Aplicamos método estándar σ conocida Somos buenos ¿Por qué nos rechazas? 3% α = 0,05 Intervalo de confianza Análisis Media Se acepta H 0 : Ensayo negativo La vida es injusta Error tipo I
  6. 7. Imaginemos que H 1 es cierto y nuestra muestra tiene realmente 3,05% (no lo sabemos aún) ¿Tiene 3% Fósforo? α = 0,05 3% Análisis Media Ojo!! Nuestra media también tiene su distribución muestral con la misma s (mismo método) 3,05% Se acepta H 1 : Ensayo positivo
  7. 8. Imaginemos que H 1 es cierto, que nuestra muestra tiene realmente 3,05% (no lo sabemos) ¿Tiene 3% Fósforo? 3% 3,02% Les engañé, creen que soy de los buenos Que pasa si analizamos y no damos 3,05%, sino p.e. 3,02%? ¿H 0 o H 1 ? Podemos tener valores de media que den por negativo un ensayo ( H 0 verdadero, diferencia por errores aleatorios), cuando en realidad es positivo ( H 1, existe un bias o sesgo no aleatorio, pertenecen al intervalo de confianza de un µ que no cumple H 0 ) !! α = 0,05 El lobo con piel de cordero Error tipo II
  8. 9. ¿Tiene 3% Fósforo? 3% 4,5% Ausencia de errores II 3% 3,05% α = 0,05 Cuanto más cerca soy más fuerte y más fácil engaño Errores II o β Podemos dar negativo (H 0 ) cuando en realidad es positivo (H 1 ) !! Ensayo positivo H 1
  9. 10. Realidad El test dice Probabilidad de cometer o no un error I o II Resumen de posibilidades Falso positivo Falso negativo
  10. 11. Disminuyamos α (P > 95%) α = 0,05 α = 0,01 Ahora sólo somos el 1% Que fácil era, ¿por qué no lo hacemos siempre así ? (P = 99%) Se ha reducido al 1% la posibilidad de dar un falso positivo (H 1 ) Ensayo negativo H 0
  11. 12. α = 0,05 Gracias, por salvar algunos angelotes me has hecho más fuerte Ha aumentado la posibilidad de cometer errores II, dar por negativo (H 0 ) un ensayo que es positivo (H 1 ) Ensayo positivo H 1 (pero µ y µ 0 próximos)
  12. 13. Errores I y II conectados, ojo al manejar α (especialmente cuando µ y µ 0 próximos) Disminuimos α (>P) Menos error I Minimizamos posibilidad de falsos positivos (H 1 ) Más error II (en casos µ y µ 0 próximos) Más posibilidad de falsos negativos (H 0 ) Aumentamos α (<P) Más error I Más posibilidad de falsos positivos (H 1 ) Menos error II (en casos µ y µ 0 próximos) Menos posibilidad de falsos negativos (H 0 ) Ensayo positivo H 1 Ensayo negativo H 0 Ensayo negativo H 0 Ensayo positivo H 1
  13. 14. Como podemos hacer los errores tipo II más pequeños sin afectar a los de tipo I ?? Distribución muestral de medias Distribución t
  14. 15. Aumentemos el tamaño de la muestra (>n) Utilicemos métodos de análisis/equipos más precisos (< s) Distribución muestral de medias Distribución t
  15. 16. Hemos disminuido la posibilidad de falsos negativos (errores tipo II)
  16. 17. Niveles máximos/mínimos permitidos Contaminación Producción fábrica Dopaje deportistas… Verificación métodos Utilización de patrones certificados Etc. H 0 x=µ Si lo son, diferencia por errores aleatorios H 1 x≠µ No lo son, diferencia significativa (sesgo) ¿Son la misma medida? Son pruebas para evaluar la exactitud (detección de un sesgo) X medido µ Max.permitido
  17. 18. Hemos de calcular t real que corresponde a la diferencia x-µ 0 ¿Cuanto de alejados están x-µ 0 en términos de t ? Se busca en tablas que valor de t crítico para una determinada probabilidad (95%) y n-1 grados de libertad Ensayo positivo H 1 Ensayo negativo H 0
  18. 19. α = 0,05 Probabilidad 95% Búsqueda en tabla t de 1 cola t critico x t crítico t crítico x µ t t crítico x µ t Una cola Ensayo positivo H 1 Ensayo negativo H 0
  19. 20. α = 0,05 Probabilidad 95% Búsqueda en tabla t de 2 cola t critico x t crítico t crítico t crítico x µ µ t crítico x µ t crítico t crítico Dos colas Ensayo positivo H 1 Ensayo negativo H 0
  20. 21. Patrón certificado selenourea 50 ng/ml = µ Analizamos ¿Nuestro método es exacto y la diferencia se debe a errores aleatorios? H 0 µ = x ¿O hay un sesgo debido a errores sistemáticos? H 1 µ = x Ejemplo Selenourea (ng/ml) 50,4 50,7 49,1 49,0 51,1 x 50,06 s 0,956
  21. 22. Calculamos t real Buscamos t crítico en tablas α =0,05 P=95% N grados libertad = n-1 = 4 t crítico = 2,78 tabla t de 2 cola Ejemplo
  22. 23. Comparemos t crítico 50,06 50 t crítico ? Ejemplo Luego se cumple H 0 µ = x 50 ≈ 50,06 ng/ml El método funciona y analiza con exactitud, no hay contribución de errores sistemáticos y la diferencia se debe a error aleatorio Ensayo negativo H 0
  23. 24. Cuando n > 30 t ≈ z ( ya no depende de n grados de libertad) Pruebas para evaluar la exactitud (detección de bias)
  24. 25. a) Hemos de calcular t real (en función de la distancia entre las medias) El fundamento es el mismo que el utilizado en un contraste de una media con un valor conocido Ojo, Ahora hay dos desviaciones estándar que se componen n 1 , n 2 < 30 s 1 , s 2 comparables
  25. 26. b) Hemos de obtener en tablas t el valor t crítico para n 1 +n 2 -2 grados de libertad y la probabilidad P marcada (habitualmente 95%) El número de grados de libertad con el que buscamos T en tablas también ha cambiado n 1 , n 2 < 30 s 1 , s 2 comparables
  26. 27. c) Comparamos Ensayo positivo H 1 Ensayo negativo H 0 n 1 , n 2 < 30 s 1 , s 2 comparables
  27. 28. Centeno ¿Concentración Cr? Laboratorio A Laboratorio B n= 5 x = 1,48 mg/kg S = 0,28 mg/kg n= 5 x = 2,33 mg/kg S = 0,31 mg/kg ¿Estos laboratorios están dando resultados comparables ? ¿La diferencia se debe a solo a errores aleatorios? n 1 , n 2 < 30 s 1 , s 2 comparables Ejemplo
  28. 29. Calculamos t real S = 0,295 t real =4,56 n 1 , n 2 < 30 s 1 , s 2 comparables Ejemplo
  29. 30. Calculamos t crítico t crítico = 2,31 α =0,05 P=95% Ejemplo n 1 , n 2 < 30 s 1 , s 2 comparables
  30. 31. Comparamos ? n 1 , n 2 < 30 s 1 , s 2 comparables Ejemplo Ensayo positivo H 1 Luego se cumple H 1 x 1 ≠ x 2 1,48 ≠ 2,33 mg/kg Los laboratorios no están dando valores comparables de análisis (no nos informa de cual ofrece el valor correcto)
  31. 32. Una vez más, mismo fundamento pero… … Y Hallar El número de grados de libertad es más complicado Las S de cada media ahora no se SIMPLIFICAN… Cálculo de t real Tablas con t crítico Tablas t=f( 𝜗,P) 𝜗 se redondea al entero más próximo!! n 1 , n 2 < 30 s 1 , s 2 diferentes
  32. 33. Y de nuevo comparamos X 1 = X 2 X 1 ≠ X 2 Ensayo positivo H 1 Ensayo negativo H 0 n 1 , n 2 < 30 s 1 , s 2 diferentes
  33. 34. La cantidad de muestra disponible a examen es suficiente para sólo una determinación por método Las muestras a examen pueden presentarse durante un extenso periodo de tiempo por lo que es necesario eliminar los efectos de las variaciones ambientales como temperatura, presión, etc. Los métodos se van a comparar utilizando una amplia variedad de muestras de diferente procedencia y concentraciones distintas No es adecuado realizar medias de los valores por método, tanda o laboratorio ¿Por qué emparejados?
  34. 35. Lotes de pastillas paracetamol % (m/m) % (m/m) ¿Los dos métodos están dando resultados comparables ?
  35. 36. Planteamiento de hipótesis No tenemos medias calculadas Ahora trabajamos con diferencias entre par de valores emparejados Hallemos t real (n<30)
  36. 37. Hallemos t crítico (n<30) Habitualmente probabilidad α =0,05 P=95% N grados libertad = n-1 ,, siendo n el número de emparejamientos tabla t de 2 cola t crítico = 2,31
  37. 38. Comparemos La diferencia de resultados entre ambos métodos no es significativa (errores aleatorios) Ensayo positivo H 1 Ensayo negativo H 0 Ensayo negativo H 0
  38. 39. <ul><li>Hay que trabajar de similar forma que en los contrastes de exactitud (comparar un F calculado con F crítico de tabla) con la diferencia de que: </li></ul><ul><li>Ahora trabajamos con parámetro F y su tabla </li></ul><ul><li>Tablas F, en estos casos son de 1 cola </li></ul><ul><li>F depende de los grados de libertad de cada distribución (dos entradas) y de probabilidad de una cola </li></ul>Ensayo negativo H 0 Ensayo positivo H 1 Compara para saber si las varianzas de dos métodos son similares (H 0 ) o un método es más preciso que otro (H 1 )
  39. 40. <ul><li>Hay que trabajar de similar forma que en los contrastes de exactitud (comparar un Q calculado con Q crítico de tabla) con la diferencia de que: </li></ul><ul><li>Ahora trabajamos con parámetro Q y su tabla </li></ul><ul><li>Tablas Q, en estos casos son de 2 colas </li></ul><ul><li>Q depende de los grados de libertad del sistema y de probabilidad de dos colas </li></ul>Compara para saber si una medida pertenece a una distribución normal de valores (H 0 ) o no (H 1 ) Ensayo negativo H 0 Ensayo positivo H 1
  40. 41. Hay algún valor discrepante en el análisis de la muestra de agua debido a un error no aleatorio?
  41. 42. Calculamos Q real Hallemos Q crítico en tablas Habitualmente probabilidad α =0,05 P=95% Q crítico = 0,831
  42. 43. Comparemos 0,380 no se elimina, pertenece a la misma distribución normal que la de los demás puntos Inconveniente Este procedimiento sólo es válido para muestras pequeñas de 4 a 7 medidas, para muestras más grandes se modifica !! Ensayo negativo H 0
  43. 44. Cuanto de alejado de x en términos de S se encuentra x En este caso x=x+Gs Contrastar con la G teórica (G crítica) x esta dentro de los valores normales de la distribución normal. Se acepta x esta demasiado alejado y no pertenece a la misma distribución (error no aleatorio). Se rechaza Ensayo negativo H 0 Ensayo positivo H 1
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×