3. Variable aleatoria
• El resultado de un experimento aleatorio puede ser descrito
en ocasiones como una cantidad numérica.
• En estos casos aparece la noción de variable aleatoria
– Función que asigna a cada suceso un número.
• Las variables aleatorias pueden ser discretas o continuas
• En las siguientes transparencias vamos a recordar conceptos
de temas anteriores, junto con su nueva designación. Los
nombres son nuevos. Los conceptos no.
3
4. Función de probabilidad (V. Discretas)
• Asigna a cada posible valor de
una variable discreta su
probabilidad.
• Recuerda los conceptos de
frecuencia relativa y diagrama de
barras.
• Ejemplo
– Número de caras al lanzar 3
monedas.
40%
35%
30%
25%
20%
15%
10%
5%
0%
0
1
2
3
4
5. Función de densidad (V. Continuas)
• Definición
– Es una función no negativa de integral 1.
• Piénsalo como la generalización del
histograma con frecuencias relativas para
variables continuas.
• ¿Para qué lo voy a usar?
– Nunca lo vas a usar directamente.
– Sus valores no representan probabilidades.
5
6. ¿Para qué sirve la f. densidad?
• Muchos procesos aleatorios vienen descritos por variables de forma
que son conocidas las probabilidades en intervalos.
• La integral definida de la función de densidad en dichos intervalos
coincide con la probabilidad de los mismos.
• Es decir, identificamos la probabilidad de un intervalo con el área bajo
la función de densidad.
6
7. Función de distribución
• Es la función que asocia a cada valor de una
variable, la probabilidad acumulada
de los valores inferiores o iguales.
– Piénsalo como la generalización de las
frecuencias acumuladas. Diagrama integral.
• A los valores extremadamente bajos les corresponden valores de la
función de distribución cercanos a cero.
• A los valores extremadamente altos les corresponden valores de la
función de distribución cercanos a uno.
• Lo encontraremos en los artículos y aplicaciones en forma de “pvalor”, significación,…
7
8. ¿Para qué sirve la f. distribución?
• Contrastar lo anómalo de una observación concreta.
• Sé que una persona de altura 210cm es “anómala” porque la función de
distribución en 210 es muy alta.
• Sé que una persona adulta que mida menos de 140cm es “anómala” porque la
función de distribución es muy baja para 140cm.
• Sé que una persona que mida 170cm no posee una altura nada extraña pues
su función de distribución es aproximadamente 0,5.
• Relaciónalo con la idea de cuantil.
• En otro contexto (contrastes de hipótesis) podremos observar unos
resultados experimentales y contrastar lo “anómalos” que son en
conjunto con respecto a una hipótesis de terminada.
8
9. Valor esperado y varianza de una v.a. X
• Valor esperado
– Se representa mediante E*X+ ó μ
– Es el equivalente a la media
• Varianza
– Se representa mediante VAR*X+ o σ2
– Es el equivalente a la varianza
– Se llama desviación típica a σ
9
10. Coeficiente de variación
Es la razón entre la desviación típica y la media.
Mide la desviación típica en forma de
“qué tamaño tiene con respecto a la media”
También se la denomina variabilidad relativa.
Es frecuente mostrarla en porcentajes
Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)
Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes
variables.
CV
S
x
Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más
dispersión en peso que en altura.
No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una
cantidad fijada arbitrariamente
Por ejemplo 0ºC ≠ 0ºF
Los ingenieros electrónicos hablan de la razón ‘señal/ruido’ (su inverso).
10
11. Algunos modelos de v.a.
• Hay v.a. que aparecen con frecuencia en las Ciencias de la
Salud.
– Experimentos dicotómicos.
• Bernoulli
– Contar éxitos en experimentos dicotómicos repetidos:
• Binomial
• Poisson (sucesos raros)
– Y en otras muchas ocasiones…
• Distribución normal (gaussiana, campana,…)
• El resto del tema está dedicado a estudiar estas
distribuciones especiales.
11
12. Distribución binomial
• Función de probabilidad
P[ X
k]
n
k
pk qn k , 0 k n
– Problemas de cálculo si n es grande y/o p cercano a 0 o 1.
• Media: μ =n p
• Varianza: σ2 = n p q
12
13. Distribución Binomial
• Si se repite un número fijo de veces, n, un experimento de Bernoulli
con parámetro p, el número de éxitos sigue una distribución
binomial de parámetros (n,p).
• Lanzar una moneda 10 veces y contar las caras.
– Bin(n=10,p=1/2)
• Lanzar una moneda 100 veces y contar las caras.
– Bin(n=100,p=1/2)
– Difícil hacer cálculos con esas cantidades. El modelo normal será más adecuado.
• El número de personas que enfermará (en una población de 500.000
personas) de una enfermedad que desarrolla una de cada 2000
personas.
– Bin(n=500.000, p=1/2000)
» Difícil hacer cálculos con esas cantidades. El modelo de Poisson será más
adecuado.
13
14. Distribución de Poisson
• También se denomina de sucesos raros.
• Se obtiene como aproximación de una
distribución binomial con la misma media, para
‘n grande’ (n>30) y ‘p pequeño’ (p<0,1).
• Queda caracterizada por un único parámetro μ
(que es a su vez su media y varianza.)
• Función de probabilidad:
k
P[ X
k] e
k!
, k 0,1,2,...
14
15. Ejemplos de variables de Poisson
• El número de individuos que será atendido un día cualquiera en el servicio de
urgencias del hospital clínico universitario.
– En Málaga hay 500.000 habitantes (n grande)
– La probabilidad de que cualquier persona tenga un accidente es pequeña,
pero no nula. Supongamos que es 1/10.000
– Bin(n=500.000,p=1/10.000) ≈ Poisson(μ=np=50)
• Sospechamos que diferentes hospitales pueden tener servicios de
traumatología de diferente “calidad” (algunos presentan pocos, pero creemos
que aún demasiados, enfermos con secuelas tras la intervención). Es dificil
compararlos pues cada hospital atiende poblaciones de tamaños diferentes
(ciudades, pueblos,…)
– Tenemos en cada hospital n, nº de pacientes atendidos o nº individuos de
la población que cubre el hospital.
– Tenemos p pequeño calculado como frecuencia relativa de secuelas con
respecto al total de pacientes que trata el hospital, o el tamaño de la
población,…
– Se puede modelar mediante Poisson(μ=np)
15
16. Distribución normal o de Gauss
• Aparece de manera natural:
–
–
–
–
Errores de medida.
Distancia de frenado.
Altura, peso, propensión al crimen…
Distribuciones binomiales con n grande (n>30) y ‘p ni
pequeño’ (np>5) ‘ni grande’ (nq>5).
• Está caracterizada por dos parámetros: La media, μ, y
la desviación típica, σ.
2
1 x
1
• Su función de densidad es:
2
f ( x)
2
e
16
17. N(μ, σ): Interpretación
geométrica
• Pudes interpretar la
media como un factor
de traslación.
• Y la desviación típica
como un factor de
escala, grado de
dispersión,…
17
18. N(μ, σ): Interpretación probabilista
• Entre la media y una
desviación típica
tenemos siempre la
misma probabilidad:
aprox. 68%
• Entre la media y dos
desviaciones típicas
aprox. 95%
18
19. Algunas características
•
La función de densidad es simétrica, mesocúrtica y unimodal.
– Media, mediana y moda coinciden.
•
Los puntos de inflexión de la fun. de densidad están a distancia σ de μ.
•
Si tomamos intervalos centrados en μ, y cuyos extremos están…
– a distancia σ, tenemos probabilidad 68%
– a distancia 2 σ, tenemos probabilidad 95%
– a distancia 2’5 σ tenemos probabilidad 99%
•
No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la función de
densidad, ya que no tiene primitiva expresable en términos de funciones ‘comunes’.
•
Todas las distribuciones normales N(μ, σ), pueden ponerse mediante una traslación μ, y un cambio de
escala σ, como N(0,1). Esta distribución especial se llama normal tipificada.
– Justifica la técnica de tipificación, cuando intentamos
comparar individuos diferentes obtenidos de sendas
poblaciones normales.
19
20. Tipificación
• Dada una variable de media μ y desviación típica σ, se denomina valor
tipificado,z, de una observación x, a la distancia (con signo) con respecto a
la media, medido en desviaciones típicas, es decir
z
x
• En el caso de variable X normal, la interpretación es clara: Asigna a todo
valor de N(μ, σ), un valor de N(0,1) que deja exáctamente la misma
probabilidad por debajo.
• Nos permite así comparar entre dos valores de dos distribuciones
normales diferentes, para saber cuál de los dos es más extremo.
20
21. Tabla N(0,1)
Z es normal tipificada.
Calcular P[Z<1,85]
Solución: 0,968 = 96,8%
21
22. Tabla N(0,1)
Z es normal tipificada.
Calcular P[Z<-0,54]
Solución: 1-0,705 = 0,295
22
23. Tabla N(0,1)
Z es normal tipificada.
Calcular P[-0,54<Z<1,85]
Solución: 0,968-0,295= 0,673
23
24. Ejemplo: Cálculo con probabilidades normales
• El colesterol en la población tiene distribución
normal, con media 200 y desviación 10.
• ¿Qué porcentaje de individuos tiene colesterol
inferior a 210?
• Qué valor del colesterol sólo es superado por el
10% de los individuos.
24
25. • Todas las distribuciones normales son similares salvo
traslación y cambio de escala: Tipifiquemos.
z
x
210 200
1
10
P[Z 1,00] (ver tabla) 0,841
25
26. •
El valor del colesterol que sólo supera el 10% de los individuos es el percentil 90.
Calculemos el percentil 90 de la N(0,1) y deshacemos la tipificación.
z
x
x 200
1,28
10
x 200 10 1,28 212,8
Bioestadística. U. Málaga.
26
27. Ejemplo: Tipificación
• Se quiere dar una beca a uno de dos estudiantes de
sistemas educativos diferentes. Se asignará al que tenga
mejor expediente académico.
– El estudiante A tiene una calificación de 8 en un sistema donde la
calificación de los alumnos se comporta como N(6,1).
– El estudiante B tiene una calificación de 80 en un sistema donde la
calificación de los alumnos se comporta como N(70,10).
• Solución
– No podemos comparar directamente 8 puntos de A frente a los 80
de B, pero como ambas poblaciones se comportan de modo
normal, podemos tipificar y observar las puntuaciones sobre una
distribución de referencia N(0,1)
27
28. zA
xA
A
A
zB
xB
B
B
8 6
1
2
80 70
1
10
Como ZA>ZB, podemos decir que el
porcentaje de compañeros del mismo
sistema de estudios que ha superado en
calificación el estudiante A es mayor que el
que ha superado B.
Podríamos pensar en principio que A es
mejor candidato para la beca.
28
29. Aplic. de la normal: Estimación en muestras
• Cada muestra ofrece un
resultado diferente: La media
muestral es variable aleatoria.
• Su distribución es más parecida
a la normal que la original.
• También está menos dispersa. A
su dispersión (‘desv. típica del
estimador media muestral’…
¿os gusta el nombre largo?) se
le suele denominar error típico.
29
30. Aplicacion de la normal:
Estimación en muestras
• Al aumentar el
tamaño, n, de la
muestra:
– La normalidad de las
estimaciones mejora
– El error típico
disminuye.
30
31. Distribuciones asociadas a la normal
•
Cuando queramos hacer inferencia estadística hemos visto que la distribución normal
aparece de forma casi inevitable.
•
Dependiendo del problema, podemos encontrar otras (asociadas):
– X2 (chi cuadrado)
– t- student
– F-Snedecor
•
Estas distribuciones resultan directamente de operar con distribuciones normales.
Típicamente aparecen como distribuciones de ciertos estadísticos.
•
Veamos algunas propiedades que tienen (superficialmente). Para más detalles consultad el
manual.
•
Sobre todo nos interesa saber qué valores de dichas distribuciones son “atípicos”.
– Significación, p-valores,…
31
32. T de student
• Tiene un parámetro denominado
grados de libertad.
• Cuando aumentan los grados de
libertad, más se acerca a N(0,1).
• Es simétrica con respecto al cero.
• Se consideran valores anómalos los
que se alejan de cero (positivos o
negativos).
32
33. Aplicación
• ¿Sabrías interpretar lo que
falta por sombrear?
Descriptiv os para Número de hijos
Media
Intervalo de
Límite
confianza para la inferior
media al 95%
Límite
superior
Estadístico
1,90
Error típ.
,045
1,81
1,99
• Observa la asimetría. ¿Crees
probable que la asimetría en la
población pueda ser cero ya
que la obtenida en la muestra
es aprox. 1?
Media recortada al 5%
1,75
Mediana
Varianza
Desv. típ.
Mínimo
Máximo
Rango
Amplitud intercuartil
• ¿Puedes dar un intervalo de
confianza para la media al 68%
de confianza?
2,00
3,114
1,765
0
8
8
3,00
Asimetría
Curtosis
1,034
1,060
,063
,126
33
35. FÓRMULA DEL INTERVALO DE CONFIANZA PARA LA MEDIA
Factor relacionado
con la confianza
Estimo
IC 95%
IC95%
Nivel de
confianza
x tn 1
Error Estándar
Parámetro: Media Poblacional
sn 1
x tn 1
n
Límites de confianza
sn 1
n
36. FÓRMULA DEL INTERVALO DE CONFIANZA PARA LA PROPORCIÓN
Parámetro: Prevalencia Poblacional
IC 95%
IC95%
p z
/2
p (1 p)
n
p z
Nivel de confianza
Límites de confianza
Error Estándar
/2
p (1 p)
n
46. Un químico afirma que el rendimiento medio de la
población de cierto proceso en lotes es 500 gramos por
milímetro de materia prima. Para verificar esta afirmación
toma una muestra de 25 lotes cada mes. Si el valor de t
calculado cae entre –t0.05 y t0.05, queda satisfecho con su
afirmación. ¿Qué conclusión extraería de una muestra que
tiene una media de 518 gramos por milímetro y una
desviación estándar de 40 gramos? Suponga que la
distribución de rendimientos es aproximadamente normal.
47. De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el
fabricante queda satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor
t entre –1.711 y 1.711.
48. Composición de un dato de laboratorio
Resultado de la muestra
Variabilidad Pre-analítica
(estimada como irrelevante)
Valor
verdadero
Variabilidad analítica
(imprecisión analítica total)
Bias Analítico
Variabilidad Biológica Intrínseca
(una constante)
VARIABILIDAD TOTAL
Variabilidad Analítica
(imprecisión analítica total)
+ Bias Analítico
= ERROR TOTAL
49. valor verdadero
medida b
medida a
probabilidad
error
aleatorio
error sistemático
80
90
100
110
120
resultado medición
-15
tamaño error sistemático
0
50. Bias: “Modelos de Estimación”
¿De que forma podemos estimar el Bias de
nuestros métodos?
1)- Comparación de Métodos.
2)- Esquemas Interlaboratorio o Peer Group.
3)- Control de Calidad Externo.
- Regresión
- T test
4)- Estudios de Recuperación, verificación de la
veracidad .
5)- Otros.
51. Bias: “Comparación de Métodos”
Interpretación de resultados
X = 100 mg/dl (valor verdadero)
Y = 109,1 mg/dl (valor obtenido)
¿Cuál es el Bias en porcentaje?
Bias = Valor Obtenido – Valor Verdadero x 1oo
Valor Verdadero
Bias = 109,1 – 100 x 1oo
100
Bias = 9,1 %
52. Bias: “Esquemas Interlaboratorio”
Evaluemos Nivel 1:
Supongamos valor verdadero: Media grupo par
Lab: 40,07
Media grupo par: 39,05
Bias: ( 40,07 - 39,05) = 1,02
Bias %: (1,02 / 39,05)*100= 2,61%
53. Desempeño del Método
El TE a debe expresarse en porcentaje.
Si TE a está expresado en concentración, debe transformarse
en porcentaje considerando el nivel de decisión médica
seleccionado:
TE a: 1 mg/dl (Calcio)
Nivel de decisión médica: 11 mg/dl
TE a%: (1/11)*100 = 9,1 %
TE a: 0,5 mEq/l (Potasio)
Nivel de decisión médica: 3,0 mEq/l
TE a%: (0,5/3,0)*100 = 16,7 %
54. Desempeño del Método
Crear el gráfico:
- Rotular el eje Y como Inexactitud permitida ( BIAS %) y establecer
una escala de 0 a TE a%.
- Rotular el eje X como Imprecisión permitida ( CV %) y establecer
una escala de 0 a TE a.0,5 (la mitad)
- Dibujar la línea bias + 2SD uniendo el TE a en el eje Y con el TE
a.0,5 en el eje X.
- Dibujar la línea bias + 3SD uniendo el TE a en el eje Y con el TE
a.0,33 en el eje X.
- Dibujar la línea bias + 4SD uniendo TE a en el eje Y con el TE a.0,25
en el eje X.
- Rotular las zonas ( de derecha a izquierda) como Pobre, Marginal,
Bueno y Excelente.
55.
56. 90% AQA
con N, de 3
(Mira primero)
50% AQA
con N, de 3
(Mira tercero)
90% AQA
con N de 6
(Mira segundo)
50% AQA
con N de 6
(Mira cuarto)
60. 1)- Esquema de reglas seleccionado
2)- Pfr del esquema seleccionado (Probabilidad Falso error)
3)- Ped del esquema seleccionado (Probabilidad de detección de error)
4)- Cantidad de controles por corrida
5)- Cantidad de corridas
6)- Punto Operativo (CV, Bias)
7)- Tea (Error Total aceptado)
8)- Sigma y Error sistemático Crítico
9)- Error total del sistema
65. ERROR CRITICO o ES crit O ES max
Mayor a 4
Excelente desempeño
Entre 3 y 4
Debería mejorar el proceso de
control de calidad Ej. Verificar Nº
de Controles
Entre 2 y 3
Debe mejorar el proceso de
control de calidad ej. Aumentar
el numero de controles
Menor de 2
Requiere mejorar el desempeño
de exactitud y precisión
69. SEIS SIGMA – REGLA DE CONTROL
SIGMA
REGLA DE CONTROL PARA 2 MATERIALES
S>6
1 3,5 S. Método con excelente desempeño
5≤S<6
1 3s. Método con desempeño bueno
4≤S<5
2 2,5s. Método con desempeño marginal.
Debe mejorar precisión.
S<4
13s / 22s /R4s , (Multiregla clásica). Método
con desempeño pobre. Debe mejorar
precisión y exactitud. Se recomienda
maximizar el procedimiento de control de
calidad, mejorando la mantención
preventiva y funciones de verificación del
instrumento. Mejorar la capacitación del
operador.
70. Medición de la Calidad con la Métrica Sigma
Medir Variación
- Es útil para los procesos analíticos
- Evalúo imprecisión.
- Evalúo Bias.
- Considero los Requerimientos de Calidad.
- Estimo el desempeño Sigma.
73. QC1
QC2
QC3
Media: 345 mg/dL
DS: 12 mg/dL
Media: 445 mg/dL
DS: 29 mg/dL
Media: 645 mg/dL
DS: 43 mg/dL
1.- ¿Cuál es la magnitud de imprecisión de los tres niveles?
CV
cv
1
S
x100
x
3,47%
cv
2
6,51%
cv
3
6,66%
74. QC1
QC2
QC3
Media: 345 mg/dL
DS: 12 mg/dL
Media: 445 mg/dL
DS: 29 mg/dL
Media: 645 mg/dL
DS: 43 mg/dL
2.- ¿Cuál es incertidumbre expandida de los tres niveles?
Z
Z
1
Z
1
z
2
qc
1,96 .
12
30
4,29
qc
1,96 .
29
30
10 ,37
1,96 .
43
30
15,38
1
2
.s
n
2
s
Z 2.
n
2
qc
Z
2
1,96
3
75. QC1
QC2
QC3
Media: 345 mg/dL
DS: 12 mg/dL
Media: 445 mg/dL
DS: 29 mg/dL
Media: 645 mg/dL
DS: 43 mg/dL
3.- ¿Cuál de los controles tiene mayor Error aleatorio?
cv
1
3,47%
cv
2
6,51%
cv
3
6,66%
76. El profesional evalúa la calibración del equipo con un MRC valorado en 50,5
mg/dL. Lo evalúa con 20 determinaciones obteniendo una media de 52,2
mg/dL y una Ds 0,9 mg/dL, y considera que debe trabajar con un límite de
confianza de 95%.
%sesgo
vo vv
x100
vv
vv 50,5
% sesgo
vo 52,2
52 ,2 50 ,5
x100
50 ,5
%sesgo
3,36%
77. ¿El equipo se encuentra calibrado?
vv
t
vo
s
n
t
50,5 52,2
0,9
20
NO ESTA CALIBRADO
n 20
0,05
gl
gl
t
8,44
n 1
20 1 19
t
, gl
2,093
-8,44
-2,093
2,093
78. ¿Cuál es la incertidumbre de la medición del equipo?
El profesional evalúa la calibración del equipo con un MRC valorado en 50,5
mg/dL. Lo evalúa con 20 determinaciones obteniendo una media de 52,2
mg/dL y una Ds 0,9 mg/dL, y considera que debe trabajar con un límite de
confianza de 95%.
t
t
1
t
1
2
, gl
2
0,9
2,093 .
20
Inc
2
.s
t
n
2, gl
s
t 2, gl .
n
2,093
Inc 0,094
cc
52,1;52,3
79. ¿Cuál es el error típico de la medición del QC1?
EE
s
n
EE
media
12
30
2,19
342 ,81;347 ,19
QC1
QC2
QC3
Media: 345 mg/dL
DS: 12 mg/dL
Media: 445 mg/dL
DS: 29 mg/dL
Media: 645 mg/dL
DS: 43 mg/dL
80. 7.- ¿Cual es el error típico de verificación de la calibración?
EE
s
n
0,9
20
EE
media
cal
0,2
52,0;52,4
81. 8.- Si el TEa del ensayo es un 10% ¿Esta en un buen desempeño?
TE
%sesgo 1,65xCV
%sesgo
3,36%
TE cv
3,36 1,65x3,47 9,08%
TE cv
3,36 1,65x6,51 14,1%
TE cv
3,36 1,65x6,66 14,3%
1
2
3
cv
1
3,47%
cv
2
6,51%
cv
3
6,66%
82. 9.- ¿Cuál es la magnitud del error sistemático (ES)?
%sesgo %BIAS ES
%sesgo
vo vv
x100
vv
vv 50,5
% sesgo
52 ,2 50 ,5
x100
50 ,5
vo 52,2
% sesgo
50 ,5 52 ,2
x100
50 ,5
%sesgo
3,36%
83. 10.- Considerando los valores obtenidos y con TEa de 10% ¿Cual es el error aleatorio maximo
que debo esperar en cada QC?
%sesgo
TE
a
CV
CV
3,36%
%sesgo 1,65xCV
TE
%sesgo
a
1,65
10 %
3,36 %
1,65
4,02 %
84. 11.- ¿Cuál es el cinturón de confianza de la medición del equipo?
t
t
1
t
1
2
, gl
2
0,9
2,093 .
20
Inc
2
.s
t
n
2, gl
s
t 2, gl .
n
2,093
Inc 0,094
cc
52,1;52,3
85. 14.- ¿Cuáles de los tres QC tiene mejor desempeño?
cv
1
3,47%
cv
2
6,51%
cv
3
6,66%