1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo
1. Estudio de un modelo de regresión lineal simple
Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio
Forzado en un segundo
Jesús Armand Calejero Román
Jesús Domingo Barrero
2. Modelos lineales: Regresión lineal simple
Introducción.
El siguiente estudio tiene como finalidad estudia la relación entre la
capacidad vital forzada y el volumen espiratorio forzado en un segundo.
• Volumen Espiratorio Forzado (VE1): es la cantidad de aire
expulsado durante el primer segundo de la espiración máxima,
realizada tras una inspiración máxima.
• Capacidad Vital Forzada (FVC): similar a la capacidad vital (VC),
pero la maniobra es forzada y con la máxima rapidez que el paciente
pueda producir. Se emplea esta capacidad debido a que en ciertas
patologías, es posible que la capacidad de aire forzada de los
pulmones puede ser menor a la capacidad vital durante una
exhalación más lenta.
El siguiente estudio tiene la finalidad de comprobar si existe algún tipo de
relación entre estas dos medidas a fin de poder crear un modelo.
2
3. Modelos lineales: Regresión lineal simple
Estudio
En primer lugar vamos a ver el comportamiento de los datos usando el diagrama
de puntos:
Se observa relación entre las dos variables de tipo lineal de forma clara.
3
4. Modelos lineales: Regresión lineal simple
Continuamos con el estudio de regresión. El coeficiente de correlación de
Pearson próximo a 1 nos ofrece una alta relación (positiva) entre las variables. El valor
de la R^2 nos informa de la proporción de la varianza de Y que viene explicada por la
varianza de X. Obtenemos una VNE por el modelo de 9.193, un R^2 igual a 0.866 con
el que podemos explicar en un 86.6% la variabilidad del FVC con nuestro modelo.
Con esta F y su p-valor podemos rechazar la hipótesis nula que dice que el
coeficiente B1= 0.
El valor de B1 es 1,139, además al tener un p-valor < 0.05 rechazamos Ho (B0 =
0). Por el contrario observamos que el término independiente tiene un p-valor superior a
0.05 con lo que podríamos aceptar la hipótesis de que Bo= 0. En este caso podríamos
más adelante analizar como se comportaría el modelo y=b1x prescindiendo del término
independiente.
4
5. Modelos lineales: Regresión lineal simple
Diagnosis del modelo.
Estudio de la homocedasticidad con el siguiente gráfico.
Se puede observar cierta forma cuadrática en el modelo. Más adelante
procederemos al estudio de este posible aspecto en nuestros datos.
5
6. Modelos lineales: Regresión lineal simple
En lo referente a la normalidad, el gráfico muestra que sí hay algún valor que
están comprendido entre -2 y 2.
6
7. Modelos lineales: Regresión lineal simple
Nos queda estudiar los valores atípicos e influyentes. En el gráfico de dispersión
no había ningún dato que destacara. Realizamos un estudio de la Distancia de Cook,
obteniendo los siguientes resultados:
Observamos que hay algún valor con un Residuo eliminado estudentizado
elevado. Se podría estudiar el modelo sin dicho valor.
No hay ningún valor próximo a 1 lo que implica que no hay valores atípicos.
Realizamos un estudio P-P de los residuos para asegurarnos. El gráfico no
muestra ningún valor que se salga de la normalidad.
7
9. Modelos lineales: Regresión lineal simple
Estudio de un modelo cuadrático.
Para ello vamos a crear la variable Z que será el resultado de elevar al cuadrado
FEV_1. Con ello obtendremos una parte cuadrática que añadir al modelo.
9
10. Modelos lineales: Regresión lineal simple
Veamos el resumen del análisis de la regresión.
Vamos a intentar modelizar un modelo de la forma:
FVC= Bo + B1FEV_1 + B2Z
En este modelo se obtiene un R^2 = 0.875 y un R^2 corregido = 0.871. Estos
datos son mejores que los obtenidos en el modelo lineal. Con este modelo podemos
explicar en un 87.5% la variabilidad del FVC. También observamos una VNE=8.569
(también menor que en el modelo anterior).
Veamos los coeficientes.
Obtenemos un p-valor = 0.471 >0.05 en B1 con lo que se acepta la hipótesis de
que B1=0. Este valor nos reforzaría la teoría de que estamos frente a un modelo
cuadrático.
10
11. Modelos lineales: Regresión lineal simple
Diagnosis del modelo.
Estudio de la homocedasticidad con el siguiente gráfico.
Ya no es tan clara la forma cuadrática, por lo demás se comporta bien. Es
posible que exista un valor un poco anómalo (el alejado por la parte derecha).
11
12. Modelos lineales: Regresión lineal simple
En el histograma podemos ver que por la cola derecha algunos valores se
escapan del 2.
12
13. Modelos lineales: Regresión lineal simple
Valores atípicos e influyentes + Distancia de Cook.
Parece que los mínimos mejoran muy poco frente al modelo anterior y los
máximos empeoran sensiblemente. Podría ser provocado por ese valor que se ve en el
diagrama de puntos un poco alejado.
En el gráfico de puntos para la distancia de Cook sí observamos un valor que,
aunque no es superior a 1 sí está alejado del resto de valores.
13
14. Modelos lineales: Regresión lineal simple
Estudio del modelo cuadrático corregido.
Como en el estudio anterior se podía aceptar la hipótesis de que B1=0 vamos a
proceder al estudio del siguiente modelo.
FVC = Bo + B1FVE_1
Resumen del modelo.
Con este modelo podemos explicar el 87,4% del a variabilidad del FVC frente al
87,5% del caso anterior. En los dos sí se observa una mejoría frente al modelo lineal
“puro”. El R^2 corregido es algo superior al anterior.
14
15. Modelos lineales: Regresión lineal simple
Se acepta la hipótesis de que todos los Bi <> 0 con i>0.
Se tiene una VNE = 8.655, mejor que en los casos anteriores.
Si observamos el p-valor de los dos coeficientes se puede rechazar la hipótesis Bo=0,
B1=0.
15
16. Modelos lineales: Regresión lineal simple
Diagnosis del modelo.
Homocedasticidad.
El gráfico es mejor que en el caso lineal y similar al caso anterior.
16
18. Modelos lineales: Regresión lineal simple
Valores atípicos e influyentes + Distancia de Cook.
Los residuos no son muy mejores que en el caso anterior. Por ahora los valores
de residuos más convincentes son los del modelo lineal.
En la distancia de Cook es muy buena pero se observa un valor un tanto alejado
del resto de valores.
18