Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Estudio de un modelo de regresión lineal simple

Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio
Forzado en un segundo

Jesús Armand Calejero Román
Jesús Domingo Barrero

Modelos lineales: Regresión lineal simple

Introducción.

El siguiente estudio tiene como finalidad estudia la relación entre la
capacidad vital forzada y el volumen espiratorio forzado en un segundo.

• Volumen Espiratorio Forzado (VE1): es la cantidad de aire
expulsado durante el primer segundo de la espiración máxima,
realizada tras una inspiración máxima.

• Capacidad Vital Forzada (FVC): similar a la capacidad vital (VC),
pero la maniobra es forzada y con la máxima rapidez que el paciente
pueda producir. Se emplea esta capacidad debido a que en ciertas
patologías, es posible que la capacidad de aire forzada de los
pulmones puede ser menor a la capacidad vital durante una
exhalación más lenta.

El siguiente estudio tiene la finalidad de comprobar si existe algún tipo de
relación entre estas dos medidas a fin de poder crear un modelo.

2


Estudio

En primer lugar vamos a ver el comportamiento de los datos usando el diagrama
de puntos:

Se observa relación entre las dos variables de tipo lineal de forma clara.

3


Continuamos con el estudio de regresión. El coeficiente de correlación de
Pearson próximo a 1 nos ofrece una alta relación (positiva) entre las variables. El valor
de la R^2 nos informa de la proporción de la varianza de Y que viene explicada por la
varianza de X. Obtenemos una VNE por el modelo de 9.193, un R^2 igual a 0.866 con
el que podemos explicar en un 86.6% la variabilidad del FVC con nuestro modelo.

Con esta F y su p-valor podemos rechazar la hipótesis nula que dice que el
coeficiente B1= 0.

El valor de B1 es 1,139, además al tener un p-valor < 0.05 rechazamos Ho (B0 =
0). Por el contrario observamos que el término independiente tiene un p-valor superior a
0.05 con lo que podríamos aceptar la hipótesis de que Bo= 0. En este caso podríamos
más adelante analizar como se comportaría el modelo y=b1x prescindiendo del término
independiente.

4


Diagnosis del modelo.

Estudio de la homocedasticidad con el siguiente gráfico.

Se puede observar cierta forma cuadrática en el modelo. Más adelante
procederemos al estudio de este posible aspecto en nuestros datos.

5


En lo referente a la normalidad, el gráfico muestra que sí hay algún valor que
están comprendido entre -2 y 2.

6


Nos queda estudiar los valores atípicos e influyentes. En el gráfico de dispersión
no había ningún dato que destacara. Realizamos un estudio de la Distancia de Cook,
obteniendo los siguientes resultados:

Observamos que hay algún valor con un Residuo eliminado estudentizado
elevado. Se podría estudiar el modelo sin dicho valor.

No hay ningún valor próximo a 1 lo que implica que no hay valores atípicos.

Realizamos un estudio P-P de los residuos para asegurarnos. El gráfico no
muestra ningún valor que se salga de la normalidad.

7


8


Estudio de un modelo cuadrático.

Para ello vamos a crear la variable Z que será el resultado de elevar al cuadrado
FEV_1. Con ello obtendremos una parte cuadrática que añadir al modelo.

9


Veamos el resumen del análisis de la regresión.

Vamos a intentar modelizar un modelo de la forma:

FVC= Bo + B1FEV_1 + B2Z

En este modelo se obtiene un R^2 = 0.875 y un R^2 corregido = 0.871. Estos
datos son mejores que los obtenidos en el modelo lineal. Con este modelo podemos
explicar en un 87.5% la variabilidad del FVC. También observamos una VNE=8.569
(también menor que en el modelo anterior).

Veamos los coeficientes.

Obtenemos un p-valor = 0.471 >0.05 en B1 con lo que se acepta la hipótesis de
que B1=0. Este valor nos reforzaría la teoría de que estamos frente a un modelo
cuadrático.

10



Estudio de la homocedasticidad con el siguiente gráfico.

Ya no es tan clara la forma cuadrática, por lo demás se comporta bien. Es
posible que exista un valor un poco anómalo (el alejado por la parte derecha).

11


En el histograma podemos ver que por la cola derecha algunos valores se
escapan del 2.

12


Valores atípicos e influyentes + Distancia de Cook.

Parece que los mínimos mejoran muy poco frente al modelo anterior y los
máximos empeoran sensiblemente. Podría ser provocado por ese valor que se ve en el
diagrama de puntos un poco alejado.

En el gráfico de puntos para la distancia de Cook sí observamos un valor que,
aunque no es superior a 1 sí está alejado del resto de valores.

13


Estudio del modelo cuadrático corregido.

Como en el estudio anterior se podía aceptar la hipótesis de que B1=0 vamos a
proceder al estudio del siguiente modelo.

FVC = Bo + B1FVE_1

Resumen del modelo.

Con este modelo podemos explicar el 87,4% del a variabilidad del FVC frente al
87,5% del caso anterior. En los dos sí se observa una mejoría frente al modelo lineal
“puro”. El R^2 corregido es algo superior al anterior.

14


Se acepta la hipótesis de que todos los Bi <> 0 con i>0.
Se tiene una VNE = 8.655, mejor que en los casos anteriores.

Si observamos el p-valor de los dos coeficientes se puede rechazar la hipótesis Bo=0,
B1=0.

15



Homocedasticidad.

El gráfico es mejor que en el caso lineal y similar al caso anterior.

16


La cola derecha sigue siento un tanto peculiar.

17


Valores atípicos e influyentes + Distancia de Cook.

Los residuos no son muy mejores que en el caso anterior. Por ahora los valores
de residuos más convincentes son los del modelo lineal.

En la distancia de Cook es muy buena pero se observa un valor un tanto alejado
del resto de valores.

18

Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Recommended

Recommended

More Related Content

What's hot

What's hot (18)

Similar to Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Similar to Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo (20)

Recently uploaded

Recently uploaded (20)

Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo