SlideShare a Scribd company logo
Universidad Central de Venezuela
Facultad de Ciencias Económicas y Sociales
Comisión de Estudios para Graduados
Área de Postgrado en Estadística y Actuariado
Programa Integrado de Postgrado en Estadística y Actuariado
DISEÑO ESTADÍSTICO DE INVESTIGACIONES
2024
Inferencia Basada en Modelos
Caso 1. Medicamentos para reducir el dolor de cabeza
Supongamos que usted dispone de 20 voluntarios para experimentar con dos
medicamentos para reducir el dolor de cabeza. En este caso, una de las mayores
dificultades consiste en medir el tiempo hasta el alivio, porque lo que constituye un
alivio del dolor para una persona presumiblemente no lo será para otra. Además,
las personas sentirán la necesidad de tomar remedios para el dolor de cabeza en
diferentes momentos de dolor. Tras estudiar el asunto y revisar la bibliografía sobre
experimentos similares, usted decide proceder de la siguiente manera. Cuando uno
de sus voluntarios experimente un dolor de cabeza, tomará el remedio prescrito
cuando el dolor sea intenso y el tiempo necesario para que se sienta cómodo. Una
vez realizado el experimento se obtuvieron los siguientes resultados:
Tiempo de alivio en minutos del dolor de cabeza por la aplicación de dos fármacos
A y B
Para comenzar a realizar el análisis de datos, comenzaremos por realizar la
exploración de los datos presentados.
1.1.Estructura de los datos
En primer lugar, adaptamos la información para poder trabajarla bajo el paquete
RStudio, estableciendo la siguiente estructura:
tibble [20 × 2] (S3: tbl_df/tbl/data.frame)
$ FARMACO: chr [1:20] "A" "A" "A" "A" ...
$ MINUTOS: num [1:20] 25 16 20 30 46 22 83 26 34 26 ...
Donde:
FARMACO: Vector que contiene la identificación del tratamiento aplicado a cada
individuo, tomando los valores A o B.
MINUTOS: Vector que contiene el tiempo necesario para que el individuo, luego de
tomar el medicamento se sienta cómodo.
A B
25 32
16 44
20 46
30 28
46 36
22 48
83 53
26 76
34 58
26 42
1.2 Estadísticas descriptivas
Procedemos a visualizar las estadísticas descriptivas, de la base de datos en
general, obteniendo el siguiente resultado:
FARMACO MINUTOS
Length:20 Min. :16.00
Class :character 1st Qu.:26.00
Mode :character Median :35.00
Mean :39.55
3rd Qu.:46.50
Max. :83.00
Aquí podemos apreciar los valores mínimos, máximo, media y mediana, así como
sus correspondientes cuartiles, es importante resaltar que el valor máximo, se
encuentra muy por encima del tercer quartil.
Para una mejor visualización de los datos, se realizo las estadísticas descriptivas
para cada tratamiento de manera que se establezca una comparación entre los
grupos.
Descriptive statistics by group
group: A
vars n mean sd median trimmed mad min max range skew kurtosis se
X1 1 10 32.8 19.49 26 28.62 7.41 16 83 67 1.61 1.51 6.16
----------------------------------------------------------------------
group: B
vars n mean sd median trimmed mad min max range skew kurtosis se
X1 1 10 46.3 13.89 45 44.88 12.6 28 76 48 0.67 -0.41 4.39
Se aprecia que la media de los individuos del tratamiento A se ubica en 32,8
minutos, mientras que en los individuos del tratamiento B se ubica en 46,3 minutos.
Media Tratamiento B – Media Tratamiento A = 46,3 – 32,8 = 13,5 minutos
Si realizamos el mismo análisis en relación a la mediana, obtenemos:
Mediana Tratamiento B – Mediana Tratamiento A = 45 – 26 = 19 minutos
Se aprecia en ambos casos, diferencias entre los grupos en relación a la media y la
varianza, más adelante detectaremos si esta diferencia es significativa. Ahora,
veremos el intervalo de confianza de la media de cada tratamiento
1.3 Intervalo de Confianza
Tratamiento A
95 percent confidence interval:
18.85594 46.74406
sample estimates:
mean of x
32.8
Entonces el intervalo de confianza del 95% de la media de los individuos a los que
se les aplico el tratamiento A, es: (18.85594, 46.74406), es decir, con un 95% de
confianza el tiempo promedio del tratamiento A esta en el intervalo 18.85594 y
46.74406
Tratamiento B
95 percent confidence interval:
36.36452 56.23548
sample estimates:
mean of x
46.3
Para el caso del Tratamiento B el intervalo de confianza del 95% de la media de los
individuos a los que se les aplico este tratamiento, es: (36.36452, 56.23548), es
decir, con un 95% de confianza el tiempo promedio del tratamiento B está en el
intervalo 36.36452 y 56.23548
1.4 Valores Perdidos
Estudiamos la existencia de valores perdidos en la data, encontrando lo siguiente:
FARMACO MINUTOS
[1,] FALSE FALSE
[2,] FALSE FALSE
[3,] FALSE FALSE
[4,] FALSE FALSE
[5,] FALSE FALSE
[6,] FALSE FALSE
[7,] FALSE FALSE
[8,] FALSE FALSE
[9,] FALSE FALSE
[10,] FALSE FALSE
[11,] FALSE FALSE
[12,] FALSE FALSE
[13,] FALSE FALSE
[14,] FALSE FALSE
[15,] FALSE FALSE
[16,] FALSE FALSE
[17,] FALSE FALSE
[18,] FALSE FALSE
[19,] FALSE FALSE
[20,] FALSE FALSE
>
> sum(is.na(farmacos))
[1] 0
Apreciamos que no existen valores perdidos en la base de datos
1.5 Grafico de Caja
Como vemos, en el gráfico de caja anterior, se muestra que ambos grupos tienen
comportamientos distintos en relación a la media, lo cual se validara con el
correspondiente análisis de la ANOVA.
Adicionalmente apreciamos que existe para cada grupo un valor atípico, que se
encuentra por encima de los limites de la caja, para verificar haremos cuales son
dichos valores:
> outliers_farmacos
[1] 83 76
Es decir, que los valores atípicos corresponden a los tiempos: 83 minutos y 76
minutos.
1.6 ANOVA
Para realizar el análisis del ANOVA, validaremos en primera instancia el supuesto
de normalidad y esto lo haremos, de manera gráfica:
Tratamiento A
Tratamiento B
Se puede apreciar el supuesto de normalidad, al igual que se visualizan los valores
atípicos en cada caso.
Ahora bien, realizaremos el ANOVA, para ello definimos que nuestra Hipótesis Nula
se expresa como:
Ho: Igualdad de medias en ambos tratamientos
H1: Diferencia de medias en los tratamientos
Df Sum Sq Mean Sq F value Pr(>F)
farmacos$FARMACO 1 911 911.2 3.181 0.0913 .
Residuals 18 5156 286.4
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Se puede apreciar que el p-valor es 0,0913, lo que implica que es mayor a 0,05, por
lo que no existe suficiente evidencia para rechazar la hipótesis nula, sin embargo,
es posible que los valores atípicos estén ejerciendo influencia en los valores de la
media, por lo que es necesario realizar su sustitución por el promedio, para realizar
nuevamente el análisis ANOVA.
Realizando la sustitución de los valores atípicos, obtenemos los siguientes
resultados:
Descriptive statistics by group
group: A
vars n mean sd median trimmed mad min max range skew kurtosis se
X1 1 10 27.8 8.5 26 27 7.41 16 46 30 0.66 -0.38 2.69
----------------------------------------------------------------------
group: B
vars n mean sd median trimmed mad min max range skew kurtosis se
X1 1 10 43.3 9.21 45 43.38 8.15 28 58 30 -0.15 -1.2 2.91
Ahora el ANOVA queda de la siguiente manera:
Df Sum Sq Mean Sq F value Pr(>F)
farmacos2$FARMACO 1 1201 1201.2 15.29 0.00102 **
Residuals 18 1414 78.5
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Como se puede apreciar, el p-valor ahora se ubica en 0,00102 lo que implica que el
p-valor es menor a 0,05, por lo tanto se rechaza la hipótesis nula de igualdad de
medias.
Caso 2. Pacientes con quemaduras
Wakeman y Kaplan proporcionan los datos de un experimento sorprendente.
Pacientes con quemaduras se asignaron a dos grupos de tratamiento: sólo
medicación y medicación bajo hipnosis. Se registró el porcentaje de medicación
permitida a cada paciente. Para cuatro de los pacientes que recibieron hipnosis el
porcentaje fue de 40%. El porcentaje para cinco pacientes que sólo recibieron la
medicación fue del 80%. Aunque los autores no proporcionaron los datos básicos
en su artículo, sólo sus promedios, supusimos que los porcentajes de medicación
requeridos por los nueve pacientes fue como se presenta a continuación:
Solo medicación Hipnósis/medicación
85 26
92 46
76 37
81 51
66
Para realizar el análisis de este ejercicio, usaremos el mismo procedimiento que en
el caso anterior:
2.1Estructura de los datos
tibble [9 × 2] (S3: tbl_df/tbl/data.frame)
$ TRATAMIENTO: chr [1:9] "M" "M" "M" "M" ...
$ PORCENTAJE : num [1:9] 85 92 76 81 66 26 46 37 51
Donde:
TRATAMIENTO: Vector que contiene la identificación del tratamiento aplicado a
cada individuo, tomando los valores M Y HM
PORCENTAJE: Vector que contiene los porcentajes de medicación requeridos por
los pacientes.
2.2 Estadísticas descriptivas
TRATAMIENTO PORCENTAJE
Length:9 Min. :26.00
Class :character 1st Qu.:46.00
Mode :character Median :66.00
Mean :62.22
3rd Qu.:81.00
Max. :92.00
Comparación entre los grupos:
Descriptive statistics by group
group: HM
vars n mean sd median trimmed mad min max range skew kurtosis se
X1 1 4 40 10.98 41.5 40 10.38 26 51 25 -0.23 -2.07 5.49
----------------------------------------------------------------------
group: M
vars n mean sd median trimmed mad min max range skew kurtosis se
X1 1 5 80 9.77 81 80 7.41 66 92 26 -0.2 -1.68 4.37
2.3 Intervalo de Confianza
Tratamiento M
95 percent confidence interval:
67.86595 92.13405
sample estimates:
mean of x
80
El intervalo de confianza del 95% de la media de los individuos a los que se les
aplico el tratamiento M, es: (67.86595, 92.13405).
Tratamiento HM
95 percent confidence interval:
22.52067 57.47933
sample estimates:
mean of x
40
El intervalo de confianza del 95% de la media de los individuos a los que se les
aplico el tratamiento HM, es: (22.52067, 57.47933).
2.4 Valores Perdidos
Estudiamos la existencia de valores perdidos en la data, encontrando lo siguiente:
TRATAMIENTO PORCENTAJE
[1,] FALSE FALSE
[2,] FALSE FALSE
[3,] FALSE FALSE
[4,] FALSE FALSE
[5,] FALSE FALSE
[6,] FALSE FALSE
[7,] FALSE FALSE
[8,] FALSE FALSE
[9,] FALSE FALSE
>
> sum(is.na(quem))
[1] 0
2.5 Grafico de Caja
Como vemos, en el gráfico de caja anterior, se muestra que ambos grupos tienen
comportamientos distintos en relación a la media, lo cual se validara con el
correspondiente análisis de la ANOVA.
2.6 ANOVA
Validaremos el supuesto de normalidad y esto lo haremos, de manera gráfica:
Tratamiento M
Tratamiento HM
Ahora bien, realizaremos el ANOVA, para ello definimos que nuestra Hipótesis Nula
se expresa como:
Ho: Igualdad de medias en ambos tratamientos
H1: Diferencia de medias en los tratamientos
Df Sum Sq Mean Sq F value Pr(>F)
quem$TRATAMIENTO 1 3556 3556 33.45 0.000675 ***
Residuals 7 744 106
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Como se puede apreciar, el p-valor se ubica en 0,000675 lo que implica que el p-
valor es menor a 0,05, por lo tanto, no existe evidencia para aceptar la hipótesis
nula de igualdad de medias.
Es importante acotar que los tamaños de los grupos desiguales afectan el poder
estadístico y las tasas de error de tipo I, por lo que los grupos de igual tamaño
maximizan el poder estadístico.
Referencias Bibliográficas
Montgomery, D. (2001). Desing and Analysis of Experiments. Fifth Edition. Jhon
Wiley and Sons. New York. USA.

More Related Content

Similar to analisis aleatorizacion de los experimentos

Trabajo de estadística
Trabajo de  estadísticaTrabajo de  estadística
Trabajo de estadística
Feer ChaVez Reiies
 
Trabajo de estadística
Trabajo de  estadísticaTrabajo de  estadística
Trabajo de estadística
Feer ChaVez Reiies
 
ANOVA.pdf
ANOVA.pdfANOVA.pdf
Estadistica
Estadistica Estadistica
Estadistica
Elena Vargas
 
Bioest_1 conferencia.pptASCDSVFVFDBDFBFDFDVFDSVDFSV
Bioest_1 conferencia.pptASCDSVFVFDBDFBFDFDVFDSVDFSVBioest_1 conferencia.pptASCDSVFVFDBDFBFDFDVFDSVDFSV
Bioest_1 conferencia.pptASCDSVFVFDBDFBFDFDVFDSVDFSV
GerardoCordova18
 
LABORATORIOS FISICA MECÁNICA.docx
LABORATORIOS FISICA MECÁNICA.docxLABORATORIOS FISICA MECÁNICA.docx
LABORATORIOS FISICA MECÁNICA.docx
yanky16
 
Trabajo de estadística de alma
Trabajo de estadística  de almaTrabajo de estadística  de alma
Trabajo de estadística de alma
Gabriel Cázares
 
Separata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersionSeparata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersion
Luis Alberto Fernandez
 
Separata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersionSeparata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersion
Luis Alberto Fernandez
 
Medidas de tendencia central 1
Medidas de tendencia central 1Medidas de tendencia central 1
Medidas de tendencia central 1
Univ Peruana Los Andes
 
SEMANA 6 MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA  6 MEDIDAS DE TENDENCIA CENTRAL.pdfSEMANA  6 MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA 6 MEDIDAS DE TENDENCIA CENTRAL.pdf
fredyflores58
 
3 Datos agrupados teoria IESPPHz.pptx
3 Datos agrupados teoria IESPPHz.pptx3 Datos agrupados teoria IESPPHz.pptx
3 Datos agrupados teoria IESPPHz.pptx
EvelynRupayHidalgo
 
Distribución de tablas en bioestadística
Distribución de tablas en bioestadísticaDistribución de tablas en bioestadística
Distribución de tablas en bioestadística
diegofamateo123
 
05.promedios
05.promedios05.promedios
05.promedios
Adrian Levano Mesias
 
Estadistica 1
Estadistica 1Estadistica 1
Estadistica 1
OrlandoGuillenM
 
Chi Cuadrado
Chi CuadradoChi Cuadrado
Análisis de supervivencia.docx
Análisis de supervivencia.docxAnálisis de supervivencia.docx
Análisis de supervivencia.docx
hugochunga
 
Gamma
GammaGamma
Medidas de tendencia central y dispersión.pptx
Medidas de tendencia central y dispersión.pptxMedidas de tendencia central y dispersión.pptx
Medidas de tendencia central y dispersión.pptx
corredoryopasaangela
 
Resumen evaluacion grade de un eca, ej pr oactive
Resumen evaluacion grade de un eca, ej  pr oactiveResumen evaluacion grade de un eca, ej  pr oactive
Resumen evaluacion grade de un eca, ej pr oactive
galoagustinsanchez
 

Similar to analisis aleatorizacion de los experimentos (20)

Trabajo de estadística
Trabajo de  estadísticaTrabajo de  estadística
Trabajo de estadística
 
Trabajo de estadística
Trabajo de  estadísticaTrabajo de  estadística
Trabajo de estadística
 
ANOVA.pdf
ANOVA.pdfANOVA.pdf
ANOVA.pdf
 
Estadistica
Estadistica Estadistica
Estadistica
 
Bioest_1 conferencia.pptASCDSVFVFDBDFBFDFDVFDSVDFSV
Bioest_1 conferencia.pptASCDSVFVFDBDFBFDFDVFDSVDFSVBioest_1 conferencia.pptASCDSVFVFDBDFBFDFDVFDSVDFSV
Bioest_1 conferencia.pptASCDSVFVFDBDFBFDFDVFDSVDFSV
 
LABORATORIOS FISICA MECÁNICA.docx
LABORATORIOS FISICA MECÁNICA.docxLABORATORIOS FISICA MECÁNICA.docx
LABORATORIOS FISICA MECÁNICA.docx
 
Trabajo de estadística de alma
Trabajo de estadística  de almaTrabajo de estadística  de alma
Trabajo de estadística de alma
 
Separata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersionSeparata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersion
 
Separata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersionSeparata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersion
 
Medidas de tendencia central 1
Medidas de tendencia central 1Medidas de tendencia central 1
Medidas de tendencia central 1
 
SEMANA 6 MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA  6 MEDIDAS DE TENDENCIA CENTRAL.pdfSEMANA  6 MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA 6 MEDIDAS DE TENDENCIA CENTRAL.pdf
 
3 Datos agrupados teoria IESPPHz.pptx
3 Datos agrupados teoria IESPPHz.pptx3 Datos agrupados teoria IESPPHz.pptx
3 Datos agrupados teoria IESPPHz.pptx
 
Distribución de tablas en bioestadística
Distribución de tablas en bioestadísticaDistribución de tablas en bioestadística
Distribución de tablas en bioestadística
 
05.promedios
05.promedios05.promedios
05.promedios
 
Estadistica 1
Estadistica 1Estadistica 1
Estadistica 1
 
Chi Cuadrado
Chi CuadradoChi Cuadrado
Chi Cuadrado
 
Análisis de supervivencia.docx
Análisis de supervivencia.docxAnálisis de supervivencia.docx
Análisis de supervivencia.docx
 
Gamma
GammaGamma
Gamma
 
Medidas de tendencia central y dispersión.pptx
Medidas de tendencia central y dispersión.pptxMedidas de tendencia central y dispersión.pptx
Medidas de tendencia central y dispersión.pptx
 
Resumen evaluacion grade de un eca, ej pr oactive
Resumen evaluacion grade de un eca, ej  pr oactiveResumen evaluacion grade de un eca, ej  pr oactive
Resumen evaluacion grade de un eca, ej pr oactive
 

Recently uploaded

MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
GustavoTello19
 
Informe fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docxInforme fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docx
mirimerlos5
 
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdfREPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
IrapuatoCmovamos
 
Libro - Teoria Historia de la Arquitectura
Libro - Teoria Historia de la ArquitecturaLibro - Teoria Historia de la Arquitectura
Libro - Teoria Historia de la Arquitectura
baceg35604
 
Presentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptxPresentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptx
eleandroth
 
William James funcionalismo datos relevantes.pdf
William James funcionalismo datos relevantes.pdfWilliam James funcionalismo datos relevantes.pdf
William James funcionalismo datos relevantes.pdf
IvanNievesEspinoza
 
Reporte_de_Accidentes_y_Criterio_de_clasificacion_1 (1).pptx
Reporte_de_Accidentes_y_Criterio_de_clasificacion_1 (1).pptxReporte_de_Accidentes_y_Criterio_de_clasificacion_1 (1).pptx
Reporte_de_Accidentes_y_Criterio_de_clasificacion_1 (1).pptx
ZuppaSRL
 
INTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdfINTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdf
YulEz1
 
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptxUGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
Mayra798665
 
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
darkskills2011
 
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllllANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
eliassalascolonia43
 
Informe 13 _ _Software OnLine_ Ofimática, edición y descargas entre otros_.docx
Informe 13 _ _Software OnLine_ Ofimática, edición y descargas entre otros_.docxInforme 13 _ _Software OnLine_ Ofimática, edición y descargas entre otros_.docx
Informe 13 _ _Software OnLine_ Ofimática, edición y descargas entre otros_.docx
francescasansonikoga
 
Plan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdfPlan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdf
agustincarranza11
 
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
hugowagner811
 
AVANCE TECNOLOGICO AREAS DE IMPACTO DEL AVANCE TECNOLOGICO
AVANCE TECNOLOGICO AREAS DE IMPACTO DEL AVANCE TECNOLOGICOAVANCE TECNOLOGICO AREAS DE IMPACTO DEL AVANCE TECNOLOGICO
AVANCE TECNOLOGICO AREAS DE IMPACTO DEL AVANCE TECNOLOGICO
ronaldomarca1999
 
resumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TIresumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TI
riveroarlett5b
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
DilmerCarranza
 

Recently uploaded (17)

MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
 
Informe fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docxInforme fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docx
 
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdfREPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
 
Libro - Teoria Historia de la Arquitectura
Libro - Teoria Historia de la ArquitecturaLibro - Teoria Historia de la Arquitectura
Libro - Teoria Historia de la Arquitectura
 
Presentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptxPresentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptx
 
William James funcionalismo datos relevantes.pdf
William James funcionalismo datos relevantes.pdfWilliam James funcionalismo datos relevantes.pdf
William James funcionalismo datos relevantes.pdf
 
Reporte_de_Accidentes_y_Criterio_de_clasificacion_1 (1).pptx
Reporte_de_Accidentes_y_Criterio_de_clasificacion_1 (1).pptxReporte_de_Accidentes_y_Criterio_de_clasificacion_1 (1).pptx
Reporte_de_Accidentes_y_Criterio_de_clasificacion_1 (1).pptx
 
INTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdfINTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdf
 
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptxUGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
 
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
MONOGRAFIA DEL BUSCADOR YAHOO! APSTI1"A"
 
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllllANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
 
Informe 13 _ _Software OnLine_ Ofimática, edición y descargas entre otros_.docx
Informe 13 _ _Software OnLine_ Ofimática, edición y descargas entre otros_.docxInforme 13 _ _Software OnLine_ Ofimática, edición y descargas entre otros_.docx
Informe 13 _ _Software OnLine_ Ofimática, edición y descargas entre otros_.docx
 
Plan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdfPlan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdf
 
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
PROCESAMIENTO DIGITAL DE IMAGENES PDS 2020
 
AVANCE TECNOLOGICO AREAS DE IMPACTO DEL AVANCE TECNOLOGICO
AVANCE TECNOLOGICO AREAS DE IMPACTO DEL AVANCE TECNOLOGICOAVANCE TECNOLOGICO AREAS DE IMPACTO DEL AVANCE TECNOLOGICO
AVANCE TECNOLOGICO AREAS DE IMPACTO DEL AVANCE TECNOLOGICO
 
resumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TIresumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TI
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
 

analisis aleatorizacion de los experimentos

  • 1. Universidad Central de Venezuela Facultad de Ciencias Económicas y Sociales Comisión de Estudios para Graduados Área de Postgrado en Estadística y Actuariado Programa Integrado de Postgrado en Estadística y Actuariado DISEÑO ESTADÍSTICO DE INVESTIGACIONES 2024 Inferencia Basada en Modelos Caso 1. Medicamentos para reducir el dolor de cabeza
  • 2. Supongamos que usted dispone de 20 voluntarios para experimentar con dos medicamentos para reducir el dolor de cabeza. En este caso, una de las mayores dificultades consiste en medir el tiempo hasta el alivio, porque lo que constituye un alivio del dolor para una persona presumiblemente no lo será para otra. Además, las personas sentirán la necesidad de tomar remedios para el dolor de cabeza en diferentes momentos de dolor. Tras estudiar el asunto y revisar la bibliografía sobre experimentos similares, usted decide proceder de la siguiente manera. Cuando uno de sus voluntarios experimente un dolor de cabeza, tomará el remedio prescrito cuando el dolor sea intenso y el tiempo necesario para que se sienta cómodo. Una vez realizado el experimento se obtuvieron los siguientes resultados: Tiempo de alivio en minutos del dolor de cabeza por la aplicación de dos fármacos A y B Para comenzar a realizar el análisis de datos, comenzaremos por realizar la exploración de los datos presentados. 1.1.Estructura de los datos En primer lugar, adaptamos la información para poder trabajarla bajo el paquete RStudio, estableciendo la siguiente estructura: tibble [20 × 2] (S3: tbl_df/tbl/data.frame) $ FARMACO: chr [1:20] "A" "A" "A" "A" ... $ MINUTOS: num [1:20] 25 16 20 30 46 22 83 26 34 26 ... Donde: FARMACO: Vector que contiene la identificación del tratamiento aplicado a cada individuo, tomando los valores A o B. MINUTOS: Vector que contiene el tiempo necesario para que el individuo, luego de tomar el medicamento se sienta cómodo. A B 25 32 16 44 20 46 30 28 46 36 22 48 83 53 26 76 34 58 26 42
  • 3. 1.2 Estadísticas descriptivas Procedemos a visualizar las estadísticas descriptivas, de la base de datos en general, obteniendo el siguiente resultado: FARMACO MINUTOS Length:20 Min. :16.00 Class :character 1st Qu.:26.00 Mode :character Median :35.00 Mean :39.55 3rd Qu.:46.50 Max. :83.00 Aquí podemos apreciar los valores mínimos, máximo, media y mediana, así como sus correspondientes cuartiles, es importante resaltar que el valor máximo, se encuentra muy por encima del tercer quartil. Para una mejor visualización de los datos, se realizo las estadísticas descriptivas para cada tratamiento de manera que se establezca una comparación entre los grupos. Descriptive statistics by group group: A vars n mean sd median trimmed mad min max range skew kurtosis se X1 1 10 32.8 19.49 26 28.62 7.41 16 83 67 1.61 1.51 6.16 ---------------------------------------------------------------------- group: B vars n mean sd median trimmed mad min max range skew kurtosis se X1 1 10 46.3 13.89 45 44.88 12.6 28 76 48 0.67 -0.41 4.39 Se aprecia que la media de los individuos del tratamiento A se ubica en 32,8 minutos, mientras que en los individuos del tratamiento B se ubica en 46,3 minutos. Media Tratamiento B – Media Tratamiento A = 46,3 – 32,8 = 13,5 minutos Si realizamos el mismo análisis en relación a la mediana, obtenemos: Mediana Tratamiento B – Mediana Tratamiento A = 45 – 26 = 19 minutos Se aprecia en ambos casos, diferencias entre los grupos en relación a la media y la varianza, más adelante detectaremos si esta diferencia es significativa. Ahora, veremos el intervalo de confianza de la media de cada tratamiento
  • 4. 1.3 Intervalo de Confianza Tratamiento A 95 percent confidence interval: 18.85594 46.74406 sample estimates: mean of x 32.8 Entonces el intervalo de confianza del 95% de la media de los individuos a los que se les aplico el tratamiento A, es: (18.85594, 46.74406), es decir, con un 95% de confianza el tiempo promedio del tratamiento A esta en el intervalo 18.85594 y 46.74406 Tratamiento B 95 percent confidence interval: 36.36452 56.23548 sample estimates: mean of x 46.3 Para el caso del Tratamiento B el intervalo de confianza del 95% de la media de los individuos a los que se les aplico este tratamiento, es: (36.36452, 56.23548), es decir, con un 95% de confianza el tiempo promedio del tratamiento B está en el intervalo 36.36452 y 56.23548 1.4 Valores Perdidos Estudiamos la existencia de valores perdidos en la data, encontrando lo siguiente: FARMACO MINUTOS [1,] FALSE FALSE
  • 5. [2,] FALSE FALSE [3,] FALSE FALSE [4,] FALSE FALSE [5,] FALSE FALSE [6,] FALSE FALSE [7,] FALSE FALSE [8,] FALSE FALSE [9,] FALSE FALSE [10,] FALSE FALSE [11,] FALSE FALSE [12,] FALSE FALSE [13,] FALSE FALSE [14,] FALSE FALSE [15,] FALSE FALSE [16,] FALSE FALSE [17,] FALSE FALSE [18,] FALSE FALSE [19,] FALSE FALSE [20,] FALSE FALSE > > sum(is.na(farmacos)) [1] 0 Apreciamos que no existen valores perdidos en la base de datos 1.5 Grafico de Caja Como vemos, en el gráfico de caja anterior, se muestra que ambos grupos tienen comportamientos distintos en relación a la media, lo cual se validara con el correspondiente análisis de la ANOVA.
  • 6. Adicionalmente apreciamos que existe para cada grupo un valor atípico, que se encuentra por encima de los limites de la caja, para verificar haremos cuales son dichos valores: > outliers_farmacos [1] 83 76 Es decir, que los valores atípicos corresponden a los tiempos: 83 minutos y 76 minutos. 1.6 ANOVA Para realizar el análisis del ANOVA, validaremos en primera instancia el supuesto de normalidad y esto lo haremos, de manera gráfica: Tratamiento A
  • 7. Tratamiento B Se puede apreciar el supuesto de normalidad, al igual que se visualizan los valores atípicos en cada caso. Ahora bien, realizaremos el ANOVA, para ello definimos que nuestra Hipótesis Nula se expresa como: Ho: Igualdad de medias en ambos tratamientos H1: Diferencia de medias en los tratamientos Df Sum Sq Mean Sq F value Pr(>F) farmacos$FARMACO 1 911 911.2 3.181 0.0913 . Residuals 18 5156 286.4 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Se puede apreciar que el p-valor es 0,0913, lo que implica que es mayor a 0,05, por lo que no existe suficiente evidencia para rechazar la hipótesis nula, sin embargo, es posible que los valores atípicos estén ejerciendo influencia en los valores de la media, por lo que es necesario realizar su sustitución por el promedio, para realizar nuevamente el análisis ANOVA.
  • 8. Realizando la sustitución de los valores atípicos, obtenemos los siguientes resultados: Descriptive statistics by group group: A vars n mean sd median trimmed mad min max range skew kurtosis se X1 1 10 27.8 8.5 26 27 7.41 16 46 30 0.66 -0.38 2.69 ---------------------------------------------------------------------- group: B vars n mean sd median trimmed mad min max range skew kurtosis se X1 1 10 43.3 9.21 45 43.38 8.15 28 58 30 -0.15 -1.2 2.91 Ahora el ANOVA queda de la siguiente manera: Df Sum Sq Mean Sq F value Pr(>F) farmacos2$FARMACO 1 1201 1201.2 15.29 0.00102 ** Residuals 18 1414 78.5 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Como se puede apreciar, el p-valor ahora se ubica en 0,00102 lo que implica que el p-valor es menor a 0,05, por lo tanto se rechaza la hipótesis nula de igualdad de medias. Caso 2. Pacientes con quemaduras Wakeman y Kaplan proporcionan los datos de un experimento sorprendente. Pacientes con quemaduras se asignaron a dos grupos de tratamiento: sólo medicación y medicación bajo hipnosis. Se registró el porcentaje de medicación permitida a cada paciente. Para cuatro de los pacientes que recibieron hipnosis el porcentaje fue de 40%. El porcentaje para cinco pacientes que sólo recibieron la medicación fue del 80%. Aunque los autores no proporcionaron los datos básicos en su artículo, sólo sus promedios, supusimos que los porcentajes de medicación requeridos por los nueve pacientes fue como se presenta a continuación: Solo medicación Hipnósis/medicación 85 26 92 46 76 37 81 51 66
  • 9. Para realizar el análisis de este ejercicio, usaremos el mismo procedimiento que en el caso anterior: 2.1Estructura de los datos tibble [9 × 2] (S3: tbl_df/tbl/data.frame) $ TRATAMIENTO: chr [1:9] "M" "M" "M" "M" ... $ PORCENTAJE : num [1:9] 85 92 76 81 66 26 46 37 51 Donde: TRATAMIENTO: Vector que contiene la identificación del tratamiento aplicado a cada individuo, tomando los valores M Y HM PORCENTAJE: Vector que contiene los porcentajes de medicación requeridos por los pacientes. 2.2 Estadísticas descriptivas TRATAMIENTO PORCENTAJE Length:9 Min. :26.00 Class :character 1st Qu.:46.00 Mode :character Median :66.00 Mean :62.22 3rd Qu.:81.00 Max. :92.00 Comparación entre los grupos: Descriptive statistics by group group: HM vars n mean sd median trimmed mad min max range skew kurtosis se X1 1 4 40 10.98 41.5 40 10.38 26 51 25 -0.23 -2.07 5.49 ---------------------------------------------------------------------- group: M vars n mean sd median trimmed mad min max range skew kurtosis se X1 1 5 80 9.77 81 80 7.41 66 92 26 -0.2 -1.68 4.37 2.3 Intervalo de Confianza Tratamiento M 95 percent confidence interval: 67.86595 92.13405
  • 10. sample estimates: mean of x 80 El intervalo de confianza del 95% de la media de los individuos a los que se les aplico el tratamiento M, es: (67.86595, 92.13405). Tratamiento HM 95 percent confidence interval: 22.52067 57.47933 sample estimates: mean of x 40 El intervalo de confianza del 95% de la media de los individuos a los que se les aplico el tratamiento HM, es: (22.52067, 57.47933). 2.4 Valores Perdidos Estudiamos la existencia de valores perdidos en la data, encontrando lo siguiente: TRATAMIENTO PORCENTAJE [1,] FALSE FALSE [2,] FALSE FALSE [3,] FALSE FALSE [4,] FALSE FALSE [5,] FALSE FALSE [6,] FALSE FALSE [7,] FALSE FALSE [8,] FALSE FALSE [9,] FALSE FALSE > > sum(is.na(quem)) [1] 0 2.5 Grafico de Caja
  • 11. Como vemos, en el gráfico de caja anterior, se muestra que ambos grupos tienen comportamientos distintos en relación a la media, lo cual se validara con el correspondiente análisis de la ANOVA. 2.6 ANOVA Validaremos el supuesto de normalidad y esto lo haremos, de manera gráfica: Tratamiento M
  • 12. Tratamiento HM Ahora bien, realizaremos el ANOVA, para ello definimos que nuestra Hipótesis Nula se expresa como:
  • 13. Ho: Igualdad de medias en ambos tratamientos H1: Diferencia de medias en los tratamientos Df Sum Sq Mean Sq F value Pr(>F) quem$TRATAMIENTO 1 3556 3556 33.45 0.000675 *** Residuals 7 744 106 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Como se puede apreciar, el p-valor se ubica en 0,000675 lo que implica que el p- valor es menor a 0,05, por lo tanto, no existe evidencia para aceptar la hipótesis nula de igualdad de medias. Es importante acotar que los tamaños de los grupos desiguales afectan el poder estadístico y las tasas de error de tipo I, por lo que los grupos de igual tamaño maximizan el poder estadístico. Referencias Bibliográficas
  • 14. Montgomery, D. (2001). Desing and Analysis of Experiments. Fifth Edition. Jhon Wiley and Sons. New York. USA.