SlideShare a Scribd company logo
1 of 19
Lenguaje R: Sesión 7
ING. LUIS FERNANDO AGUAS B
2Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (1)
Fácilmente se pueden calcular estadísticos sumario tipo media, mediana,
desviación, …
> x<-rnorm(50)
> mean(x)
[1] -0.2552258
> sd(x)
[1] 1.209657
> var(x)
[1] 1.463269
> median(x)
[1] -0.3365646
#cuantiles empíricos
> quantile(x)
0% 25% 50% 75% 100%
-3.4542028 -1.1195259 -0.3365646 0.6758368 2.0094436
> pvec<-seq(0,1,0.1)
> pvec
[1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
> quantile(x,pvec)
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
-3.4542028 -1.7757077 -1.1735237 -0.9867830 -0.6923767 -0.3365646 0.0907579 0.5180732 0.9876644 1.3546966 2.0094436
3Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (2)
#exploramos el dataset juul
> library(ISwR)
> data(juul)
> ?juul
> attach(juul)
> mean(igf1)
[1] NA
Debemos indicarle que no tenga en cuenta los valores missing:
> mean(igf1,na.rm=T)
[1] 340.168
> sd(igf1,na.rm=T)
[1] 171.0356
#una excepción: la función length
> sum(!is.na(igf1))
[1] 1018
#directamente, función summary() sobre cualquier dataset
> summary(juul)
age menarche sex igf1 tanner testvol
Min. : 0.170 Min. : 1.000 Min. :1.000 Min. : 25.0 Min. : 1.000 Min. : 1.000
1st Qu.: 9.053 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:202.3 1st Qu.: 1.000 1st Qu.: 1.000
Median :12.560 Median : 1.000 Median :2.000 Median :313.5 Median : 2.000 Median : 3.000
Mean :15.095 Mean : 1.476 Mean :1.534 Mean :340.2 Mean : 2.640 Mean : 7.896
3rd Qu.:16.855 3rd Qu.: 2.000 3rd Qu.:2.000 3rd Qu.:462.8 3rd Qu.: 5.000 3rd Qu.: 15.000
Max. :83.000 Max. : 2.000 Max. :2.000 Max. :915.0 Max. : 5.000 Max. : 30.000
NA's : 5.000 NA's :635.000 NA's :5.000 NA's :321.0 NA's :240.000 NA's :859.000
4Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (3)
#en el data frame tenemos variables categóricas
> detach(juul)
> juul$sex<-factor(juul$sex,labels=c("M","F"))
> juul$menarche<-factor(juul$menarche,labels=c("No","Yes"))
> juul$tanner<-factor(juul$tanner,labels=c("I","II","III","IV","V"))
> attach(juul)
> summary(juul)
age menarche sex igf1 tanner testvol
Min. : 0.170 No :369 M :621 Min. : 25.0 I :515 Min. : 1.000
1st Qu.: 9.053 Yes :335 F :713 1st Qu.:202.3 II :103 1st Qu.: 1.000
Median :12.560 NA's:635 NA's: 5 Median :313.5 III : 72 Median : 3.000
Mean :15.095 Mean :340.2 IV : 81 Mean : 7.896
3rd Qu.:16.855 3rd Qu.:462.8 V :328 3rd Qu.: 15.000
Max. :83.000 Max. :915.0 NA's:240 Max. : 30.000
NA's : 5.000 NA's :321.0 NA's :859.000
#también podríamos haber utilizado la función transform()
> juul<-transform(juul,
+ sex=factor(sex,labels=c("M","F")),
+ menarche=factor(menarche,labels=c("No","Yes")),
+ tanner=factor(tanner,labels=c("I","II","III","IV","V")) )
5Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (1)
#histogramas. Por defecto R, intenta hacer puntos de corte "adecuados"
> hist(x)
6Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (2)
#Ejemplo #accidentes vs edad (0-4,5-9,10-15,16,17,18-19,20-24,25-59,60-79)
> mid.age<-c(2.5,7.5,13,16.5,17.5,19,22.5,44.5,70.5)
> acc.count<-c(28,46,58,20,31,64,149,316,103)
> age.acc<-rep(mid.age,acc.count)
> brk<-c(0,5,10,16,17,18,20,25,60,80)
> hist(age.acc,breaks=brk)
7Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (3)
#distribución empírica acumulada
> n<-length(x)
> plot(sort(x),(1:n)/n,type="s",ylim=c(0,1))
8Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (4)
#qqplot
> qqnorm(x)
9Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (5)
#Boxplots IgM ( Serum IgM in 298 children aged 6 months to 6 years)
> data(IgM)
> ?IgM
> par(mfrow=c(1,2))
> boxplot(IgM)
> boxplot(log(IgM))
> par(mfrow=c(1,1))
10Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen para grupos (1)
#Folate concentration in blood cells according to three types of ventilation during
anesthesia
> data(red.cell.folate)
> attach(red.cell.folate)
> ?red.cell.folate
> summary(red.cell.folate)
folate ventilation
Min. :206.0 N2O+O2,24h:8
1st Qu.:249.5 N2O+O2,op :9
Median :274.0 O2,24h :5
Mean :283.2
3rd Qu.:305.5
Max. :392.0
> tapply(folate,ventilation,mean)
N2O+O2,24h N2O+O2,op O2,24h
316.6250 256.4444 278.0000
> #Para tener más de un estadístico resumen por grupo
> m<-tapply(folate,ventilation,mean)
> s<-tapply(folate,ventilation,sd)
> n<-tapply(folate,ventilation,length)
> cbind(mean=m,std.dev=s,n=n)
mean std.dev n
N2O+O2,24h 316.6250 58.71709 8
N2O+O2,op 256.4444 37.12180 9
O2,24h 278.0000 33.75648 5
11Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen para grupos (2)
#para el dataset juul
> tapply(igf1,tanner,mean)
I II III IV V
NA NA NA NA NA
> tapply(igf1,tanner,mean,na.rm=T)
I II III IV V
207.4727 352.6714 483.2222 513.0172 465.3344
13Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para datos agrupados (2)
#boxplots para cada grupo
> boxplot(expend~stature)
> boxplot(expend.lean,expend.obese)
14Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para datos agrupados (3)
#con muestras tan pequeñas, los boxplots pueden resultar engañosos
#gráficos de los datos originales, punto a punto
> opar<-par(mfrow=c(2,2),mex=0.8,mar=c(3,3,2,1)+0.1)
> stripchart(expend~stature)
> stripchart(expend~stature,method="jitter")
> stripchart(expend~stature,method="stack")
> stripchart(expend~stature,method="stack",jitter=0.03)
> par(opar)
15Sesión 7 – Introducción a la estadística básica y gráficos
Tablas (1)
#Una tabla debe estar en un objecto tipo matriz
#Ejemplo mujeres consumo cafeína vs estado civil
> caff.marital<-matrix(c(652,1537,598,242,36,46,38,21,218,327,106,67),nrow=3,byrow=T)
> caff.marital
[,1] [,2] [,3] [,4]
[1,] 652 1537 598 242
[2,] 36 46 38 21
[3,] 218 327 106 67
> colnames(caff.marital)<-c("0","1-150","151-300",">300")
> rownames(caff.marital)<-c("Married","Prev.married","Single")
> caff.marital
0 1-150 151-300 >300
Married 652 1537 598 242
Prev.married 36 46 38 21
Single 218 327 106 67
#también podemos crearla a partir de variables categóricas de un dataset
table(sex)
sex
M F
621 713
> table(sex,menarche)
menarche
sex No Yes
M 0 0
F 369 335
> table(menarche,tanner)
tanner
menarche I II III IV V
No 221 43 32 14 2
Yes 1 1 5 26 202
16Sesión 7 – Introducción a la estadística básica y gráficos
Tablas (2)
#podemos transponer las tablas
> t(caff.marital)
Married Prev.married Single
0 652 36 218
1-150 1537 46 327
151-300 598 38 106
>300 242 21 67
#para calcular las frecuencias marginales, perfiles fila, ...
> tanner.sex<-table(tanner,sex)
> tanner.sex
sex
tanner M F
I 291 224
II 55 48
III 34 38
IV 41 40
V 124 204
> margin.table(tanner.sex,1)
tanner
I II III IV V
515 103 72 81 328
> margin.table(tanner.sex,2)
sex
M F
545 554
> prop.table(tanner.sex,1)
sex
tanner M F
I 0.5650485 0.4349515
II 0.5339806 0.4660194
III 0.4722222 0.5277778
IV 0.5061728 0.4938272
V 0.3780488 0.6219512
> prop.table(tanner.sex,1)*100
sex
tanner M F
I 56.50485 43.49515
II 53.39806 46.60194
III 47.22222 52.77778
IV 50.61728 49.38272
V 37.80488 62.19512
> tanner.sex/sum(tanner.sex)
sex
tanner M F
I 0.26478617 0.20382166
II 0.05004550 0.04367607
III 0.03093722 0.03457689
IV 0.03730664 0.03639672
V 0.11282985 0.18562329
17Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (1)
#diagrama de barras
> total.caff<-margin.table(caff.marital,2)
> total.caff
0 1-150 151-300 >300
906 1910 742 330
> barplot(total.caff,col="white")
18Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (2)
#diagramas de barras para una tabla de contingencia
> par(mfrow=c(2,2))
> barplot(caff.marital,col="white")
> barplot(t(caff.marital),col="white")
> barplot(t(caff.marital),col="white",beside=T)
> barplot(prop.table(t(caff.marital),2),col="white",beside=T)
> par(mfrow=c(1,1))
19Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (3)
#otro diagrama de barras para una tabla de contingencia
> barplot(prop.table(t(caff.marital),2),beside=T,
+ legend.text=colnames(caff.marital),
+ col=c("white","grey80","grey50","black"))
20Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (4)
#diagrama de sectores para una tabla de contingencia
> opar<-par(mfrow=c(2,2),mex=0.8,mar=c(1,1,2,1))
> slices<-c("white","grey80","grey50","black")
> pie(caff.marital["Married",],main="Married",col=slices)
> pie(caff.marital["Prev.married",],main="Previously married",col=slices)
> pie(caff.marital["Single",],main="Single",col=slices)
> par(opar)

More Related Content

Viewers also liked

¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...Martín Cabrera
 
Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Software Guru
 
Estadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaEstadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaLuis Fernando Aguas Bucheli
 
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALLA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALGuillermo Herrera
 
Estadística con R Commander
Estadística con R CommanderEstadística con R Commander
Estadística con R CommanderFernando Reche
 
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDEstadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDDr. Orville M. Disdier
 
Los costos en la industria
Los costos en la industriaLos costos en la industria
Los costos en la industriaJorge Medina
 
Costos industriales
Costos industrialesCostos industriales
Costos industrialesyhameille
 
LENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RLENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RShirley Armas
 
administracion de operaciones
administracion de operacionesadministracion de operaciones
administracion de operacionesgueste3129d
 
Costos industriales - Definición básica
Costos industriales - Definición básicaCostos industriales - Definición básica
Costos industriales - Definición básicaVanessa Ortiz
 
Model building in credit card and loan approval
Model building in credit card and loan approval Model building in credit card and loan approval
Model building in credit card and loan approval Venkata Reddy Konasani
 
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL WILSON VELASTEGUI
 
Costos y punto de equilibrio
Costos y punto de equilibrioCostos y punto de equilibrio
Costos y punto de equilibrioCARLOS MASSUH
 

Viewers also liked (20)

¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
 
Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI
 
Estadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaEstadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión Introductoria
 
Estadística con Lenguaje R: Sesión 6
Estadística con Lenguaje R: Sesión 6Estadística con Lenguaje R: Sesión 6
Estadística con Lenguaje R: Sesión 6
 
Introduccion al Programa R
Introduccion al Programa RIntroduccion al Programa R
Introduccion al Programa R
 
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALLA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
 
Estadística con R Commander
Estadística con R CommanderEstadística con R Commander
Estadística con R Commander
 
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDEstadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
 
R- Introduction
R- IntroductionR- Introduction
R- Introduction
 
Los costos en la industria
Los costos en la industriaLos costos en la industria
Los costos en la industria
 
Costos industriales
Costos industrialesCostos industriales
Costos industriales
 
LENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RLENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION R
 
administracion de operaciones
administracion de operacionesadministracion de operaciones
administracion de operaciones
 
Costos industriales
Costos industrialesCostos industriales
Costos industriales
 
Costos industriales - Definición básica
Costos industriales - Definición básicaCostos industriales - Definición básica
Costos industriales - Definición básica
 
Step By Step Guide to Learn R
Step By Step Guide to Learn RStep By Step Guide to Learn R
Step By Step Guide to Learn R
 
Model building in credit card and loan approval
Model building in credit card and loan approval Model building in credit card and loan approval
Model building in credit card and loan approval
 
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
 
Credit Risk Model Building Steps
Credit Risk Model Building StepsCredit Risk Model Building Steps
Credit Risk Model Building Steps
 
Costos y punto de equilibrio
Costos y punto de equilibrioCostos y punto de equilibrio
Costos y punto de equilibrio
 

Similar to Estadística con Lenguaje R: Sesión 7

TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS Juan Carlos Durand
 
Estadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoEstadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoyony20
 
Ejercicios de Estadistica
Ejercicios de EstadisticaEjercicios de Estadistica
Ejercicios de EstadisticaWillian Delgado
 
Tarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaTarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaEstadistica1000
 
Cursillo estadistica
Cursillo estadisticaCursillo estadistica
Cursillo estadisticamecufer09
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2danilosaavedra
 
Seminario v etic
Seminario v eticSeminario v etic
Seminario v eticmarlopgon14
 
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Sheyla Caraballo
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdfFrankCruz49
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdfFrankCruz49
 
Sol t08 mec
Sol t08 mecSol t08 mec
Sol t08 mecfruizj
 
8.estadistica
8.estadistica8.estadistica
8.estadisticafanufe
 
Técnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoTécnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoBASEK
 

Similar to Estadística con Lenguaje R: Sesión 7 (20)

TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
 
Estadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoEstadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonado
 
Ejercicios de Estadistica
Ejercicios de EstadisticaEjercicios de Estadistica
Ejercicios de Estadistica
 
Tarea 3
Tarea 3Tarea 3
Tarea 3
 
Tarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaTarea 3 Arlet Estadistica
Tarea 3 Arlet Estadistica
 
Tarea 3
Tarea 3Tarea 3
Tarea 3
 
Cursillo estadistica
Cursillo estadisticaCursillo estadistica
Cursillo estadistica
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2
 
Estadistica uts
Estadistica utsEstadistica uts
Estadistica uts
 
Seminario v etic
Seminario v eticSeminario v etic
Seminario v etic
 
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdf
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdf
 
8.estadistica
8.estadistica8.estadistica
8.estadistica
 
Sol t08 mec
Sol t08 mecSol t08 mec
Sol t08 mec
 
8.estadistica
8.estadistica8.estadistica
8.estadistica
 
Compendio 5
Compendio 5Compendio 5
Compendio 5
 
Compendio 5
Compendio 5Compendio 5
Compendio 5
 
Técnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoTécnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del Mercado
 
+Reuniónago172014 03
+Reuniónago172014 03+Reuniónago172014 03
+Reuniónago172014 03
 

More from Luis Fernando Aguas Bucheli (20)

EFC-ISW-Luis Fernando Aguas.pptx
EFC-ISW-Luis Fernando Aguas.pptxEFC-ISW-Luis Fernando Aguas.pptx
EFC-ISW-Luis Fernando Aguas.pptx
 
P-S2.pptx
P-S2.pptxP-S2.pptx
P-S2.pptx
 
EBTS-S1.pptx
EBTS-S1.pptxEBTS-S1.pptx
EBTS-S1.pptx
 
P-S3.pptx
P-S3.pptxP-S3.pptx
P-S3.pptx
 
EBTS-S4.pptx
EBTS-S4.pptxEBTS-S4.pptx
EBTS-S4.pptx
 
P-S4.pptx
P-S4.pptxP-S4.pptx
P-S4.pptx
 
P-S1.pptx
P-S1.pptxP-S1.pptx
P-S1.pptx
 
EBTS-S3.pptx
EBTS-S3.pptxEBTS-S3.pptx
EBTS-S3.pptx
 
EBTS-S2.pptx
EBTS-S2.pptxEBTS-S2.pptx
EBTS-S2.pptx
 
PDIDTI-S7.pptx
PDIDTI-S7.pptxPDIDTI-S7.pptx
PDIDTI-S7.pptx
 
PDIDTI-S4.pptx
PDIDTI-S4.pptxPDIDTI-S4.pptx
PDIDTI-S4.pptx
 
PDIDTI-S2.pptx
PDIDTI-S2.pptxPDIDTI-S2.pptx
PDIDTI-S2.pptx
 
PDIDTI-S1.pptx
PDIDTI-S1.pptxPDIDTI-S1.pptx
PDIDTI-S1.pptx
 
PDIDTI-S8.pptx
PDIDTI-S8.pptxPDIDTI-S8.pptx
PDIDTI-S8.pptx
 
PDIDTI-S6.pptx
PDIDTI-S6.pptxPDIDTI-S6.pptx
PDIDTI-S6.pptx
 
PDIDTI-S5.pptx
PDIDTI-S5.pptxPDIDTI-S5.pptx
PDIDTI-S5.pptx
 
PDIDTI-S3.pptx
PDIDTI-S3.pptxPDIDTI-S3.pptx
PDIDTI-S3.pptx
 
TIC-S4.pptx
TIC-S4.pptxTIC-S4.pptx
TIC-S4.pptx
 
TIC-S3.pptx
TIC-S3.pptxTIC-S3.pptx
TIC-S3.pptx
 
TIC-S2.pptx
TIC-S2.pptxTIC-S2.pptx
TIC-S2.pptx
 

Recently uploaded

CONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocx
CONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocxCONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocx
CONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocxMarlynRocaOnofre
 
Profecia 2300 dias explicada, Daniel 8:14
Profecia 2300 dias explicada, Daniel 8:14Profecia 2300 dias explicada, Daniel 8:14
Profecia 2300 dias explicada, Daniel 8:14KevinBuenrostro4
 
Seguridad y virus informáticos 12°B 2024
Seguridad y virus informáticos 12°B 2024Seguridad y virus informáticos 12°B 2024
Seguridad y virus informáticos 12°B 2024sergeycrastz06
 
📝 Semana 09 - Tema 01: Tarea - Redacción del texto argumentativo
📝 Semana 09 - Tema 01: Tarea - Redacción del texto argumentativo📝 Semana 09 - Tema 01: Tarea - Redacción del texto argumentativo
📝 Semana 09 - Tema 01: Tarea - Redacción del texto argumentativoharolbustamante1
 
4ª SESION la misión santificadora del Espíritu Santo en la vida de la Iglesi...
4ª SESION  la misión santificadora del Espíritu Santo en la vida de la Iglesi...4ª SESION  la misión santificadora del Espíritu Santo en la vida de la Iglesi...
4ª SESION la misión santificadora del Espíritu Santo en la vida de la Iglesi...Reneeavia
 
a propósito del estado su relevancia y definiciones
a propósito del estado su relevancia y definicionesa propósito del estado su relevancia y definiciones
a propósito del estado su relevancia y definicionessubfabian
 
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdf
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdfPasos para enviar una tarea en SIANET - sólo estudiantes.pdf
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdfNELLYKATTY
 
📝 Semana 09 - Tema 01: Tarea - Aplicación del resumen como estrategia de fuen...
📝 Semana 09 - Tema 01: Tarea - Aplicación del resumen como estrategia de fuen...📝 Semana 09 - Tema 01: Tarea - Aplicación del resumen como estrategia de fuen...
📝 Semana 09 - Tema 01: Tarea - Aplicación del resumen como estrategia de fuen...harolbustamante1
 
Cerebelo Anatomía y fisiología Clase presencial
Cerebelo Anatomía y fisiología Clase presencialCerebelo Anatomía y fisiología Clase presencial
Cerebelo Anatomía y fisiología Clase presencialDanita2111
 
Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)
Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)
Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)JonathanCovena1
 
2.15. Calendario Civico Escolar 2024.docx
2.15. Calendario Civico Escolar 2024.docx2.15. Calendario Civico Escolar 2024.docx
2.15. Calendario Civico Escolar 2024.docxCarlosEnriqueArgoteC
 
Tema Identificar Relaciones y Casos de Uso 19-05-24.pdf
Tema Identificar Relaciones y Casos de Uso 19-05-24.pdfTema Identificar Relaciones y Casos de Uso 19-05-24.pdf
Tema Identificar Relaciones y Casos de Uso 19-05-24.pdfNoe Castillo
 
TEMA EGIPTO.pdf. Presentación civilización
TEMA EGIPTO.pdf. Presentación civilizaciónTEMA EGIPTO.pdf. Presentación civilización
TEMA EGIPTO.pdf. Presentación civilizaciónVasallo1
 
proyecto semana de los Jardines, actividades a realizar para resaltar esta fecha
proyecto semana de los Jardines, actividades a realizar para resaltar esta fechaproyecto semana de los Jardines, actividades a realizar para resaltar esta fecha
proyecto semana de los Jardines, actividades a realizar para resaltar esta fechanitoagurto67
 
Vínculo afectivo (labor expositivo de grupo )
Vínculo afectivo (labor expositivo de grupo )Vínculo afectivo (labor expositivo de grupo )
Vínculo afectivo (labor expositivo de grupo )portafoliodigitalyos
 
Época colonial: vestimenta, costumbres y juegos de la época
Época colonial: vestimenta, costumbres y juegos de la épocaÉpoca colonial: vestimenta, costumbres y juegos de la época
Época colonial: vestimenta, costumbres y juegos de la épocacecifranco1981
 
RESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdf
RESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdfRESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdf
RESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdfANEP - DETP
 

Recently uploaded (20)

La historia de la vida estudiantil a 102 años de la fundación de las Normales...
La historia de la vida estudiantil a 102 años de la fundación de las Normales...La historia de la vida estudiantil a 102 años de la fundación de las Normales...
La historia de la vida estudiantil a 102 años de la fundación de las Normales...
 
CONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocx
CONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocxCONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocx
CONCLUSIONES DESCRIPTIVAS TIC que ayudaran a tus registrosdocx
 
Profecia 2300 dias explicada, Daniel 8:14
Profecia 2300 dias explicada, Daniel 8:14Profecia 2300 dias explicada, Daniel 8:14
Profecia 2300 dias explicada, Daniel 8:14
 
Seguridad y virus informáticos 12°B 2024
Seguridad y virus informáticos 12°B 2024Seguridad y virus informáticos 12°B 2024
Seguridad y virus informáticos 12°B 2024
 
Luz desde el santuario. Escuela Sabática
Luz desde el santuario. Escuela SabáticaLuz desde el santuario. Escuela Sabática
Luz desde el santuario. Escuela Sabática
 
📝 Semana 09 - Tema 01: Tarea - Redacción del texto argumentativo
📝 Semana 09 - Tema 01: Tarea - Redacción del texto argumentativo📝 Semana 09 - Tema 01: Tarea - Redacción del texto argumentativo
📝 Semana 09 - Tema 01: Tarea - Redacción del texto argumentativo
 
4ª SESION la misión santificadora del Espíritu Santo en la vida de la Iglesi...
4ª SESION  la misión santificadora del Espíritu Santo en la vida de la Iglesi...4ª SESION  la misión santificadora del Espíritu Santo en la vida de la Iglesi...
4ª SESION la misión santificadora del Espíritu Santo en la vida de la Iglesi...
 
a propósito del estado su relevancia y definiciones
a propósito del estado su relevancia y definicionesa propósito del estado su relevancia y definiciones
a propósito del estado su relevancia y definiciones
 
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdf
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdfPasos para enviar una tarea en SIANET - sólo estudiantes.pdf
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdf
 
📝 Semana 09 - Tema 01: Tarea - Aplicación del resumen como estrategia de fuen...
📝 Semana 09 - Tema 01: Tarea - Aplicación del resumen como estrategia de fuen...📝 Semana 09 - Tema 01: Tarea - Aplicación del resumen como estrategia de fuen...
📝 Semana 09 - Tema 01: Tarea - Aplicación del resumen como estrategia de fuen...
 
Cerebelo Anatomía y fisiología Clase presencial
Cerebelo Anatomía y fisiología Clase presencialCerebelo Anatomía y fisiología Clase presencial
Cerebelo Anatomía y fisiología Clase presencial
 
Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)
Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)
Análisis de la situación actual .La Matriz de Perfil Competitivo (MPC)
 
2.15. Calendario Civico Escolar 2024.docx
2.15. Calendario Civico Escolar 2024.docx2.15. Calendario Civico Escolar 2024.docx
2.15. Calendario Civico Escolar 2024.docx
 
Tema Identificar Relaciones y Casos de Uso 19-05-24.pdf
Tema Identificar Relaciones y Casos de Uso 19-05-24.pdfTema Identificar Relaciones y Casos de Uso 19-05-24.pdf
Tema Identificar Relaciones y Casos de Uso 19-05-24.pdf
 
TEMA EGIPTO.pdf. Presentación civilización
TEMA EGIPTO.pdf. Presentación civilizaciónTEMA EGIPTO.pdf. Presentación civilización
TEMA EGIPTO.pdf. Presentación civilización
 
proyecto semana de los Jardines, actividades a realizar para resaltar esta fecha
proyecto semana de los Jardines, actividades a realizar para resaltar esta fechaproyecto semana de los Jardines, actividades a realizar para resaltar esta fecha
proyecto semana de los Jardines, actividades a realizar para resaltar esta fecha
 
Vínculo afectivo (labor expositivo de grupo )
Vínculo afectivo (labor expositivo de grupo )Vínculo afectivo (labor expositivo de grupo )
Vínculo afectivo (labor expositivo de grupo )
 
Época colonial: vestimenta, costumbres y juegos de la época
Época colonial: vestimenta, costumbres y juegos de la épocaÉpoca colonial: vestimenta, costumbres y juegos de la época
Época colonial: vestimenta, costumbres y juegos de la época
 
RESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdf
RESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdfRESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdf
RESPONSABILIDAD SOCIAL EN LAS ORGANIZACIONES (4).pdf
 
Power Point : Motivados por la esperanza
Power Point : Motivados por la esperanzaPower Point : Motivados por la esperanza
Power Point : Motivados por la esperanza
 

Estadística con Lenguaje R: Sesión 7

  • 1. Lenguaje R: Sesión 7 ING. LUIS FERNANDO AGUAS B
  • 2. 2Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (1) Fácilmente se pueden calcular estadísticos sumario tipo media, mediana, desviación, … > x<-rnorm(50) > mean(x) [1] -0.2552258 > sd(x) [1] 1.209657 > var(x) [1] 1.463269 > median(x) [1] -0.3365646 #cuantiles empíricos > quantile(x) 0% 25% 50% 75% 100% -3.4542028 -1.1195259 -0.3365646 0.6758368 2.0094436 > pvec<-seq(0,1,0.1) > pvec [1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 > quantile(x,pvec) 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% -3.4542028 -1.7757077 -1.1735237 -0.9867830 -0.6923767 -0.3365646 0.0907579 0.5180732 0.9876644 1.3546966 2.0094436
  • 3. 3Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (2) #exploramos el dataset juul > library(ISwR) > data(juul) > ?juul > attach(juul) > mean(igf1) [1] NA Debemos indicarle que no tenga en cuenta los valores missing: > mean(igf1,na.rm=T) [1] 340.168 > sd(igf1,na.rm=T) [1] 171.0356 #una excepción: la función length > sum(!is.na(igf1)) [1] 1018 #directamente, función summary() sobre cualquier dataset > summary(juul) age menarche sex igf1 tanner testvol Min. : 0.170 Min. : 1.000 Min. :1.000 Min. : 25.0 Min. : 1.000 Min. : 1.000 1st Qu.: 9.053 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:202.3 1st Qu.: 1.000 1st Qu.: 1.000 Median :12.560 Median : 1.000 Median :2.000 Median :313.5 Median : 2.000 Median : 3.000 Mean :15.095 Mean : 1.476 Mean :1.534 Mean :340.2 Mean : 2.640 Mean : 7.896 3rd Qu.:16.855 3rd Qu.: 2.000 3rd Qu.:2.000 3rd Qu.:462.8 3rd Qu.: 5.000 3rd Qu.: 15.000 Max. :83.000 Max. : 2.000 Max. :2.000 Max. :915.0 Max. : 5.000 Max. : 30.000 NA's : 5.000 NA's :635.000 NA's :5.000 NA's :321.0 NA's :240.000 NA's :859.000
  • 4. 4Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (3) #en el data frame tenemos variables categóricas > detach(juul) > juul$sex<-factor(juul$sex,labels=c("M","F")) > juul$menarche<-factor(juul$menarche,labels=c("No","Yes")) > juul$tanner<-factor(juul$tanner,labels=c("I","II","III","IV","V")) > attach(juul) > summary(juul) age menarche sex igf1 tanner testvol Min. : 0.170 No :369 M :621 Min. : 25.0 I :515 Min. : 1.000 1st Qu.: 9.053 Yes :335 F :713 1st Qu.:202.3 II :103 1st Qu.: 1.000 Median :12.560 NA's:635 NA's: 5 Median :313.5 III : 72 Median : 3.000 Mean :15.095 Mean :340.2 IV : 81 Mean : 7.896 3rd Qu.:16.855 3rd Qu.:462.8 V :328 3rd Qu.: 15.000 Max. :83.000 Max. :915.0 NA's:240 Max. : 30.000 NA's : 5.000 NA's :321.0 NA's :859.000 #también podríamos haber utilizado la función transform() > juul<-transform(juul, + sex=factor(sex,labels=c("M","F")), + menarche=factor(menarche,labels=c("No","Yes")), + tanner=factor(tanner,labels=c("I","II","III","IV","V")) )
  • 5. 5Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (1) #histogramas. Por defecto R, intenta hacer puntos de corte "adecuados" > hist(x)
  • 6. 6Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (2) #Ejemplo #accidentes vs edad (0-4,5-9,10-15,16,17,18-19,20-24,25-59,60-79) > mid.age<-c(2.5,7.5,13,16.5,17.5,19,22.5,44.5,70.5) > acc.count<-c(28,46,58,20,31,64,149,316,103) > age.acc<-rep(mid.age,acc.count) > brk<-c(0,5,10,16,17,18,20,25,60,80) > hist(age.acc,breaks=brk)
  • 7. 7Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (3) #distribución empírica acumulada > n<-length(x) > plot(sort(x),(1:n)/n,type="s",ylim=c(0,1))
  • 8. 8Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (4) #qqplot > qqnorm(x)
  • 9. 9Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (5) #Boxplots IgM ( Serum IgM in 298 children aged 6 months to 6 years) > data(IgM) > ?IgM > par(mfrow=c(1,2)) > boxplot(IgM) > boxplot(log(IgM)) > par(mfrow=c(1,1))
  • 10. 10Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen para grupos (1) #Folate concentration in blood cells according to three types of ventilation during anesthesia > data(red.cell.folate) > attach(red.cell.folate) > ?red.cell.folate > summary(red.cell.folate) folate ventilation Min. :206.0 N2O+O2,24h:8 1st Qu.:249.5 N2O+O2,op :9 Median :274.0 O2,24h :5 Mean :283.2 3rd Qu.:305.5 Max. :392.0 > tapply(folate,ventilation,mean) N2O+O2,24h N2O+O2,op O2,24h 316.6250 256.4444 278.0000 > #Para tener más de un estadístico resumen por grupo > m<-tapply(folate,ventilation,mean) > s<-tapply(folate,ventilation,sd) > n<-tapply(folate,ventilation,length) > cbind(mean=m,std.dev=s,n=n) mean std.dev n N2O+O2,24h 316.6250 58.71709 8 N2O+O2,op 256.4444 37.12180 9 O2,24h 278.0000 33.75648 5
  • 11. 11Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen para grupos (2) #para el dataset juul > tapply(igf1,tanner,mean) I II III IV V NA NA NA NA NA > tapply(igf1,tanner,mean,na.rm=T) I II III IV V 207.4727 352.6714 483.2222 513.0172 465.3344
  • 12. 13Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para datos agrupados (2) #boxplots para cada grupo > boxplot(expend~stature) > boxplot(expend.lean,expend.obese)
  • 13. 14Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para datos agrupados (3) #con muestras tan pequeñas, los boxplots pueden resultar engañosos #gráficos de los datos originales, punto a punto > opar<-par(mfrow=c(2,2),mex=0.8,mar=c(3,3,2,1)+0.1) > stripchart(expend~stature) > stripchart(expend~stature,method="jitter") > stripchart(expend~stature,method="stack") > stripchart(expend~stature,method="stack",jitter=0.03) > par(opar)
  • 14. 15Sesión 7 – Introducción a la estadística básica y gráficos Tablas (1) #Una tabla debe estar en un objecto tipo matriz #Ejemplo mujeres consumo cafeína vs estado civil > caff.marital<-matrix(c(652,1537,598,242,36,46,38,21,218,327,106,67),nrow=3,byrow=T) > caff.marital [,1] [,2] [,3] [,4] [1,] 652 1537 598 242 [2,] 36 46 38 21 [3,] 218 327 106 67 > colnames(caff.marital)<-c("0","1-150","151-300",">300") > rownames(caff.marital)<-c("Married","Prev.married","Single") > caff.marital 0 1-150 151-300 >300 Married 652 1537 598 242 Prev.married 36 46 38 21 Single 218 327 106 67 #también podemos crearla a partir de variables categóricas de un dataset table(sex) sex M F 621 713 > table(sex,menarche) menarche sex No Yes M 0 0 F 369 335 > table(menarche,tanner) tanner menarche I II III IV V No 221 43 32 14 2 Yes 1 1 5 26 202
  • 15. 16Sesión 7 – Introducción a la estadística básica y gráficos Tablas (2) #podemos transponer las tablas > t(caff.marital) Married Prev.married Single 0 652 36 218 1-150 1537 46 327 151-300 598 38 106 >300 242 21 67 #para calcular las frecuencias marginales, perfiles fila, ... > tanner.sex<-table(tanner,sex) > tanner.sex sex tanner M F I 291 224 II 55 48 III 34 38 IV 41 40 V 124 204 > margin.table(tanner.sex,1) tanner I II III IV V 515 103 72 81 328 > margin.table(tanner.sex,2) sex M F 545 554 > prop.table(tanner.sex,1) sex tanner M F I 0.5650485 0.4349515 II 0.5339806 0.4660194 III 0.4722222 0.5277778 IV 0.5061728 0.4938272 V 0.3780488 0.6219512 > prop.table(tanner.sex,1)*100 sex tanner M F I 56.50485 43.49515 II 53.39806 46.60194 III 47.22222 52.77778 IV 50.61728 49.38272 V 37.80488 62.19512 > tanner.sex/sum(tanner.sex) sex tanner M F I 0.26478617 0.20382166 II 0.05004550 0.04367607 III 0.03093722 0.03457689 IV 0.03730664 0.03639672 V 0.11282985 0.18562329
  • 16. 17Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (1) #diagrama de barras > total.caff<-margin.table(caff.marital,2) > total.caff 0 1-150 151-300 >300 906 1910 742 330 > barplot(total.caff,col="white")
  • 17. 18Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (2) #diagramas de barras para una tabla de contingencia > par(mfrow=c(2,2)) > barplot(caff.marital,col="white") > barplot(t(caff.marital),col="white") > barplot(t(caff.marital),col="white",beside=T) > barplot(prop.table(t(caff.marital),2),col="white",beside=T) > par(mfrow=c(1,1))
  • 18. 19Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (3) #otro diagrama de barras para una tabla de contingencia > barplot(prop.table(t(caff.marital),2),beside=T, + legend.text=colnames(caff.marital), + col=c("white","grey80","grey50","black"))
  • 19. 20Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (4) #diagrama de sectores para una tabla de contingencia > opar<-par(mfrow=c(2,2),mex=0.8,mar=c(1,1,2,1)) > slices<-c("white","grey80","grey50","black") > pie(caff.marital["Married",],main="Married",col=slices) > pie(caff.marital["Prev.married",],main="Previously married",col=slices) > pie(caff.marital["Single",],main="Single",col=slices) > par(opar)