1. El uso del sofware R en la probabilidad y estadística
Introduction to Probability Simulation and Gibbs Sampling with R (Eric
A. Suess Bruce E. Trumbo)
Gabriel Cervantes
Verano 2010
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 1 / 16
2. Qué es R?
R es un software abierto muy poderoso
Tiene muchas ventajas:
Es gratis
Es fácil
Es intuitivo
La investigación se mueve hacia R
Existen comunidades que comparten códigos en R
Bibliografía abundante en WEB
Se pueden cambiar parámetros con facilidad
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 2 / 16
3. Sitios interesantes (La mejor información)
http://cran.r-project.org/
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 3 / 16
4. Sitios interesantes (La mejor información)
http://cran.r-project.org/
http://learnr.wordpress.com/2009/03/29/
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 3 / 16
5. Sitios interesantes (La mejor información)
http://cran.r-project.org/
http://learnr.wordpress.com/2009/03/29/
http://www.r-bloggers.com/
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 3 / 16
6. Sitios interesantes (La mejor información)
http://cran.r-project.org/
http://learnr.wordpress.com/2009/03/29/
http://www.r-bloggers.com/
http://search.twitter.com/search?q=%23rstats
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 3 / 16
7. Sitios interesantes (La mejor información)
http://cran.r-project.org/
http://learnr.wordpress.com/2009/03/29/
http://www.r-bloggers.com/
http://search.twitter.com/search?q=%23rstats
http://www.amazon.com/s/ref=nb_sb_noss?url=search-
alias%3Dstripbooks&…eld-keywords=use+R+
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 3 / 16
8. ¿Qué es la probabilidad?
Se puede argumentar en este sentido
La frecuencia promedio con que ocurre un evento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 4 / 16
9. ¿Qué es la probabilidad?
Se puede argumentar en este sentido
La frecuencia promedio con que ocurre un evento
El grado de certeza (¡?) que tenemos de que un evento ocurra.
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 4 / 16
10. ¿Qué es la probabilidad?
Se puede argumentar en este sentido
La frecuencia promedio con que ocurre un evento
El grado de certeza (¡?) que tenemos de que un evento ocurra.
La de…nición formal de probabilidad como una función
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 4 / 16
11. Nacimiento de la Probabilidad
Repetir un experimento para asignar una probabilidad
Pierre de Fermat y Blaise Pascal (1654).
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 5 / 16
12. Nacimiento de la Probabilidad
Repetir un experimento para asignar una probabilidad
Pierre de Fermat y Blaise Pascal (1654).
Bernoulli y Doctrine of Chances (1718)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 5 / 16
13. Nacimiento de la Probabilidad
Repetir un experimento para asignar una probabilidad
Pierre de Fermat y Blaise Pascal (1654).
Bernoulli y Doctrine of Chances (1718)
Thomas Simpson (1755)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 5 / 16
14. La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo en
experimento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
15. La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo en
experimento
Existen muchos tipos de experimentos
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
16. La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo en
experimento
Existen muchos tipos de experimentos
Lanzar una moneda
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
17. La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo en
experimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
18. La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo en
experimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
19. La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo en
experimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
20. La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo en
experimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
21. La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo en
experimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Dejar de jugar después que ganemos el premio mayor
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
22. La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo en
experimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Dejar de jugar después que ganemos el premio mayor
Observar el número de horas que pasa estudiando
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
23. No siempre podremos concluir el experimento
Algunas restricicones
( Mi abuelo nunca se sacó la lotería )
Nuestro experimento
puede ser muy largo
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
24. No siempre podremos concluir el experimento
Algunas restricicones
( Mi abuelo nunca se sacó la lotería )
Nuestro experimento
puede ser muy largo
Puede ser en muchas
dimensiones
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
25. No siempre podremos concluir el experimento
Algunas restricicones
( Mi abuelo nunca se sacó la lotería )
Nuestro experimento
puede ser muy largo
Puede ser en muchas
dimensiones
Puede ser destructivo
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
26. No siempre podremos concluir el experimento
Algunas restricicones
( Mi abuelo nunca se sacó la lotería )
Puede ser complicado de
Nuestro experimento observar
puede ser muy largo
Puede ser en muchas
dimensiones
Puede ser destructivo
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
27. No siempre podremos concluir el experimento
Algunas restricicones
( Mi abuelo nunca se sacó la lotería )
Puede ser complicado de
Nuestro experimento observar
puede ser muy largo El uso de R permite
Puede ser en muchas observar lo que sucedería
dimensiones
Puede ser destructivo
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
28. No siempre podremos concluir el experimento
Algunas restricicones
( Mi abuelo nunca se sacó la lotería )
Puede ser complicado de
Nuestro experimento observar
puede ser muy largo El uso de R permite
Puede ser en muchas observar lo que sucedería
dimensiones Asignamos probabilidades
Puede ser destructivo sin necesidad de repetir el
experimento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
29. Repetiremos un experimento que observó Pascal
1 Se tienen 100 canicas, de las cuales 90 son blancas y 10 son negras.
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 8 / 16
30. Repetiremos un experimento que observó Pascal
1 Se tienen 100 canicas, de las cuales 90 son blancas y 10 son negras.
2 Un amigo piensa que puede obtener las cinco canicas blancas, si toma
cinco al azar
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 8 / 16
31. Repetiremos un experimento que observó Pascal
1 Se tienen 100 canicas, de las cuales 90 son blancas y 10 son negras.
2 Un amigo piensa que puede obtener las cinco canicas blancas, si toma
cinco al azar
3 Otro amigo piensa que es más probable que obtenga al menos una
canica negra, si toma cinco al azar
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 8 / 16
32. Repetiremos un experimento que observó Pascal
1 Se tienen 100 canicas, de las cuales 90 son blancas y 10 son negras.
2 Un amigo piensa que puede obtener las cinco canicas blancas, si toma
cinco al azar
3 Otro amigo piensa que es más probable que obtenga al menos una
canica negra, si toma cinco al azar
4 ¿Quién piensas que tiene la razón?
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 8 / 16
33. El comando para obtener una muestra de 5 de 100 canicas
Las canicas 91-100 son negras
sample(1:100, 5)
Tenemos una muestra de100 objetos. Tomamos 5 al azar
repl=T repl=F
Estos dos comandos sirven para tomar muestras con remplazo o sin
remplazo
Por default se toman sin remplazo
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 9 / 16
34. Describe la función que tienen los siguiente comando en R
1 pick = c(17, 43, 36, 99, 84)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 10 / 16
35. Describe la función que tienen los siguiente comando en R
1 pick = c(17, 43, 36, 99, 84)
2 (pick <= 90)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 10 / 16
36. Describe la función que tienen los siguiente comando en R
1 pick = c(17, 43, 36, 99, 84)
2 (pick <= 90)
3 sum(pick <= 90)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 10 / 16
37. Nos interesa calcularP (X = 5)
Usaremos 100, 000 muestras
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 11 / 16
38. Nos interesa calcularP (X = 5)
Usaremos 100, 000 muestras
Contaremos cuántas de esas muestras tienen todas las canicas blancas
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 11 / 16
39. Nos interesa calcularP (X = 5)
Usaremos 100, 000 muestras
Contaremos cuántas de esas muestras tienen todas las canicas blancas
Encontraremos la proporción de las muestras con todas las canicas
blancas
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 11 / 16
40. Nos interesa calcularP (X = 5)
Usaremos 100, 000 muestras
Contaremos cuántas de esas muestras tienen todas las canicas blancas
Encontraremos la proporción de las muestras con todas las canicas
blancas
Esto nos dará una probabilidad del evento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 11 / 16
41. set.seed(1237)
numeric(m)
good = numeric(m)
m = 100000
good = numeric(m)
for (i in 1:m)
{
pick = sample(1:100, 5) # vector of 5 items from ith box
good[i] = sum(pick <= 90) # number Good in ith box
}
mean(good == 5)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 12 / 16
42. ¿Cuántos estudiantes tiene tu clase?
¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
43. ¿Cuántos estudiantes tiene tu clase?
¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes
25
2
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
44. ¿Cuántos estudiantes tiene tu clase?
¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes
25
2
Se requieren 367 personas para garantizar que suceda al menos una
coincidencia
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
45. ¿Cuántos estudiantes tiene tu clase?
¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes
25
2
Se requieren 367 personas para garantizar que suceda al menos una
coincidencia
Simplicando el problema
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
46. ¿Cuántos estudiantes tiene tu clase?
¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes
25
2
Se requieren 367 personas para garantizar que suceda al menos una
coincidencia
Simplicando el problema
Sin años bisiestos
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
47. ¿Cuántos estudiantes tiene tu clase?
¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes
25
2
Se requieren 367 personas para garantizar que suceda al menos una
coincidencia
Simplicando el problema
Sin años bisiestos
Cualquier periodo es igualemente probable de tener nacimientos
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
48. ¿Cuántos estudiantes tiene tu clase?
¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes
25
2
Se requieren 367 personas para garantizar que suceda al menos una
coincidencia
Simplicando el problema
Sin años bisiestos
Cualquier periodo es igualemente probable de tener nacimientos
Tenemos una muestra aleatoria
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
49. El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
50. El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)
365!
2 Se tienen (365 25 )!
casos favorables
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
51. El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)
365!
2 Se tienen (365 25 )!
casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
52. El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)
365!
2 Se tienen (365 25 )!
casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
24
4 Pr (NoCoincidencia) = ∏ (1 i
365 ) = 0.4313
i =0
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
53. El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)
365!
2 Se tienen (365 25 )!
casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
24
4 Pr (NoCoincidencia) = ∏ (1 i
365 ) = 0.4313
i =0
5 1 Pr (NoCoincidencia) = 1 0.4313 = 0.5687
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
54. El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)
365!
2 Se tienen (365 25 )!
casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
24
4 Pr (NoCoincidencia) = ∏ (1 i
365 ) = 0.4313
i =0
5 1 Pr (NoCoincidencia) = 1 0.4313 = 0.5687
6 En R:
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
55. El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)
365!
2 Se tienen (365 25 )!
casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
24
4 Pr (NoCoincidencia) = ∏ (1 i
365 ) = 0.4313
i =0
5 1 Pr (NoCoincidencia) = 1 0.4313 = 0.5687
6 En R:
7 prod((365:(365-24))/365)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
56. ¿Qué crees que sucederá si n aumenta?
Dónde alcanza p=1?
¿
n = 1:60
p = numeric(60)
for (i in n)
{
q = prod(1 - (0:(i-1))/365) # P(No match) if i people in room
p[i] = 1 - q
}
plot(n, p) # plot of p against n
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 15 / 16
57. El comando Plot
p vs n
1.0
0.8
0.6
p
0.4
0.2
0.0
0 10 20 30 40 50 60
n
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 16 / 16