Distribuciones de probabilidad con ejemplos
Upcoming SlideShare
Loading in...5
×
 

Distribuciones de probabilidad con ejemplos

on

  • 34,047 views

 

Statistics

Views

Total Views
34,047
Views on SlideShare
34,047
Embed Views
0

Actions

Likes
8
Downloads
540
Comments
1

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft Word

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Distribuciones de probabilidad con ejemplos Distribuciones de probabilidad con ejemplos Document Transcript

  • Distribuciones de probabilidadLa inferencia estadística consiste en extraer una manera de una población yanalizar sus datos con el propósito de aprender acerca de ello. Muchas veces setiene un conocimiento superficial de la función de masa de probabilidad o de lafunción de densidad de probabilidad de la población. En estos casos la funciónde masa o de densidad de probabilidad se aproxima mediante una de muchasfamilias comunes de curvas o funciones. En este capitulo se describen algunasde estas funciones comunes y las condiciones en que es apropiado utiliza cadauna.Distribución Bernoulli.En teoría de probabilidad y estadística, la distribución de Bernoulli (odistribución dicotómica), nombrada así por el matemático y científicosuizo Jakob Bernoulli, es una distribución de probabilidad discreta, que tomavalor 1 para la probabilidad de éxito ( ) y valor 0 para la probabilidad de fracaso( ).Si es una variable aleatoria que mide "número de éxitos", y se realiza unúnico experimento con dos posibles resultados (éxito o fracaso), se diceque la variable aleatoria se distribuye como una Bernoulli de parámetro .La fórmula será:Su función de probabilidad viene definida por: Ejemplos: 1. Cuando se lanza un dado hay una probabilidad de 1/6 de que salga 6 x=1 si el dado cae seis y X =0 en cualquier otro caso (cual es la distribución de X?Solución:La probabilidad de éxito es P(X=1) 0 1/6 por lo que X Bernoulli (6)
  • 2. 10% de los componentes fabricados mediante determinado proceso esta defectuoso se selecciona un componente. Sea X=1 si el componente esta defectuoso y X=0 en cualquier otro caso (cual es la distribución de x?.Solución:La probabilidad de éxito es p= P(X=1) 0.1 por lo que X Bernoulli _(0.1) 3. Cuando se aplica cierto Barniz a una superficie de cerámica 5% es la probabilidad de que se decolore. 20% de que se agriete, y el 23% de que se decolore o no se agriete. O ambas . Sea X =1 si se produce una decoloración y X =0 en cualquier otro caso. Y =1 si hay alguna grieta y Y =0 en cualquier otro caso. Z=1 si hay decoloración o grieta, o ambas y Z =0 en cualquier otro caso a) Sea P x la probabilidad de éxito de X. determine PX. b) Sea Py la probabilidad de éxito de Y. determine PY. c) Sea Pz la probabilidad de éxito de Z determine Pz d) Es posible que X y Y sea igual a Z.Solución. 1. 0.05 2. 0.20 3. 0.23 4. Si 4. Cuando se lanza al aire una moneda hay una probabilidad de 0.5 de que caiga en “cara”. Sea X=1 si la moneda cae en “cara” y X =0 si cae en “Cruz”. ¿Cuál es la distribución X?Solución:Puesto que X=1 cuando cae “cara”. Esta es resultado de éxito. La probabilidad de éxitop(X=1). Es igual a 0.5. Por tanto X Bernoulli (0.5)X=1 5. Un jugador de Básquetbol esta a punto de tirar hacia la parte superios del tablero. La probabilidad de anote el tiro es de 0.55 a). sea X=1. S anota el tiro si no lo hace X=0 determine la media ya la varianza de X Solución: a) M= 0.55 V= 0.2475
  • Distribución BinomialLa distribución binomial es una distribución de probabilidad discreta quemide el número de éxitos en una secuencia de n ensayos de Bernoulliindependientes entre sí, con una probabilidad fija p de ocurrencia del éxitoentre los ensayos.Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo sonposibles dos resultados. A uno de estos se denomina éxito y tiene unaprobabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p.En la distribución binomial el anterior experimento se repite n veces, de formaindependiente, y se trata de calcular la probabilidad de un determinado númerode éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución deBernoulli.Características analíticasSu función de probabilidad esDondeSiendo las combinaciones de en ( elementos tomadosde en )EjemploSupongamos que se lanza un dado 50 veces y queremos la probabilidad de queel número 3 salga 20 veces. En este caso tenemos una X ~ B(50, 1/6) y laprobabilidad sería P(X=20):
  • Ejemplos: 1. Sea x~Bin(8,0.4) Determine:X P0 0.01679616 a) 0.209018881 0.08957952 b) 0.232243202 0.20901888 c) 0.089579523 0.27869184 d) 0.007865324 0.23224320 e) 3.25 0.12386304 f) 1.926 0.041287687 0.007864328 0.00065536 1 2. Si se toma una muestra de cinco elementos de una población grande en la cual 10% de los elementos esta defectuoso.X P0 0.59049 a) 0.000011 0.32805 b) 0.072902 0.07290 c) 0.590493 0.00810 d) 0.000454 0.000455 0.00001 1 3. Se lanza una moneda 10 veces.X P0 0.000976562 a) 0.1171875001 0.009765625 b) 52 0.043945312 c) 2.53 0.117187500 d) 1.574 0.2050781255 0.2460937506 0.2050781257 0.1171875008 0.0439453129 0.00976562510 0.000976562 0.999999997
  • 4. En un cargamento grande de llantas de automóvil, 5% tiene cierta imperfección. Se elige aleatoriamente cuatro llantas para instalarlas en el automóvilX P0 0.773780937 a)0.0000059371 0.162901250 b) 0.1629012502 0.012860625 c) 0.7737809373 0.0004512504 0.000005937 0.999999997 5. En un patrón aleatorio de ocho bits utilizado para probar un microcircuito, cada bit tiene la misma probabilidad de ser 0 o 1. Supongamos que los valores de los bits son independientes. a). ¿Cual es la probabilidad de que todos los bits sean 1? B). ¿Cual es la probabilidad de que exactamente tres de los bits sean 1? Solución: 1. 0.0039 2. 0.02188
  • Distribución de PoissonLa función de masa de la distribución de Poisson esDonde: k es el número de ocurrencias del evento o fenómeno (la función nos da la probabilidad de que el evento suceda precisamente k veces). λ es un parámetro positivo que representa el número de veces que se espera que ocurra el fenómeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo de distribución de Poisson con λ = 10×4 = 40. e es la base de los logaritmos naturales (e = 2,71828 ...)Tanto el valor esperado como la varianza de una variable aleatoria condistribución de Poisson son iguales a λ. Los momentos de orden superiorson polinomios de Touchard en λ cuyos coeficientes tienen unainterpretación combinatoria. De hecho, cuando el valor esperado de ladistribución de Poisson es 1, entonces según la fórmula de Dobinski, el n-ésimomomento iguala al número de particiones de tamaño n.La moda de una variable aleatoria de distribución de Poisson con un λ no enteroes igual a , el mayor de los enteros menores que λ (los símbolos representanla función parte entera). Cuando λ es un entero positivo, las modas son λ y λ − 1.Ejemplos: 1. si X Poisson (3), calcule P(X=2), P(X=10), P(X=0), P(X=-1) y P(X=0.5)SOLUCION:Cuando se usa la funision de masa de probailiodad (4.9), con =3, se obtiene:P=(X=2)= 0.2240P=(X=10)=0.0008P=(X=0)= 0.0498P=(X=1)= OP(X=O.5)=O
  • 2. Si X Poisson (4), calcuyle P(X< 2) y P(X>1).SOLUCION:P(X< 2)= 0.2381P(X>1)= 0.9084 3. Sea X Poisson(4). Determine: 1. P(X=1) 2. P(X=0) 3. P(X<2) 4. P(X>1)SOLUCION-. 1. 0.0733 2. 0.0183 3. 000916 4. 0.9084 4.Suponga que 0.03% de los contenedores plasticos producidos en cierto procesos tiene pequeños agujeros que lso dejan inservibles. X representa el numero de contenedores en una muestra aleatoria de 10000 que tienen este defecto. Determine: 1. P(X=3) 2. P(X<3) 3. P(1<X<4)SOLUCION: 1. 0.2240 2. 0.4232 3. 0.5974
  • 5.Una ariable aletoria X tiene una distribucion binomial y una variablealeatoria Y tiene una distribucion de Poisson.Tanto X como Y tiene medias iguales a 3. ¿es posible determinar que variablealeatoria tiene la varianza mas grande? Elija una de las siguientes respuestas: a) Si, X tiene la varaianza mas grande. b) Si, Y tiene ka varianza mas grande c) No, se necesita cono cer el numerop de ensayos, n, para X d) No, se necesita conocer la probailidad de éxito, p, para X e) No, se necesita conocel el valor de para YSOLUCION: b) SI, Y tiene la varianza mas grande
  • Distribución normalLa distribución normal es, sin duda, la distribución de probabilidad másimportante del Cálculo de probabilidades y de la Estadística. Fue descubiertapor De Moivre (1773), como aproximación de la distribución binomial. De todasformas, la importancia de la distribución normal queda totalmente consolidadapor ser la distribución límite de numerosas variables aleatorias, discretas ycontinuas, como se demuestra a través de los teoremas centrales del límite. Lasconsecuencias de estos teoremas implican la casi universal presencia de ladistribución normal en todos los campos de las ciencias empíricas: biología,medicina, psicología, física, economía, etc. En particular, muchas medidas dedatos continuos en medicina y en biología (talla, presión arterial, etc.) seaproximan a la distribución normal.Junto a lo anterior, no es menos importante el interés que supone la simplicidadde sus características y de que de ella derivan, entre otras, tres distribuciones(Ji-cuadrado, t y F) que se mencionarán más adelante, de importancia clave enel campo de la contrastación de hipótesis estadísticas.La distribución normal queda totalmente definida mediante dos parámetros: lamedia (Mu) y la desviación estándar (Sigma).Campo de variación:-¥ < x < ¥Parámetros:Mu: media de la distribución, -¥ < Mu < ¥Sigma: desviación estándar de la distribución, Sigma > 0 1. EjercicioSe supone que el nivel de colesterol de los enfermos de un hospital sigue unadistribución normal con una media de 179,1 mg/dL y una desviación estándarde 28,2 mg/dL.1. Calcule el porcentaje de enfermos con un nivel de colesterol inferior a 169mg/dL.2. ¿Cuál será el valor del nivel de colesterol a partir del cual se encuentra el 10% de losenfermos del hospital con los niveles más altos?3. Represente la función de densidad.En este caso, se tendrá que ejecutar Epidat 3.1 dos veces: en el primer caso para calcularuna probabilidad, en el segundo caso el dato de entrada es una probabilidad,concretamente la cola de la derecha, lo que permitirá obtener el punto. En ambasejecuciones se ofrece, de manera opcional, la función de densidad del nivel decolesterol.
  • solucion 1. Resultados con Epidat 3.1Cálculo de probabilidades. Distribuciones continuasNormal (Mu, Sigma)Mu: Media 179,1000Sigma: Desviación estándar 28,2000Punto X 169,0000Cola Izquierda Pr[X<=k] 0,3601Cola Derecha Pr[X>=k] 0,6399Dos Colas 1-Pr[|X|<=k] 0,7202El porcentaje de enfermos con un nivel de colesterol inferior a 169 mg/dL es36%.2. Resultados con Epidat 3.1Cálculo de probabilidades. Distribuciones continuasNormal (Mu, Sigma)Mu: Media 179,1000Sigma: Desviación estándar 28,2000Cola Izquierda Pr[X<=k] 0,9000Cola Derecha Pr[X>=k] 0,1000Dos Colas 1-Pr[|X|<=k] 0,2000Punto X 215,2398A partir de 215,24 mg/dL se encuentran los valores de colesterol del 10% de losenfermos que tienen los valores más altos.
  • 3.- Los CI de 600 aspirantes de cierta universidad se distribuyenaproximadamente de forma normal con una media de 115 y una desviaciónestándar de 12. Si la universidad requiere un CI de al menos 95, ¿cuántos deestos estudiantes serán rechazados sobre esta base sin importar susotras calificaciones?Solución:P(X < 95) = Φ[(95 – 115)/12]= Φ[-1.67] = 0.0478Número de estudiantes rechazados = 600*0.0478 = 28.68 o 29 4.-La vida promedio de cierto tipo de motor pequeño es 10 años con unadesviación estándar de dos años. El fabricante reemplaza gratis todos losmotores que fallen dentro del tiempo de garantía. Si está dispuesto areemplazar sólo 3% de los motores que fallan, ¿de qué duración debeser la garantía que ofrezca? Suponga que la duración de un motor sigue unadistribución normal.Solución:µ = 10 y σ = 2P3 Área = 0.03 Φ( Z ) = 0.03 Z = -1.88x = Zσ + µ = (-1.88)(2) + 10 = 6.24 5.-Un abogado va todos los días de su casa en los suburbios a su oficina en elcentro de la ciudad. El tiempo promedio para un viaje de ida es 24 minutos, conuna desviación estándar de 3.8 minutos. Suponga que la distribución de lostiempos de viaje está distribuida normalmente.µ = 24 y σ = 3.8Solución:¿cuál es la probabilidad de que un viaje tome al menos ½ hora?P(X > 30) = 1 - Φ[(30 – 24)/3.8 ] = 1 - Φ[1.58 ] = 1 – 0.9428 = 0.0572
  • Distribución GammaLa distribución gamma se puede caracterizar del modo siguiente: si se estáinteresado en la ocurrencia de un evento generado por un proceso de Poisson demedia lambda, la variable que mide el tiempo transcurrido hasta obtener nocurrencias del evento sigue una distribución gamma con parámetros a= n´lambda (escala) y p=n (forma). Se denota Gamma.Por ejemplo, la distribución gamma aparece cuando se realiza el estudio de laduración de elementos físicos (tiempo de vida).Esta distribución presenta como propiedad interesante la “falta de memoria”.Por esta razón, es muy utilizada en las teorías de la fiabilidad, mantenimiento yfenómenos de espera (por ejemplo en una consulta médica “tiempo quetranscurre hasta la llegada del segundo paciente”).Campo de variación:0<x<¥Parámetros:a: parámetro de escala, a > 0p: parámetro de forma, p > 0Ejercicio 1El número de pacientes que llegan a la consulta de un médico sigue una distribuciónde Poisson de media 3 pacientes por hora. Calcular la probabilidad de que transcurramenos de una hora hasta la llegada del segundo paciente.Debe tenerse en cuenta que la variable aleatoria “tiempo que transcurre hasta lallegada del segundo paciente” sigue una distribución Gamma (6, 2).Solución:Cálculo de probabilidades. Distribuciones continuas Gamma.a : Escala 6,0000p : Forma 2,0000Punto X 1,0000Cola Izquierda Pr[X<=k] 0,9826Cola Derecha Pr[X>=k] 0,0174Media 0,3333Varianza 0,0556Moda 0,1667La probabilidad de que transcurra menos de una hora hasta que llegue el segundopaciente es 0,98.Ejercicio 2Suponiendo que el tiempo de supervivencia, en años, de pacientes que son sometidos auna cierta intervención quirúrgica en un hospital sigue una distribución Gamma conparámetros a=0,81 y p=7,81, calcúlese:1. El tiempo medio de supervivencia.2. Los años a partir de los cuales la probabilidad de supervivencia es menor que 0,1.
  • Solución:Cálculo de probabilidades. Distribuciones continuas Gammaa : Escala 0,8100p : Forma 7,8100Cola Izquierda Pr[X<=k] 0,9000Cola Derecha Pr[X>=k] 0,1000Punto X 14,2429Media 9,6420Varianza 11,9037Moda 8,4074El tiempo medio de supervivencia es de, aproximadamente, 10 años.Ejercicio3Si se sabe que el tiempo de sobrevivencia de ratas expuestas a un determinadotóxico es una variable aleatoria que sigue una distribución Gamma (5, 10), ¿cuáles la probabilidad de que una rata no supere las 60 semanas de vida?Solucion:Resolviendo en R, > pgamma(60, 5, scale = 10, lower.tail = T)[1] 0.7149435Su representación gráfica en ExcelEjemplo 4También en el ámbito de la siniestralidad viaria, en un estudio de la ciudad deMedellín, Colombia, se usa la distribución Gamma para obtener la distribuciónde probabilidad de la variable aleatoria “edad de fallecimiento en accidentes detráfico”. En este caso explican que se asignaron los parámetros α y “a ojo”. Elmejor resultado es el que parece minimizar los errores cuadráticos mediosdespués de varias asignaciones. Finalmente obtienen α=2,94 y =13,94.
  • Ejemplo5En un estudio de la guardia urbana de Barcelona se toma una distribucióngamma para modelizar el número de víctimas en accidentes de tráfico. Como esmás habitual la proporción de 1 ocupante por vehículo siniestrado, y es más rarala probabilidad de 4 ó 5 ocupantes por vehículo siniestrado, se crea unadistribución gamma para modelizar el número de víctimas por accidente detráfico. El 38% de la distribución lo acumula la proporción 1 accidentado poraccidente, el 36% 2:1, 16% la 3:1, 6% el 4:1 y finalmente un 3% para 5:1. Lamedia del modelo es 1,5 víctimas por accidente, pero no indican el valor de losparámetros α y β tomados en cuenta.
  • Distribución T student.Es una distribución de probabilidad que surge del problema de estimar lamedia de una población normalmente distribuida cuando el tamaño de lamuestra es pequeño.Aparece de manera natural al realizar la prueba t de Student para ladeterminación de las diferencias entre dos medias muéstrales y para laconstrucción del intervalo de confianza para la diferencia entre las medias dedos poblaciones cuando se desconoce la desviación típica de una población yésta debe ser estimada a partir de los datos de una muestra.La distribución t de Student es la distribución de probabilidad del cociente Donde  Z tiene una distribución normal de media nula y varianza 1  V tiene una distribución ji-cuadrado con grados de libertad  Z y V son independientes Si μ es una constante no nula, el cociente es una variable aleatoria que sigue la distribución t de Student no central con parámetro de no- centralidad . 1. EJEMPLO:Cual es la probabilidad de que una variable t de Student de 6 grados de libertaddeja a la izquierda de -1,45:
  • Los valores negativos no vienen en la tabla, pero según lo anterior:En la tabla encontramos:Por tanto:Con lo que obtenemos: 2. EJEMPLO:Cual es la probabilidad acumulada a la derecha de 2,45, en una variable t deStudent de 15 grados de libertad.Según lo anterior:Por la tabla tenemos que:Que sustituyéndolo en la expresión, resulta:Que da como resultado: 3. EJEMPLO:Cual es la probabilidad:Según lo anterior:
  • Buscando el valor en la tabla, tenemos que: 4. EJEMPLO:Cual es la probabilidad acumulada de una variable t de Student de 25 gradosde libertad, se encuentre entre: 0,75 y 1,25.Según lo anterior, tenemos:En la tabla las probabilidades, tenemos los valores:Sustituyendo tenemos:Realizando la operación: 5. EJEMPLO:Calcular la probabilidad acumulada a la izquierda de 0,87 de una variable tStudent de 10 grados de libertad:el valor 0,87 no viene en la tabla, pero los valores 0,85 y 0,90 sí:Según la expresión:
  • Sustituyendo los valores numéricos, tenemos:Operando:Esto es:Dando como resultado:Que es la solución al problema planteado: