Your SlideShare is downloading. ×
Cap´   ıtulo 3Modelos Discretos3.1      Vari´veis Aleat´rias Discretas             a          o3.1.1     Vari´vel Aleat´ri...
28                                      CAP´                                           ITULO 3. MODELOS DISCRETOScalculemo...
´3.3. MODELO GEOMETRICO                                                         29                    0.05                ...
30                                         CAP´                                              ITULO 3. MODELOS DISCRETOS   ...
3.4. MODELO BINOMIAL                                                                 31                     0.25          ...
32                                    CAP´                                         ITULO 3. MODELOS DISCRETOS             ...
3.5. MODELO POISSON                                                            33                      0.2                ...
34                                        CAP´                                             ITULO 3. MODELOS DISCRETOS     ...
3.7. MODELO BINOMIAL NEGATIVO                                                                  35                         ...
36                                    CAP´                                         ITULO 3. MODELOS DISCRETOS             ...
¸˜3.9. DISTRIBUICAO DE ZIPF                                                                                               ...
38                                    CAP´                                         ITULO 3. MODELOS DISCRETOSna intensidad...
ˆ3.11. REFERENCIAS                                                            39  5. No estudo de desempenho de uma centra...
Upcoming SlideShare
Loading in...5
×

Estatística: Modelos Discretos

1,851

Published on

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,851
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
44
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Transcript of "Estatística: Modelos Discretos"

  1. 1. Cap´ ıtulo 3Modelos Discretos3.1 Vari´veis Aleat´rias Discretas a o3.1.1 Vari´vel Aleat´ria a oConsidere um experimento com espa¸o amostral Ω. Uma fun¸˜o definida no c caespa¸o Ω ´ uma vari´vel aleat´ria. Em outras palavras, imagine que s ∈ Ω seja c e a oum evento simples (um resultado em um expermento aleat´rio), uma vari´vel o aaleat´ria X ´ uma fun¸ao que atribui um valor X(s) a este evento simples. Os o e c˜valores que X assume podem ser tanto discretos quanto cont´ ınuos, implicandoem vari´veis, respectivamente discretas ou cont´ a ınuas. Neste cap´ ıtulo apenas nospreocuparemos com o caso discreto. Exemplo. Arremesso de uma Moeda Dez Vezes. Considere um experi-mento no qual arremessamos uma moeda dez vezes. O espa¸o amostral Ω deste cexperimento consiste em 210 = 1024 pontos (por exemplo, HHHHHHHHHH,HTHTHTHTHT, etc.... Lembrando que H=Cara e T=Coroa). Uma poss´ ıvelvari´vel aleat´ria seria o n´ mero de caras NH assim se s = HHHHT HT T T T , a o uent˜o NH (s) = 5. Note que a fun¸ao NH toma apenas valores discretos (por a c˜exemplo, 0, 1, 2, ...).3.1.2 Fun¸˜o discreta de probabilidade caLembremos que um modelo probabil´ ıstico ´ determinado pela terna Ω, F, P , eonde Ω ´ espa¸o amostral que representa o conjunto de poss´ e c ıveis resultados paraum experimento aleat´rio, F ´ a σ-´lgebra que representa todos os poss´ o e a ıveiseventos compostos e P ´ a medida de probabilidade que atribui um valor entre e0 e 1 para cada evento, representado a chance de ocorrˆncia deste particular eevento. A defini¸ao da medida de probabilidade sobre o espa¸o amostral e, c˜ cpor conseq¨ˆncia, sobre todos os eventos compostos (por que?)1 permite que ue 1 Revise a defini¸ao a σ-´lgebra. D´ para ver que todos eventos compostos s˜o combina¸oes c˜ a a a c˜de pontos do espa¸o amostral. Se vocˆ souber o valor das probabilidades para todos eventos c esimples, vocˆ tamb´m saber´, pela simples aplica¸ao das propriedades da probabildiade, seu e e a c˜ 27
  2. 2. 28 CAP´ ITULO 3. MODELOS DISCRETOScalculemos a fun¸ao discreta de probabilidade para qualquer vari´vel aleat´ria c˜ a oX. Assim P (X = x) = P ({s : X(s) = x}). Em palavras, a probabilidade davari´vel aleat´ria X possuir valor x ´ a probabilidade do evento composto de- a o escrito por {s : X(s) = x}, ou seja, ´ a probabilidade dos pontos do espa¸o e camostral s nos quais a fun¸ao X(s), que define a vari´vel aleat´ria, tem valor c˜ a ox. Para economizar s´ ımbolos utilizaremos tamb´m P (x) significando a mesma ecoisa (note que estamos reservando letras ma´ ıusculas para representar vari´veis aaleat´rias). o Exemplo. Arremesso de uma Moeda Dez Vezes. Retornamos para o ex-emplo do experimento de arremesso de moeda dez vezes. Qual ´ a fun¸ao de e c˜probabilidade para o n´ mero de Caras em uma execu¸ao do experimento? Os u c˜eventos de interesse s˜o, porntanto, da forma {s : NH (s) = n}. Supondo que autilizamos uma moeda honesta e que os arremessos s˜o independentes, temos aque cada ponto do espa¸o amostral tem probabildidade de 1/210 . Podemos cusar an´lise combinat´ria para contarmos quantos pontos do espa¸o amostral a o ccorrespondem a cada evento de interesse. Dado n, temos que escolher, n˜o aimportando a ordem, n entre dez posi¸oes na seq¨ˆncia de arremessos para in- c˜ ueserirmos Caras. Isso equivale a combina¸oes de 10 elementos n a n, ou seja c˜2 : 10 1 P (n) = n 210para n = 0, 1, 2, 3, 4....3.1.3 Distribui¸˜es de Probabilidade coA rigor, uma distribui¸ao de probabilidades ´ uma fun¸ao crescente definida c˜ e c˜como F (x) = P (X ≤ x) para −∞ < x < ∞. Para o caso discreto utilizaremoso mesmo termo para se referir tamb´m ` fun¸ao discreta de probabilidade. e a c˜Quando falarmos de vari´veis aleat´rias cont´ a o ınuas ficar´ mais clara a necessidade ada no¸ao de distribui¸ao de probabilidade. c˜ c˜ Os modelos probabil´ısticos discretos s˜o comumente definidos em termos de adistribui¸oes de probabilidade (aqui j´ estamos nos referindo `s fun¸oes discre- c˜ a a c˜tas de probabilidade), nas pr´ximas se¸oes introduziremos v´rios deles e suas o c˜ aaplica¸oes. c˜3.2 Modelo UniformeSuponha que desejamos descrever o simples experimento de lan¸amento de um cdado honesto. A vari´vel aleat´ria de interesse ´ simplesmente o resultado do a o earremesso que chamaremos de X. Qual a distribui¸ao de probabilidade apropri- c˜ada para descrever este experiemnto? O espa¸o amostral ´ Ω = {1, 2, 3, 4, 5, 6}, c evalor para qualquer evento composto. 2 Se n˜o lembra an´lise combinat´ria, recomendo fortemente, Iezzi, G. Matem´tica Ele- a a o amentar, Vol. 5 - Combinat´ria. o
  3. 3. ´3.3. MODELO GEOMETRICO 29 0.05 0.04 0.03 P(x) 0.02 0.01 0 −5 0 5 x Figura 3.1: Fun¸ao de probabilidade uniforme discreta. c˜como o dado ´ honesto temos que P (x) = 1/6, ou seja, a fun¸ao de probabili- e c˜dade independe do particular resultado. Este tipo de distribui¸ao ´ denominada c˜ edistribui¸ao uniforme discreta. c˜ Distribui¸˜o Uniforme Discreta. ca 1 P (xj ) = , (3.1) nonde xj ´ n˜o nulo em {x1 , x2 , ..., xn }. e a ´ Exemplo.N´mero de Caras em Unico Arremesso de uma Moeda Honesta. uNeste experimento o espa¸o amostral ´ Ω = {H, T }. A vari´vel aleat´ria que c e a odescreve o n´ mero de Caras em um unico arremesso ´ NH (H) = 1 e NH (T ) = 0. u ´ eComo a moeda ´ honesta a distribui¸ao de probabilidades ´ P (xj ) = 1/2 com e c˜ exj n˜o nulo em {0, 1}. a3.3 Modelo Geom´trico eDigamos que vocˆ seja respons´vel pelos planos de manuten¸ao de dos novos e a c˜avi˜es da Embraer com sistema de aterrisagem totalmente autom´tico. Vocˆ o a efez alguns testes de laborat´rio e concluiu que com o tempo a probabilidade ode falha do sistema tende a p. Se assumirmos que o avi˜o voar´ uma vez por a adia, qual seria a distribui¸ao do intervalo de tempo transcorrido at´ a primeira c˜ efalha? A cada utiliza¸ao h´ duas possibilidades que chamaremos de 1 (funciona- c˜ amento normal) e 0 (falha). Em princ´ ıpio, nosso experimento somente precisaser repetido at´ que a primeira falha aconte¸a, assim o espa¸o amostral con- e c ctem sequencias do tipo “0”, “10”, “110”. Podemos identificar estas seq¨ encias upela posi¸ao da primeira falha, assim Ω = {1, 2, 3, 4, ...}. Note que este espa¸o c˜ c
  4. 4. 30 CAP´ ITULO 3. MODELOS DISCRETOS 0.01 0.008 0.006 P(n) 0.004 0.002 0 100 200 300 400 500 n Figura 3.2: Fun¸ao de probabilidade geom´trica com p = 0, 01. c˜ eamostral tem infinitos pontos, visto que h´ a possibilidade, infinitamente im- aprov´vel, de que uma falha nunca ocorra. Probabilidades podem ser atribu´ a ıdasa cada seq¨ˆncia da seguinte forma: a cada utiliza¸ao do sistema a probabili- ue c˜dade de uma falha ´ p e a de funcionamento ´ 1 − p, assim, a probabilidade a e eser atribu´ ao ponto do espa¸o amostral n ´ P (n) = (1 − p)n−1 p (por que?)3 , ıda c eque ´ chamada distribui¸ao geom´trica. e c˜ e Distribui¸˜o geom´trica. ca e P (n) = (1 − p)n−1 p, (3.2)onde n = 1, 2, 3, ....3.4 Modelo BinomialSuponha agora que queremos avaliar a probabilidade de em n lan¸amentos de cuma moeda obtermos, n˜o importando a ordem, k Caras. O espa¸o amostral a c´ composto por todas as seq¨ˆncias poss´e ue ıveis de comprimento n (por exemplo,se n = 4, Ω = {HHHH, HT HT, T T HH, ...}. Suponhamos que a probabilidadede obtermos uma Cara em um lan¸amento seja q (a moeda n˜o precisa neces- c asariamente ser honesta). Considerado os lan¸amentos independentes, podemos catribuir probabilidades para cada ponto do espa¸o amostral apenas contando o cn´ mero de Caras e Coroas. Procedendo dessa forma encontramos: q k (1 − q)n−k . uComo a ordem n˜o importa temos que utilizar an´lise combinat´ria para con- a a o 3 P (n) significa a probabilidade da primeira falha ocorrer na n-´sima utiliza¸ao, ou seja, e c˜primeiro ocorrem n − 1 funcionamentos normais at´ que a seq¨ˆncia ´ encerrada com uma e ue efalha.
  5. 5. 3.4. MODELO BINOMIAL 31 0.25 0.2 0.15 P(n) 0.1 0.05 0 0 5 10 15 20 nFigura 3.3: Distribui¸ao Binomial com q = 0, 5, n = 10 (tracejado) e n = 20. c˜Note a simetria e a posi¸ao da m´dia em p × n. c˜ etarmos o n´ mero de seq¨ˆncias equivalentes (com o mesmo n´ mero de Caras, u ue us´ que em outra ordem). No final obtemos: o Distribui¸˜o Binomial. ca n P (k|n, p) = q k (1 − q)n−k (3.3) kpara k = 0, 1, 2, 3, 4.... Qualquer evento independente cujo resultado possa ser classificado de apenasduas maneiras (erro ou acerto, sucesso ou falha, etc...) ´ denominado tentativa ede Bernoulli. A distribui¸ao do n´ mero k de ocorrˆncias de uma das duas c˜ u emaneiras com probabilidade q em uma seq¨ˆncia de n tentativas de Bernoulli ´ ue eBinomial P (k|n, p). Exemplo. Fornecimento de Energia. Suponha que n = 10 trabalhadoresest˜o utilizando energia el´trica de forma intermitente. Estamos interessados em a eestimar a demanda total esperada. Como uma primeira aproxima¸ao imagine c˜que a qualquer momento cada trabalhador tem exatamente a mesma probabili-dade p de requerer uma unidade de potˆncia. Se considerarmos que os trabal- ehadores atuam de forma independente teremos que a probabilidade de k delesdemandarem energia simultaneamente ser´ binomial P (k|n, p). Se, em m´dia, a eum trabalhador utilizar energia 12 minutos por hora teremos que p = 1/5.Assim, a probabilidade de sete ou mais trabalhadores demandarem energia si-multˆneamente ser´ P (7|10; 0, 2) + P (8|10; 0, 2) + P (9|10; 0, 2) + P (10|10; 0, 2) = a a0, 000864. Em outras palavras, se a potˆncia fornecida for suficiente para co- ebrir 6 trabalhadores simultaneamenente, haver´ sobrecarga com probabilidade a0, 08%, ou seja em 1 minuto em 1157, ou ainda 1 minuto em 24 horas. Exemplo. Teste de Efic´cia de Medicamentos. A taxa normal de infec¸ao a c˜
  6. 6. 32 CAP´ ITULO 3. MODELOS DISCRETOS 0.35 0.3 0.25 0.2 P(n) 0.15 0.1 0.05 0 0 5 10 15 20 nFigura 3.4: Distribui¸ao Binomial com n = 10, q = 0, 5 (tracejado) e q = 0, 1. c˜Note a assimetria do caso q = 0, 1.de determinada doen¸a ´ de 25%. Para testar um novo medicamento, o admin- c eistramos a n indiv´ ıduos. Como poder´ ıamos avaliar o resultado do experimento?Se o medicamento for totalmente in´ til a probabilidade de exatamente k in- udiv´ıduos permanecerem livres de infec¸ao ser´ P (k|n; 0, 75). Por exemplo, para c˜ ak = n = 10, a probabilidade ´ de 5, 6%. Para k = n = 12, a probabilidade ´ e ede 3, 2%. Assim, isso n˜o seja uma demonstra¸ao conclusiva, se de 10 ou 12 in- a c˜div´ıduos nenhum contrair a infec¸ao isso poderia ser visto como uma indica¸ao c˜ c˜de que o medicamento fez efeito.3.5 Modelo PoissonTomemos novamente a distribui¸ao binomial. Imaginemos que estamos interes- c˜sados em um fenˆmeno que acontece raramente com probabilidade q = λ/n, oonde λ ´ o n´ mero de ocorrˆncias em um n´ mero muito grande n → ∞ e u e ude repeti¸oes. Reexaminemos a express˜o para a distribui¸ao binomial neste c˜ a c˜regime: k n−k n λ λ lim P (k|n, q = λ/n) = lim 1−n→∞ n→∞ k n n k n−k n! λ λ = lim 1− n→∞ (n − k)!k! n n n n n − 1 n − k + 1 λk −k λ λ = lim ... 1− 1− n→∞ n n n k! n n λk −λ = e k!
  7. 7. 3.5. MODELO POISSON 33 0.2 0.15 P(k|λ) 0.1 0.05 0 0 5 10 15 20 k Figura 3.5: Distribui¸ao de Poisson com λ = 5 (tracejado) e λ = 10. c˜ Distribui¸˜o de Poisson. ca λk −λ P (k|λ) = e . (3.4) k! Exemplo.Anivers´rios. Qual ´ achance que em um grupo de 500 pessoas 2 a efa¸am anivers´rio no dia 7 de setembro. Se as 500 pessoas forem escolhidas ao c aacaso podemos imaginar 500 tentativas de Bernoulli cada uma com probabili-dade q = 1/365. Pela defini¸ao λ = nq = 500/365 = 1, 3699... A probabilidade c˜que k pessoas fa¸am anivers´rio exatamente no dia 7 de Setembro (ou em qual- c aquer dia escolhido) ´ P (k|1, 3699). Por exemplo, se k = 2, P (2|1, 3699) = 0, 24. e Exemplo.Centen´rios. Ao nascer qualquer pessoa tem uma pequena chance ade chegar aos 100 anos. Em uma comunidade grande o n´ mero de nascimentos uem um ano ´ grande. Devido a guerras, doen¸as, etc... as dura¸oes das vidas e c c˜de uma mesma gera¸ao n˜o s˜o independentes. No entanto, podemos comparar c˜ a an nascimentos a n tentativas de Bernoulli com a vida ap´s os 100 anos como osucesso. Assim a probabilidade de k pessoas chegarem a 100 anos ´ P (k|λ), com eλ dependendo do tamanho da popula¸ao e das condi¸oes de sa´ de. c˜ c˜ u3.5.1 Distribui¸˜o de Poisson no tempo caConsidere agora uma seq¨ˆncia de eventos aleat´rios ocorrendo no tempo, tais ue ocomo desintegra¸ao radioativa ou acessos a um web server. Suponha que os c˜pontos sejam distribuidos em uma linha do tempo e que estejamos preocupadoscom sua distribui¸ao (n´ mero de pontos em um intervalo de tempo definido). c˜ uSuponha adicionalmente que: 1. As condi¸oes do experimento permanecem constantes com o tempo; c˜
  8. 8. 34 CAP´ ITULO 3. MODELOS DISCRETOS 2. Intervalos de tempo que n˜o se intersectam s˜o estatisticamente indepen- a a dentes;Quando estudarmos vari´veis aleat´rias no cont´ a o ınuo poderemos tratar este casodiretamente, por hora utilizaremos a id´ia de limite. Come¸amos por dividir e cuma unidade de tempo em um n´ mero grande de intervalos n cada um com udura¸ao 1/n. Cada intervalo ou est´ vazio (falha) ou cont´m no m´ c˜ a e ınimo umponto (sucesso). A probabilidade de sucesso pn ´ a mesma para qualquer um edos intervalos. A distribui¸ao de probabilidade de k sucessos em n intervalos ´, c˜ eportanto, binomial P (k|n, pn ). Note que o n´ mero de sucessos n˜o ´ o mesmo u a eque o n´ mero de pontos em um dado intervalo, visto que um sucesso pode urepresentar mais de um ponto em um intervalo. Suponhamos ent˜o adicional- amente que a probabilidade de dois pontos ou mais ocuparem o mesmo intervalode tempo seja desprez´ conforme n → ∞. Se fixarmos o n´ mero m´dio de ıvel u esucessos por unidade de tempo como λ = npn teremos que a probabilidade de ksucessos em uma unidade de tempo ter´ distribui¸ao de Poisson P (k|λ). Nesta a c˜categoria se encaixam: n´ mero de carros passando por um ped´gio por unidade u ade tempo; n´ mero de erros de digita¸ao em uma p´gina; n´mero de chamadas u c˜ a uem um callcenter por unidade de tempo; etc...3.6 Modelo Hipergeom´trico eSuponha que em uma caixa h´ n bolas, n1 vermelhas e n2 = n − n1 pretas. aRetiramos da caixa r elementos sem reposi¸ao. Qual ´ a probabilidade de que c˜ eexatamente k deles sejam bolas vermelhas? O n´ mero total de maneiras de u nescolhermos r elementos dentre n ´e . Notemos que o grupo escolhido rtem k bolas vermelhas e r − k bolas pretas. As k bolas vermelhas podem ser n1escolhidas de formas. As r − k bolas pretas podem ser escolhidas de k n − n1 formas. Para cada escolha de bolas vermelhas pode-se escolher r−kuma das formas equivalentes de escolha das bolas pretas, assim multiplicamosas quantidades. Finalmente obtemos: Distribui¸˜o Hipergeom´trica: ca e n1 n − n1 k r−k P (k|n, n1 , r) = . (3.5) n rcom k = 0, 1, ..., min(r, n1 ). Exemplo. Controle de Qualidade. Uma f´brica produz pe¸as que s˜o em- a c abaladas em caixas com 25 unidades. Para aceitar o lote enviado por essa f´brica, ao controle de qualidade de uma empresa procede da seguinte forma. Sorteia umacaixa do lote e, em seguida, sorteia cinco pe¸as, sem reposi¸ao, dessa mesma c c˜
  9. 9. 3.7. MODELO BINOMIAL NEGATIVO 35 0.35 0.3 0.25 P(k|n,n1,r) 0.2 0.15 0.1 0.05 0 0 2 4 6 8 10 k Figura 3.6: Distribui¸ao Hipergeom´trica com n = 30, n1 = 10 e r = 10. c˜ ecaixa. Se constatar no m´ximo duas defeituosas (k ≤ 2), aceita o lote fornecido apela f´brica. Se a caixa sorteada tivesse 4 pe¸as defeituosas, qual seria a prob- a cabilidade de rejeitar o lote? A caixa pode ter pe¸as boas (bolas pretas) ou cdefeituosas (bolas vermelhas). O n´ mero total de pe¸as ´ n = 25, vamos sortear u c er = 5 e queremos saber a probabilidade do n´ mero de defeituosas n1 = 4 sendo uque obtivemos k ≤ 2 pe¸as defeituosas em nosso sorteio. Assim calculamos : c 4 21 4 21 4 21 0 5 1 4 2 3P (k ≤ 2|n, n1 , r) = + + = 0, 984. 25 25 25 5 5 5 Assim, a probabilidade de rejeitar o lote (k > 2) quando houver 4 pe¸as cdefeituosas em 25 na caixa sorteada ser´ de 0, 016 (1, 6%). a3.7 Modelo Binomial NegativoConsidere uma seq¨ˆncia de n tentativas de Bernoulli. Quantas tentativas s˜o ue anecess´rias para conseguirmos r sucessos? A probabilidade de que r sucessos aocorram ap´s r + k tentativas ´ idˆntica ` probabilidade de que k fracassos o e e aantecedam o r-´simo sucesso. Assim teremos uma seq¨ encia com r + k − 1 e utentativas com k fracassos posicionados arbitrariamente seguida por um sucesso.A distribui¸ao de probabilidade do evento “k fracassos antes do r-´simo acerto”´ c˜ e ea distribui¸ao binomial negativa denotada: c˜ Distribui¸˜o Binomial Negativa. ca r+k−1 P (k|r, p) = pr (1 − p)k . (3.6) k
  10. 10. 36 CAP´ ITULO 3. MODELOS DISCRETOS 0.08 0.07 0.06 0.05 ur 0.04 0.03 0.02 0.01 0 0 10 20 30 40 50 Numero de fosforos no outro bolso (r)Figura 3.7: Caixa de F´sforos de Banach. Distribui¸ao de f´sforos na caixa que o c˜ oainda n˜o est´ vazia. Cada caixa no come¸o tem exatos 50 f´sforos. Quando a a c oaquela que foi sorteada (bolso esquerdo ou bolso direito) se esvazia h´ exatos r af´sforos na outra caixa. Note que o mais prov´vel ´ que haja poucos f´sforos o a e otamb´m na outra caixa. A probabilidade de haver at´ 15 f´sforos no outro bolso e e o´ de 92% (como calculo isso?)epara k = 0, 1, 2, 3, 4.... Exemplo. Caixa de F´sforos de Banach. Um matem´tico sempre carrega o aconsigo uma caixa de f´sforos em seu bolso direito e uma em seu bolso esquerdo. oQuando ele quer um f´sforo, ele escolhe um bolso ao acaso. A seq¨ˆncia de bol- o uesos ´, portanto, uma seq¨ˆncia de tentativas de Bernoulli com p = 1/2. Suponha e ueque cada caixa inicialmente contenha N f´sforos e considere o momento no qual onosso matem´tico descobre que uma das caixas est´ vazia. Neste mesmo mo- a amento a outra caixa cont´m 0, 1, 2, ..., N f´sforos com probabilidade ur . Qual ´ e o eessa probabilidade? Digamos que “sucesso”signifique escolher o bolso esquerdo.O bolso esquerdo estar´ vazio no momento em que o bolso direito contiver ex- aatamente r f´sforos se, e somente se, exatametne N − r falhas (bolso direito) oprecederem o sucesso de n´ mero N + 1. A probabilidade disso acontecer ser´ u aP (N − r|N + 1, 1/2). A mesma coisa vale para o outro bolso assim: 2N − r ur = 2P (N − r|N + 1, 1/2) = 2−2N +r . N3.8 Modelo MultinomialA distribui¸ao binomial pode ser generalizada para o caso de n tentativas inde- c˜pendentes onde cada tentativa pode resultar em r diferentes resultados. Cadaresultado Ei ocorre com probabilidade pi . Assim p1 + p2 + ... + pr = 1. A
  11. 11. ¸˜3.9. DISTRIBUICAO DE ZIPF 37 8 10 Linux reuse data SunOS reuse data 10 7 Mac OS X reuse data 6 10 5 10 Number of uses 4 10 3 10 2 10 1 10 0 10 0 1 2 3 4 5 6 7 8 10 10 10 10 10 10 10 10 10 Subroutines ordered by use frequency (n)Figura 3.8: Distribui¸ao de Zipf para reutiliza¸ao de c´digo nos sistemas Linux, c˜ c˜ oMacOS e SunOS (referˆncias versus ranking). Esta figura foi extra´ de Veld- e ıdahuizen,T.L., Software Libraries and Their Reuse: Entropy, Kolmogorov Com-plexit and Zipf’s Law, cs.SE/0508023.probabilidade de que em n tentativas E1 ocorra k1 vezes, E2 ocorra k2 vezes eassim por diante ´: e Distribui¸˜o Multinomial. ca n! P (k1 , k2 , ..., kr |p1 , p2 , ..., pr ) = pk1 pk2 ...pkr . r (3.7) k1 !k2 !...kr ! 1 2com k1 + k2 + ... + kr = n. Exemplo.Jogando Doze Dados. Se jogarmos 12 dados, qual ´ a probabil- eidade de obtermos cada face 2 vezes? Aqui E1 ,...E6 representam as seis facesdos dados. Queremos saber P (2, 2, 2, 2, 2, 2|1/6, ..., 1/6). Utilizando o modelomultinomial teremos (12!)(2)−6 (6)−12 = 0, 0034.3.9 Distribui¸˜o de Zipf caA distribui¸ao de Zipf ´ definida como: c˜ e Distribui¸˜o de Zipf. ca k −s P (k|s, N ) = N . (3.8) n=1 n−s A distribui¸ao de Zipf (tamb´m conhecida como lei de potˆncia) aparece nos c˜ e elugares mais variados: nas palavras em uma l´ıngua, nas seq¨ˆncias de DNA, ue
  12. 12. 38 CAP´ ITULO 3. MODELOS DISCRETOSna intensidade de terremotos, na popularidade de links na internet, na dis-tribui¸ao de renda dos 3% mais ricos, no n´ mero de amigos no Orkut, nomes c˜ unuma popula¸ao, popula¸ao de cidades, tempo transcorrido nas trocas de car- c˜ c˜tas (ou emails), utiliza¸ao de palavras chave em um site de busca, tamanho de c˜extin¸oes em massa de esp´cies, tamanho de grandes flutua¸oes de pre¸os na c˜ e c˜ cbolsa, cita¸oes de artigos cient´ c˜ ıficos, etc... A caracter´ ıstica mais evidente da distribui¸ao de Zipf ´ o fato de n˜o haver c˜ e aum valor t´ ıpico (isso mesmo, a m´dia n˜o existe !). Assim quando observamos e aum modelo usual temos uma varia¸ao mas h´ um tamanho t´ c˜ a ıpico (por exemplo,n˜o vemos ningu´m com 10 metros de altura, todo mundo mede algo em torno a ede 1,60 m ou 1,70m). Em mundo onde a altura das pessoas fosse regida peladistribui¸ao de Zipf, ver´ c˜ ıamos eventualmente (seriam raros, mas ver´ ıamos) pes- ´soas com 10 m, ou 100 m, ou mesmo 1 km de altura! E claro que a altura daspessoas n˜o ´ um bom exemplo. Mas o n´ mero de amigos no Orkut certamente a e usegue um modelo de Zipf (verifique).3.10 Exerc´ ıcios 1. Uma moeda viciada tem probabilidade de Cara igual a 0,4. Para dois lan¸amentos independentes dessa moeda, estude o comportamento da c vari´vel n´ mero de Caras e fa¸a um gr´fico de sua fun¸ao de distribui¸ao. a u c a c˜ c˜ 2. Uma vari´vel aleat´ria X tem a seguinte fun¸ao de distribui¸ao: a o c˜ c˜   0  se x < 10;  0, 2 se 10 ≤ x < 12;   F (x) = 0, 5 se 12 ≤ x < 13;  0, 9 se 13 ≤ x < 25;    1 se x ≥ 25.  Determine: (a) A fun¸ao de probabilidade de X; (b) P (X ≤ 12); (c) c˜ P (X < 12); (d) P (12 ≤ X ≤ 20); (e) P (X > 18). 3. Um usu´rio de transporte coletivo chega pontualmente `s 8 horas para a a pegar o seu ˆnibus. Devido ao trˆnsito ca´tico, a demora pode ser qualquer o a o tmpo entre 1 e 20 minutos (assuma que a unidade m´ ınima relevante para o tempo ´ 1 minuto). Pergunta-se: (a) Qual ´ a probabilidade de demorar e e mais de 10 minutos? (b) Qual ´ a probabilidade de demorar pelo menos 5 e minutos n˜o mais que 10 minutos? (c) Qual ´ a probabilidade da demora a e n˜o chegar a 5 minutos? (d) Se um amigo chegou 10 minutos atrasado e a vai pegar o mesmo ˆnibus (que ainda n˜o passou), qual ´ a probabilidade o a e do amigo atrasado esperar at´ 3 minutos? e 4. Supondo igualdade de probabilidade entre nascimentos de cada sexo, para uma fam´ com trˆs filhos, calcule a probabilidade de que: (a) Exata- ılia e mente dois sejam do sexo masculino. (b) Pelo menos um deles seja do sexo masculino. (c) Todos sejam do sexo feminino.
  13. 13. ˆ3.11. REFERENCIAS 39 5. No estudo de desempenho de uma central de computa¸ao, o acesso ` CPU c˜ a ´ descrito por um modelo de Poisson com 4 requisi¸oes a cada segundo. e c˜ Essas requisi¸oes podem ser de v´rias naturezas tais como: imprimir um c˜ a arquivo, efetuar um c´lculo ou enviar uma mensagem pela internet, entre a outras. (a) Escolhendo-se ao acaso um intervalo de 1 segundo, qual ´ ae ` probabilidade de haver mais de 2 acessos A CPU? E do n´ mero de acessos u ultrapassar 5? (b) considerando agora o intervalo de 10 segundos, tamb´m e escolhido ao acaso, qual ´ a probabilidade de haver 50 acessos? e 6. Um livreiro descuidado mistura 4 exemplares defeituosos junto com out- ros 16 perfeitos de um certo livro did´tico. Quatro amigas v˜o a essa a a livraria para comprar seus livros escolares. (a) Calcule a probabilidade de 3 levarem livros defeituosos. (b) Qual ´ a probabilidade de, ap´s a visita e o dessas meninas,restarem o mesmo n´ mero de defeituosso na livraria? E u de n˜o restar nenhum? a 7. Uma vacina contra a gripe ´ eficiente em 70% dos casos. Sorteamos, ao e acaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter: (a) Pelo menos 18 imunizados. (b) No m´ximo 4 imunizados. (c) N˜o a a mais do que 3 n˜o imunizados. a 8. Uma linha de produ¸ao est´ sendo analisada para efeito de controle da c˜ a qualidade das pe¸as produzidas. Tendo em vista o alto padr˜o requerido, a c a produ¸ao ´ interrompida para regulagem toda vez que uma pe¸a defeituosa c˜ e c ´ observada . Se 0,01 ´ a probabilidade da pe¸a ser defeituosa, estude o e e c comportamento da vari´vel Q, quantidade de pe¸as boas produzidas antes a c da primeira defeituosa.3.11 Referˆncias eSe quiser fazer mais exerc´ ıcios procure por (todos os exerc´ ıcios do texto foramextra´ ıdos de l´): a • Magalh˜es M.N., de Lima A.C.P., No¸oes de Probabilidade e Estat´ a c˜ ıstica, Edusp,2004. Exemplos foram extra´ ıdos de: • Feller, W. An introduction to Probability Theory and Its Applications, Volume I, John Wiley & Sons, 1950. • DeGroot, M., Probability and Statistics, Addison-Wesley, 1975. Livros de divulga¸ao cient´ c˜ ıfica relacionados ` lei de Zipf: a • Bak, P., How Nature Works, Oxford University Press, 1996. • Buchanan, M., Ubiquity, Crown Publishers, 2001.

×