• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Estatística: Probabilidade
 

Estatística: Probabilidade

on

  • 760 views

 

Statistics

Views

Total Views
760
Views on SlideShare
760
Embed Views
0

Actions

Likes
0
Downloads
7
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Estatística: Probabilidade Estatística: Probabilidade Document Transcript

    • Cap´ ıtulo 2Probabilidade2.1 Probabilidades F´ ısicasA id´ia de probabilidades est´ associada tanto com racioc´ e a ınio indutivo e jul-gamentos tais como “Provavelmente Jo˜o ´ feliz”ou “Vocˆ provavelmente ser´ a e e aaprovado em Estat´ ıstica”, quanto a experimentos f´ ısicos repetitivos tais como oarremesso de uma moeda ou de um dado. Nesta se¸ao apresentamos a segunda c˜alternativa: as probabilidades f´sicas. ı2.1.1 Espa¸o amostral cDenominamos fenˆmeno aleat´rio ` situa¸ao ou acontecimento que n˜o pode o o a c˜ aser previsto com certeza. Por exemplo, quando arremessamos uma moeda -honesta ela pode cair com a face Cara (H) ou Coroa (T) voltada para cima(´ claro que simplificamos, ignorando o caso raro em que ela fica de p´ !). e eAssim o arremesso de uma moeda ´ um evento aleat´rio. Da mesma maneira e onosso tempo de vida, o decaimento radioativo ou o resultado da loteria tamb´m es˜o fenˆmenos aleat´rios. Os resultados de um experimento envolvendo um a o ofenˆmeno aleat´rio s˜o chamados eventos. Fazemos ainda a distin¸ao entre o o a c˜eventos compostos e eventos simples. Por exemplo, se dissermos que o arremessode dois dados resultou em “soma=6”isso ser´ equivalente a dizermos que o aresultado do experimento foi “(1, 5) ou (2, 4) ou (3, 3) ou (4, 2) ou (5, 1)”. Ouseja podemos decompor o evento composto {soma = 6} em um conjunto comcinco eventos simples {(1, 5)ou(2, 4)ou(3, 3)ou(4, 2)ou(5, 1)}. Os eventos simpless˜o os resultados poss´ a ıveis de um experimento idealizado. Cada resultado desteseventos simples ´ representado por um ponto em um espa¸o denominado espa¸o e c camostral Ω (ˆmega). o2.1.2 Exemplos1. Distribui¸˜o de trˆs bolinhas distingu´ ca e ıveis (a,b e c) em trˆs caixas edistingu´ ıveis. Todos os arranjos poss´ ıveis s˜o representados na tabela abaixo: a 13
    • 14 CAP´ ITULO 2. PROBABILIDADE 1. {abc| − |−} 10. {a|bc|−} 19. {−|a|bc} 2. {−|abc|−} 11. {b|ac|−} 20. {−|b|ac} 3. {−| − |abc} 12. {c|ab|−} 21. {−|c|ab} 4. {ab|c|−} 13. {a| − |bc} 22. {a|b|c} 5. {ac|b|−} 14. {b| − |ac} 23. {a|c|b} 6. {bc|a|−} 15. {c| − |ab} 24. {b|a|c} 7. {ab| − |c} 16. {−|ab|c} 25. {b|c|a} 8. {ac| − |b} 17. {−|ac|b} 26. {c|a|b} 9. {bc| − |a} 18. {−|bc|a} 27. {c|b|a} Cada um dos 27 arranjos na tabela corresponde a um evento simples, ouseja, a um ponto no espa¸o amostral. O eventoA =“uma caixa ´ ocupada por c emais de uma bolinha”´ realizado pela uni˜o dos pontos de 1 a 21, ou seja, o e aevento A ´ o agregado dos pontos amostrais de 1 a 21. De forma semelhante o eevento composto B =“a primeira caixa n˜o est´ vazia”´ formado pelos pontos a a eamostrais 1, 4 a 15 e 22 a 27. Podemos ainda combinar eventos definindo umevento C =“tanto A quanto B ocorrem”. Pense um pouco no que seria esteevento 1 . E o evento D =“ou A ou B ocorrem”? 2 . E o evento E =“An˜o ocorre”? 3 . O que dizer ent˜o do evento F =“primeira caixa vazia e a anenhuma caixa com mais de uma bolinha”? 4 Apesar deste exemplo referir-seespecificamente a 3 bolas em 3 caixas, poder´ ıamos igualmente falar de r bolsaem n caixas. O mesmo modelo b´sico pode ser empregado em outras stua¸oes. a c˜Por exemplo: Anivers´rios. Os poss´ a ıveis anivers´rios de r pessoas s˜o exatamente an´logos a a aa r bolas em n = 365 caixas. Acidentes. A classifica¸ao de r acidentes de acordo com o dia da semana em c˜que eles ocorrer˜o ´ equivalente ` distribui¸ao de r bolas em n = 7 caixas. a e a c˜ Amostragem. A classifica¸ao de r pessoas de acordo com sua idade ou c˜profiss˜o ´ equivalente a aloca¸ao de r bolas em um n´ mero n de caixas (uma a e c˜ upara cada classe). Irradia¸ao em biologia. Para estudarmos o efeito da radia¸ao sobre os cro- c˜ c˜mossomos imaginamos que cada cromossomo corresponda a uma caixa e cadapart´ıcula α (alfa) irradiada corresponda a uma bola. Dados. As possibilidades de resultado no arremesso de r dados correspondea r bolas em n = 6 caixas. Erros de impress˜o. As poss´ a ıveis distribui¸oes de r erros de impress˜o em n c˜ ap´ginas podem ser interpretadas como r bolas em n caixas. a 2. Distribui¸˜o de trˆs bolinhas indistingu´ ca e ıveis em trˆs caixas dis- etingu´ ıveis. Neste caso temos os seguintes arranjos poss´ ıveis: 1C = {1, 4, 5, ..., 15} 2D ocorre com certeza j´ que cont´m todos os pontos do espa¸o amostral Omega a e c 3 E = {22, 23, 24, 25, 26, 27} 4 F ´ imposs´ e ıvel, assim, F = ∅.
    • 2.1. PROBABILIDADES F´ ISICAS 15 1. {∗ ∗ ∗| − |−} 6. {∗| ∗ ∗|−} 2. {−| ∗ ∗ ∗ |−} 7. {∗| ∗ ∗|−} 3. {−| − | ∗ ∗∗} 8. {−| ∗ ∗|∗} 4. {∗ ∗ | ∗ |−} 9. {−| ∗ | ∗ ∗} 5. {∗ ∗ | − |∗} 10. {∗| ∗ |∗}O espa¸o amostral Ω tem estrutura diferente, se utilizamos o modelo com bolin- chas distingu´ıveis ou indistingu´ıveis ir´ depender do particular problema que aestivermos analisando. 3. Amostragem. Suponha que quiramos estimar quantas pessoas fumamutilizando uma amostra com 100 pessoas. A unica propriedade da amostra que ´ ´ edo nosso interesse ´ o n´ mero x de fumantes. O espa¸o amostral Ω ´ constituido e u c epor 101 pontos x = 0, 1, ..., 100. Cada observa¸ao ´ descrita completamente c˜ eespecificando x. Um evento composto seria, neste caso, algo como “a maioriadas pessoas fuma”consistindo do conjunto x = 51, 52, ...100. 4. Arremessos de moedas. Para um experimento de arremesso de moedastrˆs vezes o espa¸o amostral Ω consiste de oito pontos e c {HHH, HHT, HT H, T HH, HT T, T HT, T T H, T T T }, com H representando Cara e T representando Coroa.2.1.3 Eventos e a teoria de conjuntosA partir dos exemplos da se¸ao anterior ´ poss´ noter que existe uma rela¸ao c˜ e ıvel c˜´ıntima entre eventos compostos e a teoria de conjuntos. Assim, a uni˜o entre adois eventos, A∪B, representa a ocorrˆncia de, pelo menos, um dos eventos A ou eB. A intersec¸ao entre dois eventos A∩B, representa a ocorrˆncia simultˆnea de c˜ e aA e B. Dois eventos A e B s˜o mutuamente exclusivos (ou disjuntos) quando n˜o a atˆm elementos em comum,isto ´ , quando A ∩ B = ∅. A e B s˜o complementares e e ase a uni˜o ´ o espa¸o amostral e sua intersec¸ao ´ vazia. O complementar de A a e c c˜ e´ representado por Ac e temos A ∪ Ac = Ω e A ∩ Ac = ∅.e Podemos construir uma classe de conjuntos que contenha todos os eventoscompostos, essa estrutura recebe o nome de σ-´lgebra de eventos F e ´ definida a epelas seguintes propriedades: 1. Ω ∈ F. O espa¸o amostral inteiro ´ um evento composto. c e 2. Se A ∈ F ent˜o Ac ∈ F. Se A ´ um evento, seu complementar A, ou seja, a e n˜o ocorrer A, tamb´m ´ um evento. a e e 3. Se Ai ∈ F ent˜o ∞ Ai ∈ F. Se Ai s˜o eventos ent˜o A1 ou A2 ou ...An a i=1 a a tamb´m ´ um evento para qualquer n. e e2.1.4 Axiomas de KolmogorovConforme desenvolvida por Komogorov (1903-1987), a teoria de probabilidadescl´ssica n˜o se preocupa em determinar como seu valor num´rico deve ser deter- a a e
    • 16 CAP´ ITULO 2. PROBABILIDADEminado mas sim com suas propriedades gerais. De forma semelhante ` geome- atria, estabelecem-se propriedades b´sicas que a medida de probabilidade P (.) adeve obedecer. Estas (trˆs) propriedades s˜o conhecidas como os Axiomas de e aKolmogorov: 1. P (A) ≥ 0. A probabilidade ´ um n´ mero n˜o-negativo. e u a 2. P (Ω) = 1. O espa¸o amostral cont´m todas os poss´ c e ıveis resultados do experimento, assim ´ um evento certo. e 3. P ( ∞ Ai ) = i=1 P (Ai ) se Ai , Aj ∈ F e Ai ∩ Aj = ∅, i = j. Se dois i=1 ∞ eventos A1 e A2 s˜o mutuamente exclusivos ent˜o a probabilidade de A1 a a ou A2 ´ igual a probabilidade de A1 somada ` probabilidade de A2 . O e a mesmo vale para qualquer n´ mero de eventos mutuamente exclusivos. u Um par de propriedades das medidas de probabilidade s˜o corol´rios imedi- a aatos dos Axiomas de Kolmogorov: Propriedade 1. Como A ∪ Ac = Ω, o axioma 2, implica em P (A ∪ Ac ) = 1.J´ o axioma 3 implica em P (A) + P (Ac ) = 1, ou seja, a P (Ac ) = 1 − P (A). (2.1) Propriedade 2. Da teoria de conjuntos temos que A ∪ B = (A ∩ B c ) ∪ (A ∩B) ∪ (Ac ∩ B). Onde A ∩ B c , A ∩ B e Ac ∩ B s˜o mutuamente exclusivos (por aque ?) 5 , pelo axioma 3 temos que P (A ∪ B) = P (A ∩ B c ) + P (A ∩ B) + P (Ac ∩ B). Mas A = (A ∩ B c ) ∪ (A ∩ B) e B = (Ac ∩ B) ∪ (A ∩ B) (por que?). 6 Assim P (A) = P (A ∩ B c ) + P (A ∩ B)e P (B) = P (Ac ∩ B) + P (A ∩ B), onde utilizamos novamente o axioma 3. Substituindo estas express˜es na oequa¸ao acima: c˜ P (A ∪ B) = P (A) + P (B) − P (A ∩ B). (2.2) Exemplo. Uma moeda ´ arremessada duas vezes. O espa¸o amostral ´, e c eportanto, Ω = {HH, HT, T H, T T }. Se assumirmos que a moeda ´ honesta e 5 O primeiro conjunto contem pontos do espa¸o amostral que pertencem a A e n˜o per- c atencem a B, o segundo conjunto contem pontos que pertencem a A e a B e o terceiro conjuntocontem pontos que n˜o pertencem a A e pertencem a B. Um ponto n˜o pode pertencer e n˜o a a apertencer a B simultaneamente, assim os dois primeiros s˜o disjuntos. Um ponto n˜o pode a aperntencer e n˜o pertencer a A simultanamente, assim o terceiro conjunto ´ disjunto aos dois a eprimeiros. Assim, os trˆs conjuntos s˜o disjuntos entre si. e a 6 (A ∩ B c ) ∪ (A ∩ B) ´ o conjunto dos pontos que pertencem a A e n˜o pertencem a B ou e aos pontos que pertencem a A e pertencem a B. Ou seja, tanto faz se pertencem ou n˜o a B, adesde que perten¸am a A. De forma equivalente no caso de B. c
    • 2.1. PROBABILIDADES F´ ISICAS 17 1atribuiremos probabilidade 4 para cada ponto do espa¸o amostral. Supon- chamos agora que A1 e A2 sejam, respectivamente, os eventos “Cara no primeiroarremesso”e “Cara no segundo arremesso”. Qual seria a probabilidade do evento“Cara no primeiro ou no segundo arremessos”? Este evento equivale a A1 ∪ A2 .Pela propriedade 2 teremos que P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) − P (A1 ∩ A2 ).Os eventos s˜o A1 = {HH, HT } e A2 = {HH, T H}, a intersec¸ao ´ A1 ∩ A2 = a c˜ e{HH}. Temos ent˜o que P (A1 ∪ A2 ) = 1 + 1 − 4 = 4 . 7 a 2 2 1 3 Dada a medida de probabilidade P (.) para cada ponto do espa¸o amostral cΩ e considerando que os eventos compostos formam uma σ-´lgebra ´ poss´ a e ıvelcalcular a probabilidade de qualquer evento composto utilizando apenas a teoriade conjuntos. Formalmente, um modelo probabil´ ıstico para um experimento ´ ecomposto da terna Ω, F, P .2.1.5 Atribuindo probabilidadesA teoria cl´ssica de probabilidades n˜o se preocupa em como valores num´ricos a a edevem ser atribu´ ıdos a pontos do espa¸o amostral. A determina¸ao da medida c c˜de probabilidades depende de considera¸oes f´c˜ ısicas sobre o fenˆmeno aleat´rio o oou da suposi¸ao de que ´ poss´ c˜ e ıvel repetir o experimento infinitas vezes nasmesmas condi¸oes. Na pr´tica, mesmo se fosse poss´ repetir o experimento c˜ a ıvelinfinitas vezes isso isso iria requerer quantidade infinita de tempo, assim sendo, adetermina¸ao de probabilidades via infinitas repeti¸oe deve ser entendida como c˜ c˜uma idealiza¸ao. Formalmente mede-se a probabilidade f´ c˜ ısica do evento A comoum limite da raz˜o do n´ mero de ocorrˆncias de A (nA ) em um n´ mero tendendo a u e ua infinito de repeti¸oes (n), em s´ c˜ ımbolos: nA P (A) = lim . (2.3) n→∞ n Exemplos. Bolas distingu´veis. No exemplo 1 da se¸ao anterior poder´ ı c˜ ıamos,por exemplo, assumir que todos os arranjos s˜o igualmente prov´veis, ou seja, a a a 1 1probabilidade de qualquer evento simples ´ de 27 8 . Assumindo que P (Ei ) = 27 epara todo ponto Ei do espa¸o amostral, podemos calcular a probabilidade de cqualquer outro evento composto. Por exemplo, o evento A =“uma caixa ´ eocupada por mais de uma bolinha”´ composto A = 21 Ei . Como os pon- e i=1tos do espa¸o amostral s˜o, por defini¸ao, mutuamente exclusivos, temos que, c a c˜ 7 Note que neste caso simples poder´ ıamos simplesmente enumerar diretamente A1 ∪ A2 ={HH, HT, T H}. A id´ia por tr´s da dedu¸ao de propriedades ´ justamente sabermos fazer e a c˜ eo mesmo c´lculo de v´rias maneiras poss´ a a ıveis, nunca se sabe que tipo de manipula¸ao temos c˜que fazer para resolver cada novo problema. Neste sentido, teoremas funcionam como umacaixa de ferramentas para provarmos novos teoremas cada vez mais complexos. 8 Gottfried Leibniz (1646-1716) introduziu o seguinte Princ´ ıpio da Raz˜o Suficiente: Nada a´ sem raz˜o suficente para ser como ´. Para tudo h´ uma raz˜o. Laplace adaptou o o princ´e a e a a ıpiopara afirmando que devemos atribuir probabilidades idˆnticas para todos as possibilidades de eum fenˆmento aleat´rio se n˜o tivermos raz˜o alguma para que elas sejam de outra forma. o o a aNo entanto, tal princ´ıpio n˜o integra a teoria cl´ssica de probabilidades. a a
    • 18 CAP´ ITULO 2. PROBABILIDADEutilizando o axioma 3: 21 21 7 P Ei = P (Ei ) = . i=1 i=1 9 Bolas indistigu´veis: Estat´stica de Bose-Einstein. Retomemos agora o ex- ı ıemplo 2. Podemos argumentar que o experimento propriamente dito n˜o ´ a eafetado por nossa impossibilidade de distinguir as bolas. Assim, n´s con- ofundir´ıamos entre os pontos 7, 8 e 9 do espa¸o amostral de bolas indistingu´ c ıveis,atribuindo a todos trˆs o mesmo ponto 5 do espa¸o amostral de bolas indis- e ctingu´ıveis. Seguindo este racioc´ınio, somos levados a atribuir os seguintes prob-abilidades para cada um dos 10 pontos do espa¸o amostral (confira !): c 1 P (1) = 27 P (6) = 1 9 1 P (2) = 27 P (7) = 1 9 1 P (3) = 27 P (8) = 1 9 1 P (4) = 9 P (9) = 1 9 1 2 P (5) = 9 P (10) = 9 Antes de deixarmos esta sec¸ao ´ interessante enfatizar que a rela¸ao entre c˜ e c˜teoria e experimento em se tratando de probabilidades ´ intrincada. Por ex- eemplo, na pr´tica nenhuma moeda ´ totalmente honesta, ou seja, a atribui¸ao a e c˜de probabilidades idˆnticas para Cara e Coroa, P (H) = P (T ) = 1 ´ apenas e 2 euma aproxima¸ao da realidade. Para determinarmos a “verdadeira”distribui¸ao c˜ c˜de probabilidade de uma moeda precisar´ ıamos repetir seu arremesso infinitasvezes. A tabela a seguir mostra o n´ mero de Caras obtidas em seq¨ˆncias de u ue1000 arremessos. 0 − 1000 501 −2000 485 −3000 509 −4000 536 −5000 485 −6000 488 −7000 500 −8000 497 −9000 494 −10000 484As flutua¸oes observadas na tabela acima d˜o uma id´ia do tipo de dificul- c˜ a edades que se apresentam ao tentarmos medir probabilidades atrav´s da repeti¸ao e c˜de um experimento muitas vezes. Fica claro que t´cnicas mais avan¸adas s˜o e c anecess´rias, a ´rea da Estat´ a a ıstica encarregada da obten¸ao de probabilidades a c˜partir de dados ´ a Inferˆncia Estat´ e e ıstica que estudaremos com detalhes mais afrente.
    • 2.2. PROBABILIDADE CONDICIONAL 192.2 Probabilidade CondicionalSuponha uma popula¸ao de N pessoas onde NA s˜o universit´rios e NF s˜o do c˜ a a asexo feminino. O evento de que uma pessoa escolhida ao acaso seja universit´ria a´ A, o evento de que uma pessoal escolhida ao acaso seja do sexo feminino ´e eF . A probabilidade de A ´ P (A) = NA . A probabilidade de F ´ P (F ) = e N eNF N . Suponha agora que s´ olhemos para a popula¸ao feminina. O n´ mero de o c˜ umulheres universit´rias ´ NAF . A probabilidade de uma mulher ser universit´ria a e aser´ P (A|F ) = NAF , onde o s´ a NF ımbolo P (A|F ) ´ lido como a “probabilidade de eA dado F ”. De forma equivalente, escrevemos: NAF NAF /N P (A ∩ F ) P (A|F ) = = = . NF NF /N P (F ) Assim definimos a probabilidade condicional como: P (A ∩ F ) P (A|F ) = . (2.4) P (F )Por economia de s´ ımbolos trocamos, de agora em diante, P (A ∩ F ) por P (AF ). Exemplo. Amostragem sem reposi¸ao. A partir de uma popula¸ao com n c˜ c˜elementos 1, 2, ..., n tomamos uma amostra ordenada. Suponha que i e j s˜o dois aelementos diferentes. Assumindo que i ´ o primeiro elemento amostrado, qual ´ e ea probabilidade de que o segundo elemento seja j. Temos que a probabilidade desortearmos primeiro i e j ´ P (ij) = 1/n(n − 1). A probabilidade de sortearmos ei como primeiro elemento ´ P (i) = 1/n. A probabilidade de sortearmos j logo eap´s o sorteio de i ´ ent˜o P (j|i) = P (ij)/P (i) = 1/(n − 1). Isso simplesmente o e aexpressa o fato de que tinhamos primeiro n possibilidades para o sorteio, ap´s oo sorteio de i passamos a ter n − 1 possibilidades. Exemplo. Distribui¸ao de sexos. Cosidere familias com exatamente dois c˜filhos. Chamemos de b se menino e g se menina. Temos quatro possibilidades{bb, bg, gb, gg}, onde a primeira letra indica o filho mais velho (desconsideremosos gˆmeos para efeito de exemplo). Associemos a probabilidade de 1 a cad e 4ponto do espa¸o amostral. Dado que a familia j´ tem um menino, qual ´ a c a eprobabilidade de que as duas crian¸as sejam meninos ? Temos que P (b|b) = cP (bb)/P (b) = P (bb)/(P (bb) + P (bg) + P (gb)) = 1/3. No exemplo acima utilizamos a seguinte propriedade de distribui¸oes de c˜probabilidade. Propriedade 3. Eventos C1 , C2 , ..., Ck formam uma parti¸ao do espa¸o c˜ c k kamostral se Ci ∩Cj = ∅ para i = j e i=1 Ci = Ω. Assim P (A) = i=1 P (ACi ).Tente demosntrar.9 Da Propriedade 3 e da defini¸ao de probabilidades condicionais segue: c˜ 9 Se “S {Ci } representa uma parti¸ao de Ω, ent˜o A ∩ Ci s˜o eventos disjuntos e A = A ∩ Ω = ” S c˜ a a kA∩ i=1 Ci = k (A ∩ Ci ). Do axioma 3 segue a propriedade que queriamos demonstrar. i=1
    • 20 CAP´ ITULO 2. PROBABILIDADE Propriedade 4. k k P (A) = P (ACi ) = P (A|Ci )P (Ci ). i=1 i=12.3 Independˆncia Estat´ e ısticaA no¸ao de independˆncia estat´stica tem um significado f´ c˜ e ı ısico mais ou menosbem definido. Dois fenˆmenos aleat´rios s˜o independentes se o conhecimento o o ado resultado de um deles n˜o diz nada sobre o resultado do outro. Por exemplo, aa data de nascimento de Jo˜o e a temperatura em Plut˜o. Do ponto de vista da a ateoria das probabilidades dosi eventos A e B s˜o estatisticamente independentes ase P (A|B) = P (A), ou seja, a probabilidade da ocorrˆncia de A n˜o depende e ade B ter ocorrido. Usando a defini¸ao de probabilidade condicional temos que c˜ P (AB) P (A|B) = = P (A), P (B)ou seja P (AB) = P (A)P (B). (2.5). E se tivermos trˆs eventos A, B e C como podemos saber se s˜o ou n˜o inde- e a apendentes? Ser´ que basta termos P (AB) = P (A)P (B), P (AC) = P (A)P (C) ae P (BC) = P (B)P (C)? Vejamos um exemplo. Exemplo. Dois dados s˜o arremessados. Definimos trˆs eventos: A=“O re- a esultado do primeiro dado ´ ´ e ımpar”; B=“O resultado do segundo dado ´ ´ e ımpar”;C=“A soma dos dois dados ´ ´ e ımpar”. Cada um dos 36 pontos do espa¸o amostral c 1tem probabilidade 36 . Os eventos A e B s˜o independentes, visto que os dados as˜o independnetes, assim vale P (AB) = P (A)P (B). Os eventos A e C ou B e C atamb´m s˜o independentes, j´ que a ocorrˆncia da “soma ´ e a a e ımpar”(um dado pare outro ´ımpar) nada diz sobre ter sido o primeiro (A) ou o segundo (B) dado adar resultado ´ ımpar. At´ aqui tudo bem. No entanto, note que A, B e C n˜o e apodem ocorrer ao mesmo tempo. Assim, sabemos que se A e B ocorreram ent˜o aC n˜o ocorreu. Da mesma forma se soubermos A e C ou B e C, sabemos que o aterceiro evento n˜o pode ocorrer. Em outras palavras, o conhecimento de dois ados eventos determina o terceiro e P (C|AB) = P (C). Em conclus˜o, para que atrˆs (ou mais) eventos sejam independentes ´ necess´rio que seus pares e ternas e e a(ou quaisquer grupos poss´ ıveis) sejam independendentes. A defini¸ao mais geral de independˆncia ´, portanto: c˜ e e Independˆncia Estat´ e ıstica. Os eventos A1 , A2 ,...An s˜o mutuamente aindependentes se para todas as combina¸oes poss´ c˜ ıveis de ´ ındices 1 ≤ i < j <k < ... ≤ n vale P (Ai Aj ) = P (Ai )P (Aj ) P (Ai Aj Ak ) = P (Ai )P (Aj )P (Ak )
    • 2.4. TEOREMA DE BAYES 21 ... P (A1 A2 ...An ) = P (A1 )P (A2 )...P (An )2.4 Teorema de BayesTeorema de Bayes. Seja {Cj } uma parti¸ao do espa¸o amostral. Uma pro- c˜ cpriedade de grande importˆncia das probabilidades condicionais ´: a e P (H|Cj )P (Cj ) P (Cj |H) = k . (2.6) j=1 P (H|Cj )P (Cj ) Demonstra¸ao: A definic¸ao de probabilidade condicional nos permite escr- c˜ c˜ever P (Cj A) P (ACj ) P (A|Cj )P (Cj ) P (Cj |A) = = = . P (A) P (A) P (A)Utilizando a Propriedade 4 completamos a demonstra¸ao. c˜ Exemplo. Suponha que um fabricante de sorvete recebe 20% de todo o leiteque utiliza de uma fazendo F1 , 30% de uma fazenda F2 e 50% de F3 . Um ´rg˜o o ade fiscaliza¸ao inspecionou as fazendas de surpresa e observou que 20% do leite c˜produzido em F1 estava adulterado por adi¸ao de ´gua, enqunato que para F2 c˜ ae F3 , essa propor¸ao era de 5% e 2%, respectivamente. Na ind´ stria de sorvetes c˜ uos gal˜es de leite s˜o armazenados em um refrigerador sem identifica¸ao das o a c˜fazendas. Se analisarmos um gal˜o ao acaso e constatarmos que est´ adulterado a a(evento A) qual ´ a probabilidade de que o leite seja, por exemplo, proveniente eda fazenda F1 ? A probabilidade do leite ser proveniente da fazenda F1 dadoque est´ adulterado ´, segundo o teorema de Bayes: a e P (A|F1 )P (F1 ) P (F1 |A) = . P (A|F1 )P (F1 ) + P (A|F2 )P (F2 ) + P (A|F3 )P (F3 )Temos que P (A|F1 ) = 0, 2, P (A|F2 ) = 0, 05 e P (A|F3 ) = 0, 02. Temos tamb´m eque P (F1 ) = 0, 2, P (F2 ) = 0, 3 e P (F3 ) = 0, 5. Fazendo as contas chegamos aP (F1 |A) = 0, 615.2.5 Probabilidades Subjetivas2.5.1 Atualizando cren¸as com a f´rmula de Bayes c oNo come¸o deste cap´ c ıtulo falamos sobre dois tipos de uso para o conceito deprobabilidades: como probabilidades f´ ısicas, associadas ` freq¨ˆncia de ocorrˆncia a ue ede um certo fenˆmeno aleat´rio (por ex.: “Qual ´ a probabilidade do arremesso o o ede um dado resultar em 6, trˆs vezes seguidas?”); e como cren¸as associadas ao e cracioc´ ınio indutivo (por ex.: “Qual ´ a chance do Brasil ganhar o hexacampe- eonato mundial de futebol na Alemanha?”). Quando um investigador de policiadiz algo como “a chance de um determinado crime ter sido encomendado ´ de e
    • 22 CAP´ ITULO 2. PROBABILIDADE80%”ele certamente n˜o se refere a um experimento que quando repetido um an´ mero muito grande de vezes retorna o crime em 80 a cada 100 vezes. O que uele quer dizer ´ que a experiˆncia dele (I) e as evidˆncias do caso permitem que e e eele atribua ` hip´tese do crime a probabilidade de 80. Dito isso, tentemos agora a oolhar para o Teorema de Bayes de outra maneira: P (Crime|Evidencia, I) ∝ P (Evidencia|Crime, I)P (Crime|I), (2.7)aqui omitimos do denominador o termo P (Evidencia) que apareceria na f´rmulaode Bayes. Mas o que significa esta express˜o? Antes de coletar as evidˆncias a eo investigator possuia uma cren¸a na possibilidade de crime baseada em sua cexperiˆncia pr´via, ou a priori, P (Crime|I). Ap´s a coleta de evidˆncias, esta e e o ecren¸a foi atualizada para o posterior P (Crime|Evidencia, I). A express˜o define c acomo a nova informa¸ao contida nas evidˆncias deve ser utilizada na atualiza¸ao c˜ e c˜das cren¸as do investigador, ou seja, basta multiplicar a distribui¸ao a priori pela c c˜verossimilhan¸a P (Evidencia|Crime, I), que define a chance do crime produzir cas evidˆncias coletadas. e Mas, como seria poss´ formalizar matematicamente cren¸as humanas? ıvel c2.5.2 Axiomas de Cox: probabilidades como l´gica indu- o tivaNa l´gica dedutiva partimos de um conjunto de axiomas A1 , A2 ,...An e, uti- olizando algumas poucas regras, chegamos a uma conclus˜o T . As regras de adedu¸ao garantem que se os axiomas s˜o verdadeiros ent˜o a conclus˜o tmb´m c˜ a a a eo ser´, em qualquer lugar e a qualquer tempo. Na indu¸ao temos acesso a a c˜evidˆncias E1 , E2 , ...,En . A partir destas evidˆncias procuramos construir suas e ecausas H. Do ponto de vista da l´gica dedutiva, a indu¸ao utiliza um argu- o c˜mento inv´lido (ou uma fal´cia) conhecido por afirmar o conseq¨ ente. Algo a a ucomo: Todos os humanos s˜o mam´ a ıferos. Bigode ´ um mam´ e ıfero, portanto,Bigode ´ humano. Bigode poderia set, por exemplo, um gato! e A l´gica indutiva, no entanto, n˜o visa o estabelecimento absoluto da ver- o adade, mas sim a atualiza¸ao de cren¸as dadas evidˆncias. Por exemplo, saber c˜ c eque Bigode ´ um mam´ e ıfero apenas aumenta as chances de ele ser um humano.Precisariamos de outras evidˆncias, por exemplo, saber que Bigode tem quatro epatas tornaria altamente improvavel que ele fosse um humano. As id´ias das eprobabilidades como cren¸as come¸aram com Bayes no s´culo 18 (veja a se¸ao c c e c˜sobre hist´ria no cap´ o ıtulo introdut´rio) se desenvolveram com Laplace no s´culo o e19 e foram depois esquecidas com as ondas de desenvolvimento da Estat´ ısticacapitaneadas por Galton, Pearson e Fisher, na passagem do s´culo 19 ao 20. eEstas id´ias foram retomadas por Jeffreys (colega de Fisher em Cambridge) e eformalizadas na d´cada de 1940 por Richard T. Cox em seu livro A Algebra e ´da Inferˆncia Prov´vel. Mais recentemente tem havido um renascimento destas e aid´ias com aplica¸oes importantes em ´reas como Reconhecimento de Padr˜es, e c˜ a oMinera¸ao de Dados e Inteligˆncia Artificial. c˜ e Em seu livro Cox demonstra que s˜o necess´rios dois axiomas sobr e cren¸as a a c
    • 2.5. PROBABILIDADES SUBJETIVAS 23e as regras da ´lgebra Booleana para reobtermos todas as propriedades das aprobabilidades f´ ısicas de Kolmogorov. Os Axiomas de Cox s˜o: a Axioma 1. A probabilidade de uma inferˆncia dada determinada evidˆncia e edetermina a probabilidade da seu oposto dada a mesma evidˆncia. Assim, a eprobabilidade de chover dado que o c´u est´ nublado determina a probabilidade e ade n˜o chover dado que o c´u est´ nublado. a e a Axioma 2. A probabilidade de que duas inferˆncias (I1 e I2) sejam si- emultaneamente verdadeiras dada certa evidˆncia (E) ´ determinada pela proba- e ebilidade de que I1 seja verdadeira dada E e, separadamente, pela probabilidadede I2 ser verdadeira dada E e I1. Por exemplo, a probabilidade do Brasil serhexacampe˜o na Alemanha e Adriano ser o artilheiro, dada a experiˆncia que a etemos em assistir jogos da sele¸ao, ´ determinada pela probabilidade do Brasil c˜ eser hexa, dados os jogos que assistimos, e pela probabilidade de Adriano ser o a ´artilheiro, dados os jogos que assistimos e se o Brasil for hexacampe˜o. E claroque o evento composto s´ pode ocorrer se, pelo menos, o Brasil for primeiro ohexacampe˜o.a Exemplo. Paradoxo de Monty Hall Imagine o seguinte jogo envolvendovocˆ e um apresentador, que chamaremos de Silvio. Um prˆmio ´ colocado e e eatr´s de uma de trˆs portas (A, B e C) que permanecem fechadas. Vocˆ deve a e eescolher uma das portas (por exemplo, A). Silvio ent˜o abrir´ uma das portas a aque n˜o ´ a sua e tamb´m n˜o contem o prˆmio (por exemplo, B) e perguntar´ a e e a e ase voce quer trocar de porta. Pergunta-se, vocˆ deve abrir a sua porta (A) ou edeve trocar pela porta restante (C)? Utilizemos um racioc´ ınio bayesiano para resolvermos o problema. Qual ´ aeprobabilidade a priori do prˆmio estar atr´s de qualquer uma das trˆs portas e a e(X = A, B, ou C)? P (X, I) = 1/3, onde I representa nosso conhecimentodas regras do jogo. Qual seria ent˜o a probabilidade de Silvio abrir a porta aB (evento que chamaremos de SB) dado que o prˆmio est´ justamente atr´s e a ada porta que escolhi (A)? P (SB|A, I) = 1/2. E qual seria a probabilidade deSilvio abrir a porta B se o prˆmio estivesse atr´s dela pr´pria? P (SB|B, I) = 0 e a opelas regras do jogo. Finalmente, qual seria a probabilidade de Silvio escolher aporta B dado que o prˆmio est´ em C? Seria P (SB|C, I) = 1, novamente pelas e aregras do jogo. Temos agora que escolher entre nossa primeira escolha A e aoutra porta restante C. Para isso temos que calcular P (A|SB, I) e P (C|SB, I),ou seja, a chance do prˆmio estar respectivamente em A e em C dado que Silvio eapontou a porta B e as regras do jogo. Utilizemos ent˜o o teorema de Bayes: a P (SB|A, I)P (A|I)P (A|SB, I) = P (SB|A, I)P (A|I) + P (SB|B, I)P (B|I) + P (SB|C, I)P (C|I) 1/2 × 1/3 = 1/2 × 1/3 + 0 × 1/3 + 1 × 1/3 = 1/3. (2.8)
    • 24 CAP´ ITULO 2. PROBABILIDADE Da mesma forma temos que P (SB|C, I)P (C|I)P (C|SB, I) = P (SB|A, I)P (A|I) + P (SB|B, I)P (B|I) + P (SB|C, I)P (C|I) 1 × 1/3 = 1/2 × 1/3 + 0 × 1/3 + 1 × 1/3 = 2/3. (2.9)Ou seja, a chance de ganhar trocando de porta ´ o duas vezes maior do que epermanecendo! Vocˆ deveria trocar de porta. A resposta parece contraintuitiva, epara vermos que n˜o ´ basta considerarmos uma vers˜o modificada do jogo. a e aAgora temos, por exemplo, 1000 portas. Vocˆ escolhe uma e n˜o abre. Silvio e aent˜o abre todas as portas restantes menos uma (ou seja, abre 998 portas). Vocˆ a etrocaria agora?2.6 Exerc´ ıcios 1. Uma moeda ´ viciada de modo que a probabilidade de sair cara ´ 4 vezes e e maior que a de sair coroa, Para 2 lan¸amentos independentes dessa moeda, c determinar: (a) o espa¸o amostral; (b) a probabilidade de sair somente c uma cara; (c) a probabilidade de sair pelo menos uma coroa; (d) a prob- abilidade de dois resultados iguais. 2. Considere um conjunto de 4 n´ meros dos quais nenhum deles ´ zero, dois u e s˜o positivos e dois s˜o negativos. Sorteamos ao acaso, com reposi¸ao, 2 a a c˜ n´ meros desse conjunto. Determine a probabilidade de: (a) um deles ser u negativo; (b) o quociente ser negativo; (c) os dois n´ meros terem o mesmo u sinal. 3. Uma caixa contem trˆs moedas com Caras nas duas faces, quatro moedas e com Coroas nas duas faces e duas moedas honestas. Se uma destas nove moedas for selecionada ao acaso e arremessada uma vez, qual ´ a proba- e bilidade de que uma Cara seja obtida. 4. O Palmeiras ganha com probabilidade 0,7 se chove e com 0,8 se n˜o chove. a Em Setembro a probabilidade de chuva ´ de 0,3. O Palmeiras ganhou a e partida em Setembro, qual a probabilidade de ter chovido nesse dia? 5. Uma escola de ensino m´dio do interior de S˜o Paulo tem 40% de estu- e a dantes do sexo masculino. Entre estes, 20% nunca viram o mar, ao passo que, entre as meninas, essa porcentagem ´ de 50%. Qual a probabilidade e de que um aluno selecionado ao acaso seja: (a) do sexo masculino e nunca tenha visto o mar; (b) do sexo feminino ou nunca tenha visto o mar. 6. Mostre que se A e B s˜o independentes, ent˜o Ac e B c tamb´m s˜o inde- a a e a pendentes.
    • ˆ2.7. REFERENCIAS 25 7. Um m´dico desconfia que um paciente tem tumor no abdˆmen, pois isto e o ocorreu em 70% dos casos similares que tratou. Se o paciente de fato tiver o tumor, o exame ultra-som o detectar´ com probabilidade 0,9. Entretanto, a se ele n˜o tiver o tumor, o exame pode, erroneamente, indicar que tem com a probabilidade 0,1. Se o exame detectou um tumor, qual ´ a probabilidade e do paciente tˆ-lo de fato? e2.7 Referˆncias eSe quiser ler bons livros de divulga¸ao cient´ c˜ ıfica relacionados ao problema doacaso: • Ruelle, D., Acaso e Caos, Editora Unesp, 1993. • Bennett, D.J., Aleatoriedade, Martins Fontes, 2003. Se quiser fazer mais exerc´ ıcios procure por (alguns dos exerc´ ıcios do textoforam extra´ıdos de l´): a • Magalh˜es M.N., de Lima A.C.P., No¸oes de Probabilidade e Estat´ a c˜ ıstica, Edusp,2004. Exemplos sobre espa¸os amostrais, sobre probabilidades condicionais e inde- cpendˆncia foram extra´ e ıdos de: • Feller, W. An introduction to Probability Theory and Its Applications, Volume I, John Wiley & Sons, 1950. • DeGroot, M., Probability and Statistics, Addison-Wesley, 1975. Para se aprofundar na teoria cl´ssica de probabilidades: a • Kolmogorov,A.N., Foundations of the Theory of Probability. Sobre a no¸ao matem´tica de independˆncia: c˜ a e • Kac, M., Statistical Independence in Probability, Analysis and Number Theory. Sobre probabilidades subjetivas: • Cox, R.T., The Algebra of Probable Inference, The Johns Hopkins Press, 1961. • Jeffreys, H., Theory of probability, Oxford Press, 1967. Para ler sobre aplica¸oes da Inferˆncia Bayesiana: c˜ e • Russel, S., Norvig P., Inteligˆncia Artificial, Ed. Campus, 2003. e Sobre o Dilema de Monty Hall h´ o seguinte artigo na Wikipedia: a • http://en.wikipedia.org/wiki/Monty Hall problem
    • 26 CAP´ ITULO 2. PROBABILIDADE