• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Apostila bioestatistica
 

Apostila bioestatistica

on

  • 487 views

 

Statistics

Views

Total Views
487
Views on SlideShare
487
Embed Views
0

Actions

Likes
0
Downloads
33
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Apostila bioestatistica Apostila bioestatistica Presentation Transcript

    • Sum´ario 1 Defini¸c˜oes e Conceitos em Bioestat´ıstica Aplicada 1 1.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Estat´ıstica M´edica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.3 Dados Biom´etricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.4 Os Conceitos da Bioestat´ıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.4.1 Popula¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4.2 Censo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4.3 Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4.4 Parˆametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4.5 Estimativas dos Parˆametros ou Estat´ıstica . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4.6 Unidade de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4.7 Vari´aveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4.8 Vari´aveis Aleat´orias (v.a.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2 Experimenta¸c˜ao Biom´etrica 7 2.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 O Racioc´ınio Indutivo da Biometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.3 Delineamentos Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.3.1 Etapa de um levantamento estat´ıstico . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.4.1 Estudo de Caso-Controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.4.2 Estudo de Coorte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.4.3 Ensaios Cl´ınicos Aleatorizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.4.4 Estudos Descritivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.4.5 Seccionais ou Transversais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 3 Estat´ıstica Descritiva 20 3.1 Organiza¸c˜ao de Dados Estat´ısticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.1.1 Normas para a Apresenta¸c˜ao Tabular de Dados . . . . . . . . . . . . . . . . . . . . . . 20 3.2 Distribui¸c˜ao de Freq¨uˆencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.3 Gr´aficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.3.1 Diagramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3.3.2 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.4 Medidas Descritivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.4.1 Medidas de Tendˆencia Central ou de Posi¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . 27 3.4.2 Medida de Variabilidade ou de dispers˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.5 Medidas Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.5.1 Quartis, Decis e Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.5.2 Medidas de Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.5.3 Medidas de Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 1
    • 4 Inferˆencia Estat´ıstica 38 4.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 4.2 Problemas de Inferˆencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 4.3 Distribui¸c˜ao Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.4 Distribui¸c˜oes de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.4.1 Distribui¸c˜ao Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.4.2 Distribui¸c˜ao de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.4.3 Distribui¸c˜ao Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.5 Verifica¸c˜ao da Adequa¸c˜ao do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.6 Faixas de Referˆencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.7 Teorema do Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.8 Tamanho da Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.8.1 M´etodo simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.8.2 M´etodo inferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.9 Testes de Hip´oteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4.9.1 Constru¸c˜ao de um Teste de Hip´otese . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4.9.2 O p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5 An´alise em Tabelas 2x2 e LxC 51 5.1 Tabelas de Contingˆencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 5.2 Teste de Independˆencia e de Homogeneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 6 Compara¸c˜oes Entre Grupos 61 6.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.2 Resposta Dicotˆomica: Amostras Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.2.1 Teste Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.2.2 Teste Exato de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 6.2.3 Teste z para Compara¸c˜ao de Propor¸c˜oes . . . . . . . . . . . . . . . . . . . . . . . . . . 65 6.3 Resposta Dicotˆomica: Amostras Pareadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 6.3.1 Teste de McNemar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 6.4 Resposta Cont´ınua - Teste de M´edias para Amostras Independentes . . . . . . . . . . . . . . 67 6.4.1 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 6.4.2 Teste z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 6.5 Resposta Cont´ınua - Teste de M´edias para Amostras Pareadas . . . . . . . . . . . . . . . . . 69 6.5.1 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 6.6 Testes N˜ao-Param´etricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 6.6.1 Teste U de Mann-Whitney . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 6.6.2 Teste H de Kruskal-Wallis para k amostras . . . . . . . . . . . . . . . . . . . . . . . . 74 6.6.3 Teste de Wilcoxon (Amostras Pareadas ou dependentes) . . . . . . . . . . . . . . . . . 75 6.6.4 Teste de Friedman para k tratamentos . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 6.7 Outros Testes N˜ao-Param´etricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 6.7.1 Teste de Concordˆancia ou de Replicabilidade (Coeficiente de Kappa) . . . . . . . . . . 79 6.7.2 Teste de Cochran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 7 An´alise de Variˆancia 83 7.1 An´alise de Variˆancia para Experimentos ao Acaso . . . . . . . . . . . . . . . . . . . . . . . . . 83 7.2 Teste Param´etrico para Compara¸c˜oes M´ultiplas . . . . . . . . . . . . . . . . . . . . . . . . . . 86 7.2.1 Teste Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 7.2.2 Teste Dunnett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 7.3 Teste N˜ao-Param´etrico para Compara¸c˜oes M´ultiplas . . . . . . . . . . . . . . . . . . . . . . . 89 7.3.1 Teste Dunn-Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 7.4 An´alise de Variˆancia com N´umero Diferente de Repeti¸c˜oes . . . . . . . . . . . . . . . . . . . . 91 7.4.1 Teste Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 7.4.2 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 7.4.3 Teste Dunnett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 2
    • 8 Testes Cl´ınicos 95 8.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 8.2 Testes Diagn´osticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 8.2.1 Sensibilidade e Especificidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 8.2.2 Valor das Predi¸c˜oes: VPP e VPN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 8.2.3 Decis˜oes Incorretas: PFP e PFN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 8.2.4 Combina¸c˜ao de Testes Diagn´osticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 8.2.5 Escolha entre Testes Diagn´osticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 8.2.6 Rela¸c˜ao entre Sensibilidade e Especificidade . . . . . . . . . . . . . . . . . . . . . . . . 104 8.2.7 Curva ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 Referˆencias Bibliogr´aficas 107 3
    • Cap´ıtulo 1 Defini¸c˜oes e Conceitos em Bioestat´ıstica Aplicada 1.1 Introdu¸c˜ao O objetivo deste cap´ıtulo ´e ilustrar o papel que conceitos e t´ecnicas estat´ısticas tˆem na forma¸c˜ao do estat´ıstico especializado na ´area biom´etrica, na sua pr´atica profissional e de modo especial no avan¸co do conhecimento nesta ´area espec´ıfica. Este objetivo ser´a alcan¸cado principalmente atrav´es da apresenta¸c˜ao e discuss˜ao dos resultados de es- tudos relevantes. Atrav´es destes exemplos, argumenta-se que conceitos estat´ısticos tˆem importante papel a desempenhar, tanto no estudo da sa´ude de popula¸c˜oes, como nos tratamentos individuais. 1.2 Estat´ıstica M´edica A m´a utiliza¸c˜ao de dados m´edicos ou de outras ciˆencias, com interpreta¸c˜oes errˆoneas ou mal intencionadas, tem produzido um grande ceticismo em rela¸c˜ao `a estat´ıstica. Podemos encontrar muitos professores, cl´ınicos ou mesmo profissionais de ciˆencias b´asicas, que acham que “bom senso” ´e suficiente para tratar desses dados, que qualquer coisa que exija prova estat´ıstica n˜ao pode ter valor pr´atico ou que procurar˜ao um matem´atico se tiverem algum problema estat´ıstico em seu trabalho. ´E importante compreender, no entanto, que cada vˆez que se toma a m´edia de duas leituras de pipeta, por exemplo, ou o n´umero m´edio de dias de interna¸c˜ao no hospital de pacientes com determinada doen¸ca, se est´a usando um m´etodo estat´ıstico. Do mesmo modo, usamos m´etodos estat´ısticos para concluir que a press˜ao arterial do paciente est´a normal ou que um tratamento cir´urgico ´e melhor que outro. Deste modo, a Estat´ıstica M´edica se constitui realmente nos princ´ıpios da Medicina Quantitativa. Muito da medicina depende, direta ou indiretamente, de contagem ou mensura¸c˜ao. Isto ´e ´obvio em pesquisa e verdadeiro tamb´em no diagn´ostico. Quando um m´edico, examinando um n´odulo no seio de uma paciente, leva em considera¸c˜ao sua idade e hist´oria familiar, logo est´a usando dados quantitativos, ou seja, a incidˆencia de tumores por idade e por fam´ılia. Convencionou-ser chamar de Bioestat´ıstica o conjunto de conceitos e m´etodos cient´ıficos usados no trata- mento da variabilidade nas ciˆencias m´edicas e biol´ogicas. A Bioestat´ıstica fornece m´etodos para se tomar decis˜oes ´otimas na presen¸ca de incerteza, estabelecendo faixas de confian¸ca para a efic´acia dos tratamen- tos e verificando a influˆencia de fatores de risco no aparecimento de doen¸cas. Dentro da ´area biol´ogica, compreende-se por Biometria a ciˆencia que estuda as medidas de seres vivos. A ˆenfase crescente do papel dos m´etodos quantitativos na pr´atica da medicina torna imperativo que o estudante de medicina assim como o m´edico tenham algum conhecimento de estat´ıstica. O estudante aprende na escola o melhor m´etodo de diagnose e terapˆeutica; depois de formado depender´a necessariamente de trabalhos apresentados em reuni˜oes, jornais e revistas m´edicas, para aprender novos m´etodos de terapia, assim como os progressos em diagnose e t´ecnica cir´urgica. Portanto, dever´a estar apto a avaliar por si pr´oprio os resultados de outros pesquisadores, dever´a decidir quando uma nova t´ecnica ou m´etodo pode substituir os antigos. Dever´a estar apto a responder `a pergunta da m˜ae que o consulta 1
    • 1.3 Dados Biom´etricos ROSSI, Robson M. 2 sobre a vacina mais recente e, com a mesma seguran¸ca, aconselh´a-la em rela¸c˜ao `a vacina antip´olio ou anti- sarampo. Dever´a estar apto a dar `a fam´ılia do paciente seguran¸ca quanto ao diagn´ostico, o que pode depender de sua capacidade de avaliar adequadamente os resultados de exames laboratoriais, como tamb´em de seu conhecimento sobre a rela¸c˜ao da idade, sexo e outras condi¸c˜oes do paciente a uma determinada doen¸ca. Os novos conhecimentos vir˜ao atrav´es do trabalho de pesquisa realizado por ele pr´oprio ou por outros. Deve, portanto, ser capaz de selecionar, da massa de informa¸c˜oes, aquelas que forem v´alidas e que resistirem a testes cient´ıficos r´ıgidos. Deve desenvolver um ceticismo sadio em rela¸c˜ao a tudo que lˆe. Uma no¸c˜ao b´asica em planejamentos experimentais referentes `a pesquisa m´edica, ´e o reconhecimento de que os indiv´ıduos diferem n˜ao apenas uns dos outros, mas tamb´em em rela¸c˜ao a si pr´oprios, de dia para dia ou mesmo de hora para hora. Uma certa quantidade de varia¸c˜ao ´e normal, mas a quest˜ao que desafia o m´edico ´e determinar quando uma varia¸c˜ao espec´ıfica se torna patol´ogica (referente `a doen¸ca). Para isso, o estudante deve aprender como medir a varia¸c˜ao em indiv´ıduos normais e definir qual ´e o limite de varia¸c˜ao normal. Deve aprender que h´a algum erro aleat´orio presente em cada medida ou contagem feita. ´E altamente improv´avel que duas contagens sucessivas de gl´obulos, feitas na mesma amostra de sangue, sejam idˆenticas. Quando, por´em, uma diferen¸ca se torna maior que o erro de mensura¸c˜ao? Para tratar seu paciente do melhor modo poss´ıvel, o m´edico deve saber responder `a quest˜oes como essa. Para cada medida ou determina¸c˜ao fornecida pelo laborat´orio, o m´edico deve conhecer a varia¸c˜ao que ´e parte do pr´oprio m´etodo, para saber quando uma dada varia¸c˜ao representa uma mudan¸ca real no paciente. Sempre que novos m´etodos de terapia s˜ao introduzidos, ´e necess´ario saber se s˜ao realmente superiores, isto ´e, mais eficientes aos velhos m´etodos. Ser´a nacess´ario fazer-se a avalia¸c˜ao cr´ıtica do estudo experimental, verificando principalmente se as medidas foram realizadas de modo a produzir resultados fidedignos, se o fator em prova foi o ´unico fator de diferen¸ca entre o grupo experimental e o grupo controle, se a diferen¸ca entre os resultados obtidos nos dois grupos foi maior que aquela que poderia ser atribu´ıda ao acaso. Apenas depois da avalia¸c˜ao, atrav´es de t´ecnicas estat´ısticas adequadas, da fidedignidade dos resultados, comparabilidade dos grupos experiˆencia e controle e, significˆancia da diferen¸ca encontrada ´e que podemos tirar as conclus˜oes relativas ao novo m´etodo. O n´umero de falhas encontradas em publica¸c˜oes m´edicas enfatiza a necessidade de uma avalia¸c˜ao cr´ıtica da literatura. Para ajudar o estudante a desenvolver tal atitude s˜ao necess´arios certos conceitos estat´ısticos b´asicos e uma certa familiaridade com a terminologia mais usada. M´etodos estat´ısticos s˜ao essenciais no estudo de situa¸c˜oes em que as vari´aveis de interesse est˜ao sujeitas, inerentemente, a flutua¸c˜oes aleat´orias. Este ´e o caso da ´area da sa´ude principalmente na Medicina. Mesmo tomando-se um grupo de pacientes homogˆeneos, observa-se grande variabilidade, por exemplo, no tempo de sobrevida ap´os um tratamento adequado. Dosagens de caracter´ısticas hematol´ogicas flutuam n˜ao s´o entre indiv´ıduos, como tamb´em no mesmo indiv´ıduo em ocasi˜oes diferentes. Na realidade, h´a varia¸c˜oes entre diferentes pacientes para qualquer vari´avel de interesse cl´ınico. Portanto, para se estudar problemas cl´ınicos, ´e necess´aria uma metodologia capaz de tratar a variabilidade de forma adequada. Deve-se notar, entretanto, que ao tratar um paciente, o m´edico se vale da experiˆencia de eventos ante- riores, vivenciada pessoalmente ou transmitida por outros atrav´es de livros e artigos. Assim, a Estat´ıstica pode ser vista como ferramenta de organiza¸c˜ao e valida¸c˜ao do conhecimento m´edico. 1.3 Dados Biom´etricos Nas ´areas m´edica e biol´ogica coletam-se dados de pessoas, de animais experimentais e de fenˆomenos f´ısicos e qu´ımicos. Interessam aos pesquisadores dessas ´areas dados sobre mortalidade infantil, eficiˆencia de medicamentos, incidˆencia de doen¸cas, causas de morte etc. Os dados referem-se a vari´aveis, classificadas como qualitativas, ordinais e quantitativas. O dado qualitativo est´a fortemente presente nas ciˆencias da sa´ude. Caracter´ısticas de pessoas, ra¸ca, doen¸cas, etc, s˜ao freq¨uentemente medidas como vari´aveis categ´oricas. No entanto, mercˆe de sua tradi¸c˜ao escol´astica, as ciˆencias da sa´ude ainda mostram preferˆencia pelas medidas cont´ınuas de alta precis˜ao: medir em miligramas, mil´ımetros etc. Engajado no conhecimento do bi´ologo, o cientista da sa´ude tende a isentar-se de reflex˜ao sobre a importˆancia das estrat´egias de mensura¸c˜ao e an´alise providas por outras ciˆencias, como a estat´ıstica. Exemplo 1.1. Com o objetivo de levantar conhecimento sobre algumas caracter´ısticas de homens com doen¸cas card´ıacas da cl´ınica especializada de Honolulu, no Hava´ı, decidiu-se pesquisar os pacientes com idade entre 45 e 67 anos. As caracter´ısticas de interesse eram:
    • 1.4 Os Conceitos da Bioestat´ıstica ROSSI, Robson M. 3 1 – N´ıvel de instru¸c˜ao 2 – Peso 3 – Altura 4 - Idade 5 – Fumante 6 – Atividade f´ısica 7 – Taxa de glicose 8 – Taxa de colesterol s´erico 9 – Press˜ao sang¨u´ınea sist´olica. 1.4 Os Conceitos da Bioestat´ıstica A estat´ıstica pode ser utilizada simplesmente para descrever conjuntos de dados, mostrando sua dis- tribui¸c˜ao, m´edia, dispers˜oes, etc. Mas, pode ir al´em, pode estar presente nas diversas etapas de uma pesquisa, desde o seu planejamento, at´e na interpreta¸c˜ao de seus resultados, podendo ainda, influenciar na condu¸c˜ao do processo da pesquisa. Defini¸c˜ao: Estat´ıstica ´e um conjunto de conceitos e m´etodos cient´ıficos para a coleta, a organiza¸c˜ao, a descri¸c˜ao, a an´alise e a interpreta¸c˜ao de dados experimentais, que permitem conclus˜oes v´alidas e tomadas de decis˜oes razo´aveis. Classifica¸c˜ao: Usualmente, a estat´ıstica ´e dividida em trˆes grandes ´areas que atuam em conjunto: Planejamentos de Experimentos e Amostragem, Estat´ıstica Descritiva e, Estat´ıstica Inferencial. Amostragem e Planejamento de Experimentos: ´E a parte que tem por objetivo planejar a pesquisa e se preocupa com o mecanismo da coleta de dados. Estat´ıstica Descritiva: ´E a parte que tem por objetivo organizar, apresentar e sintetizar dados observados de determinada popula¸c˜ao, sem preten¸c˜oes de tirar conclus˜oes de car´ater extensivo. Estat´ıstica Inferencial ou Indutiva: ´E a parte que, baseando-se em estudos realizados sobre os dados de uma amostra, procura inferir, induzir ou verificar leis de comportamento da popula¸c˜ao da qual a amostra foi retirada. A estat´ıstica inferencial tem sua estrutura fundamentada na teoria matem´atica das probabilidades. ´E, tamb´em definida como um conjunto de m´etodos para a tomada de decis˜oes.
    • 1.4 Os Conceitos da Bioestat´ıstica ROSSI, Robson M. 4 A Estat´ıstica est´a presente em diversas ´areas e em diversas abordagens. Podemos citar alguns exemplos de suas aplica¸c˜oes: 1. Elei¸c˜oes: An´uncio pr´evio, em termos percentuais, de que o candidato A ´e o prov´avel vencedor. (A previs˜ao pode ser feita ap´os a contagem de 2% dos votos); 2. Ind´ustria: Teste de lˆampadas “flash” para m´aquinas fotogr´aficas. O fabricante deve saber com an- tecedˆencia se o lote fabricado pode ser colocado no mercado ou n˜ao (Ele pode estar sujeito a riscos ! O Recall ´e um exemplo, onde ocorre a retirada ou troca de produtos devido a uma falha em algum est´agio de fabrica¸c˜ao n˜ao detectado pelo controle de qualidade); 3. Meteorologia: Informa que a “chance” de chuva para hoje ´e de 30% (utiliza¸c˜ao de m´etodos estat´ısticos de previs˜ao); 4. Mercado de Valores: Decis˜ao na compra ou venda de a¸c˜oes – “Risco”; 5. Institui¸c˜oes Banc´arias/Cr´edito: An´alise de cr´edito; Seguro de Vida e/ou de autom´oveis; 6. IBGE/´ındices: Censo; Taxa de desemprego; Infla¸c˜ao; Custo de vida; Valor do sal´ario m´ınimo, cesta b´asica, ´ındices de pre¸cos-INPC; Taxa de mortalidade/Natalidade; ´Indices de analfabetismo, etc. 7. Farm´acia/Medicina: Analisar a entrada de um novo medicamento, verificando a sua efic´acia. “Deve-se tomar muito cuidado” com a tomada de decis˜ao; 8. Pesquisas: Estudo sobre h´abitos migrat´orios de certo animal; Estima¸c˜ao do tamanho populacional de certas esp´ecies; 9. Experimenta¸c˜ao Agr´ıcola: Estudos de uma nova variedade de semente (modifica¸c˜ao gen´etica) ou de fertilizantes; 10. Telecomunica¸c˜oes: A utiliza¸c˜ao da Internet gera informa¸c˜oes preciosas de clientes ; Controle de tr´afego telefˆonico, chamadas e consumo, for¸cam a utiliza¸c˜ao de modelos estat´ısticos complexos; 11. Experimenta¸c˜ao Zoot´ecnica: Estudo do desenvolvimento de um animal e an´alise de fatores que in- fluenciam neste desenvolvimento tais como, alimenta¸c˜ao, cativeiro e outros; Melhoramento gen´etico; Pesquisas com vacinas animais entre outros. A amostragem ´e naturalmente usada na vida di´aria. Por exemplo, para verificar o tempero de um alimento em prepara¸c˜ao, pode-se provar (observar) uma pequena por¸c˜ao deste alimento. Desta forma, est´a se fazendo uma amostragem, ou seja, extraindo do todo (popula¸c˜ao) uma parte (amostra), com o prop´osito de avaliar (inferir) sobre a qualidade de tempero de todo o alimento. Nas pesquisas cient´ıficas em que se quer conhecer algumas caracter´ısticas de uma popula¸c˜ao, tamb´em ´e muito comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra, obter valores aproximados, ou estimativas, para as caracter´ısticas populacionais de interesse. Este tipo de pesquisa ´e usualmente chamado de levantamento por amostragem. Num levantamento por amostragem, a sele¸c˜ao dos elementos que ser˜ao observados, deve ser feita sob uma metodologia adequada, de tal forma que os resultados da amostra sejam informativos para avaliar caracter´ısticas de toda a popula¸c˜ao. A popula¸c˜ao pode ser formada por pessoas da fam´ılia, indiv´ıduos de uma certa esp´ecie, estabelecimentos industriais, ou qualquer outro tipo de elementos, cujas vari´aveis que se pretende estudar sejam pass´ıveis de serem mensuradas. Os elementos de uma popula¸c˜ao diferem entre si com respeito a fatores tais como: sexo, idade, medidas f´ısicas, cor, susceptibilidade a doen¸ca, agressividade, etc. Desta forma o padr˜ao de comportamento no qual o pesquisador esta interessado pode ser muito complicado pela grande variabilidade existente. Por estas raz˜oes, muitos trabalhos nas ciˆencias em geral tendem a ser de natureza comparativa, procurando lidar com as varia¸c˜oes inerentes.
    • 1.4 Os Conceitos da Bioestat´ıstica ROSSI, Robson M. 5 1.4.1 Popula¸c˜ao ´E qualquer conjunto de elementos, tendo pelo menos uma vari´avel em comum (Pode ser finita ou infinita). 1.4.2 Censo Pesquisas utilizando todos os elementos da popula¸c˜ao. Obs. Desvantagem quando a popula¸c˜ao ´e muito grande Ex.: A popula¸c˜ao brasileira estimada em novem- bro/2004: 182.405.960 (Fonte: IBGE - http://www.ibge.gov.br/). 1.4.3 Amostra ´E qualquer subconjunto da popula¸c˜ao. Pesquisas utilizando amostras da popula¸c˜ao denominam-se pesquisas por amostragem. 1.4.4 Parˆametros S˜ao certas caracter´ısticas populacionais espec´ıficas que se deseja descrever. 1.4.5 Estimativas dos Parˆametros ou Estat´ıstica S˜ao os valores calculados a partir dos dados da amostra, com o objetivo de avaliar parˆametros descon- hecidos, por exemplo, m´edia amostral. 1.4.6 Unidade de Amostragem ´E a unidade a ser selecionada para se chegar aos elementos da popula¸c˜ao. Pode ser os pr´oprios elementos da popula¸c˜ao, ou, outras unidades f´aceis de serem selecionadas e que, de alguma forma, estejam associadas aos elementos da popula¸c˜ao. 1.4.7 Vari´aveis S˜ao as caracter´ısticas medidas. As vari´aveis apresentam variabilidade dentro da popula¸c˜ao. Podem ser qualitativas ou quantitativas. Vari´aveis Qualitativas Quando seus valores forem expressos por atributos (n˜ao-num´ericos). • Nominal quando tem nome (ex.: Cor dos olhos, sexo, ra¸ca, consumo de ´alcool (sim, n˜ao), gostar de estudar ... etc). • Ordinal quando tem ordem (ex.: classe social, grau de instru¸c˜ao, consumo de ´alcool (pouco, m´edio, muito) ... etc). Vari´aveis Quantitativas Quando seus valores podem ser descritos numericamente. • Discreta quando seus valores resultam de contagem (ex.: n´umero de filhos, n´umero de reprova¸c˜oes, n´umero de copos de ´alcool consumidos... etc). • Cont´ınua quando seus valores resultam de medi¸c˜oes e podem assumir qualquer valor em um intervalo da reta (ex.: estatura, nota na prova, imc, quantidade de ´alcool consumido ... etc).
    • 1.4 Os Conceitos da Bioestat´ıstica ROSSI, Robson M. 6 1.4.8 Vari´aveis Aleat´orias (v.a.) S˜ao provenientes de Experimentos Aleat´orios (todos as possibilidades s˜ao equiprov´aveis, isto ´e, tem a mesma chance de ocorrˆencia). As v.as. geralmente s˜ao representadas por letras mai´usculas A, X, Y ou W, que podem assumir qualquer um dos conjuntos de valores que lhe s˜ao atribu´ıdos. Exemplo 1.2. Em um experimento de lan¸car uma moeda e observar a sua face, existem duas possibil- idades:“Cara ou Coroa“. Considerando uma v.a. discreta X: “n´umero de caras em dois lan¸camentos“, temos: possibilidades {cc,ck,kc,kk}: Cara: c Coroa: k → X : {0, 1, 2}.
    • Cap´ıtulo 2 Experimenta¸c˜ao Biom´etrica 2.1 Introdu¸c˜ao Na medicina como em outros campos da ciˆencia aplicada, o efeito geral da estat´ıstica ´e tornar um observador mais cr´ıtico e mais consciente quando, por falta de informa¸c˜ao segura, ele tem de agir com base em impress˜oes ou opini˜ao. Esta ´e a atitude cient´ıfica, e o melhor modo de come¸car a adquir´ı-la ´e procurar evidˆencias, e “provar”. Alguns princ´ıpios dessa procura de evidˆencias ser˜ao estudadas neste cap´ıtulo. 2.2 O Racioc´ınio Indutivo da Biometria Quando realizamos um experimento, a observa¸c˜ao resultante ´e vista n˜ao como um resultado a ˆesmo e irreprodut´ıvel, mas como um resultado que poderia vir a ser obtido outras vezes, sempre que o experimento fosse repetido nas mesmas condi¸c˜oes. De fato, a generaliza¸c˜ao ´e feita sob a hip´otese de que o resultado obtido ´e t´ıpico de uma classe de experimentos similares e, se consegu´ıssemos repetir, exatemente, um experi- mento, uma ´unica observa¸c˜ao constitui-se-ia em base suficiente para fazermos afirma¸c˜oes gerais. Na pr´atica, obviamente, nunca podemos garantir que dois experimentos sejam exatamente iguais em cada min´ucia de suas circunstˆancias, de tal sorte que nunca podemos garantir resultados identicamente reprodut´ıveis. As observa¸c˜oes v˜ao, de fato, variar em maior ou menor grau - aquilo que chamamos de erro experimental estar´a presente - e, em lugar de um ´unico resultado que se repete exatamente, teremos numerosos resultados que variam entre si, de acordo com o tamanho do erro experimental. As nossas generaliza¸c˜oes n˜ao podem ser absolutamente precisas: devem levar em considera¸c˜ao o erro experimental e conter, em si, um elemento de incerteza. Essa incerteza ´e caracter´ıstica do racioc´ınio indutivo, e o grande problema no racioc´ınio do particular ao geral ´e levar em devida conta essa incerteza. Em Biologia, o problema da incerteza ´e muito s´erio, pois organismos vivos e suas partes s˜ao coisas altamente vari´aveis. Eles est˜ao influenciados por uma riqueza de fatores - gen´eticos, ambientais e de de- senvolvimento - de tal modo que nenhuma situa¸c˜ao do sitema pode ser reproduzida exatamente; em geral elas n˜ao podem ser reproduzidas nem com muita aproxima¸c˜ao. Poucas (se ´e que algumas) circunstˆancias de um experimento podem ser supostas triviais em seus efeitos sobre os resultados e raramente conseguimos identificar um ou dois fatores cujos controles reduziriam o erro experimental a propor¸c˜oes desprez´ıveis. Efe- tivamente, com muita freq¨uˆencia o nosso problema ´e tentar distinguir um efeito que seja pouco maior do que o de outros fatores que provocam a varia¸c˜ao do sistema; devemos ent˜ao enfrentar o problema: Qual deve ser a fidedignidade da mensura¸c˜ao? Ou mesmo: Ser´a o efeito observado atribu´ıvel ao fator em que estamos interessados, ou ser´a conseq¨uˆencia de alguma outra causa de varia¸c˜ao que n˜ao pudemos reconhecer e certamente n˜ao pudemos controlar? 2.3 Delineamentos Experimentais Muitos trabalhos em pesquisas m´edicas s˜ao acometidos de v´arios erros devido ao procedimento na coleta e no tratamento de dados. Um dos fenˆomenos mais comuns ´e a ocorrˆencia de diferen¸cas entre homens e mulheres, entre crian¸cas e adultos, entre as estaturas, pesos, cor dos olhos e comportamento de pessoas 7
    • 2.3 Delineamentos Experimentais ROSSI, Robson M. 8 da mesma ra¸ca, sexo e idade, entre diferentes amostras da mesma substˆancia qu´ımica “pura”. Todas essa diferen¸cas s˜ao coletivamente chamadas varia¸c˜ao e a estat´ıstica pode ser descrita como ciˆencia de tratar a varia¸c˜ao. Os seres humanos s˜ao t˜ao infinitamente vari´aveis interna quanto o s˜ao externamente, mas algumas mat´erias b´asicas do curso m´edico, como a Anatomia, parecem n˜ao reconhecer tal fato, deixando de destacar esse profundo sentido da varia¸c˜ao humana. A pseudoprecis˜ao anatˆomica, criando um conceito artificial do corpo humano no in´ıcio da carreira do estudante, parece que largamente partilham essa responsabilidade; e mesmo se todos os professores enfatizassem a importˆancia da varia¸c˜ao, n˜ao iria ajudar muito, a n˜ao ser que o estudante adquirisse pr´atica em enfrentar problemas que surgem da varia¸c˜ao - especialmente, pr´atica na procura de evidˆencias e uma atitude cr´ıtica em face dos assuntos que lˆe, ouve ou discute. 2.3.1 Etapa de um levantamento estat´ıstico A. Planejamento experimental. Consiste no planejamento da pesquisa que ser´a realizada: Mainland, D. (1952) em Elementary medical statistics - The principles of quantitative medicine, sugere nove quest˜oes que constituem um roteiro valioso para desenvolvimento dessa atitude: 1. Quem?...(relativa ao pesquisador) 2. Para quˆe?...(relativa ao objetivo da pesquisa) 3. O quˆe?...(refere-se a pessoas, coisas ou fatos estudados) 4. Onde?...(refere-se ao local e ambiente) 5. Quando?...(refere-se ao tempo) 6. Como?...(relativa aos m´etodos) 7. Quanto?...(relativa `as medidas) 8. Quantos?...(relativa `a enumera¸c˜ao) 9. Por quˆe?...(referente `a interpreta¸c˜ao causal) Tomadas as devidas precau¸c˜oes, alguns aspectos estat´ısticos dever˜ao ser analisados e o tipo de estudo adequado dever´a ser abordado. Exemplo 2.1. Considere a seguinte hip´otese: ”Associa¸c˜ao entre incidˆencia de luz solar e cˆancer de mama”. Compara¸c˜oes regionais, na antiga Uni˜ao sovi´etica, mostraram correla¸c˜ao negativa entre incidˆencia de luz solar e de cˆancer do seio: em locais de baixa luminosidade solar, foi encontrada alta incidˆencia deste tipo de neoplasia, e vice-versa. Em muitos pa´ıses, semelhante associa¸c˜ao tamb´em foi detectada. A evidˆencia sugere, segundo os autores, que a vitamina D possa ter papel de relevo na redu¸c˜ao do risco de cˆancer de mama, e estudos adicionais devem ser feitos para esclarecer a mat´eria. (GOHAM et al, 1990). Os principais delineamentos experimentais para a realiza¸c˜ao destas pesquisas ser˜ao: 1. Quem? GOHAM et al. 2. Para quˆe? Verificar a associa¸c˜ao entre a taxa de incidˆencia de luz solar sobre indiv´ıduos em diferentes lugares com luminosidades desiguais e a incidˆencia de cˆancer de mama. 3. O quˆe? N´umero de mulheres com cˆancer de mama e incidˆencia de luminosidade no local destas onde habitam estas mulheres. Pelo fato de quanto maior a luminosidade maior a s´ıntese de vitamina D pela pele, h´a evidˆencias que a vitamina D possa ter elevo na redu¸c˜ao do risco de cˆancer de mama. 4. Onde? Regi˜oes diferentes que apresentam tamb´em diferentes incidˆencias de luminosidade na antiga Uni˜ao Sovi´etica. 5. Quando? 1990.
    • 2.3 Delineamentos Experimentais ROSSI, Robson M. 9 6. Como? (Metodologia): considerando que o cˆancer de mama ´e o que mais mata nas mulheres, por´em em rela¸c˜ao `a popula¸c˜ao de mulheres ´e uma doen¸ca pouco prevalente, como, por exemplo, Transtorno Pr´e-Menstrual. Assim, um estudo de caso-controle em mulheres com cˆancer de mama j´a diagnosticado exposto `a luminosidade solar por um per´ıodo de tempo predeterminado devendo ser razoavelmente grande, mas n˜ao saberia dizer quanto sem revis˜ao bibliogr´afica. Na entrevista retrospectiva perguntaria as mulheres h´a quanto tempo residiam naquela regi˜ao, e se tivessem dentro do tempo predeterminado entrariam no estudo. Faria tamb´em um grupo controle de mulheres daquela regi˜ao para compara¸c˜ao dos dados. Repetindo este mesmo estudo em mulheres de diferentes regi˜oes com diferentes luminosidades, e comparando-se as taxas de fatores de riscos, poder-se-ia chegar a conclus˜ao de associa¸c˜ao e em seguida calcular o Odds Ratio, isto ´e, a raz˜ao de chances. 7. Quanto? As medidas seriam o n´umero de mulheres diagnosticadas com cˆancer de mama comparadas a um n´umero semelhantes de mulheres sem o cˆancer (controles) separadas ap´os serem examinadas por m´edicos. J´a a luminosidade colheria as informa¸c˜oes com as centrais de meteriol´ogicas locais ou algum centro de referˆencia deste assunto para o estudo. 8. Quantos? A amostra tentaria ser a maior poss´ıvel para melhorar a confiabilidade dos resultados, j´a que a doen¸ca ´e pouco prevalente. Procuraria os centros de sa´udes locais (hospitais, cl´ınicas especializadas, etc) das respectivas regi˜oes a serem estudadas. Se o n´umero de centros for muito grande e for muito dif´ıcil abord´a-los, sortearia os centros para amostragem. 9. Por quˆe? Alguns cuidados tˆem que serem relevados como o v´ıcio da sele¸c˜ao, de informa¸c˜ao e con- fundimento. Por exemplo, a ingest˜ao de alimentos ricos em precursores e da pr´opria vitamina D bem como uso de suplementos alimentares com vitamina D (p´ılulas), poderia influenciar os resultados dos estudos. Observa¸c˜ao: Outros tipos de estudos e delineamentos podem ser utilizados nesta pesquisa. Avalia¸c˜ao de informa¸c˜oes existentes. Inicialmente, deve-se realizar um levantamento bibliogr´afico sobre o assunto para obter subs´ıdios que podem representar valiosa colabora¸c˜ao para o estudo e, tamb´em, serem aproveitados nas discuss˜oes posteriores. B. Formula¸c˜ao de hip´oteses. Com exce¸c˜ao das pesquisas meramente descritivas, todas as pesquisas estat´ısticas comportam a formula¸c˜ao de hip´oteses. Com base nos dados observados, a hip´otese ser´a rejeitada ou n˜ao. C. Verifica¸c˜ao das hip´oteses. A verifica¸c˜ao das hip´oteses ser´a realizada no decorrer da pesquisa. D. Delineamento da pesquisa. Compreende o estudo (planejamento) detalhado da coleta de dados, da realiza¸c˜ao do trabalho e da an´alise dos dados. Os dados podem ser retirados diretamente da fonte ou aproveitados de bancos de dados retirados por outros indiv´ıduos. Para o caso de dados retirados diretamente da fonte, existem 3 procedimentos: a observa¸c˜ao direta, o question´ario ou interrogat´orio e a entrevista. Observa¸c˜ao: ´e a observa¸c˜ao direta dos fenˆomenos em laborat´orios ou na natureza. Question´ario: ´e uma seq¨uˆencia de perguntas previamente preparadas. O question´ario ´e aplicado por meio de entrevista ou remetido pelo correio. Os valores observados podem ser complementados por ob- serva¸c˜ao. Execu¸c˜ao da pesquisa. Coleta dos dados e realiza¸c˜ao da an´alise estat´ıstica. An´alise e apresenta¸c˜ao dos resultados. Os dados coletados devem ser apresentados na forma de: gr´aficos e/ou de tabelas. A an´alise dos dados deve ser realizada pelo pesquisador, com a ajuda de um estat´ıstico, aplicando os recursos estat´ısticos necess´arios para refutar ou n˜ao as hip´oteses previamente for- muladas. Exemplo 2.2. Objetivo geral: conhecer o perfil dos homens portadores de doen¸cas card´ıacas em Honolulu, Hava´ı. Para dar seq¨uˆencia a esta pesquisa, ´e preciso especificar melhor o que se quer conhecer da popula¸c˜ao de portadores de doen¸cas card´ıacas, ou seja, os objetivos espec´ıficos. Exemplos de alguns desses objetivos. (a) conhecer a distribui¸c˜ao do grau de instru¸c˜ao dos portadores de doen¸cas card´ıacas.
    • 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos ROSSI, Robson M. 10 (b) Conhecer a idade e o peso m´edio dos portadores de doen¸cas card´ıacas. (c) Conhecer os h´abitos dos portadores de doen¸cas card´ıacas. (d) Avaliar a condi¸c˜ao de sa´ude dos portadores de doen¸cas card´ıacas. Exemplo 2.3. Delineamento da pesquisa: um levantamento de dados a partir do levantamento das in- forma¸c˜oes contidas em uma amostra dos prontu´arios dos pacientes. Dados observados: resultados de diversos atributos e medidas relativas aos pacientes selecionados para participarem da amostra. Esquematicamente: População: Todos os portadores de doenças cardíacas de Honolulu. Levantamento de dados. Plano de amostragem. Amostra: Parte dos portadores de doenças cardíacas de Honolulu. Dados observados. Figura 2.1: Esquema 1. Exemplo 2.4. Objetivo geral: Comparar a eficiˆencia de dois m´etodos para detectar o bacilo causador de tuberculose. Em outras palavras, quer-se avaliar se os meios utilizados s˜ao equivalentes ou se um ´e mais eficiente que o outro. Delineamento da pesquisa: s˜ao formados dois grupos de pacientes com tuberculose e amostras de saliva destes pacientes foram colocadas em duas culturas (A e B). Dados observados: a detec¸c˜ao ou n˜ao do bacilo foi registrada para cada amostra, resultando em dois conjuntos, relativos a cada m´etodo. Esquematicamente: Meio A. Meio B. Amostra 1 de respostas Sim ou Não. Grupo 1 de pacientes. Grupo 1 de pacientes. Amostra 2 de respostas Sim ou Não. Figura 2.2: Esquema 2. Este ´e um delineamento de pesquisa experimental, onde o pesquisador exerce controle sobre o m´etodo utilizado. 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos O objetivo central da pesquisa etiol´ogica (parte da medicina que trata das causas das doen¸cas) ´e deter- minar se o fato de uma pessoa contrair uma dada doen¸ca est´a associado com um dado fator, o qual pode ser, por exemplo uma caracter´ıstica pessoal, alguma especificidade do ambiente onde viveu ou uma experiˆencia
    • 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos ROSSI, Robson M. 11 pela qual passou. Discutiremos maneiras de se organizar um estudo etiol´ogico, m´etodos estat´ısticos para se determinar quais fatores est˜ao associados com o contrair da doen¸ca e meios de se quantificar esta associa¸c˜ao. A pesquisa etiol´ogica ´e baseada em dados coletados em pacientes convenientemente escolhidos. O pesquisador n˜ao controla quem ser´a exposto ou n˜ao ao fator em quest˜ao, mas tem liberdade de deter- minar quem entrar´a ou n˜ao no estudo. Para que os resultados tenham validade, a pesquisa tem de ser planejada segundo modelos bem definidos. Os principais tipos de planejamento para estudos etiol´ogicos receberam os nomes de estudos tipo Caso-Controle, estudos tipo Coorte, Ensaios Cl´ınicos Aleatorizados, Estudos Descritivos e Seccionais ou Tranversais. 2.4.1 Estudo de Caso-Controle Um estudo tipo caso-controle pode ser definido como um estudo no qual a determina¸c˜ao da associa¸c˜ao da doen¸ca com um fator ´e baseada na observa¸c˜ao de freq¨uˆencias muito altas ou muito pequenas do fator entre as pessoas doentes. Para isto um grupo de indiv´ıduos afetados pela doen¸ca em quest˜ao ´e comparado com um grupo controle de indiv´ıduos n˜ao afetados. Como as informa¸c˜oes s˜ao obtidas de maneira retrospectiva, freq¨uentemente, este tipo de planejamento recebe o nome de Estudo Retrospectivo. Um estudo retrospectivo come¸ca com um grupo de indiv´ıduos, a serem chamados de ”casos”, que tenham contra´ıdos a doen¸ca em quest˜ao. O pesquisador escolhe como padr˜ao de compara¸c˜ao, um grupo ”controle” constitu´ıdo de pacientes que n˜ao est˜ao sofrendo da doen¸ca. A seguir obtem a hist´oria cl´ınica de todos os pacientes selecionados a fim de averiguar a presen¸ca ou ausˆencia do fator de risco que est´a sendo estudado. A quest˜ao ´e saber se o fator de risco est´a presente mais freq¨uentemente ou em n´ıvel mais elevados entre os casos do que entre os controles. Se a evidˆencia for suficiente o pesquisador concluir´a que existe uma associa¸c˜ao entre o fator de risco e a doen¸ca. Idealmente, os casos devem ser todos os que ocorreram durante um per´ıodo de tempo em uma popula¸c˜ao finita. Os controles devem ser pessoas compar´aveis aos casos, mas sem a doen¸ca, ou seja, pessoas que, se desenvolvessem a doen¸ca, seriam escolhidas como casos. Os grupos de casos e de controles podem ser formados de forma emparelhada ou de forma independente. No primeiro esquema, para cada caso ou mais controles semelhantes s˜ao escolhidos. J´a na forma¸c˜ao de grupos de forma independente, os controles n˜ao escolhidos de forma associada a um caso espec´ıfico. Preocupa-se apenas em garantir que o grupo de casos seja, na sua totalidade, parecido com o grupo de controles. O caso particular do emparelhamento em que h´a apenas um controle para cada caso ´e denominado pareamento. Os estudos de caso-controle s˜ao uma forma de pesquisa simples e eficiente, por isso muito utilizada. Atrav´es dela, j´a se verificaram ou se confirmaram associa¸c˜oes entre fatores de risco e v´arios tipos de cˆancer. N˜ao h´a dificuldades ´eticas para sua implementa¸c˜ao e, portanto, os dados usados s˜ao os de seres humanos. Isto livra o pesquisador de dif´ıceis generaliza¸c˜oes inerentes aos estudos desenvolvidos em animais. O tempo gasto e os custos associados s˜ao relativamente pequenos, j´a que, normalmente, s˜ao utilizados dados preexistentes. S˜ao particularmente adequados ao estudo de doen¸cas raras, porque o pesquisador come¸ca com um grupo de pessoas que comprovadamente tˆem a doen¸ca. Sua grande limita¸c˜ao ´e a suscetibilidade aos v´ıcios de informa¸c˜ao e de sele¸c˜ao. Outra ´e que obtemos apenas informa¸c˜ao sobre associa¸c˜ao entre fatores e doen¸ca e n˜ao sobre causas da doen¸ca. O resultado de tais estudos deve ser considerado um elo a mais em uma cadeia de evidˆencias que levar´a ao veredito de causalidade. Descreveremos abaixo alguns tipos de tendenciosidade aos quais os estudos caso-controle est˜ao sujeitos. O leitor deve, antes de se envolver no planejamento de um tal estudo, conhecer mais profundamente a literatura m´edica da ´area. Esta experiˆencia ´e fundamental pois lhe dar´a conhecimento das formas espec´ıficas pelas quais estas tendenciosidades aparecem. Embora n˜ao existindo associa¸c˜ao entre o fator e a doen¸ca em quest˜ao, existem v´arias maneiras pelas quais uma associa¸c˜ao pode aparecer em um estudo caso-controle. Uma delas ´e chamada V´ıcio da Sele¸c˜ao. Ocorre quando os casos ou os controles s˜ao incluidos no estudo por causa de alguma caracter´ıstica que possuam e que est´a relacionada com o fator de risco sendo considerado. Chamamos de V´ıcio de Informa¸c˜ao `aquele introduzido pelos pesquisadores que, j´a desconfiando da associa¸c˜ao a ser constatada, s˜ao mais cuidadosos ao levantar a hist´oria cl´ınica dos casos que dos controles. Dizemos que houve V´ıcio de Confundimento se a associa¸c˜ao observada ´e produto n˜ao do fator considerado mas de outros fatores n˜ao controlados no estudo. O grupo controle ´e usualmente constitu´ıdo de pacientes de hospitais, onde est˜ao sendo tratados os pa- cientes do grupo de casos. Deve-se escolher para o grupo controle pacientes de uma grande variedade de
    • 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos ROSSI, Robson M. 12 doen¸cas. Isto protege os resultados de uma forma de v´ıcio da sele¸c˜ao; o estudo n˜ao detecta uma associa¸c˜ao porque a doen¸ca dos pacientes-controle e a doen¸ca sendo estudada est˜ao ambas associadas com o fator de risco. Quando existe facilidade na coleta de dados o n´umero de pacientes do grupo controle pode ser at´e 4 vezes maior que o n´umero de pacientes do grupo de casos. O m´etodo de sele¸c˜ao dos indiv´ıduos do grupo controle ´e quase que inteiramente dependente das circunstˆancias espec´ıficas do estudo. Aqui tamb´em ´e fun- damental o conhecimento da literatura m´edica da ´area, j´a que ´e usual apresentar-se uma descri¸c˜ao detalhada dos controles utilizados. Exemplo 2.5. Fatores de risco em cˆancer de mama. Gomes (1992), em tese de doutorado na Faculdade de Medicina da UFMG, realizou estudo caso-controle com o objetivo de avaliar a influˆencia de fatores de risco no cˆancer de mama, utilizando dados de nosso meio. Como “casos” foram escolhidas pacientes portadoras de cˆancer de mama registradas no Hospital das Cl´ınicas da UFMG, que satisfizeram os seguintes crit´erios de inclus˜ao: idade na ´epoca do diagn´ostico entre 25 e 75 anos, diagn´ostico feito entre 1978-1987 e confirmado por exame an´atomo-patol´ogico, tumor origin´ario do tecido epitelial e ter sido submetida a algum tipo de cirurgia na mama. Como “controles” foram escolhidas pacientes com idade igual `a do “caso” (mais ou menos dois anos), data de admiss˜ao ao hospital igual `a data de confirma¸c˜ao do diagn´ostico do caso (mais ou menos seis meses) e exame cl´ınico da mama sem indica¸c˜ao de patologias mam´arias. De acordo com esses crit´erios, foram selecionados, atrav´es de emparelhamento, dois controles para cada caso. O primeiro foi selecionado no ambulat´orio de ginecologia e o segundo no registro geral do hospital. A an´alise estat´ıstica, entre v´arias outras conclus˜oes, mostrou que a presen¸ca na paciente de hist´oria familiar (retrospectivamente) de cˆancer de mama aumenta o risco desta patologia em 8,84 vezes. AMOSTRA DE CASOS DOENTES (GRUPOS DE CASOS) NÃO-DOENTES (GRUPO DE CONTROLES) EXPOSTOS NÃO-EXPOSTOS EXPOSTOS NÃO-EXPOSTOS a b c d FORMAÇÃO DOS GRUPOS POR OBSERVAÇÃO DA EXPOSIÇÃO ANÁLISE DE DADOS a, b, c, d : os quatro possíveis resultados (note o caráter retrospectivo) POPULAÇÃO DE CASOS E DE CONTROLES MENSURAÇÃO DA EXPOSIÇÃO AMOSTRA DE CONTROLES  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  Figura 2.3: Esquema de Estudo Caso-Controle.
    • 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos ROSSI, Robson M. 13 Vantagens do Estudo de Caso-Controle • Baixo custo relativo; • Alto potencial anal´ıtico; • Adequado para estudar doen¸cas raras. Desvantagens do Estudo de Caso-Controle • Incapaz de estimar risco (reduzido poder descritivo); • Vulner´avel a in´umeros biases (sele¸c˜ao, etc.) • Complexidade anal´ıtica. 2.4.2 Estudo de Coorte Em contraste com um estudo retrospectivo, um estudo prospectivo avan¸ca no tempo e coloca ˆenfase no fator de risco. O Estudo de Coorte ´e uma forma de pesquisa que visa verificar se indiv´ıduos, selecionados porque foram expostos ao fator de risco, desenvolvem a doen¸ca em quest˜ao, em maior ou menor propor¸c˜ao do que um grupo de indiv´ıduos, compar´aveis, mas n˜ao expostos ao fator de risco. Identificam-se um grupo exposto ao fator e o grupo controle, constitu´ıdo de pessoas que n˜ao foram expostas a ele. Os dois grupos s˜ao acompanhados por um per´ıodo de tempo e as taxas de incidˆencia da doen¸ca calculadas. Se essas taxas s˜ao significativamente diferentes nos dois grupos, o pesquisador conclui que h´a associa¸c˜ao significativa entre a doen¸ca e o fator. Os epidemiologistas preferem o termo “Estudo Tipo Coorte” para este tipo de estudo, entretanto “Estudo Prospectivo” ´e a nomenclatura mais utilizada. Os Estudos de Coorte possuem v´arias vantagens. O pesquisador tem a possibilidade de usar crit´erios uniformes, tanto na identifica¸c˜ao da presen¸ca ou n˜ao do fator de risco ao in´ıcio do estudo, quanto na verifica¸c˜ao da ocorrˆencia da doen¸ca nos v´arios exames de acompamento. Nos dois grupos a comparabilidade pode ser verificada no in´ıcio do estudo e identificadas as vari´aveis para as quais s˜ao necess´arios ajustamentos na an´alise dos dados. Em um estudo prospectivo, o pesquisador tem muito mais liberdade sobre o que medir e como medir, j´a que n˜ao se restringir´a ao uso de dados j´a coletados. Uma outra vantagem, que s´o poder´a ser completamente apreciada ao se estudar a metodologia de an´alise de dados, ´e que os estudos de coorte nos permitem obter diretamente uma estimativa da magnitude do risco relativo. Isto significa que ´e poss´ıvel quantificar o risco de desenvolver a doen¸ca comparando-se o grupo de expostos ao fator de risco com o grupo de n˜ao expostos. Estudos de Coorte s˜ao grandes, longos e normalmente caros. Quanto mais rara a doen¸ca em quest˜ao, maior o n´umero de pacientes que precisam ser examinados, portanto n˜ao indicado para doen¸cas raras. Embora, do ponto de vista te´orico, os Estudos de Coorte sejam melhores que os Estudos Caso-Controle, estes ´ultimos s˜ao mais comuns.
    • 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos ROSSI, Robson M. 14 Sele¸c˜ao das Coortes Grupos de pessoas s˜ao selecionadas para o Estudo de Coorte por uma variedade de raz˜oes. Apresentamos a seguir dois exemplos: Exemplo 2.6. Fumo e cˆancer de pulm˜ao. O cl´assico estudo de Doll & Hill (1964) sobre associa¸c˜ao entre cˆancer no pulm˜ao e fumo ilustra a escolha da coorte pelo fato de o grupo possuir caracter´ısticas que facilitam a obten¸c˜ao dos dados sobre a exposi¸c˜ao ao fator e o seguimento dos pacientes. Foram acompanhados m´edicos da Inglaterra desde o fim dos anos 20, um grupo f´acil de contactar e no qual todas as mortes s˜ao rotineiramente bem documentadas. Estas pesquisas iniciaram-se devido ao grande aumento da mortalidade causada por este cˆancer. No primeiro estudo, publicado em 1950, compararam-se dois grupos de pacientes. O primeiro, constitu´ıdo de todos os casos de cˆancer de pulm˜ao de um conjunto de hospitais londrinos. Assistentes sociais, especial- mente treinadas para o estudo, entrevistaram todos os pacientes internados com diagn´ostico de cˆancer de pulm˜ao, levantando sua hist´oria cl´ınica e seus h´abitos tabagistas. O segundo grupo, chamado de controle, foi constitu´ıdo por pacientes dos mesmos hospitais, sem diagn´ostico de cˆancer, na mesma faixa et´aria, do mesmo sexo e da mesma regi˜ao de residˆencia que os casos anteriores. A Tabela 2.1 mostra os resultados obtidos. A associa¸c˜ao ´e clara e forte. Tabela 2.1: N´umero de fumantes e n˜ao fumantes entre pacientes do sexo masculino com diagn´ostico de cˆancer pulmonar e controles. Grupo Fumantes N˜ao-Fumantes Total Cˆancer pulmonar 647 2 650 Controle 622 27 649 Total 1269 29 1299 A forma de organiza¸c˜ao deste estudo ´e chamada de Estudo Caso-Controle. `A ´epoca, esta metodologia era muito criticada, pois, com facilidade, podia produzir associa¸c˜oes esp´urias. Por isso, a evidˆencia, embora clara e forte, n˜ao foi convincente o suficiente. Assim, os mesmos autores iniciaram um segundo estudo, cuja caracter´ıstica b´asica ´e o fato de que o acompanhamento dos pacientes foi prospectivo. Este tipo de planejamento ´e chamado de Estudo de Coorte. Em outubro de 1951, os pesquisadores enviaram um question´ario simples a todos os m´edicos da Inglaterra, aproximadamente 60.000 indiv´ıduos. O question´ario perguntava se o respondente j´a havia fumado ou n˜ao. Em caso afirmativo, pedia informa¸c˜oes sobre o que e quanto. Mais de dois ter¸cos dos m´edicos responderam com detalhe suficiente para que seus dados pudessem ser inclu´ıdos no estudo. As respostas possibilitaram aos pesquisadores classificar cada respondente como fumante ou n˜ao fumante. A defini¸c˜ao de n˜ao-fumante usada foi: um n˜ao fumante ´e uma pessoa que fumou at´e no m´aximo um cigarro di´ario, em m´edia, por um per´ıodo inferior a um ano. Atrav´es de complexo sistema de acompanhamento, observaram-se nos primeiros 10 anos, 136 mortes associadas ao cˆancer pulmonar entre os m´edicos inclu´ıdos no estudo. Destas, apenas 3 eram de n˜ao-fumantes. Para equalizar os per´ıodos de acompanhamento nos v´arios grupos, trabalhou-se com a taxa de incidˆencia por 1.000 pessoas-ano de exposi¸c˜ao. Os valores desta taxa est˜ao na Tabela 2.2. O risco de morte por cˆancer pulmonar das pessoas que fumam mais de 25 cigarros di´arios ´e quase 32 vezes maior do que o mesmo risco para quem n˜ao fuma. Tabela 2.2: Taxa de mortalidade por 1.000 pessoas-ano devida a cˆancer pulmonar (n´umero de mortes entre parˆenteses) para n˜ao fumantes e fumantes. N˜ao-Fumantes Cigarros di´arios (Fumantes) 0,07(3) 1-14 5-24 25+ 0,57(22) 1,39(54) 2,27(57) Estes dois planejamentos, estudo Caso-Controle e Estudo de Coorte, s˜ao as formas usuais de organiza¸c˜ao da pesquisa etiol´ogica. Muitos outros estudos como os descritos anteriormente foram feitos em popula¸c˜oes variadas para se verificar o poss´ıvel papel do fumo. Em todos, a evidˆencia foi clara. Hoje, o papel de agente
    • 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos ROSSI, Robson M. 15 causador do cˆancer de pulm˜ao ´e amplamente reconhecido e justifica a militˆancia cada vez mais organizada contra o fumo. Em muitos Estudos de Coorte os grupos de compara¸c˜ao s˜ao obtidos ap´os o in´ıcio do estudo, de acordo com o n´ıvel de exposi¸c˜ao ao fator. As coortes do estudo de Framingham sobre doen¸cas coran´arias (Kannel et al., 1972), foram constru´ıdas dividindo-se o grupo acompanhado de acordo com h´abitos de fumo, n´ıveis de colesterol, etc. Nestes casos n˜ao h´a necessidade de um grupo externo de compara¸c˜ao. Exemplo 2.7. Personalidade e desenvolvimento de doen¸ca coronariana. Um Estudo de Coorte com o objetivo de avaliar o poss´ıvel efeito da personalidade no risco de desenvolvi- mento de doen¸ca coronariana foi conduzido entre 3.154 trabalhadores do sexo masculino com idade de 30 a 59 anos (Brand et al., 1976). Os indiv´ıduos entraram no estudo entre 1960-61 e foram acompanhados por um per´ıodo m´edio de 8 anos e meio. Atrav´es de entrevista no in´ıcio do estudo, foram classificados em dois tipos de personalidade, A e B, sendo os primeiros mais agressivos, competitivos e ansiosos. Os resultados da Tabela 2.3 indicam que nas duas faixas et´arias consideradas os percentuais de indiv´ıduos do tipo A que desenvolveram doen¸ca coronariana s˜ao aproximadamente o dobro dos encontrados no outro grupo. Em outras situa¸c˜oes, particularmente quando um grupo submetido a uma exposi¸c˜ao pouco comum ´e estudado, ´e importante comparar o resultado observado com aquele esperado, caso os indiv´ıduos n˜ao tivessem sido submetidos ao fator de risco. Usa-se a experiˆencia da popula¸c˜ao em geral, ao tempo em que a coorte ´e formada, como padr˜ao de compara¸c˜ao. Tabela 2.3: Percentual de indiv´ıduos que desenvolveram doen¸ca coronariana segundo faixa et´aria e tipo de personalidade. Faixa et´aria Personalidade A B 39-49 8,9 4,2 50-59 15,9 7,6 Finalmente, usa-se tamb´em como base de compara¸c˜oes outra coorte formada por pessoas n˜ao expostas, parecidas nas caracter´ısticas demogr´aficas com o grupo exposto. Por exemplo, considerando uma coorte de radiologistas, Seltser e Sartwell (1965) usaram como padr˜ao de compara¸c˜ao dados de oftalmologistas e otorrinolaringologistas. AMOSTRA PARA ESTUDO  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  EXPOSTOS NÃO-EXPOSTOS ou grupo-experimental ou grupo-controle DOENTES NÃO-DOENTES DOENTES NÃO-DOENTES a b c d FORMAÇÃO DOS GRUPOS POR OBSERVAÇÃO DA EXPOSIÇÃO ANÁLISE DE DADOS a, b, c, d : os quatro possíveis resultados POPULAÇÃO MEDIÇÃO DOS EFEITOS Figura 2.4: Esquema de Estudo Coorte.
    • 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos ROSSI, Robson M. 16 Vantagens do Estudo de Coorte • Produz medidas diretas de risco; • Alto poder anal´ıtico; • Facilidade de an´alise. Desvantagens do Estudo de Coorte • Estudos de Coorte s˜ao grandes, longos e normalmente caros. Quanto mais rara a doen¸ca em quest˜ao, maior o n´umero de pacientes que precisam ser examinados. Portanto este estudo ´e inadequado para doen¸cas de baixa freq¨uˆencia; • Vulner´avel a perdas (biases). 2.4.3 Ensaios Cl´ınicos Aleatorizados O Ensaio Cl´ınico Aleatorizado ´e um experimento m´edico, realizado com o objetivo de verificar, entre dois ou mais tratamentos, qual ´e o mais efetivo. S˜ao usados quando ´e incerto o valor de uma nova terapia ou os m´eritos da terapia existente est˜ao em disputa. ´E a metodologia apropriada para a compara¸c˜ao de tratamentos. Ap´os um crit´erio de admiss˜ao ter sido definido, os pacientes s˜ao, `a medida que entram no experimento, alocados de maneira aleat´oria ao grupo controle, que recebe a terapˆeutica padr˜ao, ou ao grupo tratamento, que recebe a terapˆeutica sendo testada. Todo esfor¸co deve ser feito para oferecer os mesmos cuidados aos dois grupos. Terminado o experimento, t´ecnicas estat´ısticas s˜ao usadas para se decidir se h´a ou n˜ao diferen¸ca na efic´acia das terapias envolvidas. Esta ´e uma forma experimental de pesquisa, isto ´e, o pesquisador interfere deliberadamente no curso natural dos acontecimentos, em contraposi¸c˜ao aos estudos observacionais, em que o pesquisador se restringe `a coleta de dados, sem alterar a dinˆamica do processo em considera¸c˜ao. Por isto est´a sujeita a costrangimentos ´eticos, disciplinados pela conven¸c˜ao de Helsinque. O conhecimento pelo paciente ou pelo m´edico do tratamento a ser administrado pode influir na evolu¸c˜ao da doen¸ca, n˜ao atrav´es de fatores estr´ınsecos, mas diretamente pelo processo de auto-sugest˜ao. ´E o efeito placebo, que traz v´ıcios ao estudo cl´ınico. A ´unica maneira de eliminar o efeito placebo nos grupos comparados ´e realizar, sempre que poss´ıvel, experimentos cegos, nos quais o paciente ou o m´edico n˜ao conhece o tratamento, ou duplo-cego, no qual ambas as parte desconhecem o tratamento. Este ideal, entretanto, nem sempre ´e fact´ıvel. Exemplo 2.8. Tamoxifeno e cˆancer de mama. Muitos avan¸cos no tratamento do cˆancer de mama tˆem sido estabelecidos atrav´es de estudos realizados pelo National Surgical Adjuvant Breast and Bowel Project (NSABP). Em 1985, discutia-se a necessidade de se submeter `a quimioterapia ou hormonioterapia, pacientes de bom progn´ostico, logo ap´os a cirurgia. Em particular, havia evidˆencias de v´arias origens de que o tamoxifeno poderia melhorar ainda mais o progn´ostico dessas pacientes. Naquela ´epoca, o tamoxifeno j´a era usado largamente no tratamento de pacientes com cˆancer de mama. Diante disto, o NSABP iniciou o protocolo B-14 para determinar a efic´acia do tamoxifeno em pacientes consideradas de bom progn´ostico, isto ´e, aquelas com tumores com receptor de estr´ogeno positivo (>10 fmol), idade inferior a 70 anos, com cˆancer de mama oper´avel e linfonodos axilares negativos ao exame histol´ogico. Foram criados dois grupos de pacientes atrav´es de aleatoriza¸c˜ao feita dentro de estratos definidos por idade e tamanho do tumor na an´alise cl´ınica, tipo de cirurgia e concentra¸c˜ao de receptor de estr´ogeno. Um grupo recebeu tamoxifeno (10 mg por dia, via oral, duas vezes ao dia) e o outro, placebo, indistingu´ıvel do tamoxifeno na aparˆencia e gosto. Al´em disto, o ensaio foi organizado na forma duplo-cego. Ap´os acompanhamento das pacientes por um per´ıodo de at´e 4 anos, constatou-se uma diferen¸ca signi- ficativa em termos de tempo livre de doen¸ca em favor das pacientes que receberam o tamoxifeno. No grupo tratamento, 83% estavam livres da doen¸ca aos quatro anos ap´os a cirurgia, enquanto que no grupo placebo esta porcentagem era de 73%. Este estudo, publicado por Fisher et al. (1989), contribuiu decisivamente para a ado¸c˜ao do tamoxifeno como quimioterapia adjuvante logo ap´os a cirurgia em pacientes de bom progn´ostico.
    • 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos ROSSI, Robson M. 17 AMOSTRA PARA ESTUDO  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡  EXPOSTOS À INTERVENÇÃO NÃO-EXPOSTOS À INTERVENÇÃO ou grupo-experimental ou grupo-controle EFEITO: PRESENTE EFEITO: AUSENTE EFEITO: PRESENTE EFEITO: AUSENTE a b c d FORMAÇÃO DOS GRUPOS POR ALEATORIZAÇÃO E APLICAÇÃO DOS TRATAMENTOS ANÁLISE DE DADOS a, b, c, d : os quatro possíveis resultados POPULAÇÃO MEDIÇÃO DOS EFEITOS Figura 2.5: Esquema de um Ensaio Cl´ınico Aleatorizado. 2.4.4 Estudos Descritivos As investiga¸c˜oes de cunho descritivo, tˆem o objetivo de informar sobre a distribui¸c˜ao de um evento, na popula¸c˜ao, em termos quantitativos. Elas podem ser de incidˆencia ou de prevalˆencia. Nelas, n˜ao h´a forma¸c˜ao de grupo-controle para a compara¸c˜ao dos resultados, ao menos na forma como ´e feita nos estudos anal´ıticos - da´ı serem considerados estudos n˜ao-controlados. Exemplos de temas de estudos descritivos • A incidˆencia de infec¸c˜ao chag´asica em habitantes rurais; • A prevalˆencia da hepatite B entre os volunt´arios `a doa¸c˜ao de sangue; • As caracter´ısticas demogr´aficas e socioeconˆomicas dos pacientes que sofrem de artrite reumat´oide ou das pessoas que fumam; • As principais causas de ´obito da popula¸c˜ao residente em um dado munic´ıpio; • O estado imunit´ario de pr´e-escolares, de um munic´ıpio, frente `a poliomielite; • Os padr˜oes de crescimento e desenvolvimento de crian¸cas normais ou daquelas acometidas por uma determinada doen¸ca; • A varia¸c˜ao regional na utiliza¸c˜ao de servi¸cos de sa´ude. • A tendˆencia do coeficiente de mortalidade por tuberculose, de uma cidade, nos ´ultimos anos. Estudo de Caso Trata-se de observar um ou poucos indiv´ıduos com uma mesma doen¸ca ou evento e, a partir de descri¸c˜ao dos respectivos casos, tra¸car um perfil das suas principais caracter´ısticas. Muitas revistas cient´ıficas apresentam uma se¸c˜ao de ”relato” ou ”apresenta¸c˜ao de casos”, para difundir os resultados destes estudos. O estudo de casos ´e empregado para enfocar grupos espec´ıficos da popula¸c˜ao ou um particular aspecto de interesse, n˜ao devidamente investigados em pesquisas quantitativas ou que simplesmente necessitem de suplementa¸c˜ao de informa¸c˜oes, com maior riqueza de detalhes. Vantagens do Estudo de Casos • Em geral, o estudo de caso ´e relativamente f´acil de ser realizado e de baixo custo.
    • 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos ROSSI, Robson M. 18 • O relato pode restringir-se a uma simples descri¸c˜ao ou ir mais al´em, de modo a sugerir explica¸c˜oes sobre elementos pouco conhecidos, tais como os fatores implicados na etiologia ou no curso de uma doen¸ca, sob vigˆencia ou n˜ao de terapˆeutica. • Em cl´ınica, ´e poss´ıvel acompanhar pacientes durante anos, e mesmo d´ecadas, chegando-se a um quadro repleto de detalhes sobre aspectos evolutivos de uma dada condi¸c˜ao. • O estudo de casos constitui-se em um verdadeiro invent´ario do que acontece genericamente, `a luz da observa¸c˜ao de poucos indiv´ıduos. • ´E um enfoque qualitativo e explorat´orio, embora muitas facetas possam ser quantificadas. Um aspecto positivo, conv´em real¸car, ´e a possibilidade de observa¸c˜ao intensiva de cada caso. Desvantagens do Estudo de Casos • Os indiv´ıduos observados costumam ser altamente selecionados. `As vezes, a observa¸c˜ao restringe-se a situa¸c˜oes incomuns de enfermos graves, outras vezes, aos casos de evolu¸c˜ao at´ıpica, de rea¸c˜ao inusitada ou de resultado terapˆeutico inesperado; muito raramente, abrange pacientes em todas as faces de manifesta¸c˜ao da doen¸ca. • A falta de indiv´ıduos-controle, para comparar resultados, pode fazer com que simples coincidˆencias sejam dif´ıceis de interpretar: por exemplo, em investiga¸c˜ao de um surto de diarr´eia, se os casos beberam ´agua de um certo po¸co a evidˆencia ´e ainda fr´agil para incriminar a ´agua do po¸co na etiologia da doen¸ca. Seria conveniente saber se os sadios tamb´em beberam ou n˜ao ´agua do mesmo po¸co. Em s´ıntese, apesar das vantagens referentes `a facilidade de realiza¸c˜ao e baixo custo, duas limita¸c˜oes principais est˜ao presentes no estudo de casos: • a falta de controle - eles serviriam para contornar problemas de aferi¸c˜ao e compara¸c˜ao acima men- cionados; • o n´umero pequeno de indiv´ıduos inclu´ıdos para observa¸c˜ao - o que aponta para a prudˆencia na in- terpreta¸c˜ao dos resultados de estudos de casos, especialmente, na generaliza¸c˜ao, como ele tem sido atualmente empregado na ´area cl´ınica, ´e ´util para levantar problemas, muitos dos quais s˜ao comple- mentarmente investigados com o aux´ılio de outros m´etodos. 2.4.5 Seccionais ou Transversais Investiga¸c˜oes que produzem ”instantˆaneos” da situa¸c˜ao de sa´ude de uma popula¸c˜ao ou comunidade, com base na avalia¸c˜ao individual do estado de sa´ude de cada um dos membros do grupo, e da´ı produzindo indicadores globais de sa´ude para o grupo investigado, s˜ao chamadas de estudos seccionais ou de corte- transversal-seccional. O Estudo Seccional tamb´em ´e conhecido como Estudo Transversal ou da Prevalˆencia. Vantagens do Estudo Seccional • Simplicidade e baixo custo; • Rapidez; • N˜ao h´a necessidade de seguimento das pessoas; • Alto potencial descritivo (subs´ıdio ao planejamento); • Boa op¸c˜ao para descrever as caracter´ısticas dos eventos na popula¸c˜ao, para identificar casos na comu- nidade e para detectar grupos de alto risco, aos quais pode ser oferecida aten¸c˜ao especial. Desvantagens do Estudo Seccional • Vulnerabilidade a biases ou v´ıcios (especialmente de sele¸c˜ao);
    • 2.4 Aspectos Estat´ısticos dos Estudos Etiol´ogicos ROSSI, Robson M. 19  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡  AMOSTRA PARA ESTUDO POPULAÇÃO FORMAÇÃO DOS GRUPOS POR OBSERVAÇÃO SIMULTÂNEA DE EXPOSIÇÃO E DOENÇA EXPOSTOS E DOENTES EXPOSTOS E NÃO-DOENTES NÃO-EXPOSTOS E DOENTES NÃO-EXPOSTOS E NÃO-DOENTES ANÁLISE DOS DADOS a b c d Figura 2.6: Esquema de um Estudo Seccional. • Baixo poder anal´ıtico (inadequado para testar hip´oteses causais); • Condi¸c˜oes de baixa prevalˆencia exigem amostra de grande tamanho, logo tˆem dificuldades operacionais; • N˜ao determina risco absoluto (ou seja, a incidˆencia); • A associa¸c˜ao entre exposi¸c˜ao e doen¸ca, se detectada, refere-se `a ´epoca de realiza¸c˜ao do estudo e pode n˜ao ser a mesma da ´epoca de aparecimento da doen¸ca. Exerc´ıcio 2.1. Indique qual forma de pesquisa foi utilizada nos seguintes problemas: 1. (a) ”Viagra para os diab´eticos” (Revista isto ´e, no 1535 de 03/03/1999) - A famosa p´ılula azul pode tamb´em ser eficaz para diab´eticos que tem a fun¸c˜ao er´etil comprometida. Estudos preliminares haviam descartados a eficiˆencia do Viagra nesses casos. Mas uma pesquisa realizada com 268 homens pela Universidade de Creighton, nos Estados Unidos, mostrou que 56 % dos pacientes que tomaram Viagra tiveram melhoras contra 10 % dos que ingeriram placebo. (b) Um estudo foi conduzido em um grupo de gˆemeos monozigotos e dizigotos do mesmo sexo, sendo que um gˆemeo do par tinha cˆancer no c´olon e o outro n˜ao. Todos foram de universidades do sudoeste dos Estados Unidos durante um per´ıodo de 5 anos. Informa¸c˜oes sobre o teor de fibras da dieta foram coletadas para cada um dos indiv´ıduos afim de estimar seu efeito na ocorrˆencia do cˆancer no c´olon. (c) Durante o ano de 1982, identificou-se cada crian¸ca nascida na cidade de Pelotas e procedeu-se `a revis˜ao dos registros de nascimento com o objetivo de conhecer, entre outras vari´aveis, o peso ao nascimento. As crian¸cas eram classificadas em dois grupos (peso normal 2.300g e baixo peso <2.300g) sendo seguidas por um ano. Ao final deste per´ıodo comparou-se a mortalidade infantil nos dois grupos. (d) Com o objetivo de avaliar uma poss´ıvel associa¸c˜ao entre uso de reserpina e cˆancer de mama, forma identificadas 100 pacientes internadas por cˆancer de mama (casos novos) em um hospital geral durante um per´ıodo de dois anos. Estas pacientes foram entrevistadas sendo colhida a informa¸c˜ao quanto ao uso pr´evio de reserpina. Para cada caso eram entrevistados quatro controles, seleciona- dos aleatoriamente dentro do grupo de mulheres internadas por outros diagn´osticos durante o mesmo per´ıodo do caso. (e) 300 pacientes portadores de diabetes mellitus foram alocados aleatoriamente em dois grupos, cada um com 150. O primeiro grupo recebeu uma droga hipoglicemiante nova, enquanto os demais permaneceram em uso de clorpropamida. Os pacientes foram acompanhados por seis meses e o grau de controle metab´olico dos pacientes nos dois grupos foi comparado atrav´es das determina¸c˜oes de glicemia capilar (di´arias) e da hemoglobina glicosilada (aferida a cada dois meses).
    • Cap´ıtulo 3 Estat´ıstica Descritiva 3.1 Organiza¸c˜ao de Dados Estat´ısticos 3.1.1 Normas para a Apresenta¸c˜ao Tabular de Dados A representa¸c˜ao tabular ´e uma apresenta¸c˜ao num´erica dos dados. Consiste em dispor os dados em linhas e colunas, distribu´ıdas de modo ordenado, segundo algumas regras pr´aticas adotadas pelos diversos sistemas estat´ısticos. As regras que prevalecem no Brasil foram fixadas pelo Conselho Nacional de Estat´ıstica. Uma tabela estat´ıstica comp˜oe-se de elementos essenciais e elementos complementares. 1. Elementos essenciais a. T´ıtulo: ´E a indica¸c˜ao da natureza do fato estat´ıstico observado, fazendo referˆencia ao local e ao tempo em que foi observado. b. Cabe¸calho: S˜ao as indica¸c˜oes que especificam o conte´udo das colunas. c. Coluna indicadora: S˜ao as indica¸c˜oes que especificam o conte´udo das linhas. 2. Elementos complementares a. Fonte ´E a entidade respons´avel pelos dados contidos na tabela. b. Nota S˜ao informa¸c˜oes que esclarecem crit´erios usados na confec¸c˜ao da tabela. c. Chamada ´E a informa¸c˜ao de natureza espec´ıfica, que serve para complementar determinado dado usado na confec¸c˜ao da tabela. 20
    • 3.2 Distribui¸c˜ao de Freq¨uˆencias ROSSI, Robson M. 21 Tabela 3.1: Popula¸c˜ao brasileira por faixa et´aria. Idades (Anos) 1980 (%) 1991 (%) 0 `a 9 27.9 23.6 10 `a 19 20.6 18.3 20 `a 59 45.0 50.9 ≥ 60 6.5 7.2 Fonte: IBGE 3.2 Distribui¸c˜ao de Freq¨uˆencias Geralmente ap´os a coleta de dados, estes s˜ao apresentados de forma desorganizada e de dif´ıcil manip- ula¸c˜ao, logo f´az-se necess´ario organiz´a-los. Para organizar os dados provenientes de uma vari´avel qualitativa, ´e usual fazer uma Tabela de freq¨uˆencias. Tabela 3.2: Total de alunos matriculados na UEM em 2002. Sexo Freq¨uˆencia Feminino 7545 Masculino 5905 Total 13450 Fonte: UEM/2002. Quando a vari´avel em estudo ´e do tipo cont´ınua e assume muitos valores distintos, o agrupamento dos dados em classes ser´a sempre necess´ario na constru¸c˜ao das tabelas de freq¨uˆencias. Em publica¸c˜oes mais antigas sobre constru¸c˜ao de tabelas de freq¨uˆencias, h´a f´ormulas para determina¸c˜ao do n´umero de classes de acordo com o n´umero de dados. Essas f´ormulas eram ´uteis, pois a constru¸c˜ao dos gr´aficos era muito custosa sem o aux´ılio do computador. Esse procedimento ´e aconselh´avel como uma primeira visualiza¸c˜ao da distribui¸c˜ao de freq¨uˆencias de uma vari´avel. A seguir ´e apresentado um roteiro para constru¸c˜ao de distribui¸c˜oes de freq¨uˆencia. Exemplo 3.1. Considere uma amostra de 25 crian¸ca, das quais foram obtidas medidas de intoxica¸c˜ao alimentar por uma substˆancia desconhecida (g). Dados brutos 0,77 0,75 0,80 0,78 0,75 0,65 1,05 1,10 0,75 0,75 0,85 0,61 0,78 0,58 0,52 0,78 1,02 0,99 0,65 0,55 0,85 0,90 0,96 0,79 0,55 Fonte: Dados hipot´eticos Os dados, como apresentados acima, s˜ao chamados brutos, pois n˜ao foram ainda submetidos a nenhum tipo de tratamento. Inicialmente, os dados devem ser colocados em ordem crescente: Dados em ordem crescente 0,52 0,55 0,55 0,58 0,61 0,65 0,65 0,75 0,75 0,75 0,75 0,77 0,78 0,78 0,78 0,79 0,80 0,85 0,85 0,90 0,96 0,99 1,02 1,05 1,10 Fonte: Dados hipot´eticos Pode-se observar, agora, que das 25 observa¸c˜oes o menor valor ´e xm´ın = 0, 55 e o maior ´e xm´ax = 1, 10. Amplitude (AT): ´e a diferen¸ca entre o maior e o menor valor do conjunto de dados observados. AT = xm´ax − xm´ın
    • 3.2 Distribui¸c˜ao de Freq¨uˆencias ROSSI, Robson M. 22 Para os dados acima: AT = 1, 10 − 0, 52 = 0, 58 Observe que esse exemplo cont´em um n´umero pequeno de observa¸c˜oes (n = 25), quando h´a um grande n´umero de dados observados o processo de ordena¸c˜ao ´e trabalhoso e a listagem final pouco representar´a. Nesses casos, pode-se simplificar o processo agrupando os dados em certo n´umero de classes, cujos limites ser˜ao denominados limite inferior e limite superior. A quantidade de classes e a amplitude destas devem ser obtidas observando as seguintes normas: i) as classes devem cobrir a amplitude total; ii) o extremo superior de uma classe ´e o extremo inferior da classe seguinte; iii) cada valor observado deve enquadrar-se em apenas uma classe; iv) o n´umero total de classes n˜ao deve ser inferior a 5 e nem superior a 25; O n´umero de classes (k), pode ser obtido de uma das f´ormulas seguintes: i) k = √ n ; ii) k = 1 + 3, 22 log n , (f´ormula de Sturges). Para o exemplo 2.1: k = √ 25 = 5 ou k = 1 + 3, 22log(25) 5, 50. Dividindo a amplitude total (AT) por k = 5 chega-se ao tamanho ou amplitude de cada uma das classes: h = AT k = 0, 58 5 ∼= 0, 12 Obs.: quando os valores observados s˜ao n´umeros inteiros, os limites das classes tamb´em devem ser n´umeros inteiros. Para isso, aconselha-se escolher o n´umero mais pr´oximo de AT que resulte h = AT k em um n´umero inteiro. Agora, utilizando esse valor pode-se obter os limites inferiores e superiores das classes: i) o limite inferior da primeira classe pode ser o menor valor da s´erie, neste caso : 0,52. ii) os demais limites ser˜ao obtidos somando aos limites inferiores o valor de h. Isto ´e, 0, 52 (0, 52 + h = 0, 52 + 0, 12) = 0, 64 0, 64 (0, 64 + h) = 0, 76 0, 76 (0, 76 + h) = 0, 88 0, 88 (0, 88 + h) = 1, 00 1, 00 (1, 00 + h) = 1, 12. Lembrando que a nota¸c˜ao ( ) significa que se esta incluindo os valores iguais ao limite inferior e excluindo os valores iguais ou superiores ao limite superior. A partir da listagem ordenada das classes, pode-se construir os chamados quadros (ou tabelas) de freq¨uˆencia ou distribui¸c˜oes de freq¨uˆencia, que permitem uma melhor visualiza¸c˜ao dos dados. Freq¨uˆencia: ´e o n´umero de valores que aparecem no dom´ınio de uma classe. Um quadro de freq¨uˆencias completo deve conter as seguintes informa¸c˜oes: i) xi ´e o ponto m´edio da i-´esima classe; representa a m´edia dos pontos limites da classe; xi = li + Li 2 ; li : limite inferior e Li : limite superior da classe i. ii) n ´e o tamanho da amostra; iv) Fi ´e a freq¨uˆencia absoluta da i-´esima classe;
    • 3.3 Gr´aficos ROSSI, Robson M. 23 v) fi ´e a freq¨uˆencia relativa da i-´esima classe, fi = Fi n ; vi) Faci ´e a freq¨uˆencia acumulada da i-´esima classe; vii) faci ´e a freq¨uˆencia relativa acumulada da i-´esima classe, faci = Faci n . Assim, no caso da amostra de 25 crian¸ca intoxicadas, a distribui¸c˜ao de freq¨uˆencia pode ser da seguinte forma: Tabela 3.3: Distribui¸c˜ao do n´ıvel de intoxica¸c˜ao. Classes xi Fi fi Fac fac 0,52 0,64 0,58 5 0,20 5 0,20 0,64 0,76 0,70 6 0,24 11 0,44 0,76 0,88 0,82 8 0,32 19 0,76 0,88 1,00 0,94 3 0,12 22 0,88 1,00 1,12 1,06 3 0,12 25 1,00 Total - 25 1 - - Fonte: Dados hipot´eticos Outras informa¸c˜oes: Nenhuma cela ( casa ) deve ficar em branco . H´ıfen ( - ) , indica que o valor num´erico ´e nulo. Reticˆencia ( ... ) , indica que n˜ao se disp˜oe do dado. Interroga¸c˜ao ( ? ) , indica d´uvida quanto a exatid˜ao do valor num´erico. Zeros ( 0 ; 0,0 ; 0,00 ), indica valor muito pequeno em rela¸c˜ao a unidade utilizada. 3.3 Gr´aficos Os gr´aficos s˜ao representa¸c˜oes pict´oricas, de grande valia na compreens˜ao e visualiza¸c˜ao dos dados. Os principais gr´aficos utilizados na representa¸c˜ao estat´ıstica s˜ao: 1. Diagramas; (a) Por Pontos; (b) Por Linhas; i. Poligonais; ii. Curvas; (c) Por Superf´ıcies; i. em Colunas; ii. em Barras; iii. em Histogramas; iv. em Setores; 2. Cartogramas; 3. Estereogramas.
    • 3.3 Gr´aficos ROSSI, Robson M. 24 3.3.1 Diagramas S˜ao representa¸c˜oes gr´aficas de s´eries estat´ısticas por interm´edio de linhas e superf´ıcies. As linhas utilizadas s˜ao as poligonais e as curvas, e as superf´ıcies s˜ao retˆangulos, c´ırculos e quadrados. Para suas contru¸c˜oes pode-se utilizar a proporcionalidade entre s´erie de n´umeros ou do sistema retil´ınio ortogonal. Este sistema estabelece uma correspondˆencia biun´ıvoca entre os pares de n´umeros reais e os pontos de um plano. Assim, de modo geral, num sistema retil´ıneo ortogonal, um ponto P do plano est´a determinado pelos n´umeros reais X e Y, tomados sobre dois eixos divididos em segmentos unit´arios. Diagramas por Pontos (Diagramas de Dispers˜ao): ´E a representa¸c˜ao gr´afica dos dados de forma bruta e geral, o que pode fornecer uma id´eia da variabilidade dos dados, pontos extremos tec. 0 2 4 6 8 0246810 x y Figura 3.1: Diagrama de Dispers˜ao de Pontos. Diagramas por Linha Poligonal: ´E a representa¸c˜ao gr´afica de uma s´erie estat´ıstica por meio de uma linha poligonal. ´E um dos mais impor- tantes gr´aficos; representa observa¸c˜oes feitas ao longo do tempo, em intervalos iguais ou n˜ao. Tais conjuntos de dados constituem as chamadas s´eries hist´oricas ou s´eries temporais. Traduzem o comportamento de um fenˆomeno em certo intervalo de tempo. 3.54.04.55.05.56.0 x y Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Figura 3.2: Gr´afico para S´eries Temporais.
    • 3.3 Gr´aficos ROSSI, Robson M. 25 O pol´ıgono de freq¨uˆencia ´e um gr´afico que se obt´em unindo por uma poligonal os pontos correspondentes `as freq¨uˆencias das diversas classes, centradas nos respectivos pontos m´edios. Para obter as interse¸c˜oes do pol´ıgono com o eixo, cria-se em cada extremo do histograma uma classe com freq¨uˆencia nula. Obs.: Suavizando a linha poligonal que define o pol´ıgono obt´em-se uma curva que visualiza a tendˆencia de varia¸c˜ao dos dados. Amostra Probabilidade −4 −3 −2 −1 0 1 2 3 0.00.10.20.3 Figura 3.3: Suaviza¸c˜ao do pol´ıgono de freq¨uˆencia. Ogiva A Ogiva ou Pol´ıgono de Freq¨uˆencia Acumulada, consiste de uma linha poligonal das Fac ou das fac. Diagramas por Linha Curva: ´E a representa¸c˜ao de uma s´erie estat´ıstica por meio de uma linha curva. Pode ser utilizada para repre- sentar uma tendˆencia do tipo linear. −2 0 2 4 6 020406080 x y Figura 3.4: Diagrama por Linha Curva. Diagrama por Superf´ıcie em Colunas: ´E a representa¸c˜ao de uma s´erie estat´ıstica por interm´edio de retˆangulos em posi¸c˜oes verticais. Este tipo de gr´afico proporciona comparar grandezas.
    • 3.3 Gr´aficos ROSSI, Robson M. 26 Os valores da vari´avel dependente, dados pela s´erie estat´ıstica ou suas diferen¸cas, devem ser proporcionais `as ´areas dos retˆangulos a serem tra¸cados. Para tanto pode-se utilizar o sitema retil´ınio ortogonal marcando- se os pontos de forma j´a indicada, e a partir do eixo dos x, construir retˆengulos de bases iguais e que tenham respectivamente, por meio de cada base, os valores da vari´avel independente e os pontos marcados. 0 1 2 3 4 5 6 0510152025 Figura 3.5: Gr´afico em Barras Verticais. 3.3.2 Histograma Diagrama por Superf´ıcie em Histogramas: O Histograma ´e um conjunto de retˆangulos com bases sobre um eixo dividido de acordo com os tamanhos de classe, centrados nos pontos m´edios das classes e ´areas proporcionais `as freq¨uˆencias. amostra Freqüência −3 −2 −1 0 1 2 05101520 Figura 3.6: Histograma. Diagrama por Superf´ıcie em Setores (Pizza): ´E a representa¸c˜ao gr´afica de uma s´erie estat´ıstica por interm´edio de superf´ıcies setoriais. ´E utilizado quando se pretende comparar os valores de uma s´erie com a sua soma total. A representa¸c˜ao ´e feita tomando como figura b´asica um c´ırculo que ´e dividido em setores. O quociente entre a soma dos valores da s´erie e a ´area do c´ırculo deve ser o mesmo que entre cada valor da vari´avel dependente e a respectiva ´area do setor representativo. Por´em em virtude da proporcionalidade das ´areas dos setores de um c´ırculo com seus ˆangulos centrais, podem-se dividir os valores considerados na s´erie proporcionalmente a estes ˆangulos.
    • 3.4 Medidas Descritivas ROSSI, Robson M. 27 A B C D Figura 3.7: Diagrama por Superf´ıcie em Setores (Pizza). 3.4 Medidas Descritivas 3.4.1 Medidas de Tendˆencia Central ou de Posi¸c˜ao S˜ao medidas que objetivam representar o ponto central de equil´ıbrio de uma distribui¸c˜ao de dados. Essas medidas representam quantitativamente os dados, sendo as mais utilizadas em an´alise: M´edia Representa o ponto de equil´ıbrio de um conjunto de dados. Seja (x1, . . . , xn) um conjunto de dados. A m´edia ser´a dada por: µ = N i=1 xi N ( dados populacionais ), para dados n˜ao-agrupados em tabelas de freq¨uˆencias. x = n i=1 xi n ( dados amostrais ), para dados n˜ao-agrupados em tabelas de freq¨uˆencias. x = k i=1 xiFi n ( dados amostrais ), quando os dados agrupados em tabelas de freq¨uˆencias, com k classes. Quando os dados s˜ao agrupados em intervalos de classes, xi corresponde ao ponto m´edio do intervalo. Exemplo 3.2. Considere do Exemplo anterior, o conjunto de dados da amostra retirada da vari´avel n´ıvel de intoxa¸c˜ao, dado no in´ıcio desta parte. A m´edia ser´a dada por: xA = 25 i=1 xi n = 19, 53 25 = 0, 7812, para os dados brutos, ou xB = 5 i=1 xiFi n = 19, 66 25 = 0, 7864, para os dados agrupados (Tabela 3.3). Observe que ¯xA ¯xB.
    • 3.4 Medidas Descritivas ROSSI, Robson M. 28 Propriedades da M´edia: 1 - A soma alg´ebrica dos desvios tomados em rela¸c˜ao a m´edia ´e nula. Isto ´e, k i=1 di = k i=1(xi − x) = 0 , i = 1, 2, . . . , n X = {2, 3, 7} → x = 4, pela propriedade: k i=1 di = (2 − 4) + (3 − 4) + (7 − 4) = 0. 2 - Somando-se ou subtraindo-se uma constante k, a todos os valores de uma vari´avel, a m´edia do conjunto fica aumentada ou diminu´ıda dessa constante. yi = xi ± k ⇒ y = x ± k Para k = +2, tem-se: Y = {4, 5, 9} → y = 6, pela propriedade: y = x + 2 = 4 + 2 = 6. 3 - Multiplicando-se ou dividindo-se todos os valores de uma vari´avel por uma constante k, a m´edia do conjunto fica multiplicada ou dividida por essa constante. yi = k · xi ⇒ y = k · x e yi = xi k ⇒ y = x k ; .k = 0. Para k = +5, tem-se Y = {10, 15, 35} → y = 20, pela propriedade: y = 5.x = 5.4 = 20. Vantagens e desvantagens da M´edia: 1 - ´E uma medida que, pˆor uniformizar os dados, n˜ao representa bem os conjuntos que revelam tendˆencias extremas, uma vez que a mesma ser´a grandemente influenciada pelos valores discrepantes. Suponha por exemplo, que durante um ano letivo, um aluno tenha as seguintes notas em uma disciplina: 30, 35, 25, 30, 25 35, 35, 95, 90, 100. Um c´alculo r´apido nos mostra que sua m´edia final foi x = 500 10 = 50. Como a m´edia deve traduzir o aproveitamento do aluno durante o ano e a m´edia 50 s´o foi conseguida `a custa das trˆes ´ultimas notas, conclu´ımos que 50 ´e um valor falho para medir o aproveitamento do aluno. 2 - A m´edia nem sempre tem existˆencia real, isto ´e, ela nem sempre faz parte do conjunto de dados (x /∈ X). 3 - ´E a medida de posi¸c˜ao mais conhecida e de maior emprego. 4 - ´E facilmente calculada. 5 - Serve para compararmos conjuntos semelhantes. 6 - Depende de todos os valores do conjunto de dados. 7 - em geral n˜ao ocupa a posi¸c˜ao central do conjunto (ocupa a posi¸c˜ao do centro de equil´ıbrio). Moda A Moda (Mo) ´e o valor que ocorre com maior freq¨uˆencia em uma s´erie de dados. Existem s´eries de dados em que nenhum valor aparece mais vezes que outros. Neste caso n˜ao apresenta moda. S˜ao s´eries amodais. Em outros casos, pode aparecer dois ou mais valores de concentra¸c˜ao. Diz-se ent˜ao, que a s´erie tem duas ou mais modas (bimodal, trimodal ou multimodal). X : {2, 2, 2, 2, 5, 5, 5, 6, 6, 7, 8} → Mo = 2 (unimodal).
    • 3.4 Medidas Descritivas ROSSI, Robson M. 29 Quando os dados se apresentam agrupados em tabelas de freq¨uˆencias ´e necess´ario utilizar a express˜ao de “Czuber” (a mais precisa), dada a seguir, para calcular o valor que representa a moda: ( onde i ´e a ordem da classe de maior freq¨uˆencia). “Czuber”: Mo = li + h(Fi − Fi−1) (Fi − Fi−1) + (Fi − Fi+1) . Outras modas: “Pearson”: Mo = 3.Md − 2.x e “King”: Mo = li + h.Fi+1 Fi−1 + Fi+1 . Exemplo 3.3. Calcular a moda de Czuber, para os dados agrupados da amostra dada na Tabela 3.3. i = 3 (Classe de maior freq¨uˆencia) h = 0, 12 l3 = 0, 76 Fi = F3 = 8 Fi−1 = F2 = 6 Fi+1 = F4 = 3 Mo = 0, 76 + 0, 12(8 − 6) (8 − 6) + (8 − 3) 0, 794 Isto significa que o n´ıvel de toxicidade mais freq¨uˆente ´e de 0,794 g. Mediana A mediana (Md) de um conjunto de valores ordenados segundo uma ordem de grandeza, ´e o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo n´umero de elementos (´e o valor que est´a no meio !). Quando o conjunto de observa¸c˜oes tem um n´umero ´ımpar de valores, n˜ao-agrupados em classes, ent˜ao a mediana ´e dada pela express˜ao: Md = xp , onde p = n + 1 2 . x1 x2 x3 x4 x5 3 5 5 6 7 → Md = 5. Quando o conjunto de observa¸c˜oes tem um n´umero par de valores, n˜ao-agrupados em classes, ent˜ao a mediana ser´a, a m´edia aritm´etica dos dois n´umeros que ocuparem o meio da s´erie: Md = xp + xp+1 2 , onde p = n 2 . x1 x2 x3 x4 x5 x6 3 5 5 6 7 7 → Md = 5 + 6 2 = 5, 5. Quando o conjunto de observa¸c˜oes se apresenta agrupados em classes em uma tabela de freq¨uˆencias, ent˜ao a mediana ´e dada pela express˜ao abaixo, onde onde i representa a classe mediana, isto ´e, a classe onde estar´a presente o valor de p = n 2 . Md = li + h(p − Fac−1) Fi Exemplo 3.4. Calcular a mediana para os dados agrupados da amostra da Tabela 3.3.
    • 3.4 Medidas Descritivas ROSSI, Robson M. 30 n = 25 i = 3 p = n 2 = 12, 5 est´a na terceira linha −→ olhar em Fac h = 0, 12 Fi = 8 Fac−1 = 11 (freq¨uˆencia acumulada da classe anterior) l3 = 0, 76 Md = 0, 76 + 0, 12(12, 5 − 11) 8 0, 783 Isto significa que o 50% das crian¸cas apresenta n´ıvel de toxicidade acima de 0,783 g. 3.4.2 Medida de Variabilidade ou de dispers˜ao S˜ao medidas estat´ısticas que indicam o grau de dispers˜ao, ou variabilidade do conjunto de observa¸c˜oes pesquisados, em rela¸c˜ao a uma medida de tendˆencia central, por exemplo, ¯x. Uma ´unica medida n˜ao ´e suficiente para descrever de modo satisfat´orio um conjunto de observa¸c˜oes. Por exemplo, dois conjuntos de dados podem ter a mesma m´edia aritm´etica e, no entanto, a dispers˜ao de um pode ser muito maior que a dispers˜ao do outro. As principais medidas de dispers˜ao s˜ao: amplitude total (AT), variˆancia (σ2 ou s2 ), desvio-padr˜ao (σ ou s) e coeficiente de varia¸c˜ao (CV). Amplitude total Amplitude total (AT): ´E a diferen¸ca entre o maior e o menor valor observado AT = xm´ax − xm´ın Desvio absoluto m´edio Desvio absoluto m´edio (Dm): ´E a m´edia aritm´etica dos valores absolutos dos desvios tomados em rela¸c˜ao a uma das seguintes medidas de tendˆencia central: m´edia ou mediana. Desvio m´edio em rela¸c˜ao `a m´edia para dados n˜ao tabulados: Dm = n i=1 |xi − ¯x| n Desvio m´edio em rela¸c˜ao `a m´edia para dados tabulados: Dm = n i=1 |xi − ¯x| Fi n Variˆancia Variˆancia [Var(X)]. ´E a medida que fornece o grau de dispers˜ao, ou variabilidade dos valores do conjunto de observa¸c˜oes em torno da m´edia. Ela ´e calculada somando os quadrados dos desvios em rela¸c˜ao `a m´edia: Amostral Populacional D. Brutos s2 = n i=1 (xi − ¯x) 2 n − 1 σ2 = N i=1 (xi−µ)2 N D. Agrupados s2 = k i=1 (xi − ¯x) 2 Fi n − 1 ou s2 = 1 n − 1      k i=1 x2 i Fi − k i=1 xiFi 2 n      σ2 = k i=1 (xi−µ)2 Fi N
    • 3.4 Medidas Descritivas ROSSI, Robson M. 31 Desvio-padr˜ao Desvio-padr˜ao [DP(X)]. Como a variˆancia calculada a partir do quadrados dos desvios, sua unidade ´e quadrada em rela¸c˜ao `a vari´avel estudada, o que, sob o ponto de vista pr´atico ´e um inconveniente. Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpreta¸c˜ao pr´atica, denominada desvio padr˜ao, definida como a raiz quadrada da variˆancia e representada por: Amostral Populacional s = √ s2 σ = √ σ2 Propriedades da Variˆancia e do Desvio-Padr˜ao 1 - V ar(X) ≥ 0 =⇒ DP(X) ≥ 0. 2 - Somando-se ou subtraindo-se uma constante k, a todos os valores de uma vari´avel, a variˆancia e o desvio-padr˜ao do novo conjunto permanecem inalterados: Y = X ± k ⇒ V ar(Y ) = V ar(X) + 0 Y = X ± k ⇒ DP(Y ) = DP(X) + 0 X: Vari´avel Aleat´oria e k: constante real. 3 - Multiplicando-se ou dividindo-se todos os valores de uma vari´avel por uma constante, k, a variˆancia e o desvio-padr˜ao do novo conjunto s˜ao alterados da seguinte forma: Y = k · X ⇒ V ar(Y ) = k2 · V ar(X) Y = k · X ⇒ DP(Y ) = |k| · DP(X) e para k = 0, Y = X k ⇒ V ar(Y ) = V ar(X) k2 Y = X k ⇒ DP(Y ) = DP(X) |k| 4 - Sejam X e W vari´aveis aleat´orias independentes, a e b constantes reais, tal que Y = aX ± bW, tem-se: Y = aX ± bW ⇒ V ar(Y ) = V ar(aX ± bW) = a2 V ar(X) + b2 V ar(W). Variˆancia Relativa A variˆancia relativa de uma s´erie X ´e indicada por VR(X) e definida por: V R(X) = s2 (¯x) 2 (amostral) Note que o coeficiente de varia¸c˜ao, como ´e uma divis˜ao de elementos de mesma unidade, ´e um n´umero puro. Portanto, pode ser expresso em percentual. Coeficiente de varia¸c˜ao Coeficiente de varia¸c˜ao (CV). ´E uma medida relativa da dispers˜ao ou variabilidade dos dados: CV(x) = s ¯x (amostral) ou CV(x) = σ µ (populacional). Crit´erios para interpreta¸c˜ao: Quanto menor for o coeficiente de varia¸c˜ao (CV ≤ 25%), mais representa- tiva dos dados ser´a a m´edia.
    • 3.5 Medidas Separatrizes ROSSI, Robson M. 32 Exemplo 3.5. Calcular a variˆancia, o desvio-padr˜ao e o coeficiente de varia¸c˜ao para o conjunto de dados da amostra X: {2, 3, 5, 7}. Sabemos que x = 4, 25 4, 3, ent˜ao: s2 = n i=1 (xi − ¯x) 2 n − 1 = (2 − 4, 3) 2 + (3 − 4, 3) 2 + (5 − 4, 3) 2 + (7 − 4, 3) 2 3 4, 92 s = √ 4, 92 2, 12, assim: CV = 2, 12 4, 25 0, 522 (sendo CV=52,2% > 25%, h´a indicativo de que a m´edia n˜ao ´e representativa). Exemplo 3.6. Calcular a variˆancia, o desvio-padr˜ao e o coeficiente de varia¸c˜ao para o conjunto de dados amostrais apresentados na tabela abaixo. Tabela 3.4: Exemplo de Tabela de Freq¨uˆencia. xi Fi 1 2 3 4 5 2 Total 8 sendo x = 3 i=1 xiFi n = 1.2 + 3.4 + 5.2 8 = 3, temos s2 = k i=1 (xi − ¯x) 2 Fi n − 1 = (1 − 3) 2 .2 + (3 − 3) 2 .4 + (5 − 3) 2 .2 7 2, 29, ou s2 = 1 n − 1      k i=1 x2 i Fi − k i=1 xiFi 2 n      = s2 = 1 8 − 1 88 − (24) 2 8 = 16 7 2, 29 logo, s = √ 2, 29 1, 51, assim: cv = 1, 51 3 0, 50 (h´a indicativo de que a m´edia n˜ao ´e representativa). 3.5 Medidas Separatrizes 3.5.1 Quartis, Decis e Percentis As medidas de posi¸c˜ao denominadas “Separatrizes” para valores agrupados s˜ao calculadas atrav´es da express˜ao: Sk = li + h(p − Fac−1) Fi onde SK : ´e a medida de posi¸c˜ao separatriz desejada (Md : Mediana, Qk : Quartil, Dk : Decil ou Pk : Percentil de ordem k); k : ´e a ordem da medida; w : ´e o divisor;
    • 3.5 Medidas Separatrizes ROSSI, Robson M. 33 Sk k w Md 1 2 Q 1, 2, 3 4 D 1, 2, ...,9 10 P 1, 2, ...,99 100 p : ´e a posi¸c˜ao da observa¸c˜ao, dado por: p = n.k w Exemplo 3.7. Calcule o Q1, Q2, Q3, D7, P10 e P90 para os dados da Tabela 3.3. Tabela 3.5: Distribui¸c˜ao do n´ıvel de intoxica¸c˜ao (g) em 25 crian¸cas. Classes xi Fi fi Fac fac 0,52 0,64 0,58 5 0,20 5 0,20 0,64 0,76 0,70 6 0,24 11 0,44 0,76 0,88 0,82 8 0,32 19 0,76 0,88 1,00 0,94 3 0,12 22 0,88 1,00 1,12 1,06 3 0,12 25 1,00 Total - 25 1 - - Fonte: Dados hipot´eticos Solu¸c˜ao: C´alculo de Q1 : {k = 1; w = 4; } p = 25.1 4 = 6, 25 (i = 2 : olhar em Fac) h = 0, 12 Fi = F2 = 6 li = 0, 64 Fac−1 = 5 Q1 = 0, 64 + 0, 12(6, 25 − 5) 6 = 0, 64 + 0, 025 = 0, 665 Obs.: O valor Q1 = 0, 665 representa o n´ıvel de intoxica¸c˜ao que deixa 25% dos demais valores abaixo dele. C´alculo de Q2 : {k = 2; w = 4; } p = 25.2 4 = 12, 5 (i = 3) h = 0, 12 Fi = 8 li = 0, 76 Fac−1 = 11 Q2 = 0, 76 + 0, 12(12, 5 − 11) 8 0, 783 = Md Obs.: O valor Q2 0, 783 representa o o n´ıvel de intoxica¸c˜ao que deixa 50% dos demais valores abaixo dele, isto ´e, ´e o valor mediano. C´alculo de Q3 : {k = 3; w = 4; } p = 25.3 4 = 18, 75 (i = 3) h = 0, 12 Fi = 8 li = 0, 76 Fac−1 = 11 Q3 = 0, 76 + 0, 12(18, 75 − 11) 8 0, 876
    • 3.5 Medidas Separatrizes ROSSI, Robson M. 34 Obs.: O valor Q3 0, 876 representa o n´ıvel de intoxica¸c˜ao que deixa 75% dos demais valores abaixo dele. C´alculo de D7 : {k = 7; w = 10; } p = 25.7 10 = 17, 5 (i = 3) h = 0, 12 Fi = 8 li = 0, 76 Fac−1 = 11 D7 = 0, 76 + 0, 12(17, 5 − 11) 8 0, 858 Obs.: O valor D7 0, 858 representa o o n´ıvel de intoxica¸c˜ao que deixa 70% dos demais valores abaixo dele. C´alculo de P10 : {k = 10; w = 100; } p = 25.10 100 = 2, 5 (i = 1) h = 0, 12 Fi = 5 li = 0, 52 Fac−1 = 0 P10 = 0, 52 + 0, 12(2, 5 − 0) 5 = 0, 58 Obs.: O valor P10 = 0, 58 representa o o n´ıvel de intoxica¸c˜ao que deixa 10% dos demais valores abaixo dele. C´alculo de P90 : {k = 90; w = 100; } p = 25.90 100 = 22, 5 (i = 1) h = 0, 12 Fi = 3 li = 1, 00 Fac−1 = 22 P90 = 1 + 0, 12(22, 5 − 22) 3 = 1, 02 Obs.: O valor P90 = 1, 02 representa o o n´ıvel de intoxica¸c˜ao que deixa 90% dos demais valores abaixo dele ou 10% acima dele. 3.5.2 Medidas de Simetria Tem por objetivo b´asico medir o quanto a distribui¸c˜ao de freq¨uˆencias do conjunto de valores observados se afasta da condi¸c˜ao de simetria. (A) Distribui¸c˜ao Assim´etrica negativa. Quando a m´edia ´e menor que a mediana que ´e menor que a moda. (B) Distribui¸c˜ao Sim´etrica. Quando a m´edia, moda e mediana s˜ao iguais, ou muito pr´oximas. (C) Distribui¸c˜ao Assim´etrica positiva. Quando a m´edia ´e maior que a mediana que ´e maior que a moda.
    • 3.5 Medidas Separatrizes ROSSI, Robson M. 35 Gr´afico das distribui¸c˜oes quanto `a assimetria Figura 3.8: (A) Assim´etrica Negativa (¯x < Md < Mo) Figura 3.9: (B) Sim´etrica (¯x = Md = Mo) Figura 3.10: (C) Assim´etrica Positiva (Mo < Md < ¯x) Uma das medidas para quantificar a assimetria de uma distribui¸c˜ao pode ser dada pelo primeiro coe- ficiente de assimetria de Pearson (Ap) : Ap = ¯x − Mo s ou Ap = 3 (¯x − Md) s Outra ´e atrav´es do coeficiente quartil´ıtico de Bowley (Ab) : Ab = Q3 + Q1 − 2Md Q3 − Q1 Em ambos temos: Se A < 0 a distribui¸c˜ao ´e assim´etrica negativa. Se A = 0 a distribui¸c˜ao ´e distribui¸c˜ao sim´etrica. Se A > 0 a distribui¸c˜ao ´e assim´etrica positiva. Exemplo 3.8. Considerando o conjunto de dados da Tabela 3.3, obter Ap. sabemos que: x = 0, 7864; s = 0, 153 e Mo 0, 794, assim: Ap = ¯x − Mo s = 0, 786 − 0, 794 0, 153 −0, 04967 (Ap < 0 : assim´etrica negativa ).
    • 3.5 Medidas Separatrizes ROSSI, Robson M. 36 3.5.3 Medidas de Curtose A curtose ou achatamento mede a concentra¸c˜ao ou dispers˜ao dos valores de um conjunto de valores em rela¸c˜ao `as medidas de tendˆencia central em uma distribui¸c˜ao de freq¨uˆencias conhecida (a distribui¸c˜ao Normal). (A) Distribui¸c˜ao Leptoc´urtica. Quando a distribui¸c˜ao apresenta uma curva de freq¨uˆencia mais “fechada” que a da distribui¸c˜ao Normal. (B) Distribui¸c˜ao Mesoc´urtica. Quando a distribui¸c˜ao apresenta uma curva de freq¨uˆencia “idˆentica” a da distribui¸c˜ao Normal. (C) Distribui¸c˜ao Platic´urtica. Quando a distribui¸c˜ao apresenta uma curva de freq¨uˆencia mais “aberta” que a da distribui¸c˜ao Normal. Gr´afico das distribui¸c˜oes quanto `a curtose Figura 3.11: Leptoc´urtica Figura 3.12: Mesoc´urtica Figura 3.13: Platic´urtica As medidas de curtose podem ser calculadas atrav´es da express˜ao: k = (Q3 − Q1) 2(P90 − P10) Obs1: k : coeficiente de curtose
    • 3.5 Medidas Separatrizes ROSSI, Robson M. 37 Obs2: Q3 − Q1 ´e denominado Desvio Interquartil´ıtico. Relativamente `a curva da distribui¸c˜ao Normal, temos: Se k < 0, 263 ( leptoc´urtica ) Se k = 0, 263 ( mesoc´urtica ) Se k > 0, 263 ( platic´urtica ) Podemos utilizar tamb´em, o coeficiente de curtose baseado nos momentos centrados (k4), para dados tabelados: k4 = (xi − ¯x)4 Fi Fi σ4 − 3 Lembrando que σ4 = σ2 2 = (xi − ¯x)2 Fi N 2 (populacional). e s4 = s2 2 = (xi − ¯x)2 Fi n − 1 2 (amostral). Analogamente, temos: Se k4 > 0 a distribui¸c˜ao ´e leptoc´urtica Se k4 = 0 a distribui¸c˜ao ´e mesoc´urtica Se k4 < 0 a distribui¸c˜ao ´e platic´urtica Exemplo 3.9. Considerando o conjunto de dados da Tabela 3.3, obter k, o coeficiente de curtose interquar- til´ıtico. Sabemos que Q1 = 0, 665, Q3 = 0, 876, P10 = 0, 58 e P90 = 1, 02 , ent˜ao: k = (Q3 − Q1) 2(P90 − P10) = (0, 876 − 0, 665) 2(1, 02 − 0, 58) = 0, 2398 (k < 0, 263 : leptoc´urtica).
    • Cap´ıtulo 4 Inferˆencia Estat´ıstica 4.1 Introdu¸c˜ao Inferˆencia Estat´ıstica ou Estat´ıstica indutiva ´e a parte da estat´ıstica que utiliza m´etodos cient´ıficos para fazer afirma¸c˜oes e tirar conclus˜oes sobre caracter´ısticas ou parˆametros de uma popula¸c˜ao, baseando-se em resultados de uma amostra. O pr´oprio termo “indutiva” decorre da existˆencia de um processo de indu¸c˜ao, isto ´e, um processo de racioc´ınio em que, partindo-se do conhecimento de uma parte, procura-se tirar conclus˜oes sobre a realidade no todo. O uso de informa¸c˜oes da amostra para concluir sobre o todo faz parte da atividade di´aria da maioria das pessoas. Basta observar como uma cozinheira verifica se o prato que ela est´a preparando tem ou n˜ao a quantidade adequada de sal. Ou ainda, quando uma dona de casa, ap´os experimentar um peda¸co de uma laranja numa banca de feira, decide se as compra ou n˜ao. Essas s˜ao decis˜oes baseadas em procedimentos amostrais. O objetivo ´e procurar a conceitua¸c˜ao formal desses princ´ıpios intuitivos do dia-a-dia para que possam ser utilizados cientificamente em situa¸c˜oes mais complexas. ´E f´acil perceber que um processo de inferˆencia ou indu¸c˜ao ( em estat´ıstica) n˜ao pode ser exato. A Inferˆencia Estat´ıstica, entretanto, ir´a dizer at´e que ponto pode-se estar errando nas inferˆencias, e com que probabilidade. Esse fato ´e fundamental para que uma inferˆencia possa ser considerada estat´ıstica, e faz parte dos objetivos da Inferˆencia Estat´ıstica. Em suma, a Inferˆencia Estat´ıstica busca obter resultados sobre as popula¸c˜oes a partir das amostras, dizendo tamb´em, qual a precis˜ao desses resultados e com que probabilidade se pode confiar nas conclus˜oes obtidas. Evidentemente, a forma como as inferˆencias ser˜ao realizadas ir´a depender de cada tipo de problema, conforme ser´a estudado posteriormente. Segue-se que a teoria da Inferˆencia Estat´ıstica recorre intensamente a conceitos e resultados do C´alculo de Probabilidades. 4.2 Problemas de Inferˆencia O objetivo da Inferˆencia Estat´ıstica ´e obter afirma¸c˜oes sobre uma dada caracter´ıstica da popula¸c˜ao, na qual se tem interesse, a partir de informa¸c˜oes colhidas de uma amostra. Essa caracter´ıstica de interesse pode ser representada por uma vari´avel aleat´oria. Se informa¸c˜oes completa sobre a distribui¸c˜ao de probabilidade da vari´avel em estudo, fosse conhecida n˜ao haveria necessidade de colher uma amostra. Toda afirma¸c˜ao desejada seria obtida atrav´es da distribui¸c˜ao da vari´avel, usando-se as propriedades estudadas anteriormente. Mas isso raramente acontece. A informa¸c˜ao que se tem a respeito da vari´avel ´e parcial ou nada se conhece. Por exemplo, a altura dos brasileiros adultos, apresenta uma distribui¸c˜ao normal, mas os parˆametros que a caracterizam (m´edia e variˆancia) s˜ao desconhecidos. Em outros casos, pode-se ter uma id´eia da m´edia e variˆancia, mas se desconhece a forma da curva. Ou ainda, n˜ao h´a informa¸c˜oes nem sobre os parˆametros, nem sobre a forma da curva. Ent˜ao, o uso de uma amostra permite ter uma id´eia sobre o comportamento da vari´avel na popula¸c˜ao. 38
    • 4.3 Distribui¸c˜ao Amostral ROSSI, Robson M. 39 4.3 Distribui¸c˜ao Amostral J´a foi visto, que o problema da Inferˆencia Estat´ıstica ´e fazer uma afirma¸c˜ao sobre parˆametros da popula¸c˜ao atrav´es da amostra. Suponha que uma afirma¸c˜ao deva ser feita sobre um parˆametro populacional (m´edia, variˆancia ou qualquer outra medida). Ser´a utilizado uma amostra aleat´oria simples, com reposi¸c˜ao, de n elementos sorteados dessa popula¸c˜ao. A decis˜ao ser´a baseada em uma estat´ıstica calculada em fun¸c˜ao da amostra, (X1 ,X2 ,.., Xn). A validade da resposta seria melhor compreendida se fosse conhecido o que acontece com a estat´ıstica, quando todas as amostras de uma popula¸c˜ao conhecida s˜ao retiradas, segundo o plano amostral adotado. Isto ´e, qual a distribui¸c˜ao da estat´ıstica quando (X1 ,X2 ,.., Xn) assume todos os valores poss´ıveis. Esta distribui¸c˜ao ´e chamada de distribui¸c˜ao amostral da estat´ıstica e desempenha papel fundamental na teoria de Inferˆencia Estat´ıstica. Didaticamente, tem-se o seguinte esquema: 1. Uma popula¸c˜ao X, com um certo parˆametro de interesse. 2. Todas as amostras retiradas da popula¸c˜ao, de acordo com um certo procedimento. 3. Para cada amostra, calcula-se o valor da estat´ıstica. 4. Os valores da estat´ıstica formam uma nova popula¸c˜ao, cuja distribui¸c˜ao recebe o nome de distribui¸c˜ao amostral da estat´ıstica. 4.4 Distribui¸c˜oes de Probabilidade O objetivo da Inferˆencia Estat´ıstica ´e obter afirma¸c˜oes sobre uma dada caracter´ıstica da popula¸c˜ao, na qual se tem interesse, a partir de informa¸c˜oes colhidas de uma amostra. Essa caracter´ıstica de interesse pode ser representada por uma vari´avel aleat´oria. Se informa¸c˜oes completa sobre a distribui¸c˜ao de probabilidade da vari´avel em estudo, fosse conhecida n˜ao haveria necessidade de colher uma amostra. Ent˜ao, toda afirma¸c˜ao desejada seria obtida atrav´es desta distribui¸c˜ao. Mas isso raramente acontece. A informa¸c˜ao que se tem a respeito da vari´avel ´e parcial ou nada se conhece. Exemplos: • a altura dos brasileiros adultos, apresenta uma distribui¸c˜ao Normal? • a prevalˆencia (propor¸c˜ao) de uma determinada doen¸ca infecciosa segue uma distribui¸c˜ao Binomial? • o n´umero de filhos de um casal humano segue uma distribui¸c˜ao de Poisson ? • o tempo de vida de pacientes soropositivos segue uma distribui¸c˜ao Exponencial? Se n˜ao h´a informa¸c˜oes nem sobre os parˆametros, nem sobre a forma da curva, ent˜ao, o uso de uma amostra nos d´a uma id´eia sobre o comportamento da vari´avel na popula¸c˜ao. Atrav´es de suas carac- ter´ısticas e atrav´es de testes de aderˆencia, podemos verificar qual o modelo probabil´ıstico (conhecido) ser´a mais adequado aos dados. Muitas vezes isto n˜ao acontece. Nestes casos um novo modelo dever´a ser produzido, ou a distribui¸c˜ao ´e produzida atrav´es de simula¸c˜ao computacional. 4.4.1 Distribui¸c˜ao Binomial Considere n ensaios independentes e todos com a mesma probabilidade de sucesso p. A vari´avel aleat´oria discreta que conta o n´umero total de sucessos ´e denominada Binomial com parˆametros n e p, isto ´e X ∼ Bin(n; p) onde sua fun¸c˜ao de probabilidade ´e dada por: P(X = x) = n x px qn−x , q = 1 − p; x = 0, 1, 2, ..., n.
    • 4.4 Distribui¸c˜oes de Probabilidade ROSSI, Robson M. 40 Exemplo 4.1. Uma certa doen¸ca pode ser curada atrav´es de procedimentos cir´urgicos em 80% dos casos. Dentre os que tˆem essa doen¸ca, sorteamos 15 pacientes que ser˜ao submetidos `a cirurgia. Fazendo alguma suposi¸c˜ao adicional que julgar necess´aria. Qual a probabilidade de todos serem curados? X ∼ Bin(15; 0, 8) P(X = 15) = 15 15 0, 815 0, 215−15 0, 0352 ou 3, 52%. Obs.: Se X tem uma distribui¸c˜ao Binomial ent˜ao m´edia : E(X) = np variˆancia : V ar(X) = npq 4.4.2 Distribui¸c˜ao de Poisson Uma vari´avel X tem distribui¸c˜ao de Poisson com parˆametro λ > 0 se sua fun¸c˜ao de probabilidades ´e dada por P(X = x) = e−λ λ x! , x = 0, 1, 2, ... com parˆametro λ sendo usualmente referido como a taxa de ocorrˆencia. A nota¸c˜ao utilizada ser´a X ∼ Po(λ). O modelo Poisson ´e um modelo discreto muito utilizado em experimentos biol´ogicos e, nesses casos, λ ´e a freq¨uˆencia m´edia ou esperada de ocorrˆencias num determinado intervalo de tempo. Exemplo 4.2. Chegada de pacientes em um pronto socorro. Suponha que o n´umero de pacientes que chegam a um pronto socorro de uma pequena cidade durante a madrugada tenha distribui¸c˜ao de Poisson com m´edia 3 (λ = 3). Calcular as probabilidades de chegadas desses pacientes: Tabela 4.1: Distribui¸c˜ao de Poisson com parˆametro λ = 3. x P(X = x) x P(X = x) 0 0,050 7 0,022 1 0,149 8 0,008 2 0,224 9 0,003 3 0,224 10 0,001 4 0,168 11 0,000 5 0,101 12 0,000 6 0,050 ≥ 13 ≈ 0 4.4.3 Distribui¸c˜ao Normal A maioria dos fenˆomenos da natureza, em especial os biol´ogicos, apresenta varia¸c˜oes dentro de um intervalo definido. Se colet´assemos os dados quanto ao peso de mil indiv´ıduos, encontrar´ıamos diversos valores, dos quais haveria pequena quantidade de baixos e altos, e grande quantidade em torno dos valores centrais. Numa representa¸c˜ao gr´afica dos dados obtidos, encontrar´ıamos uma distribui¸c˜ao normal, conforme figura abaixo. A Distribui¸c˜ao de Probabilidade Normal, ou Distribui¸c˜ao Gaussiana (curva de Gauss), se caracteriza por reunir um grande n´umero de valores em torno da m´edia, que diminuem gradualmente de freq¨uˆencia `a medida que se afastam dela.
    • 4.4 Distribui¸c˜oes de Probabilidade ROSSI, Robson M. 41 Amostra Probabilidade −4 −3 −2 −1 0 1 2 3 0.00.10.20.3 Figura 4.1: Distribui¸c˜ao Normal. A distribui¸c˜ao de probabilidade ´e dada por: P(X = x) = 1 σ √ 2π e − 1 2 x − µ σ 2 , − ∞ < x < +∞ X ∼ N(µ, σ) Lˆe-se: O conjunto de dados X, tˆem distribui¸c˜ao Normal com m´edia : µ e desvio-padr˜ao : σ. Devido a complexidade da fun¸c˜ao de probabilidade, fazemos uso da Tabela Normal-Padr˜ao ou Normal- Reduzida, constru´ıda atrav´es da transforma¸c˜ao na vari´avel X: Z = X − µ σ ∼ N(0, 1) Caracter´ısticas: 1. ´e cont´ınua; 2. a curva em forma de sino, que engloba o total de freq¨uˆencias ou 100%; 3. ´e sim´etrica: a m´edia (µ) = a moda (Mo) = a mediana (Md); 4. ´e unimodal; 5. o desvio-padr˜ao ´e σ; 6. a curva de inflex˜ao ocorre nos pontos x = µ ± σ; Como j´a dissemos, a ´area subordinada `a curva normal representa 100% das freq¨uˆencias. Em torno da m´edia determinamos intervalos com utiliza¸c˜ao do desvio-padr˜ao, conforme abaixo: µ ± σ = 68, 26% µ ± 2σ = 95, 45% µ ± 3σ = 99, 73% Exemplo 4.3. Press˜ao sist´olica em jovens saud´aveis. Suponha que a press˜ao arterial sist´olica em pessoas jovens gozando de boa sa´ude tenha distribui¸c˜ao N(120, 10) mmHg. Qual ´e a probabilidade de se encontrar uma pessoa com press˜ao sist´olica acima de 140 mmHg ? Z = X − µ σ = 140 − 120 10 = 2 P(X ≥ 140) = P(Z ≥ 2) = P(Z ≤ −2) = 0, 0228 ou 2, 28%. Isto ´e, 2, 28% das pessoas jovens e sadias tˆem press˜ao sist´olica acima de 140 mmHg.
    • 4.5 Verifica¸c˜ao da Adequa¸c˜ao do Modelo ROSSI, Robson M. 42 4.5 Verifica¸c˜ao da Adequa¸c˜ao do Modelo Na pr´atica n˜ao podemos fazer suposi¸c˜oes arbitr´arias a respeito da distribui¸c˜ao de probabilidade dos dados, logo usamos de t´ecnicas para fazer uma verifica¸c˜ao da adequa¸c˜ao do modelo suposto. A verifica¸c˜ao pode ser baseada nas caracter´ısticas do modelo, em gr´aficos especiais e em testes de aderˆencia. Para a distribui¸c˜ao Normal, em especial, sabemos que: µ ± σ = 68, 26% µ ± 2σ = 95, 45% µ ± 3σ = 99, 73% Grandes discrepˆancias entre as freq¨uˆencias relativas observadas e as probabilidades te´oricas acima sitadas, indicam uma poss´ıvel falta de adequa¸c˜ao ao modelo gaussiano. Outros crit´erios: • T´ecnicas Gr´aficas: Normal-plot, Q-Q-plot e P-P-plot; • Testes de aderˆencia: Kolmogorov-Smirnov (K-S) [µ e σ conhecidos], Shapiro Wilks (W) e/ou Lilliefors (L) [µ e σ desconhecidos e estimados pelos dados atrav´es de ¯x e s, respectivamente]. A hip´otese de normalidade nos dados deve ser da seguinte forma: H0 : Os dados s˜ao normalmente distribu´ıdos Ha : Os dados n˜ao s˜ao normalmente distribu´ıdos Por exemplo, para um n´ıvel de significˆancia de 5%, se p-valor < 5% ent˜ao rejeitamos H0, conseq¨uente- mente os dados n˜ao s˜ao normalmente distribu´ıdos. Na pr´atica, se for verificado que pelo menos o p-valor de um teste ´e significante (p < α%), a hip´otese de normalidade da distribui¸c˜ao deve ser rejeitada; e caso contr´ario se houver concordˆancia dos testes W e L, isto ´e, os dados s˜ao normalmente distribu´ıdos. 4.6 Faixas de Referˆencia Toda medida laboratorial ´e analisada confrontando-se seu valor com uma faixa padr˜ao. Isto ´e t˜ao comum que, na pr´opria apresenta¸c˜ao do resultado, muitos laborat´orios j´a indicam os limites inferiores e superiores para o valor da medida que devem servir de base ao racioc´ınio cl´ınico. • Devemos fixar, inicialmente, o n´ıvel de confian¸ca (1 − α)% ou cobertura; • Calculamos atrav´es da amostra de pessoas supostamente saud´aveis: ¯x e s. Tabela 4.2: Faixas de Referˆencia. Cobertura (1 − α)% Faixa 90% ¯x ± 1, 64.s 95% ¯x ± 1, 96.s 99% ¯x ± 2, 58.s ... ... (1 − α)% ¯x ± Zα 2 .s
    • 4.6 Faixas de Referˆencia ROSSI, Robson M. 43  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡  alfa/2 alfa/2 -Zalfa/2 alfa/2+Z 1-alfa Figura 4.2: Faixa de Referˆencia Exemplo 4.4. Faixa de referˆencia para identificar o Pseudomonas sp. Um pesquisador deseja criar um padr˜ao para identificar presen¸ca de infec¸c˜ao bacteriana (Pseudomonas sp) no trato respirat´orio atrav´es de cultura de escarro. Para isto, coletaram-se dados de pessoas sabidamente sadias e determinou-se o n´umero de colˆonias encontradas em cada cultura. Foram encontrados os seguintes resultados, em duas etapas amostrais distintas. Amostra 1: 20 21 23 24 25 25 25 25 25 25 26 26 27 28 29 29 29 29 29 30 30 30 30 30 30 31 31 31 32 32 32 32 32 33 33 33 34 34 34 35 35 35 36 36 37 37 38 38 41 42 Amostra 2: 17 22 23 23 23 23 24 24 24 24 24 23 25 25 25 25 25 25 25 26 28 28 29 30 30 31 31 35 35 35 36 40 41 41 41 42 51 54 56 56 56 58 60 68 79 Observe atrav´es da Figura 4.3 o ajuste dos dados (pontos) linearizados, indicando ajuste dos dados a distribui¸c˜ao Normal. Para a Amostra 1, foram realizados os testes de normalidade e indicaram ajuste dos dados j´a que p- Lilliefors >.20 e p-W = 0,8892. (Software Statistica vers˜ao 6.0). Observe atrav´es da Figura 4.4 uma assimetria do Histograma comparado `a Normal assim como a n˜ao aderˆencia ou desajuste dos dados (pontos) sob a reta, indicando que os dados n˜ao seguem uma distribui¸c˜ao Normal. Os testes confirmam isto: Para a Amostra 2 obtemos p-Lilliefors <0,01 e p-W < 0,000013. Neste caso duas metodologias distintas dever˜ao ser utilizadas para construir faixas de referˆencia: • Met´odo de Gauss para a Amostra 1: [¯x ± 1, 96.s] : [30, 7 ± 1, 96.4, 9] [21; 40] colˆonias. ”Adequado” Observe que devido a normalidade temos praticamente a mesma faixa, utilizando o m´etodo dos per- centis: [21; 41] colˆonias. ”Adequado”
    • 4.7 Teorema do Limite Central ROSSI, Robson M. 44 0.00.020.040.060.080.10 Freqüências amostra 2025303540 20 25 30 35 40 -2 -1 0 +1 +2 Q-QPlot Figura 4.3: Histograma e Q-Q Plot da Amostra 1 0.000.010.020.030.040.05 Freqüências 203040506070 amostra2 20 40 60 80 Q-=Q Plot -2 -1 0 1 2 Figura 4.4: Histograma e Q-Q Plot da Amostra 2 • e Met´odo dos Percentis para a Amostra 2, isto ´e, obter uma faixa de inclua, por exemplo, 95% dos elementos, excluindo os 2,5% valores menores e os 2,5 % maiores valores [22; 68] colˆonias. ”Adequado” Observe que agora, se opt´assemos pelo m´etodo de gauss ter´ıamos: [7; 63] colˆonias. ”Inadequado” Um teste estat´ıstico a ser usado depende do tipo de vari´avel e do tipo de planejamento. A seguir ser˜ao apresentados os testes mais comuns para quatro situa¸c˜oes: vari´avel dicotˆomica (amostras independentes e pareadas) e vari´avel cont´ınua (amostras independentes e pareadas). 4.7 Teorema do Limite Central Teorema. Para amostras aleat´orias simples (X1 ,X2 ,.., Xn), retiradas de uma popula¸c˜ao com m´edia µ e variˆancia σ2 , a distribui¸c˜ao amostral da m´edia aproxima-se de uma distribui¸c˜ao normal com m´edia µ e variˆancia σ2 n , quando n→ ∞, isto ´e ¯X ∼ N µ; σ2 n .
    • 4.8 Tamanho da Amostra ROSSI, Robson M. 45 Utilizando-se deste teorema, podemos construir um Intervalo de Confian¸ca de (1 − α)% para µ, para um n´ıvel de significˆancia, α, fixo: IC(µ) : ¯X ± Zα 2 . σ √ n . Se a popula¸c˜ao original ´e pr´oxima da normal, sua convergˆencia ´e r´apida; j´a, se a distribui¸c˜ao da popula¸c˜ao tem outra distribui¸c˜ao, essa convergˆencia ´e mais demorada. Como regra pr´atica, aceita-se que para amostras com mais de 30 elementos a aproxima¸c˜ao j´a pode ser considerada muito boa. No caso de amostras pequenas, usa-se uma aproxima¸c˜ao atrav´es da distribui¸c˜ao t − student : IC(µ) : ¯X ± t(n−1; α 2 ). s √ n , onde s ´e o desvio-padr˜ao amostral, utilizado quando n˜ao se conhece σ, o desvio-padr˜ao populacional. Seja uma popula¸c˜ao em que a propor¸c˜ao de elementos portadores de uma certa caracter´ıstica ´e p. Assim, a popula¸c˜ao pode ser considerada como a vari´avel aleat´oria X, tal que: X : 1, se o indiv´ıduo possui a caracter´ıstica; 0, se o indiv´ıduo n˜ao possui a caracter´ıstica p. assim, para n suficientemente grande, pode-se considerar a distribui¸c˜ao amostral de ˆp do seguinte modo: ˆp ∼ N p; p.(1 − p) n onde a propor¸c˜ao de indiv´ıduos portadores da caracter´ıstica na amostra ´e dada por: ˆp = Y n sendo que Y ´e o total de indiv´ıduos portadores da caracter´ıstica na amostra. Analogamente ao processo de obten¸c˜ao do IC para a m´edia, podemos obter um IC com uma confian¸ca de (1 − α)%, para a propor¸c˜ao populacional, considerando um n´ıvel de significˆancia, α, fixo: IC(p) : ˆp ± Zα 2 . ˆp.(1 − ˆp) n . 4.8 Tamanho da Amostra O assunto pertence `a Teoria da Amostragem. Pode-se, entretanto, calcular, para algumas situa¸c˜oes especiais, o tamanho da amostra necess´ario para se fazer inferˆencias. 4.8.1 M´etodo simples Tamanho de uma amostra aleat´oria simples. Ser´a abordado c´alculo do tamanho da amostra para amostragem aleat´oria simples. A diferen¸ca entre a estat´ıstica descritiva dos elementos da amostra e o verdadeiro valor do parˆametro que se deseja estimar como o erro amostral. Para determinar o tamanho da amostra o pesquisador deve especificar o erro amostral toler´avel, ou seja, quanto ele admite errar na avalia¸c˜ao dos parˆametros de interesse. A especifica¸c˜ao do erro amostral toler´avel deve ser feita sob um enfoque probabil´ıstico, pois por maior que seja a amostra, existe sempre o risco do sorteio gerar uma amostra com caracter´ısticas bem diferentes da popula¸c˜ao de onde ela foi extra´ıda. O calcular do tamanho m´ınimo de uma amostra aleat´oria simples ´e dado por: Sejam: N: tamanho (n´umero de elementos) da popula¸c˜ao; n: tamanho (n´umero de elementos) da amostra; n0 : uma primeira aproxima¸c˜ao do tamanho da amostra, e E0: erro amostral toler´avel.
    • 4.8 Tamanho da Amostra ROSSI, Robson M. 46 onde n0 = 1 E0 . Conhecendo N o tamanho da popula¸c˜ao, pode-se corrigir o c´alculo: n = N.n0 N + n0 . Exemplo 4.5. Com objetivo de conhecer algumas caracter´ısticas dos pacientes de uma cl´ınica com 35 pacientes. Suponha que seja de interesse realizar um levantamento por amostragem para avaliar diversas caracter´ısticas da popula¸c˜ao de pacientes. Qual deve ser o tamanho m´ınimo da amostra aleat´oria simples, tal que se possa admitir, com alta confian¸ca, que os erros amostrais n˜ao ultrapassem 4% (E0 = 0,04)? Solu¸c˜ao: Uma primeira aproxima¸c˜ao ´e dada por: n0 = 1 0, 042 = 625 pacientes. Corrigindo, em fun¸c˜ao do tamanho N da popula¸c˜ao, tem-se: n = 35.625 35 + 625 34. Exemplo 4.6. Suponha que na clinica do Exemplo anterior a popula¸c˜ao fosse de N = 200 pacientes. Qual deve ser o tamanho m´ınimo da amostra aleat´oria simples, tal que se possa admitir, com alta confian¸ca, que os erros amostrais n˜ao ultrapassem 4% (E0 = 0,04)? Solu¸c˜ao: O valor de n0 continua sendo o mesmo do exemplo anterior, pois n˜ao depende de N. Fazendo a corre¸c˜ao em termos do novo valor de N, tem-se: n = 200.625 200 + 625 152. Exemplo 4.7. Suponha agora que a popula¸c˜ao fosse de N = 200.000 pacientes. Solu¸c˜ao: Da mesma forma, o valor de n0 continua sendo o mesmo dos exemplos anteriores. E a corre¸c˜ao em termos do novo valor de N, ´e: n = 200.000.625 200.000 + 625 623 pacientes. Observe que: Para manter o mesmo erro amostral, no Exemplo ?? foi necess´aria uma amostra abrangendo quase 100% da popula¸c˜ao; enquanto no Exemplo 4.6 a amostra abrange 76%; e no Exemplo 4.7 abrange 0,3% da popula¸c˜ao. ´E, portanto, errˆonea a id´eia de que para uma amostra ser representativa deva abranger uma percentagem fixa da popula¸c˜ao. Tamanho da amostra em subgrupos da popula¸c˜ao ´E muito comum termos interesse em estudar separadamente certos subgrupos da popula¸c˜ao. Nesta situa¸c˜ao, ´e preciso calcular o tamanho da amostra para cada uma destas partes. O tamanho total da amostra vai corresponder `a soma dos tamanhos das amostras de cada parte. O tamanho total da amostra cresce bastante quando se desejam estimativas isoladas para os diversos subgrupos da popula¸c˜ao, por isso, ´e comum o pesquisador n˜ao ser muito exigente na precis˜ao das estimativas nos subgrupos, tolerando erros amostrais maiores. 4.8.2 M´etodo inferencial Tamanho da amostra sem conhecimento de N : Tamanho da Popula¸c˜ao. Se o objetivo ´e estimar a m´edia, ou uma propor¸c˜ao, pode-se usar os intervalos de confian¸ca anteriormente estabelecidos para obter n, o tamanho da amostra. Para isto, ´e preciso fixar o maior erro aceit´avel e o n´ıvel de confian¸ca com que se quer trabalhar.
    • 4.8 Tamanho da Amostra ROSSI, Robson M. 47 Sendo o tamanho m´aximo do erro aceit´avel : e (fixo), com probabilidade (1 − α) (fixo), o intervalo de confian¸ca de n´ıvel 100(1 − α)% ser˜ao, respectivamente, para a m´edia e para a propor¸c˜ao, considerando a popula¸c˜ao infinita, tem-se: n = Zα 2 .so e 2 onde e = Zα 2 so √ n n = Zα 2 . e 2 .ˆp0.(1 − ˆp0) ou n ≤ Zα 2 . 2e 2 onde ˆp0 e so s˜ao estimativas da propor¸c˜ao e da dispers˜ao, respectivamente, obtidos atrav´es de uma amostra piloto. Exemplo 4.8. Numa amostra de classifica¸c˜ao de veteranos de um col´egio com. ¯x = 2, 6 e so = 0, 3, qual deve ser o tamanho da amostra para que tenhamos 95% de confian¸ca em que erro da estimativa de µ n˜ao supere 0,05? Sol.: n = Zα 2 .so e 2 = 1, 96.0, 3 0, 05 2 139. Exemplo 4.9. Suponha que, em uma amostra de 500 fam´ılias que possuem aparelho de televis˜ao em certa cidade, haja 340 com televisor em cores. Se o objetivo ´e estimar o n´umero de fam´ılias que possuem televisor em cores, qual o tamanho da amostra necess´ario para que tenhamos 95% de confian¸ca em que o erro da estimativa n˜ao seja superior a 0,02 ? Sol.: Trate as 500 fam´ılias como uma mostra preliminar que fornece a estimativa ˆp0 = 0, 68. Ent˜ao: n = Zα 2 . e 2 .ˆp0.(1 − ˆp0) = 1, 96 0, 02 2 .0, 68.(0, 32) = 2.090 Tamanho da amostra com o conhecimento de N : Tamanho da Popula¸c˜ao. Para o caso em que a popula¸c˜ao ´e finita e pequena, onde a amostragem ´e sem reposi¸c˜ao, temos as f´ormulas para o c´alculo do tamanho amostral, respectivamente, para a m´edia e para a propor¸c˜ao: n = N. Zα 2 .so 2 (N − 1).e2 + Zα 2 .so 2 ; e n = N.ˆp0.ˆq0. Zα 2 2 ˆp0.ˆq0. Zα 2 2 + (N − 1).e2 ou n ≤ N. Zα 2 2 Zα 2 2 + 4(N − 1).e2 Alternativamente, temos tanto para o caso em que estudamos vari´aveis quantitativas discretas, quanto cont´ınuas, utilizamos as f´ormula descritas anteriormente, e tomamos n = n0, e conhecendo N, o c´aculo de n, tamanho amostral poder´a ser obtido atrav´es de: n = n0 1 + n0 N . Exemplo 4.10. Determinado trabalho, realizado para investigar a prevalˆencia de hansen´ıase em trabal- hadores rurais, apresentou um valor igual a 22%. Para estimar o tamanho da amostra para novo projeto sobre hansen´ıase, desejamos um n´ıvel de confian¸ca de 95% e erro de amostragem de 5%. Determine n, o tamanho da amostra nescess´aria para uma popula¸c˜ao de tamanho N = 100.000.
    • 4.9 Testes de Hip´oteses ROSSI, Robson M. 48 Sol.: n0 = Zα 2 . e 2 .ˆp0.(1 − ˆp0) n0 = 1, 96 0, 05 2 .0, 22.(0, 78) n0 264 logo, o tamanho da amostra corresponder´a a: n = n0 1 + n0 N n = 264 1 + 264 100.000 n = 263. 4.9 Testes de Hip´oteses Freq¨uentemente ´e necess´ario tomar decis˜oes sobre parˆametros ou distribui¸c˜oes populacionais com base em informa¸c˜oes amostrais, as quais s˜ao denominadas decis˜oes estat´ısticas. Na tomada de decis˜oes, s˜ao formuladas hip´oteses que ser˜ao rejeitadas ou n˜ao rejeitadas. Tais hip´oteses, que podem ser verdadeiras ou n˜ao, chamam-se hip´oteses estat´ısticas e, em geral, consistem de afirma¸c˜oes sobre os parˆametros populacionais ou sobre as distribui¸c˜oes de probabilidade das popula¸c˜oes, como por exemplo: 1. a m´edia populacional da altura dos brasileiros ´e 1,65m; 2. a propor¸c˜ao de brasileiros com a doen¸ca X ´e 40% (p = 0, 40); 3. a distribui¸c˜ao dos pesos dos pacientes adultos do hospital X ´e normal. Os processos que nos permitem decidir por rejeitar ou n˜ao rejeitar uma hip´otese, ou determinar se amostras observadas diferem significativamente dos resultados esperados s˜ao chamados Testes de Hip´oteses. O objetivo ´e fornecer ferramentas que nos permitam validar ou refutar uma hip´otese, atrav´es de resultados da amostra. Os Testes de Hip´oteses podem ser de dois tipos: (a) N˜ao Param´etricos: quando formulamos hip´oteses com respeito `a natureza da distribui¸c˜ao da popula¸c˜ao. Estes testes n˜ao dependem dos parˆametros populacionais, nem de suas respectivas estimativas. Veja o item (3.) acima. (b) Param´etricos: quando formulamos hip´oteses com respeito ao valor de um parˆametro populacional. Veja itens (1.) e (2.) acima. 4.9.1 Constru¸c˜ao de um Teste de Hip´otese Inicialmente, para a constru¸c˜ao de um teste, deve-se formular duas hip´oteses a cerca da afirma¸c˜ao: (a) Hip´otese Nula (H0): ´e uma afirma¸c˜ao que diz que o parˆametro populacional ´e tal como especificado. (b) Hip´otese alternativa (Ha): ´e uma afirma¸c˜ao que oferece uma alega¸c˜ao alternativa (isto ´e, o parˆametro ´e diferente do valor alegado). As hip´oteses estat´ısticas para um parˆametro q, podem ser formuladas como segue: 1. Teste Bilateral: quando utilizamos ambas as “caudas” da distribui¸c˜ao. Teste Unilateral `a Direita: quando utilizamos a “cauda” direita da distribui¸c˜ao. H0 : θ = θ0 Ha : θ = θ0
    • 4.9 Testes de Hip´oteses ROSSI, Robson M. 49 2. Teste Unilateral `a Direita: quando utilizamos a “cauda” direita da distribui¸c˜ao. H0 : θ = θ0 Ha : θ > θ0 3. Teste Unilateral `a Esquerda: quando utilizamos a “cauda” esquerda da distribui¸c˜ao. H0 : θ = θ0 Ha : θ < θ0 Ao se testar uma hip´otese, o que se deseja verificar ´e, atrav´es de uma estat´ıstica obtida de uma amostra, se a hip´otese pode ou n˜ao rejeitada com o n´ıvel de significˆancia pr´e-fixado, α. Esta conclus˜ao ´e tomada com base na Regi˜ao Cr´ıtica (RC: cuja ´area corresponde a α) que ´e constru´ıda de modo que: P(ˆθ ∈ RC|H0´e´e verdadeira) = α. RA ´e denominada Regi˜ao de n˜ao rejei¸c˜ao cuja ´area corresponde a 1 − α. O procedimento que ser´a utilizado para a constru¸c˜ao de um teste de hip´otese ´e o que consiste em apresentar o n´ıvel descritivo ou p-valor (p-value).  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡  alfa/2 alfa/2 -Zalfa/2 alfa/2+Z 1-alfa Figura 4.5: Teste de Hip´otese Bilateral. A seq¨uˆencia abaixo pode ser usada sistematicamente para qualquer teste de hip´otese: 1. Passo 1: Definir as hip´oteses H0 e Ha; 2. Passo 2: Use a teoria estat´ıstica e as informa¸c˜oes para decidir qual a distribui¸c˜ao da estat´ıstica (estimador) que ser´a utilizada no julgamento de H0; 3. Passo 3: Escolher o n´ıvel de significˆancia a e utilizando as informa¸c˜oes fornecidas pela amostra para encontrar o valor do estimador do parˆametro (estat´ıstica) que est´a sendo testado; 4. Passo 4: Com o valor da estat´ıstica observada na amostra encontrar a probabilidade (probabilidade de significˆancia p-valor) de ocorrer amostras com valores mais extremos do que o valor obtido. 5. Passo 5: Conclus˜ao. Compare a probabilidade obtida, p-valor, com o valor de a. A hip´otese nula ser´a rejeitada para aqueles n´ıveis de significˆancia cujos valores sejam maiores que a probabilidade calculada.
    • 4.9 Testes de Hip´oteses ROSSI, Robson M. 50 4.9.2 O p-valor O procedimento de teste de hip´otese descrito acima fornece informa¸c˜ao sobre a for¸ca da evidˆencia contra H0 obtida a partir dos dados. Isto ´e, ´e informado se o valor observado para a estat´ıstica de teste que levou `a rejei¸c˜ao de H0 est´a pr´oxima da fronteira da RC regi˜ao cr´ıtica (baixa evidˆencia contra H0) ou se est´a muito afastada da fronteira (alta evidˆencia contra H0). O p-valor ´e a probabilidade de ocorrˆencia do valor particular observado para a estat´ıstica de teste ou de valores mais extremos, na dire¸c˜ao da regi˜ao cr´ıtica, quando a hip´otese nula H0 ´e verdadeira. Quanto maior for a for¸ca da evidˆencia contra H0, menor ser´a o p-valor.
    • Cap´ıtulo 5 An´alise em Tabelas 2x2 e LxC Neste t´opico estudaremos a rela¸c˜ao entre duas vari´aveis categ´oricas (ou qualitativas), onde as observa¸c˜oes podem ser classificadas em uma das v´arias categorias (n´ıveis ou c´elulas) mutuamente exclusivas. O problema de mensura¸c˜ao do grau de associa¸c˜ao entre dois conjuntos de escores ´e de car´ater bem diferente do teste da simples existˆencia de uma associa¸c˜ao em determinada popula¸c˜ao. Naturalmente, h´a interesse em avaliar o grau de associa¸c˜ao entre dois conjuntos de escores referentes a um grupo de indiv´ıduos. Mas ´e talvez de muito maior interesse podermos afirmar que determinada associa¸c˜ao observada em uma amostra de escores indica, ou n˜ao, probabilidade de associa¸c˜ao entre as vari´aveis na popula¸c˜ao da qual se extraiu a amostra (Siegel, 1956). 5.1 Tabelas de Contingˆencia Segundo o dicion´ario Webster o termo “contingency” significa the quality or state of having a close connection or relationship. O termo “contingency table” se refere ao fato de que as tabelas constru´ıdas s˜ao usadas para testar a existˆencia de rela¸c˜oes entre duas vari´aveis. Observamos que infelizmente este termo em portuguˆes n˜ao tem o mesmo significado. Segundo o Aur´elio, “contingˆencia” significa qualidade do que ´e contingente, incerteza se uma coisa vai acontecer ou n˜ao e “contingente” significa que pode ou n˜ao suceder, eventual, incerto. Logo, em estat´ıstica, quando nos referimos a palavra “contingˆencia” estamos tomando o mesmo significado da l´ıngua inglesa. O teste chi-quadrado (χ2 ) pode ser usado para avaliar a rela¸c˜ao entre duas vari´aveis qualitativas. Este teste ´e um teste n˜ao-param´etrico, que ´e muito ´util, pois n˜ao precisa da suposi¸c˜ao de normalidade das vari´aveis para analisar o grau de associa¸c˜ao entre as duas vari´aveis, por´em este teste ´e menos poderoso que o teste param´etrico. Dentro deste teste devemos distinguir dois tipos de testes: o de independˆencia e o de homogeneidade. Vejamos quando estamos tratando de um teste de independˆencia e quando estamos tratando com um teste de homogeneidade, atrav´es de exemplos. 5.2 Teste de Independˆencia e de Homogeneidade Suponha que uma educadora quer analisar se existe rela¸c˜ao entre a participa¸c˜ao ativa dos pais dos alunos nos deveres extra-escolares e o desempenho dos alunos em Matem´atica. Suponha que ela categoriza o desempenho dos alunos em trˆes grupos: baixo, m´edio, alto e, do mesmo modo, categoriza a participa¸c˜ao dos pais em dois grupos: participa¸c˜ao ativa, participa¸c˜ao fraca. Suponha que ela deseja trabalhar com 300 crian¸cas. Neste caso a educadora pode delinear sua pesquisa de duas formas: 51
    • 5.2 Teste de Independˆencia e de Homogeneidade ROSSI, Robson M. 52 Caso 1. Selecionar uma amostra de crian¸cas aleatoriamente e examinar em que c´elula cada uma est´a alocada, logo o ´unico valor fixo ser´a o total geral que ser´a de 300. Mas os totais de colunas e de linhas ser˜ao frutos da pesquisa, portanto, aleat´orios, neste caso estamos frente a um teste de independˆencia de vari´aveis. Logo a tabela de contingˆencia ser´a: Tabela 5.1: Exemplo de tabela de contingˆencia. Participa¸c˜ao Desempenho do aluno em Matem´atica Total dos pais Baixo M´edio Alto Ativa Aleat´orio Fraca Aleat´orio Total Aleat´orio Aleat´orio Aleat´orio 300 =⇒ Teste de Independˆencia Por´em ela pode fixar o n´umero de alunos de acordo com seu desempenho. Caso 2. Pegar uma amostra aleat´oria de tamanho 100 de cada grupo de alunos, logo os totais das colunas ser˜ao fixos, mas os totais das linhas ser˜ao aleat´orios e assim estaremos frente a um teste de homogeneidade: Logo a tabela de contingˆencia ser´a: Tabela 5.2: Exemplo de tabela de contingˆencia. Participa¸c˜ao Desempenho do aluno em Matem´atica Total dos pais Baixo M´edio Alto Ativa Aleat´orio Fraca Aleat´orio Total 100 (fixo) 100 (fixo) 100 (fixo) 300 =⇒ Teste de Homogeneidade Os valores totais, das colunas e das linhas, s˜ao chamados de “totais marginais”. Quando os totais marginais variam livremente, o teste de associa¸c˜ao ´e chamado de independˆencia, e quando um dos conjuntos, linha ou coluna ´e fixado pelo pesquisador ent˜ao ´e chamado de teste de homogeneidade. Isso vai depender do pesquisador. No exemplo da educadora, observemos que para ela ´e muito mais f´acil fixar o n´umero de alunos segundo seu desempenho, do que fixar pela participa¸c˜ao dos pais, que, apriori ser´a quase imposs´ıvel. Teste de Independˆencia Apresentaremos a l´ogica do teste com um exemplo bastante simples. Exemplo 5.1. Suponha que 125 crian¸cas foram expostas a trˆes tipos de comerciais de TV, sobre cereais para caf´e da manh˜a. Ap´os a exposi¸c˜ao foi solicitado a cada crian¸ca para indicar qual dos comerciais ela gostou mais. O que se deseja saber ´e se a escolha do comercial est´a relacionado ao gˆenero da crian¸ca: pois suspeita-se de que o gˆenero pode estar influenciando na escolha do comercial. Os dados podem ser apreciados na Tabela 5.3. Tabela 5.3: N´umero de crian¸cas segundo tipo de comercial escolhido e gˆenero. Tipo de comercial Gˆenero A B C Total Meninos 30 29 16 75 Meninas 12 33 5 50 Total 42 62 21 125 Analisando atentamente a Tabela 5.3, composta por valores absolutos, percebemos:
    • 5.2 Teste de Independˆencia e de Homogeneidade ROSSI, Robson M. 53 • a amostra est´a composta por mais meninos do que meninas, • nos comerciais A e C o n´umero de meninos ´e maior do que meninas, e • no comercial B essa rela¸c˜ao se inverte. Contudo, essa an´alise fica prejudicada pela composi¸c˜ao da amostra, que tem mais meninos do que meni- nas. Portanto, a primeira coisa a fazer ´e analisar as estruturas percentuais, mostradas na Tabela 4.3, ou seja retirar a influˆencia da amostragem. Tabela 5.4: Porcentagem para os valores absolutos de crian¸cas por tipo de comercial escolhido e gˆenero apresentados na tabela anterior. Tipo de comercial Gˆenero A B C Total Meninos 71% 47% 76% 60% Meninas 29% 53% 24% 40% Total 100% 100% 100% - Observe cuidadosamente a Tabela 5.4, onde 60% da amostra ´e composta por meninos. Se a preferˆencia das crian¸cas pelos comerciais independe do gˆenero, esperar´ıamos que a estrutura percentual para cada comercial ficasse em torno de 60% para os meninos e 40% para as meninas, desvios grandes destes percentuais estariam mostrando evidˆencias de que existe alguma rela¸c˜ao entre essas vari´aveis. Essa inspe¸c˜ao intuitiva, tamb´em, pode ser feita analisando a estrutura dentro de cada gˆenero como mostra a Tabela 5.5. Tabela 5.5: Porcentagem de crian¸cas por gˆenero e tipo de comercial escolhido. Tipo de comercial Gˆenero A B C Total Meninos 40% 39% 21% 100% Meninas 24% 66% 10% 100% Total 33% 50% 17% - Analisando a Tabela 5.5 observamos que as meninas tem uma forte preferˆencia pelo comercial B, enquanto que os meninos se dividem entre o comercial A e B. Assim, intuitivamente percebemos que existe interferˆencia do gˆenero na preferˆencia, agora precisamos saber at´e que ponto essas diferen¸cas se devem ao acaso, ou a existˆencia de associa¸c˜ao entre as duas vari´aveis: X: preferˆencia pelo comercial ( A, B e C) → qualitativa; Y: gˆenero (meninos, meninas) → qualitativa. Hip´otese nula (H0): A preferˆencia pelo comercial independe do gˆenero da crian¸ca; Hip´otese alternativa (Ha): A preferˆencia pelo comercial depende do gˆenero da crian¸ca (ou, o gˆenero interfere na preferˆencia pelo comercial); Analogamente, temos: Ho : independˆencia de vari´aveis H1 : dependˆencia de vari´aveis Como deveriam ser os valores a serem observados se as vari´aveis fossem independentes?, ou dito de outra forma, sob a hip´otese de nulidade, de independˆencia de vari´aveis, como deveriam ser os valores a serem observados? A l´ogica nos diz que esses valores devem estar muito pr´oximos da estrutura percentual global. Esses valores s˜ao chamados de valores esperados. Cada valor esperado ser´a calculado supondo que a estrutura percentual global se mantenha em cada coluna: Calculando os valores esperados, sobre a suposi¸c˜ao de independˆencia:
    • 5.2 Teste de Independˆencia e de Homogeneidade ROSSI, Robson M. 54 Tabela 5.6: Valores percentuais Tipo de comercial Gˆenero A B C Total Meninos 60% 60% 60% 60% Meninas 40% 40% 40% 40% Total 42 62 21 125 e Valores absolutos Valores esperados Gˆenero A B C Total Meninos 25 37 13 75 Meninas 17 25 8 50 Total 42 62 21 125 Valor esperado menino, comercial A: 60% de 42 = 25,2 Valor esperado menino, comercial B: 60% de 62 = 37,2 ... O mesmo teria acontecido se fixarmos primeiro o comercial: Valor esperado comercial A, menino: 33,7% de 75 = 25,2 Valor esperado comercial A, menina: 33,7% de 50 = 16,8 ... Tanto faz fixar a linha ou a coluna pois: Ei = Tl × Tc T = Tl × Tc T = Tc × Tl T Por exemplo, calculemos o valor esperado da primeira linha e primeira coluna: Ei = 75 × 42 125 = 75 × 42 125 = 42 × 75 125 = 25, 2 Assim calculando os valores esperados para todas as c´elulas temos: Tabela 5.7: Tipo de comercial Gˆenero A B C Total Meninos Oi = 30 Ei = 25,2 di = +4,8 29 37,2 -8,2 16 12,6 +3,4 75 Meninas 12 16,8 -4,8 33 24,8 +8,2 5 8,4 -3,4 50 Total 42 62 21 125 Dentro de cada c´elula, no canto superior esquerdo colocamos o valor observado, no canto superior direito o valor esperado (sob a hip´otese de independˆencia) e, na parte inferior, a distˆancia entre o observado e o esperado. Logo, se as vari´aveis fossem independentes, as distˆancias entre os valores observados e esperados deveriam ser muito pequenas, caso contr´ario haver´a ind´ıcios de dependˆencia. A pergunta agora ´e: quando a distˆancia ´e pequena ou grande? Para isto devemos calcular o valor (χ2 ) qui-quadrado da amostra: χ2 amostra = k i=1 (observado − esperado)2 esperado = k i=1 (Oi − Ei)2 Ei que ter´a uma distribui¸c˜ao chi-quadrado com graus de liberdade igual ao produto do n´umero de linhas menos um vezes o n´umero de colunas menos um, isto ´e: χ2 amostra ∼ χ2 ν ⇒ ν : graus de liberdade ν : (no colunas - 1)×(no linhas - 1) Para testar as hip´oteses, temos a estat´ıstica teste qui-quadrado com corre¸c˜ao de continuidade de Yates: χ2 cY = k i=1 |Oi − Ei| − 1 2 2 Ei ∼ χ2 [L−1×C−1;(1−α)%] (Tabelas L × C)
    • 5.2 Teste de Independˆencia e de Homogeneidade ROSSI, Robson M. 55 No nosso exemplo sem a corre¸c˜ao de Yates, temos: χ2 amostra = (+4, 8)2 25, 2 + (−8, 2)2 37, 2 + (+3, 4)2 12, 6 + (−4, 8)2 16, 8 + (+8, 2)2 24, 8 + (−3, 4)2 8, 4 = 0, 914 + 1, 808 + 0, 917 + 1, 371 + 2, 711 + 1, 376 = 9, 09818 (p-valor : 0,0106) onde v = (2 − 1) × (3 − 1) = 1 × 2 = 2 Para aceitar ou rejeitar a hip´otese devemos conhecero valor de χ2 calculado na tabela qui-quadrado, com dois graus de liberdade. Para α = 5%, o valor cr´ıtico ´e 5, 991, como o valor da amostra ´e maior que o valor cr´ıtico, logo rejeitamos a hip´otese nula, concluindo que o gˆenero interfere na preferˆencia pelos comerciais. No caso de dispormos de um pacote estat´ıstico, este, via de regra, calcula o p-valor, nesse caso ´e s´o comparar esse valor com o n´ıvel de significˆancia desejado. No nosso caso o p − valor = 0, 01058, ou seja, rejeitamos ao n´ıvel de 5% mas n˜ao ao n´ıvel de 1%. Obs.: Quando as vari´aveis s˜ao independentes (H0), as freq¨uˆencias observadas tendem a ficar perto das esperadas. Neste caso, o valor de χ2 deve ser pequeno. Limita¸c˜oes do teste χ2 : 1. Infelizmente, o teste qui-quadrado n˜ao permite concluir como se d´a a rela¸c˜ao, uma vˆez que ele testa apenas a hip´otese geral de que as duas vari´aveis s˜ao independentes. Examinando a distˆancia entre valor observado e esperado, por exemplo, observamos que as meninas tem uma maior preferˆencia pelo comercial B, por´em n˜ao podemos concluir nada. 2. Uma outra limita¸c˜ao do teste qui-quadrado ´e que o valor esperado das c´elulas n˜ao deve ser menor ou igual a 5 e devido a isso torna vulner´avel a estat´ıstica. Nesse caso usamos outra estrat´egia: o teste exato de Fisher. Teste de Homogeneidade Quando testamos independˆencia de vari´aveis, o pesquisador s´o controla o tamanho total da amostra, mas os totais para cada coluna e linha s˜ao aleat´orios. Exemplo 5.2. No caso do exemplo anterior, os pesquisadores selecionaram aleatoriamente 125 crian¸cas, das quais 75 eram meninos e 50 meninas. Ele n˜ao fixou o numero de meninos e o n´umero de meninas. Vejamos um exemplo de teste de homogeneidade. Retomemos o exemplo inicial e suponhamos que a professora fixou o tamanho dentro de cada grupo de alunos e os resultados foram os seguintes: Tabela 5.8: N´umero de alunos segundo seu desempenho em Matem´atica e participa¸c˜ao dos pais nas atividades extra-escolares. Desempenho em Matem. Participa¸c˜ao dos pais Baixo M´edio Alto Total Ativa 5 25 70 100 Fraca 95 75 30 200 Total 100 100 100 300 H0 : p11 = p12 = p13 → igualdade de propor¸c˜oes H1 : p1i = p1j; para algum i = j → existe pelo menos uma propor¸c˜ao diferente A hip´otese nula esta testando que a propor¸c˜ao de alunos com baixo desempenho ´e igual a propor¸c˜ao de alunos m´edio e igual a propor¸c˜ao de alunos com desempenho alto quando seus pais participam ativamente das atividades extra-escolares, contra a hip´otese alternativa que indica que existe pelo menos uma propor¸c˜ao diferente. O teste ´e idˆentico ao teste de independˆencia.
    • 5.2 Teste de Independˆencia e de Homogeneidade ROSSI, Robson M. 56 O Coeficiente de Contingˆencia. O coeficiente de contingˆencia ´e uma medida do alcance da associa¸c˜ao ou rela¸c˜ao entre dois conjuntos de atributos. Ele ´e calculado em fun¸c˜ao do valor calculado na tabela de contingˆencia e independe de ordena¸c˜ao das categorias das vari´aveis: C = χ2 χ2 + n , onde n ´e o tamanho da amostra. Exemplo 5.3. No exemplo dos comerciais de TV, o coeficiente de contingˆencia ser´a: C = 9, 09818 9, 09818 + 125 = 0, 26047. Para testar a significˆancia deste coeficiente ter´ıamos que recorrer a tabela pr´opria. H0 : C = 0 H1 : C = 0 Se o p-valor associado for menor que alfa rejeitamos H0 e conclu´ımos de que existe associa¸c˜ao entre as vari´aveis, caso contr´ario n˜ao. Para facilitar a interpreta¸c˜ao, usaremos uma modifica¸c˜ao deste coeficiente. Chamaremos de k o menor entre l (no de linhas da tabela) e c (no de colunas da tabela), isto ´e: k = min{l; c}. O chamado coeficiente de contingˆencia modificado (C∗ ) ´e dado por: C∗ = k.χ2 (k − 1)(χ2 + n) . O valor C∗ sempre estar´a no intervalo de 0 a 1. Ser´a 0, somente quando houver completa independˆencia e ser´a 1 quando houver associa¸c˜ao perfeita. Valores de C∗ pr´oximos de 1 descrevem associa¸c˜ao forte, enquanto que valores de C∗ pr´oximos de 0 indicam associa¸c˜ao fraca. Os valores de C∗ em torno de 50% podem ser interpretados como associa¸c˜ao moderada. Exemplo 5.4. C´alculo do coeficiente de contingˆencia para os dados do exemplo anterior. k = min{2; 3} = 2 C∗ = k.χ2 (k − 1)(χ2 + n) = 2.(9, 09818) (2 − 1)(9, 09818 + 125) = 0, 3684 ou 36, 84%. Este resultado indica uma fraca associa¸c˜ao entre X: preferˆencia pelo comercial e Y: gˆenero. Exerc´ıcio 5.1. A freq¨uˆencia da invers˜ao F do cromossomo IIL foi estudada em popula¸c˜oes urbanas de Drosophila willistoni. Os exemplares foram coletados em zonas considerada de alta, m´edia e baixa urban- iza¸c˜ao, na cidade de Porto Alegre ( Valente et al, 1993). Os dados foram comparados entre si e com um grupo-controle n˜ao-urbano. Verifique ao n´ıvel de 1% de significˆancia se existem evidˆencias de associa¸c˜ao entre a invers˜ao F e a Urbaniza¸c˜ao. Exerc´ıcio 5.2. Crian¸cas hospitalizadas e alimentadas por nutri¸c˜ao endovenosa `as vezes apresentam colestase,um bloqueio do fluxo da bile que pode produzir c´alculos biliares e outros problemas. Suponha que foi realizado um estudo do tipo caso-controle para avaliar o efeito (α = 5%) de uma infec¸c˜ao grave sobre o risco de colestase em crian¸cas com nutri¸c˜ao parenteral. A Tabela abaixo mostra o resultado de um estudo feito em 113 crian¸cas hospitalizadas. Como o desfecho, isto ´e, a colestase, ´e uma caracter´ıstica rara na popula¸c˜ao, o risco relativo foi estimado atrav´es do Odds Ratio (Fonte: Carvalho, 1993).
    • 5.2 Teste de Independˆencia e de Homogeneidade ROSSI, Robson M. 57 Tabela 5.9: Associa¸c˜ao entre Invers˜ao F e Urbaniza¸c˜ao quando comparadas a um controle. Urbaniza¸c˜ao Invers˜ao F Alta Intermedi´aria Baixa Controles Total Sim 63 421 641 223 1349 N˜ao 475 1201 1542 658 3875 Total 538 1622 2183 881 5224 % Invers˜ao F 12% 26% 29% 25% 26% Tabela 5.10: Presen¸ca de colestase em crian¸cas com nutri¸c˜ao endovenosa, som e sem infec¸c˜ao grave. Colestase Infec¸c˜ao grave Sim N˜ao Sim 19 61 N˜ao 1 32 Exerc´ıcio 5.3. Com o objetivo de avaliar fatores de risco para o cˆancer intra-epitelial da c´ervice uterina, Soares (1998) estudou 43 casos com essa doen¸ca e 63 mulheres controles da popula¸c˜ao de Porto Alegre. A Tabela 2 apresenta dados relativos `a presen¸ca do alelo DQB1*03, do sistema HLA. Teste a associa¸c˜ao entre a doen¸ca e o fator ao n´ıvel de 5%. Em caso afirmativo determine o risco de desenvolver a neoplasia e seu respectivo IC. Tabela 5.11: Associa¸c˜ao entre cˆancer intra-epitelialda c´ervice uterina e presen¸ca do alelo DQB1*03. Presen¸ca do alelo Cˆancer DQB1*03 Outro Casos 33 10 Controles 24 39
    • 5.2 Teste de Independˆencia e de Homogeneidade ROSSI, Robson M. 58 Exerc´ıcio 5.4. Verificar se a freq¨uˆencia dos dois tipos de cromossomos Y est´a relacionado com o grau de mistura racial aparente e com a idade do touro ao n´ıvel de 5%. Tabela 5.12: Associa¸c˜ao entre tipo de cromossomo e contamina¸c˜ao de ra¸ca aparente. Tipo do cromossomo Contamina¸c˜ao racial aparente Acrocˆentrico Submetacˆentrico Sim 38 16 N˜ao 13 8 Tabela 5.13: Associa¸c˜ao entre tipo de cromossomo e idade do touro. Tipo do cromossomo Idade do touro Acrocˆentrico Submetacˆentrico 1 a 2 anos 21 17 3 anos ou + 30 7 Exerc´ıcio 5.5. Em um estudo gen´etico realizado em macacos amazˆonicos da subesp´ecie ”Saimiri sciureus ustus”, Silva et al. (1993) encontraram varia¸c˜ao nas freq¨uˆencias de dois tipos de enzimas glioxalase (GLO) em animais que vivem nas margens do rio Jamari, em Rondˆonia. Na Tabela 4, est˜ao os n´umeros observados de animais com diferentes tipos de enzim´aticos, coletados nas margens esquerda e direita desse rio. Verifique se existem evidˆencias de associa¸c˜ao entre as vari´aveis ao n´ıvel de 1%. Tabela 5.14: Associa¸c˜ao entre tipos enzim´aticos e margem do rio Jamari-Rondˆonia. Margem do rio Enzima Esquerda Direita GLO 2 72 74 GLO 2-3 22 3
    • 5.2 Teste de Independˆencia e de Homogeneidade ROSSI, Robson M. 59 Exerc´ıcio 5.6. Vieira e Prolla (1979) estudaram uma amostra de 384 pacientes com problemas pulmonares, classificando-os segundo a presen¸ca ou n˜ao de eosin´ofilos no escarro e o tipo de pneumopatia diagnosticada. Existem evidˆencias de associa¸c˜ao entre as vari´aveis ao n´ıvel de 5%? e a 1%? G1: asmas; G2: broncoespasmo; G3: enfisema; G4: outras doen¸cas. Tabela 5.15: Presen¸ca de eosin´ofilos no escarro e tipo de doen¸ca pulmonar em 384 pacientes porto-alegrenses. Grupo quanto a pneumopatia Eosin´ofilos no escarro G1 G2 G3 G4 Sim 142 26 32 28 N˜ao 55 19 41 41 Exerc´ıcio 5.7. O cole´optero chauliognathus flavipes pode apresentar 10 diferentes padr˜oes para as manchas pretas que ocorrem sobre os ´elitros (asas), que s˜ao amarelos. Machado e Ara´ujo (1994) coletaram insetos dessa esp´ecie em v´arias localidades do Rio Grande do Sul, nos anos de 1989 e 1990, como mostra a Tabela 6. Teste a hip´otese de igualdade de propor¸c˜oes entre as localidades ao n´ıvel de 5% e a 1%. Tabela 5.16: N´umero de indiv´ıduos da esp´ecie Chauliognathus com diferentes padr˜oes de manchas nos ´elitros, coletados em trˆes localidades do Rio Grande do Sul. Padr˜ao do ´elitros Localidade Claro Intermedi´ario Escuro Porto Alegre 67 20 4 S˜ao Leopoldo 68 29 19 Caxias do Sul 26 3 6 Exerc´ıcio 5.8. Verifique se as localidades a seguir diferem quanto a freq¨uˆencia dos diferentes grupos sang¨u´ıneos do sistema ABO, ao n´ıvel de 5%. Tabela 5.17: N´umero de indiv´ıduos da esp´ecie Chauliognathus com diferentes padr˜oes de manchas nos ´elitros, coletados em trˆes localidades do Rio Grande do Sul. Tipo sang¨u´ıneo Localidade A B AB O Cidade I 43 9 1 47 Cidade II 29 17 9 45
    • 5.2 Teste de Independˆencia e de Homogeneidade ROSSI, Robson M. 60 Exerc´ıcio 5.9. Um estudo foi conduzido para investigar se existe uma associa¸c˜ao entre doen¸ca card´ıaca e apn´eia (ronco). Teste esta hip´otese ao n´ıvel de 5%. Tabela 5.18: Associa¸c˜ao entre doen¸ca card´ıaca e apn´eia. Apn´eia Doen¸ca card´ıaca n˜ao ocasionalmente quase toda noite todas as noites Sim 24 35 21 30 N˜ao 1355 603 192 224 Exerc´ıcio 5.10. Reestruture os dados para uma tabela 2x2 considerando apenas sim ou n˜ao para a apn´eia, em seguida teste a mesma hip´otese ao n´ıvel de 5%, determine o OR e seu respectivo IC.
    • Cap´ıtulo 6 Compara¸c˜oes Entre Grupos 6.1 Introdu¸c˜ao `As vezes, ´e preciso comparar duas popula¸c˜oes. Por exemplo, imagine que um pesquisador obteve, para um grande n´umero de crian¸cas, a idade em que cada uma delas come¸cou a falar. Para verificar se meninos e meninas aprendem a falar na mesma idade, o pesquisador ter´a que comparar os dados dos dois sexos. Outras vezes, ´e preciso comparar condi¸c˜oes experimentais. Por exemplo, para saber se um tratamento tem efeito positivo, organizam-se dois grupos de unidades: um grupo recebe o tratamento em teste (´e o grupo tratado), enquanto o outro n˜ao recebe o tratamento (´e o grupo controle). O efeito do tratamento ´e dado pela compara¸c˜ao dos dois grupos. Freq¨uentemente, para compara¸c˜ao de dois tratamentos observam-se caracter´ısticas ou mede-se o valor da vari´avel resposta de interesse que as caracter´ısticas importantes dos indiv´ıduos que integram o mesmo par sejam t˜ao semelhantes quanto poss´ıvel. O tratamento ´e administrado a um dos elementos do par e o outro ´e mantido como controle. A vantagem do procedimento ´e clara. Os indiv´ıduos no par s˜ao semelhantes, exceto no que se refere ao tratamento recebido. Em algumas situa¸c˜oes o par ´e constitu´ıdo do mesmo indiv´ıduo em duas ocasi˜oes diferentes (amostras dependentes). 6.2 Resposta Dicotˆomica: Amostras Independentes Comparar dois grupos atrav´es do resultado observado em uma vari´avel dicotˆomica ´e um problema comum na pesquisa m´edica, aparecendo com freq¨uˆencia em todos os tipos de estudos cl´ınicos. A vari´avel de interesse ´e a ocorrˆencia de um evento, como o desenvolvimento de uma doen¸ca de certo atributo, por exemplo, albinismo. O problema de compara¸c˜oes das probabilidades de ocorrˆencia do evento ou do atributo nos dois grupos (p1 e p2) ´e formulado atrav´es das hip´oteses: H0 : p1 = p2 Ha : p1 = p2 “n˜ao h´a diferen¸ca significativa entre os grupos” “h´a diferen¸ca significativa entre os grupos” 6.2.1 Teste Qui-Quadrado A Tabela 6.1 apresenta dados gen´ericos de uma situa¸c˜ao envolvendo a compara¸c˜ao de dois grupos e que a resposta de interesse ´e dicotˆominca: a ocorrˆencia ou n˜ao de um evento. Tabela 6.1: Distribui¸c˜ao quanto `a ocorrˆencia de um evento. Grupo Ocorrˆencia do Evento Total Sim N˜ao I a b n1 = a + b II c d n2 = c + d Total m1 = a + c m2 = b + d n = n1 + n2 61
    • 6.2 Resposta Dicotˆomica: Amostras Independentes ROSSI, Robson M. 62 A estat´ıstica teste ser´a: χ2 c = k i=1 (Oi − Ei)2 Ei ∼ χ2 1;(1−α)% ou, para Tabelas 2×2: χ2 c = n (ad − bc) 2 n1n2m1m2 ∼ χ2 1;(1−α)% (Tabelas 2 × 2) H´a restri¸c˜oes para aplica¸c˜ao do χ2 em tabelas contingˆencia, logo a corre¸c˜ao de Yates (1934) ´e necess´aria. Esta corre¸c˜ao deve ser feita quando: • n < 40; • 20 < n < 40 e Ei ≤ 5 para algum i; • n > 40 e Ei ≤ 5 para algum i; Para testar as hip´oteses acima citadas temos a estat´ıstica teste qui-quadrado com corre¸c˜ao de continuidade de Yates, temos χ2 cY = n |ad − bc| − n 2 2 n1n2m1m2 ∼ χ2 1;(1−α)% (Tabelas 2 × 2) Exemplo 6.1. Estudo sobre a associa¸c˜ao entre o uso corrente de contraceptivos e o infarto de mioc´ardio. Shapiro et al. (1979) observaram os resultados entre pacientes com idade entre 30 e 34 anos e estes s˜ao mostrados na Tabela 6.2. Tabela 6.2: Distribui¸c˜ao de uso de contraceptivo oral segundo grupo que sofreu ou n˜ao infarto do mioc´ardio. Grupo Uso recente Total Sim N˜ao Casos 9 12 21 Controles 33 390 423 Total 42 402 444 Entre os casos, ou seja, entre as pacientes que tiveram um infarto do mioc´ardio, a propor¸c˜ao de uso recente de contraceptivos ´e 9 21 = 0, 43 e entre os controles, 33 423 = 0, 08. A diferen¸ca entre estas duas propor¸c˜oes (0,35) parece indicar que o uso de contraceptivos orais ´e mais freq¨uente entre os casos (infartos). Mas ser´a que este resultado n˜ao ocorreu por mero acaso? A express˜ao χ2 c = 24, 76 > 3, 84 = χ2 1;95%, nos indica, com alto grau de confian¸ca (95%) afirmar que existe associa¸c˜ao entre o uso de contraceptivos orais e infarto do mioc´ardio para pacientes entre 30 e 34 anos.
    • 6.2 Resposta Dicotˆomica: Amostras Independentes ROSSI, Robson M. 63 6.2.2 Teste Exato de Fisher Nos casos em que formamos uma tabela de contingˆencia com formato 2 × 2, com pequeno n´umero de observa¸c˜oes (n < 20 ou pr´oximo) e, conseq¨uentemente, com freq¨uˆencias observadas em cada casela muito baixas, a literatura apresenta a utiliza¸c˜ao do teste exato de Fisher, no qual estimamos, a partir da menor freq¨uˆencia contida na tabela, a probabilidade de ocorrˆencia deste valor e de uma freq¨uˆencia menor ainda, fazendo-se p = n i=0 pi, em que n ´e a menor freq¨uˆencia verificada na tabela. Numa tabela de contingˆencia 2 × 2, com os totais marginais fixos, apresentada como a Tabela 5.1, as freq¨uˆencias observadas tˆem distribui¸c˜ao hipergeom´etrica e a probabilidade de ocorrˆencia i ser´a dada por: pi = n1!n2!m1!m2! a!b!c!d!n! Exemplo 6.2. Um estudo foi realizado para verificar a existˆencia de associa¸c˜ao entre o tipo de tratamento e mortalidade por AIDS. A Tabela 6.3 apresenta os dados. Tabela 6.3: Associa¸c˜ao entre o tipo de tratamento e mortalidade por AIDS. Tratamento Mortalidade Total Sim N˜ao A 7 5 12 B 1 9 10 Total 8 14 22 Sendo p = 1 i=0 pi, temos p1 = 12!10!8!14! 7!5!1!9!22! = 0, 024. e Tabela 6.4: Associa¸c˜ao entre o tipo de tratamento e mortalidade por AIDS. Tratamento Mortalidade Total Sim N˜ao A 8 4 12 B 0 10 10 Total 8 14 22 assim p0 = 12!10!8!14! 8!4!0!10!22! = 0, 0015. O valor de p ser´a 0, 024 + 0, 0015 = 0, 0255 (p-valor : 0,0263). Como este p ´e menor que o n´ıvel de significˆancia, para α = 0, 05 a decis˜ao correta ser´a rejeitar H0, isto ´e, pode-se concluir que h´a diferen¸ca quanto `a mortalidade em rela¸c˜ao ao tipo de tratamento, sendo B mais efic´az. Exemplo 6.3. Suponha um grupo de dezesseis ratos, divididos em dois grupos, experimental e normal. O grupo experimental ´e formado por 9 animais geneticamente modificados, por apresentarem uma disfun¸c˜ao pancre´atica com diminui¸c˜ao da capacidade de produ¸c˜ao de insulina. Imagine que, ap´os um ano e meio em ambiente controlado, o n´umero de ratos vivos do grupo experimental e do normal seja o seguinte (Tabela 6.5): Pode-se notar que aproximadamente 71% dos ratos normais ainda permaneciam vivos, enquanto a so- brevida para o grupo experimental ´e de apenas 11%. O teste exato de Fisher consiste em elaborar, com base nos totais marginais do fator discriminante da tabela original, duas outras tabelas, que ser˜ao denominadas tabelas ou matrizes extremas, X1 e X2. A matriz
    • 6.2 Resposta Dicotˆomica: Amostras Independentes ROSSI, Robson M. 64 Tabela 6.5: Estudo em ratos sobre disfun¸c˜ao pancre´atica. Grupo Sobrevida + 1,5 ano Total Vivos Mortos Normal 5 2 7 Experimental 1 8 9 Total 6 10 16 extrema 1 ´e a matriz em que todos os animais mortos pertencem ao grupo normal (s˜ao 10 mortos, mas o grupo normal tem 7 ratos, logo, os outros 3 que morreram pertencem ao grupo experimental) e todos que sobraram do grupo experimental est˜ao vivos (todos os vivos, pois sobraram 9-3 = 6 ratos). Desta forma, resulta na Matriz X1 (Tabela 6.6): Tabela 6.6: Matriz X 1. Grupo Sobrevida + 1,5 ano Total Vivos Mortos Normal 0 7 7 Experimental 6 3 9 Total 6 10 16 A matriz extrema 2, X2, corresponde a uma tabela com os mesmos totais marginais, mas com todos os animais vivos no grupo normal. Ent˜ao, pela matriz X2 (Tabela 6.7): Tabela 6.7: Matriz X 2. Grupo Sobrevida + 1,5 ano Total Vivos Mortos Normal 6 1 7 Experimental 0 9 9 Total 6 10 16 Observe que existe um ´obito no grupo normal, pois o n´umero de ratos do grupo normal ´e maior que o de ratos que sobreviveram. Obviamente, os 9 mortos que restaram pertencem ao grupo experimental. Nenhum rato do grupo experimental sobreviveu. Finalmente, o valor de significˆancia para o teste ´e calculado segundo a f´ormula apresentada anteriormente: Para a matriz original: F0 : 7!.9!.10!.6! 2!.5!.8!.1!.16! = 0, 02360 Para a matriz X 1 : FX1 : 7!.9!.10!.6! 0!.7!.6!.3!.16! = 0, 0105 Para a matriz X 2 : FX2 : 7!.9!.10!.6! 6!.1!.0!.9!.16! = 0, 0009 Finalmente, p = F0 + FX1 + FX2 = 0, 0236 + 0, 01505 + 0, 0009 = 0, 035 ou 3, 5%. Ou seja, a afirma¸c˜ao de que a sobrevida dos ratos geneticamente alterados ´e menor que a dos ratos normais envolve uma probabilidade de erro de 3,5%. Portanto, ao n´ıvel de 5% de significˆancia, rejeita-se a hip´otese de nulidade (ou seja, de que as vidas dos ratos normais e dos transgˆenicos s˜ao iguais).
    • 6.3 Resposta Dicotˆomica: Amostras Pareadas ROSSI, Robson M. 65 6.2.3 Teste z para Compara¸c˜ao de Propor¸c˜oes Denotamos os dois resultados poss´ıveis da vari´avel dicotˆomica por sucesso e fracasso. Sejam p1 e p2 as propor¸c˜oes de sucesso referentes aos tratamentos a serem comparados, que s˜ao estimadas por ˆp1 e ˆp2, as propor¸c˜oes amostrais baseadas em amostras de tamanhos n1 e n2, respectivamente. Queremos testar as hip´oteses: H0 : p1 = p2 Ha : p1 = p2 isto ´e, estamos investigando a equivalˆencia entre os dois tratamentos. Apresentaremos uma alternativa para o teste qui-quadrado para a compara¸c˜ao de propor¸c˜oes. Trata-se de um teste aproximado que requer amostras grandes para sua aplica¸c˜ao. Um crit´erio ´e exigir que n1 ˆp1 e n2 ˆp2 excedam o valor 5. O teste ´e baseado em Zc = ˆp1 − ˆp2 ˆp1(1−ˆp1) n1 + ˆp2(1−ˆp2) n2 ∼ N(0, 1). Exemplo 6.4. Compara¸c˜ao de drogas contra n´ausea. Com o objetivo de comparar a efic´acia de dois preventivos contra n´ausea, dividiu-se aleatoriamente uma amostra de 400 marinheiros em dois grupos de 200. Um grupo recebeu a p´ılula A e o outro a p´ılula B, sendo que no primeiro grupo 152 n˜ao enjoaram durante uma tempestade e no outro grupo apenas 132. H´a indica¸c˜oes de que a efic´acia da p´ılula A e B ´e a mesma? Sol.: Sejam pA e pB as propor¸c˜oes de marinheiros que n˜ao enjoam, respectivamente para as p´ılulas A e B. Temos que nA = 200, nB = 200, ˆpA = 152 200 = 0, 76, ˆpB = 132 200 = 0, 66, logo tem-se: Z = 0, 76 − 0, 66 0,76(1−0,76) 200 + 0,66(1−0,66) 200 = 2, 22 (p-valor : 0,0281). Fixando-se o n´ıvel de significˆancia em 5%, rejeita-se H0. Portanto, pode-se concluir que as duas p´ılulas n˜ao s˜ao igualmente efetivas. H´a indica¸c˜ao de que a p´ılula A oferece maior prote¸c˜ao contra n´ausea comparada `a p´ılula B. 6.3 Resposta Dicotˆomica: Amostras Pareadas Podemos disting¨uir trˆes tipos de pareamento: auto-pareamento, pareamento natural e pareamento artifi- cial. O auto-pareamento ocorre quando o indiv´ıduo serve como seu pr´oprio controle, como na situa¸c˜ao em que um indiv´ıduo recebe duas drogas administradas em ocasi˜oes diferentes. Outra situa¸c˜ao ´e a que um tratamento ´e administrado e as vari´aveis de interesse s˜ao observadas antes e depois do programa. Finalmente, a compara¸c˜ao de dois ´org˜aos no mesmo indiv´ıduo, como bra¸cos, pernas, olhos, narinas, segundo alguma caracter´ıstica estudada tamb´em constitui um auto-pareamento. O pareamento natural consiste em formar pares t˜ao homogˆeneos quanto poss´ıvel, controlando os fatores que possam interferir na resposta, sendo que o pareamento aparece de forma natural. Por exemplo, em ex- perimentos de laborat´orio pode-se formar pares de cobaias selecionadas da mesma ninhada; em investiga¸c˜oes cl´ınicas, gˆemeos univitelinos s˜ao muitos usados. No pareamento artificial escolhe-se indiv´ıduos com caracter´ısticas semelhantes, tais como, idade, sexo, n´ıvel s´ocio-econˆomico, estado de sa´ude ou, em geral, fatores que podem influenciar de maneira relevante a vari´avel resposta.
    • 6.3 Resposta Dicotˆomica: Amostras Pareadas ROSSI, Robson M. 66 6.3.1 Teste de McNemar O exemplo a seguir ilustra a necessidade de desenvolvimento de um teste espec´ıfico para a situa¸c˜ao de dados pareados em que a resposta ´e dicotˆomica. Exemplo 6.5. Suponhamos que dois patologistas examinaram, separadamente, o material de 100 tumores e os classificaram como benignos ou malignos. A quest˜ao de interesse ´e saber se os patologistas diferem nos seus crit´erios de decis˜ao. Neste caso, a forma adequada de apresenta¸c˜ao dos dados ´e mostrada na Tabela 6.8. Tabela 6.8: Classifica¸c˜ao de dois patologistas (A e B) quanto `a malignidade de tumores. Diagn´ostico de B Diagn´ostico de A Total Malignos Benignos Malignos 9 1 10 Benignos 9 81 90 Total 18 82 100 ´E importante observar que a unidade de an´alise aqui ´e o tumor, avaliado por dois patologistas. Embora tenham sido feitas 200 an´alises, o total de tumores ´e, na realidade, apenas 100. Al´em disto, alguns tumores ser˜ao claramente mais malignos do que outros e, portanto, a hip´otese funda- mental na constru¸c˜ao do teste de probabilidade constante de malignidade n˜ao ´e razo´avel aqui. Isto explica a necessidade de desenvolvimento de teste espec´ıfico, isto ´e, para dados pareados. Os dados a serem analisados no processo de compara¸c˜ao podem ser resumidos no formato da Tabela 6.9. Tabela 6.9: Apresenta¸c˜ao de dados obtidos em uma classifica¸c˜ao de dados pareados. Controle Tratamento Total Sucesso Fracasso Sucesso a b n1 Fracasso c d n2 Total m1 m2 n Se p1 e p2 s˜ao as probabilidades de sucesso nos grupos controle e tratamento, respectivamente, a hip´otese de interesse ´e: H0 : p1 = p2 Ha : p1 = p2 A Estat´ıstica Teste: (B/C) χ2 McN = (|b − c| − 1)2 b + c ∼ χ2 1. A hip´otese nula dever´a ser rejeitada quando χ2 McN > χ2 1.
    • 6.4 Resposta Cont´ınua - Teste de M´edias para Amostras Independentes ROSSI, Robson M. 67 Exemplo 6.6. Amigdalectomia e doen¸ca de Hodgkin. Johnson & Johnson (1972), ao analisarem retrospectivamente a hist´oria cl´ınica de pacientes de doen¸ca de Hodgkin, um tipo de cˆancer no tecido linf´oide, n˜ao encontraram evidˆencias que sustentassem a hip´otese de que a amigdalectomia aumenta a suscetibilidade `a doen¸ca, pela remo¸c˜ao da ”barreira linf´atica” representada pela am´ıgdala. Neste estudo, usaram um planejamento do tipo caso-controle pareado. A conclus˜ao relatada no artigo foi feita, entretanto, com uma an´alise apropriada para dados provenientes de grupos independentes. Logo ap´os a publica¸c˜ao, v´arios autores observaram a impropriedade da an´alise e, utilizando as informa¸c˜oes do artigo, fizeram a an´alise correta, que ´e baseada nos dados da Tabela 6.10. Tabela 6.10: Distribui¸c˜ao de pacientes com e sem doen¸ca de Hodgkin em um estudo caso-controle pareado segundo `a amigdalectomia. Doen¸ca de Controle Total Hodgkin Operados N˜ao operados Operados 26 15 41 N˜ao operados 7 37 44 Total 33 52 85 O valor da estat´ıstica do teste de McNemar ´e: χ2 McN = (|15 − 7| − 1)2 15 + 7 = 2, 23 (p-valor : 0,1356). Este valor dever ser comparado com 3,84 para um n´ıvel de significˆancia de 5%. Ou seja, com uma confian¸ca de 95% acreditamos que n˜ao h´a associa¸c˜ao entre a doen¸ca de Hodgkin e a amigdalectomia. Esta conclus˜ao n˜ao est´a de acordo com trabalhos anteriores, como o de Vianna et al. (1971). 6.4 Resposta Cont´ınua - Teste de M´edias para Amostras Indepen- dentes `As vezes, ´e preciso comparar duas popula¸c˜oes. Por exemplo, imagine que um pesquisador obteve, para um grande n´umero de crian¸cas, a idade em que cada uma delas come¸cou a falar. Para verificar se meninos e meninas aprendem a falar na mesma idade, o pesquisador ter´a que comparar os dados dos dois sexos. Nesta se¸c˜ao apresentamos a metodologia para comparar dois grupos de pacientes (por exemplo, doentes versus n˜ao doentes) em rela¸c˜ao a uma resposta cont´ınua, por exemplo, press˜ao sist´olica. Testa-se, neste caso, a igualdade das m´edias das respostas de dois tratamentos. Sejam µ1 e µ2 as m´edias da vari´avel estudada para os dois grupos, respectivamente. As hip´oteses a serem testadas s˜ao: H0 : µ1 = µ2 Ha : µ1 = µ2 6.4.1 Teste t Se a vari´avel em an´alise tem distribui¸c˜ao normal ou aproximadamente normal, aplica-se o teste t para comparar duas m´edias. Mas primeiro ´e preciso estabelecer o n´ıvel de significˆancia, α. Depois, dados os dois grupos, 1 e 2, calculam-se: a) as m´edias de cada grupo: ¯x1 : m´edia do grupo 1 ¯x2 : m´edia do grupo 2 b) as variˆancias ou os desvios-padr˜oes de cada grupo: s1 : desvio-padr˜ao do grupo 1 s2 : desvio-padr˜ao do grupo 2
    • 6.4 Resposta Cont´ınua - Teste de M´edias para Amostras Independentes ROSSI, Robson M. 68 c) a variˆancia ponderada: s2 p = (n1 − 1)s2 1 + (n2 − 1)s2 2 n1 + n2 − 2 d) o valor da estat´ıstica teste, tc, definida por: tc = ¯x1 − ¯x2 s2 p 1 n1 + 1 n2 ∼ tn1+n2−2;α% O intervalo de confian¸ca para (µ1 − µ2) ser´a: (¯x1 − ¯x2) ± tn1+n2−2;α%.s2 p. 1 n1 + 1 n2 Exemplo 6.7. Compara¸c˜ao entre tratamentos para dieta. Para verificar se duas dietas para emagrecer s˜ao igualmente eficientes, um m´edico separou, ao acaso, um conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para seu grupo. Decorrido certo tempo, o m´edico obteve a perda (ou ganho) de peso, em quilogramas, de cada paciente de cada grupo. Os dados est˜ao apresentados na Tabela 6.11: Tabela 6.11: Perdas de peso, em quilogramas, segundo a dieta. 1 15 19 15 12 13 16 15 - - - 2 12 8 15 13 10 12 14 11 12 13 Ap´os alguns c´alculos preliminares, temos: ¯x1 = 12; ¯x2 = 15; s2 1 = 4; s2 2 = 5; s2 p = 4, 4, desta forma, para α = 5%, temos t15;5% = ±2, 13, assim: tc = 12 − 15 4, 4 1 10 + 1 7 = −2, 902 ∈ Regi˜ao de rejei¸c˜ao de H0, logo podemos p − valor : 0, 010947 concluir que, em m´edia, as perdas de peso de pacientes submetidos aos dois tipos de dieta s˜ao diferentes. Em termos pr´aticos, a perda de peso ´e maior quando os pacientes s˜ao submetidos `a dieta 2. 6.4.2 Teste z Um pressuposto importante para aplicar o teste t visto anteriormente ´e que os dois grupos comparados tenham a mesma variabilidade, o que nem sempre acontece na pr´atica. No caso de amostras grandes (n1 e n2 ≥ 30) dispomos de um teste em que n˜ao ´e necess´ario qualquer suposi¸c˜ao adicional sobre σ2 1 e σ2 2, ou seja, as varˆancias podem ser iguais ou diferentes. A estat´ıstica teste usada ser´a: Zc = ¯x1 − ¯x2 s2 1 n1 + s2 2 n2 ∼ N(0, 1). Exemplo 6.8. Efeito do halotano em cirurgias card´ıacas. O halotano ´e uma droga bastante utilizada para induzir a anestesia geral. Trata-se de um poderoso anest´esico de inala¸c˜ao, n˜ao inflam´avel e n˜ao explosivo, com um odor relativamente agrad´avel. Pode ser administrado ao paciente com o mesmo equipamento usado para sua oxigena¸c˜ao. Ap´os a inala¸c˜ao, a substˆancia chega aos pulm˜oes tornando poss´ıvel a passagem para o estado anest´esico mais rapidamente do que seria poss´ıvel com drogas administradas de forma intravenosa.
    • 6.5 Resposta Cont´ınua - Teste de M´edias para Amostras Pareadas ROSSI, Robson M. 69 Entretanto, os efeitos colaterais incluem a depress˜ao do sistema respirat´orio e cardiovascular, sensibi- liza¸c˜ao a arritmias produzidas por adrenalina e eventualmente o desenvolvimento de les˜ao hep´atica. Alguns anestesistas acreditam que esses efeitos podem causar complica¸c˜oes em pacientes com problemas card´ıacos e sugerem o uso da morfina como um agente anest´esico nesses pacientes devido ao seu pequeno efeito na atividade card´ıaca. Conahan et al. (1973) compararam esses dois agentes anest´esicos em um grande n´umero de pacientes submetidos a uma cirurgia de rotina para reparo ou substitui¸c˜ao da v´alvula card´ıaca. Para obter duas amostras compar´aveis, os pacientes foram alocados aleatoriamente a cada tipo de anestesia. Com o objetivo de estudar o efeito desses dois tipos de anestesia, foram registradas vari´aveis hemodinˆamicas, como press˜ao sang¨u´ınea antes da indu¸c˜ao anest´esica, ap´os a anestesia mas antes da incis˜ao, e em outros per´ıodos impor- tantes durante a opera¸c˜ao. A quest˜ao que surge ´e se o efeito do halotano e da morfina na press˜ao sang¨u´ınea ´e o mesmo. Para comparar os dois grupos, necessitamos dos resultados apresentados na Tabela 6.12 a seguir: Tabela 6.12: M´edia e desvio-padr˜ao da press˜ao sang¨u´ınea (mmHg) segundo o tipo de anestesia. Informa¸c˜oes Anestesia sobre a amostra Halotano Morfina M´edia 66,9 73,2 Desvio-Padr˜ao 12,2 14,4 n 61 61 Nas condi¸c˜oes do problema, as hip´oteses s˜ao: H0 : µ1 = µ2 Ha : µ1 = µ2 ; isto ´e, devemos testar a diferen¸ca entre as press˜oes sang¨u´ıneas m´edias de indiv´ıduos anestesiados com halotano ou morfina. Como as amostras s˜ao grandes, podemos usar o teste Z, cujo valor da estat´ıstica do teste ´e: Zc = 66, 9 − 73, 2 12, 22 61 + 14, 42 61 = − 6, 30 √ 5, 84 = −2, 61 (p-valor : 0,0103). Adotando um n´ıvel de siginificˆancia de 5%, o resultado ´e estatisticamente significativo, j´a que |−2, 61| > 1, 96, indicando que os dois anest´esicos n˜ao s˜ao equivalentes. 6.5 Resposta Cont´ınua - Teste de M´edias para Amostras Pareadas 6.5.1 Teste t Para estudar o efeito de um tratamento, muitas vezes comparam-se pares de indiv´ıduos. Por exemplo, em alguns estudos de psicologia comparam-se pares de gˆemeos: um dos gˆemeos recebe o tratamento, enquanto o outro permanece sem o tratamento (controle). Outras vezes, comparam-se os dois lados dos mesmos indiv´ıduos. Por exemplo, par estudar o efeito de um tratamento para preven¸c˜ao de c´aries, o dentista pode aplicar o tratamento em um lado da arcada dent´aria de cada paciente, e deixar o outro lado sem tratamento (controle). Tamb´em s˜ao feitos experimentos em que se observam os mesmos indiv´ıduos duas vezes, isto ´e, uma vez antes, outra vez, depois de administrar o tratamento. Por exemplo, para verificar o efeito de um tratamento sobre press˜ao arterial, o m´edico pode obter a press˜ao arterial de seus pacientes, antes e depois de administrar o tratamento. Todos esses exemplos s˜ao de observa¸c˜oes pareadas (pares de gˆemeos, dois lados de um indiv´ıduo, ob- serva¸c˜oes no mesmo indiv´ıduo). Para testar o efeito de um tratamento, quando as observa¸c˜oes s˜ao pareadas, aplica-se o teste t.
    • 6.5 Resposta Cont´ınua - Teste de M´edias para Amostras Pareadas ROSSI, Robson M. 70 Estat´ıstica teste: tc = ¯d s2 n ∼ tn−1;α% onde: ¯d : m´edia das diferen¸cas, di = x2 − x1 : a diferen¸ca entre as unidades de cada um dos n pares ¯d = n i=1 di n s2 : variˆancia das diferen¸cas, di. Toda vez que o valor absoluto de tc for igual ou maior do que o valor tabelado tn−1;α%, conclui-se que o tratamento tem efeito ao n´ıvel α% estabelecido. O intervalo de confian¸ca para d, ser´a dado por: ¯d ± tn−1;α%. S √ n Exemplo 6.9. S˜ao dados os pesos de 9 pessoas, antes e depois da dieta para emagrecimento. Tabela 6.13: Pesos em Kg de 9 pessoas antes e depois da dieta para emagrecimento. Dieta Antes Depois di 77 80 3 62 58 -4 61 61 0 80 76 -4 90 79 11 72 69 -3 86 90 4 59 51 -8 88 81 -7 Total -30 Para fazer o teste, ´e preciso primeiro estabelecer o n´ıvel de significˆancia. Seja α = 1%, ¯d = − 30 9 = −3, 33 s2 = 25 logo tc = −3, 33 25 9 = −2, 0 (p-valor : 0,080516). Ao n´ıvel de siginificˆancia de 1% com g.l. = 8, o valor de t tabelado para t8;1%.´e de 3,36. Como o valor absoluto de tc (2,0) ´e menor do que o valor da tabela, concui-se que o tratamento n˜ao tem efeito significativo. Em termos pr´aticos, o experimento n˜ao provou que a dieta emagrece.
    • 6.6 Testes N˜ao-Param´etricos ROSSI, Robson M. 71 Exerc´ıcio 6.1. Avalia¸c˜ao morfoquantitativa dos neurˆonios mioent´ericos nadh-diaforase reativos do estˆomago de ratos com diabetes induzido por estreptozootocina e suplementados com ´acido asc´orbico (Mestrado em Morfologia-UEM). Este trabalho teve entre v´arios objetivos, verificar se existe diferen¸ca de tamanho entre as regi˜oes glandular e aglandular, entre as sub-regi˜oes aglandular (A e B) e glandular (A e B) e entre o estˆomago como um todo; e verificar se o diabetes afeta mais a regi˜ao glandular do que a regi˜ao aglandular, ou vice e versa. Parte dos dados est˜ao dispon´ıveis na Tabela (6.14) a seguir. Tabela 6.14: Avalia¸c˜ao morfoquantitativa dos neurˆonios mioent´ericos nadh-diaforase reativos do estˆomago de ratos com diabetes induzido por estreptozootocina e suplementados com ´acido asc´orbico. aglanB aglanA aglanTotal glanB glanA glanTotal Grupos 101,1 92,37 193,47 123,6 123,2 246,8 c 97,24 121,9 219,14 92,83 100,6 193,43 c 146,9 197,2 344,1 138,6 133,5 272,1 c 94,44 96,5 190,94 149,5 114,3 263,8 c 139,5 110,4 249,9 184,4 143,6 328 c 203,3 191,1 394,4 438,1 367,2 805,3 d 232,4 216,1 448,5 290,7 311 520,7 d 237,3 240,3 477,6 271,4 193,4 464,8 d 139,5 158,2 297,7 269,5 159,6 429,1 d 222,9 262,4 485,3 334,6 246,8 581,4 d 234,1 191,9 426 253 231,5 484,5 ds 201,9 207,3 409,2 237,7 186,6 424,3 ds 164,1 213,3 377,4 269,3 214,7 484 ds - - - 251,1 217,1 468,2 ds 6.6 Testes N˜ao-Param´etricos Os testes n˜ao-param´etricos s˜ao boas op¸c˜oes para situa¸c˜oes em que ocorrem viola¸c˜oes dos pressupostos b´asicos necess´arios para a aplica¸c˜ao de um teste param´etrico. Por exemplo, para testar a diferen¸ca de dois ou mais grupos quando a distribui¸c˜ao subjacente ´e assim´etrica ou dos dados foram coletados em uma escala ordinal. 6.6.1 Teste U de Mann-Whitney Este teste corresponde a mais uma alternativa para a compara¸c˜ao de duas amostras independentes, utilizando, como os demais testes n˜ao-param´etricos, os n´umeros naturais para classifica¸c˜ao conjunta dos valores observados. Portanto, o posto de um valor de um conjunto de n valores corres-ponde a um n´umero natural que indicar´a a sua posi¸c˜ao no conjunto anteriormente ordenado (posto, score ou rank), isto ´e, todas as N observa¸c˜oes recebem uma pontua¸c˜ao atrav´es dos n´umeros naturais 1, 2, 3, 4, ..., n. Assim, ao menor valor se dar´a o n´umero 1, e assim sucessivamente at´e o valor maior, que receber´a a maior pontua¸c˜ao. Quando ocorre a presen¸ca de valores iguais no conjunto, considera-se um ponto m´edio, n˜ao afetando o posto seguinte. Portanto, num conjunto de seis valores j´a ordenados {7-12-18-18-19-23} os postos ser˜ao {1-2-3,5-3,5-5-6}, respectivamente. Quanto ao procedimento mais adequado para a aplica¸c˜ao do teste, baseamo-nos no c´alculo de U1 e U2, sendo: U1 = n1n2 + n1(n1 + 1) 2 − T1 e U2 = n1n2 + n1(n1 + 1) 2 − T2 onde n1 e n2 s˜ao os tamanhos das duas amostras de T1 e T2, que correspondem as somas dos pontos (postos) atribu´ıdos aos valores das duas amostras.
    • 6.6 Testes N˜ao-Param´etricos ROSSI, Robson M. 72 Para amostras pequenas (n ≤ 20) Uc = m´ın{U1; U2} Obtemos uma estat´ıstica tabelada : UT = Uα,n1,n2 e conclu´ımos para a rejei¸c˜ao de Ho se Uc ≤ UT . Para amostras grandes (n > 20) Neste caso o teste pode ser aplicado por aproxima¸c˜ao normal, sendo µ(u) = n1n2 2 e σ(u) = n1n2(n1 + n2 + 1) 12 . Neste caso, a express˜ao do teste ser´a: Z = u1 − µ(u) σ(u) ∼ N(0, 1). Exemplo 6.10. Verificar se os dados das duas amostras apresentam diferen¸ca significativa. Tabela 6.15: Dados hipot´eticos. Amostra A Amostra B 2,6 (9,5) 2,3 (5) 2,9 (13) 2,8 (12) 2,5 (8) 2,0 (2) 2,7 (11) 1,8 (1) 3,2 (14) 2,4 (7) 2,6 (9,5) 2,3 (5) 2,3 (5) 2,2 (3) 3,3 (15) - T1 = 85, 0 T2 = 35, 0 Procede-se `a ordena¸c˜ao dos valores para obten¸c˜ao dos seus postos e posteriormente seu somat´orio. Temos ent˜ao n1 = 8, n2 = 7, T1 = 85 e T2 = 35. O valor de U1 e de U2, respectivamente ser˜ao: U1 = 8.7 + 8(8 + 1) 2 − 85 = 7 U2 = 8.7 + 7(7 + 1) 2 − 35 = 49. Assim Uc = m´ın{7;49} = 7 O valor da estat´ıstica tabelada ser´a de: UT = Uα,n1,n2 = U5%,8,7 12 Como Uc ≤ UT rejeitamos Ho. Portanto as amostras diferem entre si ao n´ıvel de 5% de significˆancia. Suponho n ≥ 20 O teste pode ser aplicado tanto para U1 ou U2, pois ambos s˜ao sim´etricos em rela¸c˜ao `a m´edia 28. µ(u) = n1n2 2 = 8.7 2 = 28 e σ(u) = 8.7(8 + 7 + 1) 12 = 8, 63. Sendo assim: Z = 7 − 28 8, 63 = −2, 43 (p-valor : 0,013986). Como o valor de |Z| ´e maior do que Zα, quando α = 5%, ou seja, o valor 1,96, rejeitamos H0. Considera-se que as amostras diferem entre si ao n´ıvel de 5% de significˆancia.
    • 6.6 Testes N˜ao-Param´etricos ROSSI, Robson M. 73 Exerc´ıcio 6.2. Diagn´ostico e tratamento da Osteoporose. Osteoporose ´e uma doen¸ca esquel´etica sistˆemica caracterizada por baixa massa ´ossea e altera¸c˜ao da micro-arquitetura, levando a um aumento da fragilidade ´ossea e, conseq¨uentemente, do risco de fratura. A massa ´ossea aumenta durante a infˆancia e principalmente adolescˆencia, atingindo seu pico em torno dos 25 anos na mulher e 30 a 35 anos no homem. Ap´os a parada do crescimento ´osseo, a forma¸c˜ao e a reabsor¸c˜ao ocorrem na mesma propor¸c˜ao, em um processo denominado de remodela¸c˜ao ´ossea. Com o avan¸co da idade cronol´ogica, a forma¸c˜ao ´ossea torna-se menor que a reabsor¸c˜ao, levando a uma perda de massa ´ossea em torno de 1% ao ano. A quantidade de osso presente no adulto ´e proporcional ao pico de massa ´ossea atingido. Na osteoporose p´os-menopausa (desencadeada pelo hipoestrogenismo), a reabsor¸c˜ao ´ossea se manifesta mais precocemente nas regi˜oes ricas em osso trabecular, levando `a fratura na regi˜ao distal do radio e colapso central das v´ertebras dorsais e lombares. A osteoporose ´e uma doen¸ca assintom´atica at´e o paciente apresentar alguma fratura. Os locais mais comuns s˜ao v´ertebras, regi˜ao distal do r´adio e colo do fˆemur. As principais complica¸c˜oes das fraturas s˜ao dor crˆonica e deformidade ´ossea. Assim, com objetivo de detectar pacientes com osteoporose coletou-se uma amostra de 30 pacientes aleatoriamente em um Hospital Universit´ario. De cada paciente realizou-se um cadastro onde tinha as seguintes vari´aveis: idade, peso, altura, atividade f´ısica, hist´oria de fratura materna, ingest˜ao adequada de c´alcio, ra¸ca e outras como, tabagismo, algumas doen¸cas (hipogonadismo, s´ındromes disabsortivas) e drogas (cortic´oide) s˜ao fatores de risco que aceleram a perda ´ossea. Exerc´ıcio 6.3. Utilize o banco de dados em anexo de nome: osteporose ex.stw e verifique se existe diferen¸ca entre os grupos: Tabagismo e Ingest˜ao, com rela¸c˜ao entre as vari´aveis: Altura, Peso e IMC, onde IMC = Peso Altura2 ; * Considere α = 5%.
    • 6.6 Testes N˜ao-Param´etricos ROSSI, Robson M. 74 6.6.2 Teste H de Kruskal-Wallis para k amostras O teste de Kruska-Wallis foi criado como um substituto ao teste F na an´alise param´etrica. Ele ´e utilizado para que se verifique o contraste entre k amostras independentes. Requisitos: • Compara¸c˜ao entre 3 ou mais grupos independentes; • Dados ordinais (que possam ser ordenados); • ni ≥ 6. Os valores obtidos nas diversas amostras diferem entre si e portanto, ser´a uma maneira de verificar se estas diferen¸cas s˜ao devidas ao acaso ou se as amostras prov´em de popula¸c˜oes diferentes. Da mesma forma que nos outros testes, ser˜ao consideradas as hip´oteses nula (H0) e alternativa (Ha), isto ´e: H0 : “n˜ao h´a diferen¸ca significativa entre os tratamentos”. Ha : “h´a diferen¸ca significativa entre os tratamentos”. Quanto `a metodologia usada no teste de Kruskal-Wallis, a express˜ao ´e definida por: HK−W = 12 N(N + 1) . k i=1 T2 i ni − 3(N + 1) tal que H ∼ χ2 (k−1) em que: Ti : ´e a soma das ordens atribu´ıdas ao tratamento i; k : corresponde ao n´umero de tratamentos ou amostras a comparar; ni : o n´umero de observa¸c˜oes em cada tratamento k e, N : o total de observa¸c˜oes em todos os tratamentos k. Exemplo 6.11. Analisar o tempo de sobrevida, em meses, de pacientes atendidos na cl´ınica de abdˆomen do hospital X, na cidade de Cabrob´o. Tabela 6.16: Tempo de sobrevida. Radioterapia (n1 = 7) Quimioterapia (n2 = 8) Cirurgia (n3 = 8) 17 (11) 20 (12) 32 (17) 14 (9) 5 (3) 35 (20) 4 (2) 9 (6) 26 (15) 8 (5) 13 (8) 34 (18,5) 29 (16) 34 (18,5) 21 (13) 6 (4) 2 (1) 45 (21) 15 (10) 11 (7) 50 (23) - 22 (14) 47 (22) T1 = 57, 0 T2 = 69, 5 T3 = 149, 5 Quest˜oes: H´a diferen¸ca sifnificativa entre os tempos de sobrevivˆencia? Qual o tratamento recomendado baseado no tempo de sobrevida? Independentemente do n´umero de observa¸c˜oes em cada grupo e utilizando os n´umeros naturais, procede- mos `a ordena¸c˜ao dos valores. Assim os valores acima receberiam a seguinte numera¸c˜ao, conforme os valores j´a entre parˆenteses.
    • 6.6 Testes N˜ao-Param´etricos ROSSI, Robson M. 75 Ent˜ao: HK−W = 12 N(N + 1) . k i=1 T2 i ni − 3(N + 1) = 12 23(23 + 1) . 3 i=1 T2 i ni − 3(23 + 1) = 1 46 . 572 7 + 69, 52 8 + 149, 52 8 − 72 = 1 46 . (3861, 7) − 72 = 11, 95 (p-valor : 0,0025). Como HK−W ∼ χ2 (k−1), ent˜ao H ∼ χ2 (3−1) ⇒ χ2 2;5% = 5, 99 e χ2 2;1% = 9, 21, portanto, considerando que o valor encontrado de HK−W = 11, 95 ´e maior do que os valores da tabela, tanto para α = 5% como para α = 1%, conclu´ımos pela rejei¸c˜ao de H0 e conseq¨uentemente, pela indica¸c˜ao de que o tratamento cir´urgico se destaca dos demais, pois apresenta maiores valores aos tempos de sobrevida. Exerc´ıcio 6.4. Utilize o banco de dados citado no exerc´ıcio anterior: osteoporose ex.stw para verificar se existe diferen¸ca entre as Ra¸cas, considerando as vari´aveis: Altura, Peso e IMC, ao n´ıvel de 5%. 6.6.3 Teste de Wilcoxon (Amostras Pareadas ou dependentes) Trata-se de um teste n˜ao-param´etrico para comparar dois tratamentos quando os dados s˜ao obtidos atrav´es do esquema de pareamento. A prova de Wilcoxon avalia a grandeza das diferen¸cas quando comparados postos de observa¸c˜oes. Dada a grandeza das diferen¸cas observadas, atribui-se maior valor para a maior diferen¸ca encontrada, diminuindo este valor de acordo com as menores diferen¸cas existentes. Procedimento 1. Calcular di : diferen¸ca entre as obseva¸c˜oes di = x (2) i − x (1) i 2. Ignorar os sinais e atribuir postos 3. Calcular a soma dos postos (T+ e T−). 4. Obter o valor da estat´ıstica calculada Tc = m´ın{|T−|; |T+|} 5. Obter o valor da estat´ıstica Tabelada (Anexo) Tα;n 6. Concluir pela rejei¸c˜ao de H0 se Tc ≤ Tα;n. Pequenas Amostras (n ≤ 25) No confronto de dois grupos quando desejamos identificar se existe diferen¸ca significativa entre os mesmos quanto `as medidas encontradas, empregamos o teste de Wilcoxon quando a varia¸c˜ao dos valores apresenta-se de forma acentuada. A aplica¸c˜ao deste teste pressup˜oe que as duas amostras sejam casualizadas e independentes, e que as vari´aveis em confronto sejam cont´ınuas. A metodologia do teste consiste em se proceder `a ordena¸c˜ao dos valores das amostras e, posteriormente, atribuir aos mesmos seus “ranks”. Em seguinda, obt´em-se os totais do ranks da amostra de menor tamanho, consultando-se a tabela (anexo) do referido teste.
    • 6.6 Testes N˜ao-Param´etricos ROSSI, Robson M. 76 Exemplo 6.12. Foi realizado um ensaio cl´ınico em que foram utilizadas duas drogas A e B. Com a droga A foram tratados oito pacientes e com a droga B, cinco pacientes. Os n´ıveis de anticorpos corresponderam a: Tabela 6.17: N´ıveis de anticorpos. Tratamento A B 7,4 (6) 9,1 (7) 12,3 (9) 0,7 (1) 11,8 (8) 19,2 (12) 16,4 (10) 2,4 (3) 1,9 (2) 17,5 (11) 3,0 (4) - 6,8 (5) - 20,4 (13) - T1 = 57 T2 = 34 Logo, para Tc = m´ın{57; 34} = 34 consultando-se a Tabela de Wilcoxon, verifica-se que Tα;n = T5%;5 = 0 > 34 (no Statistica o p-valor : 0,8927). Assim, podemos afirmar que n˜ao rejeitamos H0, ou seja, que os valores comparados, referentes `as drogas A e B, n˜ao apresentam-se com diferen¸ca siginificativa. Conclui-se, ent˜ao, que os valores de n´ıveis de anticorpos em rela¸c˜ao aos dois tipos de drogas se comportam de forma semelhante. Grandes Amostras (n > 25) Nos casos de grandes amostras, estas apresentam valores com distribui¸c˜ao normal e, portanto, a com- para¸c˜ao das medidas ser´a realizada atrav´es de determina¸c˜ao de um valor W∗ . S˜ao enunciadas naturalmente as hip´oteses. H0 ser´a rejeitada se o valor de W∗ for maior ou igual a Zα para um n´ıvel de significˆancia, α, pr´e-determinado. Assim, para a compara¸c˜ao de conjuntos de medidas, provenientes de duas amostras, ser´a necess´ario utilizar a express˜ao de W∗ : W∗ = Tc − n(n + 1) 4 n(n + 1)(2n + 1) 24 ∼ N(0, 1) em que: n : n´umero de elementos da menor amostra;
    • 6.6 Testes N˜ao-Param´etricos ROSSI, Robson M. 77 Exemplo 6.13. Evolu¸c˜ao do tratamento com tianeptina: Escores dos pacientes do grupo tianeptina no primeiro e no ´ultimo dia: Tabela 6.18: Tratamento com tianeptina. Tianeptina Primeiro dia (m = 8) ´Ultimo dia (n = 8) d Postos 24 6 -18 (-) 11,5 46 33 -13 (-) 7 26 21 -5 (-) 4,5 44 26 -18 (-) 11,5 27 10 -17 (-) 9,5 34 29 -5 (-) 4,5 33 33 0 (+) 1 25 29 +4 (+) 3 35 37 +2 (+) 2 30 15 -15 (-) 8 38 2 -36 (-) 14 38 21 -17 (-) 9,5 31 7 -24 (-) 13 27 * * * 34 * * * 32 26 -6 (-) 6 Sendo assim temos: |T−| = 99 e |T+| = 6, ent˜ao Tc = m´ın{99; 6} = 6 De acordo com a Tabela de Wilcoxon, Tα;n = T5%;14 = 21 Como 6 < 21, rejeitamos H0. Supondo n grande teremos: W∗ = 6 − 14(14 + 1) 4 14(14 + 1)(2.14 + 1) 24 = −2, 92 (p-valor : 0,003). Considerando que o valor de W∗ = −2, 92 est´a na ´area de rejei¸c˜ao de H0, para o valor de Z5% = ±1, 96, rejeitamos H0, ou seja, os valores dos dois conjuntos apresentam diferen¸cas significativas.
    • 6.6 Testes N˜ao-Param´etricos ROSSI, Robson M. 78 6.6.4 Teste de Friedman para k tratamentos O teste de Friedman ´e recomendado como um substituto do teste F, quando procede-se `a compara¸c˜ao de k amostras relacionadas ou dependentes cujas observa¸c˜oes apresentam valores com acentuadas varia¸c˜oes e em cada tratamento s˜ao constitu´ıdos blocos. Na verdade, procura-se fazer a compara¸c˜ao de tratamentos em que s˜ao formados blocos com a inten¸c˜ao de que isto resulte em um pareamento consider´avel entre os diversos tratamentos. A forma de realiza¸c˜ao do teste ´e an´alogo aos demais. Dentro de cada um do n blocos formados procede-se `a classifica¸c˜ao das i-´esimas observa¸c˜oes em k tratamentos, utilizando-se n´umeros naturais. Assim, tem-se a estat´ıstica teste: HF r = 12 nk(k + 1) . k i=1 T2 i − 3n(k + 1) tal que HF r ∼ χ2 (k−1) Exemplo 6.14. S˜ao prescritos quatro procedimentos t´ecnicos para determina¸c˜ao de certa vari´avel. Foram formados cinco blocos e obtidos os seguintes valores: Tabela 6.19: Dados de quatro procedimentos t´ecnicos. Tratamentos A B C D 12 (2) 13 (3) 16 (4) 7 (1) 8 (2) 9 (3) 12 (4) 5 (1) 14 (2) 20 (3) 22 (4) 6 (1) 17 (3) 16 (2) 21 (4) 11 (1) 12 (2) 15 (3) 16 (4) 10 (1) T1 = 11 T2 = 14 T3 = 20 T4 = 5 Substituindo-se os valores na express˜ao no teste, tem-se: HF r = 12 5.4(4 + 1) . 4 i=1 T2 i − 3.5(4 + 1) = 12 100 . [121 + 196 + 400] − 75 = 14, 04 (p-valor : 0,00285). Como HF r ∼ χ2 (k−1), ent˜ao HF r ∼ χ2 (4−1) ⇒ χ2 3;5% = 7, 82 e χ2 3;1% = 11, 34, portanto, considerando que o valor encontrado de HF r = 14, 04 ´e maior do que os valores da tabela, tanto para α = 5% como para α = 1%, conclu´ımos pela rejei¸c˜ao de H0, logo verifica-se que h´a diferen¸ca significativa entre as medidas dos tratamentos. O tratamento C apresentou melhores resultados em rela¸c˜ao aos demais grupos.
    • 6.7 Outros Testes N˜ao-Param´etricos ROSSI, Robson M. 79 6.7 Outros Testes N˜ao-Param´etricos 6.7.1 Teste de Concordˆancia ou de Replicabilidade (Coeficiente de Kappa) O coeficiente de Kappa ´e utilizado para verificar a concordˆancia entre os diagn´osticos de dois especialistas. Observe a Tabela (6.20) abaixo: Tabela 6.20: Concordˆancia entre o diagn´ostico de dois especialistas. Diagn´ostico Diagn´ostico Especialista 1 Total Especialista 2 Presente (+) Ausente (-) Presente (+) a (++) b (+-) n1 = a + b Ausente (-) c (-+) d (–) n2 = c + d Total m1 = a + c m2 = b + d n C´alculos auxiliares: • Propor¸c˜ao de concordˆancia observada: po = a + d n • Propor¸c˜ao de concordˆancia casual: pc = n1.m1 + n2.m2 n2 • Coefficiente: Kappa = po − pc 1 − pc . Classifica¸c˜ao: Kappa Concordˆancia k = 0 nenhuma k < 0, 4 leve 0, 4 ≤ k < 0, 8 moderada 0, 8 ≤ k < 1 forte k = 1 perfeita Exemplo 6.15. Em uma determinada experiˆencia, foi avaliado o grau de les˜ao do tecido hep´atico, em 20 cobaias `as quais foi administrada uma certa substˆancia t´oxica. Os resultados dos exames efetuados por dois patologistas foram o seguinte: Tabela 6.21: Teste Kappa para a concordˆancia entre patologistas quanto ao grau de les˜ao do tecido hep´atico. Cobaia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Patologista 1 + + + + + + - + + + + + + - - + - + + - Patologista 2 + + - + + + - - + + - + + - - - - - + - + : presen¸ca de les˜ao hep´atica - : ausˆencia de les˜ao hep´atica. Com base nesses resultados, ´e poss´ıvel construir a tabela abaixo:
    • 6.7 Outros Testes N˜ao-Param´etricos ROSSI, Robson M. 80 Tabela 6.22: Concordˆancia entre o diagn´ostico de dois especialistas. Diagn´ostico Diagn´ostico Patologista 1 Total Patologista 2 Presente (+) Ausente (-) Presente (+) 10 5 15 Ausente (-) 0 5 5 Total 10 10 20 Ent˜ao temos: po = a + d n = 10 + 5 20 = 0, 75 pc = n1.m1 + n2.m2 n2 = 15.10 + 5.10 202 = 200 400 = 0, 5 Kappa = po − pc 1 − pc = 0, 75 − 0, 5 1 − 0, 5 = 0, 5. Conclui-se que existe uma concordˆancia apenas moderada entre os diagn´osticos dos patologistas. 6.7.2 Teste de Cochran O teste de Cochran ´e utilizado quando as respostas do tratamento s˜ao do tipo ”Sucesso” ou ”Insucesso”, ”Alterado” ou ”N˜ao alterado” e, al´em disso, cada unidade experimental ´e avaliada em rela¸c˜ao a mais de dois tratamentos distintos, o que caracteriza a dependˆencia ou o pareamento das unidades amostrais. ´E uma extens˜ao da prova de McNemar para a significˆancia de mudan¸cas. Particularmente ´e aplic´avel aos planejamentos do tipo “antes e depois”, em que cada indiv´ıduo ´e utilizado como seu pr´oprio controle e a mensura¸c˜ao se faz ao n´ıvel de uma escala nominal ou ordinal. A prova de Cochran para k amostras relacionadas proporciona um m´etodo para comprovar se trˆes ou mais conjuntos correspondentes de freq¨uˆencias ou propor¸c˜oes diferem entre si significativamente: Os mesmos indiv´ıduos s˜ao observados sob condi¸c˜oes diferentes; Para escores ordinais dicotomizados, atribui o escore 1 a cada “sucesso” e o escore 0 a cada “falha”; Posiciona os dados numa tabela CxI com C colunas, que correspondem ao n´umero k de tratamentos I linhas, que coincidem com o n´umero de casos em cada um dos k tratamentos; Utiliza o somat´orio dos resultados correspondentes a cada grupo e os somat´orios dos escores de cada bloco; Grupo Bloco k j=1 Gj = G1 + G2 + ... + Gk n i=1 Lj = L1 + L2 + ... + Ln n i=1 L2 j = L2 1 + L2 2 + ... + L2 n Estat´ıstica teste: Q = (k − 1)k   k j=1 G2 j − k j=1 Gj 2   k n i=1 Lj − n i=1 L2 j ∼ χ2 k−1; Quando Q > χ2 k−1 a decis˜ao a ser tomada ´e de rejei¸c˜ao de H0. N˜ao se conhece exatamente o poder da prova de Cochran. A no¸c˜ao de poder-eficiˆencia n˜ao tem sentido quando se aplica a prova de Cochran a dados nominais ou naturalmente dicotˆomicos, pois as provas param´etricas n˜ao se aplicam a tais dados. Quando se utiliza a prova de Cochran em dados que n˜ao sejam nominais ou naturalmente dicotˆomicos, h´a perda de informa¸c˜oes.
    • 6.7 Outros Testes N˜ao-Param´etricos ROSSI, Robson M. 81 Exemplo 6.16. Suponha que estejamos interessados em estudar a influˆencia da atitude de um entrevistador sobre as respostas das donas de casa a determinada pesquisa de opini˜ao. Poderemos treinar um entrevistador para efetuar suas entrevistas de trˆes maneiras diferentes: entrevista tipo 1 – demonstrando interesse, cordialidade, entusiasmo; entrevista tipo 2 – demonstrando formalismo, reserva e cortesia; entrevista tipo 3 – demonstrando desinteresse, modo abrupto, formalismo ´aspero. Tabela 6.23: Influˆencia do pesquisador em pesquisas de opini˜ao. Conjunto Resposta `a entrevista 1 Resposta `a entrevista 2 Resposta `a entrevista 3 Li L2 i 1 0 0 0 0 0 2 1 1 0 2 4 3 0 1 0 1 1 4 0 0 0 0 0 5 1 0 0 1 1 6 1 1 0 2 4 7 1 1 0 2 4 8 0 1 0 1 1 9 1 0 0 1 1 10 0 0 0 0 0 11 1 1 1 3 9 12 1 1 1 3 9 13 1 1 0 2 4 14 1 1 0 2 4 15 1 1 0 2 4 16 1 1 1 3 9 17 1 1 0 2 4 18 1 1 0 2 4 O entrevistador visitaria trˆes grupos de 18 casas, aplicando aleatoriamente o tipo 1 de entrevista a um grupo, o tipo 2 a outro grupo, o tipo 3 ao terceiro grupo. Ter´ıamos ent˜ao 3 amostras relacionadas (correspondentes) com 18 elementos cada uma (n = 18). Dese- jamos comprovar se as diferen¸cas fundamentais nos tipos de entrevista influenciariam o n´umero de respostas afirmativas (“sim”) dadas a determinada pergunta. Etapa 1: H0: A probabilidade de um “sim” ´e a mesma para os trˆes tipos de entrevista. H1: As probabilidades de um “sim” diferem conforme o tipo de entrevista. Etapa 2: Estabelecendo o n´ıvel de significˆancia: α = 0, 01. Etapa 3: Estabelecendo a estat´ıstica de teste: Q de Cochran porque os dados se referem a mais de dois grupos relacionados (k = 3) e se apresentam dicotomizados sob forma “sim” ou “n˜ao”. Etapa 4: Estabelecendo os valores cr´ıticos para gl = k − 1 = 3 − 1 = 2 e n´ıvel de significˆancia = 0, 01 um valor de 9, 21. Etapa 5: C´alculo da Estat´ıstica teste: Calculando os somat´orios dos resultados correspondentes a cada grupo e o somat´orio dos escores de cada bloco (Li) temos: G1 = 13 - no total de respostas sim para entrevista 1 G2 = 13 - no total de respostas sim para entrevista 2 G3 = 3 - no total de respostas sim para entrevista 3 ap´os c´alculos Q = 16, 7. Etapa 6: Como Q > χ2 cr´ıtico (16, 7 > 9, 21), ent˜ao rejeita-se H0, ou seja, o n´umero de respostas “sim” difere significativamente em rela¸c˜ao aos tipos 1, 2 e 3 de entrevista.
    • 6.7 Outros Testes N˜ao-Param´etricos ROSSI, Robson M. 82 Figura 6.1: Gr´afico para o teste de Cochran. Exerc´ıcio 6.5. Comparar quatro t´ecnicas de treinamento aplicadas a seis blocos de funcion´arios do setor de marca¸c˜ao de luz de uma empresa cinematogr´afica. Cada bloco foi formado de modo que os quatro funcion´arios que o constitu´ıam eram equivalentes em seu desempenho atual no cargo. Os resultados obtidos na escala de avalia¸c˜ao de desempenho, aplicada ap´os o treinamento, foram os que constam no quadro abaixo. Tabela 6.24: Teste em funcion´arios do setor de marca¸c˜ao de luz de uma empresa cinematogr´afica. Tratamentos Blocos X1 Escore X2 Escore X3 Escore X4 Escore A 7 1 9 1 10 1 6 0 B 8 1 12 1 11 1 5 0 C 6 0 7 1 8 1 4 0 D 3 0 5 0 6 0 6 0 E 9 1 10 1 8 1 2 0 F 4 0 7 1 5 0 9 1 Total - 3 - 5 - 4 - 1 Exerc´ıcio 6.6. Rea¸c˜ao em cadeia da polimerase (PCR) em sangue de camundongos infectados com clones de trypanosoma cruzi pertencentes a diferentes gen´otipos. (Banco de dados: Analises Clinicas ex.stw) O objetivo principal do trabalho foi o de investigar se existe diferen¸ca entre os tratamentos: PCR, ELISA, HEMO e ESF de modo global (para toda a amostra), por Gen´otipo: 39, 32, 20 e 19 e por Fase: Aguda ou Crˆonica. Exerc´ıcio 6.7. Utilize o bancos de dados: Pediat ex.stw e Psi1 ex.stw, leia as informa¸c˜oes e fa¸ca o que se pede.
    • Cap´ıtulo 7 An´alise de Variˆancia `As vezes ´e preciso comparar m´edias de mais de duas popula¸c˜oes. Por exemplo, para verificar se pessoas com diferentes n´ıveis de renda, isto ´e, alto, m´edio e baixo tˆem, em m´edia, o mesmo peso corporal, ´e preciso comparar m´edias de trˆes popula¸c˜oes. Outras vezes, ´e preciso comparar v´arias situa¸c˜oes experimentais. Por exemplo, se um pesquisador separa, ao acaso, um conjunto de pacientes em 4 grupos e administra uma droga diferente a cada grupo, ter´a que comparar m´edias de quatro ”popula¸c˜oes”. Para comparar m´edias de mais de duas popula¸c˜oes normais ou aproximadamente normais, aplica-se o teste F. Neste caso conv´em verificar antecipadamente a normalidade dos dados. Por exemplo, imagine que 4 amostras casuais simples, todas com cinco elementos mas cada uma prove- niente de uma popula¸c˜ao, conduziram aos dados apresentados na Tabela 7.1. Tabela 7.1: Dados de 4 amostras e respectivas m´edias. Amostras A B C D 11 8 5 4 8 5 7 4 5 2 3 2 8 5 3 0 8 5 7 0 ¯x1 = 8 ¯x2 = 5 ¯x3 = 5 ¯x4 = 2 Ser´a que as diferen¸cas das m´edias das amostras s˜ao suficientemente grandes para que se possa afirmar que as m´edias das popula¸c˜oes s˜ao diferentes? Para responder a esta pergunta, ´e preciso um teste estat´ıstico. 7.1 An´alise de Variˆancia para Experimentos ao Acaso Primeiro, ´e preciso estudar as causas de varia¸c˜ao. Por que os dados variam? Uma explica¸c˜ao ´e o fato de as amostras provirem de popula¸c˜oes diferentes. Outra explica¸c˜ao ´e o caso, porque mesmo dados provenientes da mesma popula¸c˜ao variam. O teste F ´e feito atrav´es de uma an´alise de variˆancia, que separa a variabilidade devido aos “trata- mentos” (no exemplo, devido `as amostras terem provindo de popula¸c˜oes diferentes) da variabilidade residual, isto ´e, devido ao acaso. Para aplicar o teste F ´e preciso fazer uma s´erie de c´alculos, que exigem conhecimento de nota¸c˜ao. A Tabela 7.2, apresenta os dados de k tratamentos, cada um com r repeti¸c˜oes (no exemplo, denominam-se repeti¸c˜oes os elementos da mesma amostra). A soma das r repeti¸c˜oes de um mesmo tratamento constitui o total desse tratamento. O total geral ´e dado pela soma dos k totais de tratamentos. 83
    • 7.1 An´alise de Variˆancia para Experimentos ao Acaso ROSSI, Robson M. 84 Tabela 7.2: Nota¸c˜ao para a an´alise de variˆancia. Tratamentos 1 2 3 ... k Total x11 x21 x31 ... xk1 x12 x22 x32 ... xk2 . . . . . . x1r x2r x3r xkr Total T1 T2 T3 ... Tk T = x No de repeti¸c˜oes r r r ... r n = kr M´edia ¯x1 ¯x2 ¯x3 ¯xk Para fazer a an´alise de variˆancia ´e preciso calcular as seguintes quantidades: 1. os graus de liberdade: (a) de tratamento: k − 1 (b) de total: n − 1 (c) de res´ıduo: (n − 1) − (k − 1) = n − k 2. o valor C, dado pelo total geral elevado ao quadrado e dividido pelo n´umero de dados. O valor C ´e chamado corre¸c˜ao. C = ( x)2 n 3. a soma de quadrados total: SQT = x2 − C 3. a soma de quadrados de tratamentos: SQTr = T2 r − C 4. a soma de quadrados de res´ıduos: SQR = SQT − SQTr 5. o quadrado m´edio de tratamentos: QMTr = SQTr k − 1 6. o quadrado m´edio de res´ıduo: QMR = SQR n − k 7. o valor de F F = QMTr QMR Em seguida, ´e preciso comparar o valor calculado de F com o valor tado em tabela, ao n´ıvel de significˆancia estabelecido e com (k − 1) graus de liverdade no numerador e (n − k) graus de liberdade no denominador. Toda vez que o valor calculado de F for maior ou igual do que o da tabela conclui-se, ao n´ıvel de significˆancia estabelecido, que as m´edias de tratamentos s˜ao iguais.
    • 7.1 An´alise de Variˆancia para Experimentos ao Acaso ROSSI, Robson M. 85 Exemplo 7.1. Para os dados apresentados na Tabela 7.1, proceder uma an´alise de variˆancia para verificar se existe diferen¸ca significativa entre os tratamentos. 1. os graus de liberdade: (a) de tratamento: k − 1 = 4 − 1 = 3 (b) de total: n − 1 = 20 − 1 = 19 (c) de res´ıduo: (n − 1) − (k − 1) = n − k = 20 − 4 = 16 2. o valor C: C = ( x)2 n = (11 + 8 + ... + 0)2 20 = 500 3. a soma de quadrados total: SQT = x2 − C = 112 + 82 + ... + 02 − 500 = 658 − 500 = 158 3. a soma de quadrados de tratamentos: SQTr = T2 r − C = 402 + 252 + 252 + 102 5 − 500 = 590 − 500 = 90 4. a soma de quadrados de res´ıduos: SQR = SQT − SQTr = 158 − 90 = 68 5. o quadrado m´edio de tratamentos: QMTr = SQTr k − 1 = 90 3 = 30 6. o quadrado m´edio de res´ıduo: QMR = SQR n − k = 68 16 = 4, 25 7. o valor de F F = QMTr QMR = 7, 06 As quantidades calculadas s˜ao apresentadas numa tabela de an´alise de variˆancia. Veja a Tabela 7.3: Tabela 7.3: An´alise de variˆancia dos dados da Tabela 6.1. Causas da varia¸c˜ao GL SQ QM F p Tratamentos 3 90 30 7,06 0,003086 Res´ıduo 16 68 4,25 Total 19 158 Ao n´ıvel de significˆancia de 5%, o valor de F tabelado, com 3 e 16 graus de liberdade (numerador e denominador, respectivamente), ´e de 3,24. Como o valor obtido ´e maior do que 3,24, conclui-se que as m´edias n˜ao s˜ao iguais, ao n´ıvel de significˆancia de 5%.
    • 7.2 Teste Param´etrico para Compara¸c˜oes M´ultiplas ROSSI, Robson M. 86 7.2 Teste Param´etrico para Compara¸c˜oes M´ultiplas 7.2.1 Teste Tukey Uma an´alise de variˆancia permite estabelecer se as m´edias das popula¸c˜oes em estudo s˜ao, ou n˜ao s˜ao, esta- tisticamente iguais. No entanto, esse tipo de an´alise n˜ao permite detectar quais s˜ao as m´edias estat´ısticamente diferentes das demais. Por exemplo, a an´alise de variˆancia apresentada na Tabela 6.3 mostrou que as m´edias das popula¸c˜oes n˜ao s˜ao iguais, mas n˜ao permite concluir que ´e, ou quais s˜ao, as m´edias diferentes das demais. O teste de Tukey permite estabelecer a diferen¸ca m´ınima significante (d.m.s), ou seja, a menor diferen¸ca de m´edias de amostras que deve ser tomada como estatisticamente significante, em determinado n´ıvel. Essa diferen¸ca (d.m.s) ´e dada por: d.m.s = q. QMR r onde q ´e um valor dado em tabela, QMR ´e o quadrado m´edio do res´ıduo da an´alise de variˆancia e r ´e o n´umero de repeti¸c˜oes de cada tratamento. Considere agora os dados da Tabela 7.1. A an´alise de variˆancia apresentada na Tabela 7.3 mostra um valor F significante ao n´ıvel de 5%. Ent˜ao as m´edias de A, B, C e D n˜ao s˜ao estat´ısticamente iguais. Mas qual ´e, ou quais s˜ao, as m´edias diferentes entre si? A pergunta pode ser respondida com a aplica¸c˜ao do teste de Tukey. Ao n´ıvel de significˆancia de 5%, o valor de q para comparar 4 tratamentos (A,B, C e D), com 16 graus de liberdade no res´ıduo, ´e de 4,05. Como QMR = 4,25 e r = 5, segue-se que: d.m.s = 4, 05. 4, 25 5 = 3, 73. De acordo com o teste de Tukey, duas m´edias s˜ao estatisticamente diferentes toda vez que o valor absoluto da diferen¸ca entre elas for igual ou superior ao valor da d.m.s. No caso do Exemplo, o valor da d.m.s. ´e 3.73 e os valores absolutos das diferen¸cas entre as m´edias est˜ao apresentados a seguir. ´E f´acil ver que a diferen¸ca entre as m´edias A e D ´e maior do que a d.m.s. Ent˜ao, ao n´ıvel de 5%, a m´edia de A ´e significativamente mair do que a m´edia de D. Tabela 7.4: Compara¸c˜oes entre as m´edias via Tukey. Pares de m´edias Valor absoluto da diferen¸ca A e B |8 − 5| = 3 A e C |8 − 5| = 3 A e D |8 − 2| = 6 B e C |5 − 5| = 0 B e D |5 − 2| = 3 C e E |5 − 2| = 3
    • 7.2 Teste Param´etrico para Compara¸c˜oes M´ultiplas ROSSI, Robson M. 87 Exemplo 7.2. Com base nos dados apresentados na Tabela 7.5 abaixo, verifique se existe diferen¸ca estat´ıstica entre os grupos. Note que s˜ao trˆes grupos em compara¸c˜ao. No grupo operado foi feita a remo¸c˜ao das glˆandulas salivares maiores, e no grupo pseudo-operado foram executados todos os tempos cir´urgicos, mas nenhuma glˆandula foi removida (Banco de dados: Tukey1 ex.stw). Tabela 7.5: Taxa de glicose, em miligramas por 100 ml de sangue, em ratos Wistar machos de 60 dias, segundo o grupo. Grupo Operado Pseudo-operado Normal 96 90 86 95 93 85 100 89 105 108 88 105 120 87 90 110,5 92,5 100 97 87,5 95 92,5 85 95 Sol.: A tabela de an´alise de variˆancia resume os c´alculos: Tabela 7.6: ANOVA para a taxa de glicose. Causas da varia¸c˜ao GL SQ QM F p Grupos 2 717,25 358,625 6,73 0,005509 Res´ıduo 21 1118,75 53,274 Total 23 1836,00 Para aplicar o teste de Tukey ao n´ıvel de significˆancia de 5%, tem-se: q3;21 3, 57 e d.m.s. = 3, 57 53, 247 8 = 9, 21. Os valores absolutos das diferen¸cas de m´edias est˜ao apresentados na Tabela (7.7). Tabela 7.7: Compara¸c˜oes para as taxas m´edias de glicose. Pares de m´edias Valor absoluto da diferen¸ca p Operado vs pseudo |102, 375 − 89, 0| = 13, 375 0,0004 Operado vs normal |102, 375 − 95, 125| = 7, 25 0,1403 Pseudo vs normal |89, 000 − 92, 125| = 6, 125 0,2368 A taxa de glicose ´e, em m´edia, maior nos operados do que nos pseudo-operados, ao n´ıvel de significˆancia de 5.
    • 7.2 Teste Param´etrico para Compara¸c˜oes M´ultiplas ROSSI, Robson M. 88 7.2.2 Teste Dunnett Em muitos experimentos, ´e comum a necessidade de se realizar m´ultiplas compara¸c˜oes, todas em rela¸c˜ao a um ´unico grupo denominado “Controle”. Neste caso, o test Dunnett (1964) ´e apropriado. Teremos (k − 1) compara¸c˜oes a serem realizadas em rela¸c˜ao ao controle e queremos testas as seguintes hip´oteses: H0 : µi = µc i = 1, 2, ..., k − 1 Ha : µi = µc c: controle O procedimento de Dunnett ´e an´alogo ao teste t, mas modificado. d.m.s = d. 2.QMR r onde r ´e o n´umero de repeti¸c˜oes. Considerando um n´ıvel de confian¸ca α, rejeitamos H0 se: |¯xi − ¯xc| > dα,(k−1),f . QMR. 1 ni + 1 nc onde: dα,(k−1),f est´a tabelado (Tabela Dunnett) para k −1 comara¸c˜oes e f : no de observa¸c˜oes dos tratamentos (exceto o controle); QMR : proveniente da ANOVA (Quadrado M´edio dos Res´ıduos); ni : no de observa¸c˜oes do tratamento i; nc : no de observa¸c˜oes do controle; ¯xi e ¯xc : m´edias, do tratamento e controle, respectivamente. Exemplo 7.3. Deseja-se comparar o efeito de cinco drogas na diminui¸c˜ao da press˜ao arterial. Para isto utilizou-se cinco grupos distintos e foram comparadas suas m´edias em rela¸c˜ao a m´edia de um grupo controle, que recebeu placebo. Ao todo, 30 indiv´ıduos participaram no experimento. A Tabela abaixo apresenta os valores referentes a diferen¸ca entre a press˜ao arterial no in´ıcio e no fim do experimento (mmHg). Tabela 7.8: Diminui¸c˜ao da press˜ao arterial, em mil´ımetros de merc´urio, segundo o tratamento. Tratamento A B C D E Controle 25 10 18 23 11 8 17 -2 8 29 23 -6 27 12 4 25 5 6 21 4 14 35 17 0 15 16 6 33 9 2 Ap´os a an´alise de variˆancia, tem-se: Tabela 7.9: ANOVA para os dados de press˜ao arterial, em mil´ımetros de merc´urio, segundo o tratamento. Causas da varia¸c˜ao GL SQ QM F p Grupos 5 2354,17 470,83 13,08 0,000003 Res´ıduo 24 864 36 Total 29 3218,17 Como o valor de F apresentado ´e de 13,08 (p-valor = 0,000003) ´e significante ao n´ıvel de 5%, ´e razo´avel procurar um teste para comparar as m´edias dos tratamentos. A d.m.s. estabelecida pelo teste Dunnett (espec´ıfico para este caso) ser´a: d.m.s = d. 2.QMR r = 2, 70 2.36 5 = 10, 25
    • 7.3 Teste N˜ao-Param´etrico para Compara¸c˜oes M´ultiplas ROSSI, Robson M. 89 Obs. O valor d = 2, 70 ´e proveniente da Tabela Dunnett com 24 graus de liberdade. Desta forma teremos: Tabela 7.10: Compara¸c˜oes entre as m´edias dos dados de Press˜ao arterial. Pares de m´edias Valor absoluto da diferen¸ca p A vs Controle |21 − 2| = 19 > 10, 25 0,000182 B vs Controle |8 − 2| = 6 < 10, 25 0,392329 C vs Controle |10 − 2| = 8 < 10, 25 0,162730 D vs Controle |29 − 2| = 27 > 10, 25 0,000007 E vs Controle |13 − 2| = 11 > 10, 25 0,032024 ´E facil observar que os tratamentos A, D e E apresentam, em m´edia, resultados melhores que os do controle, ao n´ıvel de 5%. 7.3 Teste N˜ao-Param´etrico para Compara¸c˜oes M´ultiplas 7.3.1 Teste Dunn-Bonferroni Analogamente ao processo do Teste de Tukey para comparar tratamentos atrav´es de parˆametros popu- lacionais como a m´edia, por exemplo, o M´etodo de Dunn-Bonferroni pode ser utilizado para o caso N˜ao- Param´etrico. Hip´oteses a serem testadas: H0 : Mi = Mj (m´edias) Ha : Mi = Mj, para algum i = j. A diferen¸ca m´ınima significativa (d.m.s.) para os contrastes (em pares): d.m.s. = Z1− α 2Q N(N + 1) 12 1 ni + 1 nj onde Q = k(k − 1) 2 . Intervalo de Confian¸ca via Dunn-Bonferroni para os contrastes: IC(1 − α)% = (Mi − Mj) ± d.m.s. Decis˜ao: Se o n´umero 0 n˜ao pertencer ao IC, Rejeitamos H0. Exemplo 7.4. Deseja-se comparar 3 Grupos, de 15 ratos (5 cada) em trˆes tipos de incentivos distintos: comida, ´agua e sexo. Os resultados mostrados na Tabela 7.11, representam tempos em segundos que cada rato precisou para sair de um labirinto de pesquisa. Tabela 7.11: Tempo de percurso de um rato at´e sair do labirinto. Grupo I (comida) 30, 33, 29, 35, 34 Grupo II (´agua) 28, 25, 31 27, 26 Grupo III (sexo) 23, 21, 18, 15, 20 Desejamos saber se existe evidˆencia suficiente para afirmar, a um n´ıvel de significˆancia de 1%, que existe diferen¸ca entre os grupos, e se houver, desejamos saber entre quais.
    • 7.3 Teste N˜ao-Param´etrico para Compara¸c˜oes M´ultiplas ROSSI, Robson M. 90 Hip´oteses: H0 : n˜ao h´a diferen¸ca significativa entre os tratamentos. Ha : h´a diferen¸ca significativa entre os tratamentos. Sol.: Utilizando o teste de Kruskal-Wallis para k provas, temos a Tabela 7.12 com os postos das ob- serva¸c˜oes. Tabela 7.12: Postos do tempo de percurso de um rato at´e sair do labirinto. Tratamento xi Ti = xi ni ¯xi Grupo I (comida) 12 13 11 15 14 65 5 13 Grupo II (´agua) 9 6 10 8 7 40 5 8 Grupo III (sexo) 5 4 2 1 3 15 5 3 A estat´ıstica teste: HK−W = 12 N(N + 1) . k i=1 T2 i ni − 3(N + 1) = 12 15(15 + 1) . 3 i=1 T2 i 5 − 3(15 + 1) = (0, 05). 652 + 402 + 152 5 − 48 = 12, 5 como H ∼ χ2 (k−1) ⇒ χ2 (1%;2) = 7, 98, e sendo HK−W = 12, 5 > 7, 98, Rejeita-se H0. O passo seguinte, ser´a o de determinar qual(is) pares de tratamentos (contrastes) ocasionaram esta rejei¸c˜ao. C´alculo do d.m.s.: Q = k(k − 1) 2 = 3(3 − 1) 2 = 3 assim, d.m.s. = Z1− 0,01 2.3 15(15 + 1) 12 1 5 + 1 5 = 2, 95.(2, 83) = 8, 35 Contrastes: Tabela 7.13: Contrastes para os dados de tempo de percurso de um rato at´e sair do labirinto. Contraste IC(1 − α)% ˆL1 = ¯x1 − ¯x2 = 5 5 ± 8, 35 : (−3, 38; 13, 35) ˆL2 = ¯x1 − ¯x3 = 10 10 ± 8, 35 : (1, 66; 18, 35) ˆL3 = ¯x2 − ¯x3 = 5 5 ± 8, 35 : (−3, 38; 13, 35) Decis˜ao: Se o n´umero 0 n˜ao pertencer ao IC, Rejeitamos H0. Observando que o 0 (zero) pertence somente aos IC de ˆL1 e ˆL3, podemos concluir que os tratamentos que diferem significativamente s˜ao dados pelo contraste ˆL2: motiva¸c˜ao pela comida e motiva¸c˜ao sexual. Isto ´e, as ratas tendem a correr mais para sair do labirinto, quando estimuladas `a comida e ao sexo.
    • 7.4 An´alise de Variˆancia com N´umero Diferente de Repeti¸c˜oes ROSSI, Robson M. 91 7.4 An´alise de Variˆancia com N´umero Diferente de Repeti¸c˜oes Muitas vezes o pesquisador disp˜oe de diversas amostras, cada uma proveniente de uma popula¸c˜ao, mas essas amostras n˜ao tˆem todas o mesmo tamanho. Mesmo assim, ´e poss´ıvel conduzir a an´alise de variˆancia. Ali´as, todos os c´alculos, com exce¸c˜ao da soma de quadrados de tratamentos, s˜ao feitos na forma j´a apresentada anteriormente. Para entender como se calcula a soma de quadrados de tratamentos quando os tratamentos n˜ao tˆem o mesmo n´umero de repeti¸c˜oes, primeiro observe a Tabela 7.14. Tabela 7.14: Nota¸c˜ao para a an´alise de variˆancia com diferentes repeti¸c˜oes. Tratamentos 1 2 3 ... k Total x11 x21 x31 ... xk1 x12 x22 x32 ... xk2 . . . . . . x1r x2r x3r xkr Total T1 T2 T3 ... Tk T = x No de repeti¸c˜oes r1 r2 r3 ... rk n = kr M´edia ¯x1 ¯x2 ¯x3 ¯xk A soma de quadrados de tratamentos ´e dada pela f´ormula: SQTr = T2 1 r1 + T2 2 r2 + ... + T2 k rk − C onde C ´e a corre¸c˜ao j´a definida anteriormente. ´E mais f´acil entender a aplica¸c˜ao de f´ormulas atrav´es de um exemplo.
    • 7.4 An´alise de Variˆancia com N´umero Diferente de Repeti¸c˜oes ROSSI, Robson M. 92 Exemplo 7.5. An´alise de variˆancia para os dados da Tabela 7.15. Tabela 7.15: Dados de 3 amostras e respectivas m´edias. Amostras A B C 15 23 19 10 16 15 13 19 21 18 18 14 15 16 13 ¯x1 = 84 ¯x2 = 76 ¯x3 = 86 1. os graus de liberdade: (a) de tratamento: k − 1 = 3 − 1 = 2 (b) de total: n − 1 = 15 − 1 = 14 (c) de res´ıduo: (n − 1) − (k − 1) = n − k = 15 − 3 = 12 2. o valor C: C = ( x)2 n = (15 + 10 + ... + 16)2 15 = 4001, 67 3. a soma de quadrados total: SQT = x2 − c = 152 + 102 + ... + 162 − 4001, 67 = 159, 33 3. a soma de quadrados de tratamentos: SQTr = T2 r − C = 842 6 + 762 4 + 852 5 − 4001, 67 = 63, 33 4. a soma de quadrados de res´ıduos: SQR = SQT − SQTr = 159, 33 − 63, 33 = 96, 00 5. o quadrado m´edio de tratamentos: QMTr = SQTr k − 1 = 63, 33 2 = 31, 67 6. o quadrado m´edio de res´ıduo: QMR = SQR n − k = 96 12 = 8, 00 7. o valor de F F = QMTr QMR = 31, 67 8, 00 = 3, 96 Os valores calculados est˜ao apresentados na Tabela 7.16. Ao n´ıvel de significˆancia de 5%, com 2 e 12 g.l., o valor de F tabelado ´e de 3,89, menor do que 3,96, conclui-se que as m´edias diferem entre si. Os m´etodos de compara¸c˜ao de m´edias apresentados anteriormente tamb´em podem ser usados quando o n´umero de repeti¸c˜oes por tratamento n˜ao ´e constante. Se ri e rj s˜ao o n´umero de repeti¸c˜oes dos tratamentos em compara¸c˜ao, as f´ormulas para a diferen¸ca m´ınima significante ficam como segue:
    • 7.4 An´alise de Variˆancia com N´umero Diferente de Repeti¸c˜oes ROSSI, Robson M. 93 Tabela 7.16: An´alise de variˆancia. Causas da varia¸c˜ao GL SQ QM F p Tratamentos 2 63,33 31,67 3,96 0,04784 Res´ıduo 12 96 8 Total 14 159,33 7.4.1 Teste Tukey Para comparar as m´edias de tratamentos duas a duas, pode-se aplicar o teste de Tukey que, neste caso, ´e aproximado, porque os tratamentos tˆem n´umeros diferentes de repeti¸c˜oes. A diferen¸ca m´ınima significativa (d.m.s.) ´e dada pela f´ormula: d.m.s. = q 1 ri + 1 rj QMR 2 onde ri ´e o n´umero de repeti¸c˜oes do i-´esimo tratamento e rj ´e o n´umero de repeti¸c˜oes do j-´esimo tratamento. No caso do Exemplo anterior com dados na Tabela 7.15, para comparar a m´edia de A com a m´edia de B, tem-se: d.m.s. = 3, 77 1 6 + 1 4 8 2 = 4, 87. Para comparar A com C, tem-se: d.m.s. = 3, 77 1 6 + 1 5 8 2 = 4, 57. Para comparar B com C, tem-se: d.m.s. = 3, 77 1 4 + 1 5 8 2 = 5, 06. Os valores absolutos das diferen¸cas entre as m´edias est˜ao s˜ao apresentados a seguir. Como o valor absoluto da diferen¸ca entre A e B ´e maior do que a respectiva d.m.s., conclui-se que, em m´edia, A difere de B, ao n´ıvel de significˆancia de 5%. Tabela 7.17: Comapara¸c˜oes entre m´edias. Pares de m´edias Valor absoluto da diferen¸ca p A e B |14 − 19| = 5 0,0443* A e C |14 − 17| = 3 0,2272 B e C |19 − 17| = 2 0,5589
    • 7.4 An´alise de Variˆancia com N´umero Diferente de Repeti¸c˜oes ROSSI, Robson M. 94 7.4.2 Teste t A diferen¸ca m´ınima significativa (d.m.s.) ´e dada pela f´ormula: d.m.s. = t 1 ri + 1 rj QMR 7.4.3 Teste Dunnett A diferen¸ca m´ınima significativa (d.m.s.) ´e dada pela f´ormula: d.m.s. = d 1 ri + 1 rj QMR Considera¸c˜oes A escolha apropriada de um teste ´e muito flex´ıvel. Se o pesquisador quer ter alta chance de rejeitar H0 : de que as m´edias s˜ao iguais, pode optar pelo teste t ou pelo teste Duncan (N˜ao apresentado neste material-Ver Vieira, 1999). Estes dois testes tˆem caracter´ısticas similares, mas o teste t ´e mais antigo e, talvez por isso, mais conhecido. Tamb´em ´e de aplica¸c˜ao mais f´acil. Entretanto, o pesquisador tamb´em pode optar por aplicar o teste de Tukey ou de Dunnett, com n´ıvel de significˆancia mais elevado. Estes testes teriam, ent˜ao, maior poder. Por exemplo, o teste de Tukey a 10% tem maior poder do que o teste de Tukey a 5%. Um pesquisador que pretende somente rejeitar a hip´otese de que as m´edias s˜ao iguais com muita confian¸ca, deve optar pelo teste de Tukey ou de Dunnett, com baixo n´ıvel de significˆancia. Esta situa¸c˜ao pode ocorrer quando se comparam novas drogas terapˆeuticas com uma droga conhecida. Toda droga tem efeitos colaterais. Ent˜ao, muitas vezes s´o ´e razo´avel indicar uma nova droga - de efeitos colaterais desconhecidos - quando existem indica¸c˜oes seguras de que essa nova droga ´e melhor do que a convencional. De qualquer forma, fica aqui um alerta: todos os procedimentos para a compara¸c˜oes de m´edias tˆem vantagens e desvantagens. Ainda n˜ao existe um teste definitivamente “melhor” que todos os outros.
    • Cap´ıtulo 8 Testes Cl´ınicos 8.1 Introdu¸c˜ao Uma das experiˆencias mais rotineiras da pr´atica m´edica ´e a solicita¸c˜ao de um teste diagn´ostico. Os objetivos s˜ao v´arios, incluindo a triagem de paciente, o diagn´ostico de doen¸cas e o acompanhamento ou progn´ostico da evolu¸c˜ao de um paciente. Para chegar ao diagn´ostico, o m´edico considera v´arias possibilidades, com n´ıveis de certeza que variam de acordo com as informa¸c˜oes dispon´ıveis. Um dos objetivo deste cap´ıtulo ´e mostrar como se mede o n´ıvel de certeza da ocorrˆencia de um evento, por exemplo: a presen¸ca de uma doen¸ca ap´os a observa¸c˜ao de um teste positivo. Consideraremos o teste positivo quando indicar a presen¸ca da doen¸ca e negativo quando indicar a ausˆencia. N˜ao existe teste perfeito, aquele que com certeza absoluta determina a presen¸ca ou ausˆencia da doen¸ca. Estudaremos os´ındices nos quais o conceito de qualidade de um teste diagn´ostico ´e usualmente desmenbrado. Freq¨uˆentemente, um ´unico teste n˜ao ´e suficiente, e portanto deve-se combinar dois ou mais testes. O ideal seria que, para cada patologia, fossem determinados os testes a serem inclu´ıdos no processo diagn´ostico e a melhor forma de combin´a-los. Apresentaremos as formas mais comuns de combina¸c˜oes de testes e como medir a qualidade do teste conjunto. 8.2 Testes Diagn´osticos O bom uso de um teste diagn´ostico requer, al´em de considera¸c˜oes cl´ınicas, o conhecimento de medidas que caracterizam a sua qualidade intr´ınsica: a sensibilidade, a especificidade e os parˆametros que refletem a sua capacidade de produzir decis˜oes cl´ınicas corretas: Valor da Predi¸c˜ao Positiva e o Valor da Predi¸c˜ao Negativa. Na an´alise da qualidade de testes diagn´osticos, interessa conhecer duas probabilidades condicionais, que por suas importˆancias, recebem nomes especiais: 95
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 96 8.2.1 Sensibilidade e Especificidade A sensibilidade, denotada por s, ´e definida como a probabilidade de o teste ser positivo dado que o paciente examinado ´e doente: s = Pr(T+|D+) A especificidade, denotada por e, ´e definida como a probabilidade de o teste ser negativo dado que o paciente examinado n˜ao ´e doente: e = Pr(T−|D−) Os nomes s˜ao descritivos: sensibilidade mede a capacidade de rea¸c˜ao do teste em um paciente doente enquanto que especificidade, a rea¸c˜ao do teste em pacientes n˜ao portadores da doen¸ca, isto ´e, o teste ´e espec´ıfico para a doen¸ca em quest˜ao. A an´alise da defini¸c˜ao desses dois ´ındices (s e e) mostra que, subjacentemente a estes conceitos, estamos assumindo a existˆencia de um padr˜ao ouro (gold-standart), ou seja, um teste diagn´ostico que sempre produz resultados corretos. Al´em, disso assumimos que os pacientes s˜ao classificados apenas como doentes e n˜ao- doentes n˜ao se admitindo est´agios intermedi´arios. De acordo com a Tabela 8.1, Tabela 8.1: Distribui¸c˜ao quanto `a ocorrˆencia de um evento. Fator Total Doen¸ca Presente Ausente Presente a b n1 = a + b Ausente c d n2 = c + d Total m1 = a + c m2 = b + d n = n1 + n2 os ´ındices s e e s˜ao estimados por: s = a a + b = a n1 e e = d c + d = d n2 . Exemplo 8.1. Diagn´ostico de doen¸ca coronariana. Wiener et al. compararam os resultados do teste ergom´etrico de tolerˆancia a exerc´ıcios entre indiv´ıduos com e sem doen¸ca coronariana. O teste foi considerado positivo quando se observou mais de 1 mm de depress˜ao ou eleva¸c˜ao do segmento ST, por no m´ınimo 0,08 s, em compara¸c˜ao com os resultados obtidos com o paciente em repouso. O diagn´ostico definitivo foi feito atrav´es de angiografia (gold). A Tabela 8.2, sintetiza os resultados encontrados. Tabela 8.2: Resultados da avalia¸c˜ao da aplica¸c˜ao do teste ergom´etrico de tolerˆancia a exerc´ıcios em 1465 pacientes. Doen¸ca Teste ergom´etrico Total Coronariana Positivo (T+) Negativo (T−) Presente (D+) 815 208 1023 Ausente (D−) 115 327 442 Total 930 535 1465 A sensibilidade e a especificidade s˜ao estimadas por: s = 815 1023 = 0, 797 e e = 327 442 = 0, 740. O teste ergom´etrico tem uma sensibilidade de 79,7%, ligeiramente superior que sua especificidade (74%).
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 97 8.2.2 Valor das Predi¸c˜oes: VPP e VPN A sensibilidade e a especificidade, embora sendo ´ındices ilustrativos e bons sintetizadores das qualidades gerais de um teste, tem uma limita¸c˜ao s´eria: n˜ao ajudam a decis˜ao da equipe m´edica que, recebendo um paciente com resultado positivo do teste, precisa avaliar se o paciente est´a ou n˜ao doente. N˜ao se pode depender apenas da sensibilidade e da especificidade, pois estes ´ındices s˜ao provenientes de uma situa¸c˜ao em que h´a certeza total sobre o diagn´ostico, o que n˜ao acontece no consult´orio m´edico. Da´ı a necessidade destes dois outros ´ındices que refletem melhor a realidade pr´atica. Neste momento, interessa mais conhecer os seguintes ´ındices denominados valor da predi¸c˜ao positiva (VPP) e valor da predi¸c˜ao negativa (VPN), definidos respectivamente por: V PP = Pr [D+|T+] e V PN = Pr [D−|T−] . Em palavras, VPP ´e a probabilidade do paciente estar realmente doente quando o resultado do teste ´e positivo e VPN, a probabilidade do paciente n˜ao estar doente quando o resultado do teste ´e negativo. Estes valores s˜ao probabilidades condicionais, tal que o evento condicionante ´e o resultado do teste, aquele que na pr´atica acontece primeiro. A maneira mais f´acil de se calcular o VPP e o VPN ´e atrav´es das f´ormulas sugeridas por Vecchio (1966). Tabela 8.3: Probabilidade necess´arias para o c´alculo dos ´ındices VPP e VPN. Popula¸c˜ao Propor¸c˜ao Propor¸c˜ao com resultado Positivo Negativo Doente p ps p(1 − s) Sadia 1 − p (1 − p)(1 − e) (1 − p)e Total p + (1 − p) ps + (1 − p)(1 − e) p(1 − s) + (1 − p)e Seja p = Pr(D+) a prevalˆencia da doen¸ca na popula¸c˜ao de interesse, isto ´e, a propor¸c˜ao de pessoas doentes, ou a probabilidade de doen¸ca pr´e-teste. O valor de predi¸c˜ao positiva ´e obtido dividindo-se a freq¨uˆencia dos ”verdadeiros-positivos” (oriundos de pacientes doentes), pelo total de positivos V PP = ps ps + (1 − p)(1 − e) . De forma an´aloga, considerando-se os ”verdadeiros-negativos” obtemos o valor da predi¸c˜ao negativa V PN = (1 − p)e p(1 − s) + (1 − p)e . Ambas as express˜oes dependem do conhecimento de p, uma estimativa da prevalˆencia da doen¸ca na popula¸c˜ao de interesse. Estas s˜ao probabilidades de resultados corretos de diagn´ostico. Exemplo 8.2. Diagn´ostico de doen¸ca coronariana (Continua¸c˜ao). Para uma popula¸c˜ao cuja prevalˆencia de doen¸ca coronariana ´e de 2%, os valores de predi¸c˜ao do teste ergom´etrico s˜ao: V PP = 0, 02 × 0, 797 0, 02 × 0, 797 + (1 − 0, 02)(1 − 0, 74) = 5, 89%. e V PN = (1 − 0, 02) × 0, 797 0, 02 × (1 − 0, 74) + (1 − 0, 02) × 0, 797 = 99, 34%. Portanto, o valor de predi¸c˜ao positiva ´e baixo enquanto que o valor de predi¸c˜ao negativa ´e bastante alto. Se o resultado da ergometria for negativo, a chance de n˜ao haver uma doen¸ca coron´aria ´e de 99,43%. Se, antes de qualquer informa¸c˜ao, o paciente tinha uma chance de 2% de apresentar a doen¸ca, ap´os o resultado do teste negativo esta chance ´e de apenas 0,66% (1-0,9934).
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 98 8.2.3 Decis˜oes Incorretas: PFP e PFN As probabilidades PFP = Pr [D−|T+] = 1 − Pr [D+|T+] = 1 − V PP e PFN = Pr [D+|T−] = 1 − Pr [D−|T−] = 1 − V PN referem-se, respectivamente, ao ”falso-positivo” e ao ”falso-negativo”, isto ´e, decis˜oes incorretas baseadas no teste diagn´ostico. Uma dificuldade com rela¸c˜ao `a estes ´ındices ´e que muitos autores admitem, implicitamente, que a prevalˆencia que ocorre na tabela ´e a mesma na popula¸c˜ao de interesse e assim usam tabelas 2 × 2 para calcular os valores de predi¸c˜ao. Nada justifica esta hip´otese. Este procedimento se usado sistematicamente, leva a erros s´erios. Exemplo 8.3. Teste ELISA para detec¸c˜ao do HIV. Entre as v´arias tecnologias para detectar a presen¸ca do HIV, a primeira a se difundir no Brasil foi o ELISA (Enzymelinked immunosorbent assay). Em 1985 esta foi simultaneamente comercializada por v´arios laborat´orios americanos. Alguns deles reportaram, em seus testes preliminares, sensibilidade de 95% e especificidade de 99,8%. Os valores para os outros laborat´orios s˜ao parecidos, segundo Marwick (1985). A Tabela 8.4 apresenta os valores dos ´ındices VPP e VPN para a implementa¸c˜ao do teste ELISA e v´arios supostos valores da prevalˆencia. Tabela 8.4: Valores da VPP, VPN, PFP e PFN para o teste ELISA para a detec¸c˜ao do HIV. Prevalˆencia VPP(%) VPN(%) PFP(%) PFN(%) 1/100.000 0,47 100,00 99,53 0,00 1/10.000 4,54 100,00 95,46 0,00 1/1.000 32,21 99,99 67,79 0,01 1/500 48,77 99,99 51,23 0,01 1/200 70,47 99,99 29,53 0,01 1/100 82,75 99,99 1725 0,01 1/50 90,65 99,89 9,35 0,11 Considerando-se a popula¸c˜ao total de um pa´ıs, a AIDS ´e uma doen¸ca de prevalˆencia pequena. Os resultados da Tabela 8.4 mostram que em um programa de uso do teste em larga escala, grande parte dos pacientes com resultado positivo consiste na realidade de falsos-positivos; em outra palavras, o valor da predi¸c˜ao positiva ´e muito pequeno. Por outro lado, pouqu´ıssimos n˜ao doentes deixar˜ao de ser detectados e, portanto, o valor de predi¸c˜ao negativa ´e alto. Isto sugere um cuidado b´asico: um resultado positivo dever ser reconfirmado atrav´es de teste baseado em tecnologia diferente do ELISA. 8.2.4 Combina¸c˜ao de Testes Diagn´osticos Muitas vezes, para o diagn´ostico de certa doen¸ca dispomos apenas de testes com VPP ou VPN baixo ou, se existe um bom teste, este ´e muito caro ou oferece grande risco e/ou desconforto ao paciente. Nestas circunstˆancias, uma op¸c˜ao freq¨uentemente usada ´e o uso de uma combina¸c˜ao de testes mais simples. A associa¸c˜ao de testes eleva a qualidade do diagn´ostico, diminuindo o n´umero de resultados incorretos. Quando dois ou mais testes s˜ao usados para se chegar a um diagn´ostico ´e preciso saber como s˜ao obtidos os ´ındices de qualidade do teste m´ultiplo, aquele composto pela agrega¸c˜ao de dois ou mais testes individuais. Restringiremos ao caso de apenas dois testes e as id´eias apresentadas a seguir podem ser estendidas para o caso de mais de dois testes. Alguns detalhes podem ser encontrados em Hirsh & Rielgelman (1996). Formas de Combina¸c˜ao de Testes As maneiras mais simples de se formar um teste m´ultiplo a partir dos resultados de dois testes s˜ao os esquemas em paralelo e em s´erie. No caso do teste em paralelo, se um dos dois testes ´e positivo o teste conjunto tamb´em o ´e. No teste em s´erie, este ´e considerado positivo se os dois testes individuais s˜ao positivos.
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 99 A associa¸c˜ao de testes em s´erie ´e bastante empregada, tanto em triagens como no diagn´ostico individual, sendo de grande utilidade quando a quest˜ao do custo ´e relevante. Chamando os testes originais de A e B, o teste em paralelo de Tp e o em s´erie de Ts, e usando a linguagem de eventos temos: Tp+ = A+ ∪ B+ e Ts+ = A+ ∩ B+. As sensibilidade e especificidade de Tp e Ts s˜ao calculadas com o aux´ılio das regras de c´alculo de proba- bilidades de eventos. Combina¸c˜ao em Paralelo Nesse caso, o resultado do teste ser´a considerado positivo, se pelo menos um dos testes apresentar resultado positivo. ´E de maior utilidade em casos de urgˆencia, quando se necessita de uma abordagem r´apida, ou por outro tipo de conveniˆencia, como para pacientes provenientes de lugares distantes. A Tabela 8.5 apresenta de forma expl´ıcita o procedimento proposto. Tabela 8.5: Resultado do teste em paralelo dependendo da classifica¸c˜ao dos testes individuais A e B. Teste A Teste B Teste em paralelo - - - - + + + - + + + + Em analogia `a express˜ao para obter a sensibilidade temos: Pr[Tp+|D+] = Pr[A+ ∪ B+|D+] = Pr[A+|D+] + Pr[B+|D+] − Pr[A+ ∩ B+|D+] ou seja, a sensibilidade do teste em paralelo (sp) ´e dada por sp = sA + sB − sA × sB. Admitindo-se que os resultados dos dois testes s˜ao independentes, pode-se calcular a especificidade de um teste em paralelo da seguinte forma: Pr[Tp−|D−] = Pr[A− ∩ B−|D−] = Pr[A−|D−] × Pr[B−|D−] ou seja, a especificidade do teste em paralelo (ep) ´e dada por ep = eA × eB. Portanto, facilmente calculamos a sensibilidade e a especificidade de um teste em paralelo a partir das sensibilidades e especificidades dos testes A e B. Al´em disso, os parˆametros VPP e VPN s˜ao calculados da mesma forma j´a vista para testes isolados, utilizando-se agora a sensibilidade e especificidade da combina¸c˜ao em paralelo, e a prevalˆencia da popula¸c˜ao de interesse. Combina¸c˜ao em S´erie Nesse caso, os testes s˜ao aplicados consecutivamente, sendo o segundo teste aplicado apenas se o primeiro apresentar resultados positivo. O teste s´o ser´a considerado positivo, se o resultado dos dois testes for positivo. Esse procedimento ´e indicado em situa¸c˜oes em que n˜ao h´a necessidade de r´apido atendimento e quando o paciente pode ser acompanhado ao longo do tempo, e se a considera¸c˜ao de custo ´e importante, seja pela quest˜ao finaceira, pelo risco ou desconforto induzidos pelo exame. A Tabela 8.6 apresenta de forma expl´ıcita o procedimento proposto.
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 100 Tabela 8.6: Resultado do teste em s´erie dependendo da classifica¸c˜ao dos testes individuais A e B. Teste A Teste B Teste em s´erie - desnecess´ario - + - - + + + Como s´o ser˜ao aplicados dos testes se o primeiro for positivo, o custo desse tipo de combina¸c˜ao ´e menor. Uma discuss˜ao sobre a ordem mais indicada para a aplica¸c˜ao dos testes a serem combinados em s´erie pode ser encontrada em Soares & Parenti (1995). Se os dois testes A e B s˜ao independentes, a sensibilidade (ss) e a especificidade (es) par o teste combinado em s´erie s˜ao obtidos sa seguinte forma: Pr[Ts+|D+] = Pr[A+ ∩ B+|D+] = Pr[A+|D+] × Pr[B+|D+]. Portanto, ss = sA × sB e es = eA + eB − eA × eB. Para os c´alculos da sensibilidade e especificidade da associa¸c˜ao em s´erie e em paralelo, a independˆencia dos dois testes ´e crucial. Entretanto, n˜ao se pode garantir que isto ocorra sempre. Quando os testes n˜ao forem independentes, n˜ao h´a uma forma anal´ıtica simples para se obter tais ´ındices para um teste composto. Exemplo 8.4. Diagn´ostico de cˆancer pancre´atico. Imagine um paciente idoso com dores persistentes nas costas e no abdomem e perda de peso. Na ausˆencia de uma explica¸c˜ao para estes sintomas, a possibilidade de cˆancer do pˆancreas ´e freq¨uentemente levantada. ´E comum para se verificar esta possibilidade diagn´ostica, que ambos os testes de ultrasom (A) e tomografia computadorizada (B) do pˆancreas sejam solicitados. A Tabela 8.7 apresenta dados hipot´eticos sobre os ´ındices s e e dos testes, quando utilizados separadamente e em conjuto (Griner et al., 1981). Tabela 8.7: Sensibilidade e especificidade dos testes de ultra-som e tomografia computadorizada no di- agn´ostico do cˆancer de pˆancreas individualmente e em conjunto. Teste Sensibilidade (%) Especificidade (%) A: Ultra-Som 80 60 B: Tomografia 90 90 C: A ou B positivo 98 54 D: A e B positivo 72 96 Note que os esquemas C e D correspondem respectivamente a testes em paralelo e em s´erie. Admitindo que os resultados dos dois testes sejam independentes e usando as express˜oes vistas anteriormente, temos as seguintes sensibilidades e especificidades combinadas: Em paralelo: sC = 0, 8 + 0, 9 − 0, 8 × 0, 9 = 0, 98 e eC = 0, 6 × 0, 9 = 0, 54; Em s´erie: sD = 0, 8 × 0, 9 = 0, 72 eD = 0, 6 + 0, 9 − 0, 6 × 0, 9 = 0, 96. Quando um ou outro teste ´e positivo, a sensibilidade combinada ´e maior que o mais sens´ıvel dos testes, mas a especificidade ´e menor.
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 101 Ao contr´ario, quando o crit´erio para a positividade do teste ´e que tanto o ultra-som como a tomografia sejam positivos, a especificidade combinada ´e maior que o mais espec´ıfico dos dois, mas a sensibilidade ´e menor. Portanto, a sugest˜ao seria o teste em s´erie. Exemplo 8.5. Sensibilidade e especificidade de testes em paralelo e em s´erie. Consideremos dois testes A e B com sensibilidade e especificidade apresentados na Tabela 8.7, supondo uma prevalˆencia de 1%, ent˜ao teremos os seguintes valores: s, e, VPP e VPN. Tabela 8.8: Sensibilidade, especificidade e valores de predi¸c˜ao de testes individuais A e B e dos testes em s´erie e em paralelo considerando-se uma prevalˆencia de 1%. Teste s e VPP VPN A 0,9500 0,9000 0,0876 0,9994 B 0,8000 0,9500 0,1391 0,9979 Paralelo 0,9900 0,8550 0,0645 0,9999 S´erie 0,7600 0,9950 0,6056 0,9976 A combina¸c˜ao em paralelo apresenta alta sensibilidade (0,99) mas sua especificidade ´e menor que a dos testes isolados. J´a a combina¸c˜ao em s´erie apresenta alta especificidade (0,995) enquanto que a sensibilidade ´e relativamente baixa comparada com testes isolados. Como esperado, os valores de predi¸c˜ao negativa s˜ao altos, tanto para os testes isolados como para as duas formas combinadas dos testes. Entretanto, os valores de predi¸c˜ao positiva n˜ao s˜ao altos, sendo que a combina¸c˜ao em s´erie proporcionou o melhor resultado (V PP = 0, 6056). ´E importante lembrar que, na maioria das vezes, os testes usados na combina¸c˜ao s˜ao dependentes entre si. Portanto, os valores acima tendem a superestimar o verdadeiro valor dos ´ındices dos testes combinados. Nesse caso, n˜ao ´e poss´ıvel determinar os valores dos parˆametros de qualidade conhecendo-se apenas os valores de cada teste em separado. Torna-se necess´ario um trabalho de pesquisa realizado em um grupo de pacientes nos quais s˜ao utilizados o teste padr˜ao (gold test) e teste combinado (Di Magno et al., 1977). 8.2.5 Escolha entre Testes Diagn´osticos Idealmente, os testes utilizados devem ter alta sensibilidade e especificidade. Entretanto, na pr´atica nem sempre existem testes dispon´ıveis com caracter´ısticas ´otimas. ´E relativamente comum a situa¸c˜ao em que h´a mais de um teste e ent˜ao surge a necessidade da compara¸c˜ao entre eles para uma escolha mais adequada. Em processos de escolha do ponto de corte (ponto limite para decidir se um paciente ´e doente ou sadio), por exemplo, Galen & Gambino (1975) sugeriram uma medida de eficiˆencia definida pela soma da sensibili- dade e especificidade, isto ´e, o valor de referˆencia (k :Ponto de corte) foi obtido atrav´es dos valores de s e e que tinham a maior soma. Suponha que dois testes diagn´osticos est˜ao dispon´ıveis: um com alta sensibilidade mas relativamente baixa especificidade e o outro com alta especificidade e relativamente baixa sensibilidade. Qual seria a melhor escolha? Embora a avalia¸c˜ao de um teste n˜ao seja trivial, j´a que v´arios fatores devem ser considerados, apre- sentaremos alguns argumentos baseados nas medidas de qualidades, que podem ajudar na escolha de um teste diagn´ostico. O primeiro fato importante ´e que os valores de predi¸c˜ao (VPP e VPN) dependem conjuntamente de s, e e p. Soares & Parenti (1995) apresentam um estudo detalhado atrav´es de gr´aficos que ilustram claramente o efeito da prevalˆencia nos valores de predi¸c˜ao. O exemplo a seguir ilustra numericamente este fato. Exemplo 8.6. Diagn´ostico da gonorr´eia. O teste Gonosticon Dri-Drot, desenvolvido para o diagn´ostico de gonorr´eia, tem sensibilidade de 0,80 e especificidade de 0,95. Os valores da predi¸c˜ao positiva e negativa s˜ao apresentados na Tabela 8.9 para quatro popula¸c˜oes com diferentes prevalˆencias. Embora o teste tenha parˆametros de qualidades razo´aveis, o VPP ´e baix´ıssimo para popula¸c˜oes de baixa prevalˆencia, tornando o exame sem utilidade nessas condi¸c˜oes. Para simplificar o racioc´ınio sobre a escolha de testes diagn´osticos, vamos inicialmente considerar duas situa¸c˜oes extremas, obviamente sem interesse pr´atico, e depois vamos estender para situa¸c˜oes masi gerais.
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 102 Tabela 8.9: Valores de predi¸c˜ao (VPP e VPN) do teste Gonosticon Dri-Drot para quatro prevalˆencias (p). Popula¸c˜ao p VPP VPN A 0,500 0,940 0,830 B 0,100 0,640 0,980 C 0,020 0,250 0,990 D 0,001 0,020 1,00 Suponhamos que p = 0, isto ´e, ningu´em tem a doen¸ca, ou que p = 1, isto ´e, toda a popula¸c˜ao tem a doen¸ca em quest˜ao. Facilmente chagamos nos valores apresentados na Tabela 8.10, para quaisquer valores de s e e. Tabela 8.10: Valores de predi¸c˜ao (VPP e VPN) e propor¸c˜ao de resultados falsos (PFP e PFN) para casos extremos de prevalˆencias. p VPP PFP VPN PFN 0 0 1 1 0 1 1 0 0 1 A extens˜ao para o caso mais geral de p pequeno (doen¸ca rara) e p grande (doen¸ca comum) pode ser feita pela an´alise das express˜oes j´a estudadas variando-se as quantidades envolvidas (s, e e p), mas nos restringimos a apresentarmos uma an´alise num´erica. A Tabela 8.11 mostra os valores de predi¸c˜ao para prevalˆencias de 1% e 90%. Tabela 8.11: Valores de predi¸c˜ao (VPP e VPN) para alguns valores de sensibilidade e especificidade para prevalˆencias de 1% e 90%. Prevalˆencia de 1% Prevalˆencia de 90% s e VPP VPN VPP VPN 0,99 0,99 0,5000 0,9999 0,9989 0,9167 0,99 0,90 0,0909 0,9999 0,9889 0,9091 0,99 0,80 0,0476 0,9999 0,9780 0,8989 0,90 0,99 0,4762 0,9990 0,9988 0,5238 0,90 0,90 0,0833 0,9989 0,9878 0,5000 0,90 0,80 0,0435 0,9987 0,9759 0,4706 0,80 0,99 0,4469 0,9980 0,9986 0,3548 0,80 0,90 0,0748 0,9978 0,9863 0,3333 0,80 0,80 0,0388 0,9975 0,9730 0,3077 Quando a prevalˆencia ´e baixa, o valor de predi¸c˜ao positiva (VPP) ´e mais influenciado pela especificidade. O valor de predi¸c˜ao negativa (VPN) ´e pouco influenciado tanto pela sensibilidade quanto pela especificidade e ´e alto, como era de se esperar. Para a prevalˆencia alta, o VPP ´e pr´oximo de 1, independente dos valores da sensibilidade e da especifi- cidade. Al´em disso, o VPN ´e influenciado mais pela sensibilidade do que pela especificidade. Embora este n˜ao seja um estudo exaustivo, existem evidˆencias para as seguintes conclus˜oes: 1. Um teste com alta especificidade deve ser usado quando a prevalˆencia da doen¸ca ´e relativamente baixa (doen¸ca rara), mesmo que o teste tenha relativamente baixa sensibilidade. 2. Um teste com alta sensibilidade deve ser usado quando a prevalˆencia da doen¸ca ´e alta (doen¸ca comum), mesmo que o teste tenha relativamente baixa especificidade. ´E comum a id´eia de que se a doen¸ca ´e rara, um teste com alta sensibilidade dever ser usado para achar os casos e para uma doen¸ca de alta prevalˆencia, um teste com alta especificidade deve ser escolhido. Esse racioc´ınio n˜ao coincide com os argumentos apresentados. Outro tipo de simula¸c˜ao ´e apresentado nas Figuras 8.1 e 8.2 para algumas situa¸c˜oes espec´ıficas:
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 103 Prevalência VPP s = 99%; e = 70% s = 95%; e = 95% s = 70%; e = 99% s = 99%; e = 99% 0% 10% 20% 30% 40% 50% 0% 100% 50% Figura 8.1: Valor Preditivo Positivo em Fun¸c˜ao da Prevalˆencia Prevalência VPN s = 70%; e = 99% s = 95%; e = 95% s = 99%; e = 70% s = 99%; e = 99% 0% 20% 40% 60% 80% 100% 0% 50% 100% Figura 8.2: Valor Preditivo Negativo em Fun¸c˜ao da Prevalˆencia Inicialmente percebe-se na Figura 8.1 que, para qualquer situa¸c˜ao, quanto maior a prevalˆencia da doen¸ca, maior o valor preditivo positivo. Para um teste com sensibilidade e especificidade elevadas (s = 99% e e = 99%) o seu valor preditivo positivo ser´a muito alto mesmo em situa¸c˜oes de prevalˆencia n˜ao muito elevada. Entretanto, esta situa¸c˜ao sofre um impacto importante ao se diminuir apenas um pouco a sensibilidade e especificidade do teste (s = 95% e e = 95%). Uma outra situa¸c˜ao ocorrer´a ao se modificar apenas uma das caracter´ısticas do teste. Por exemplo, ao se diminuir a sensibilidade mantendo-se a especificidade elevada (s = 70% e e = 90%), percebe-se que prati- camente n˜ao houve impacto nos valores preditivos positivos em fun¸c˜ao da prevalˆencia. Entretanto, quando essa mesma diminui¸c˜ao ocorre na especificidade, o impacto ´e bastante grande, diminuindo-se muito o valor preditivo positivo do resultado mesmo para prevalˆencias mais elevadas. Dessa forma, pode-se afirmar que o valor preditivo positivo de um teste ´e fun¸c˜ao da prevalˆencia da doen¸ca, da sensibilidade e fundamentalmente da especificidade, conforme j´a fora observado na f´ormula anterior. Note na Figura 8.2 que, ao reduzir apenas a sensibilidade (s = 70% e e = 99%), ocorre uma dr´astica redu¸c˜ao no VPN, mostrando o grande impacto que essa medida exerce no VPN. Ao se reduzir apenas a especificidade (s = 99% e e = 70%), o impacto no VPN ´e muito pequeno, menor do que quando se reduz apenas um pouco a sensibilidade e a especificidade conjuntamente (s = 95 e e = 95%). Note tamb´em que, para um mesmo teste diagn´ostico (exce¸c˜ao apenas para s = 70% e e = 99%), o impacto do aumento da prevalˆencia na redu¸c˜ao do VPN ´e muito pequeno. Esse impacto se acentua nas prevalˆencias muitos elevadas. Como na pr´atica cl´ınica, as doen¸cas estudadas comumente possuem prevalˆencias relati- vamente baixas, o VPN ir´a sofrer apenas pequena varia¸c˜ao ao se modificar a especificidade de um teste diagn´ostico e mesmo ao se modificar pouco a sensibilidade.
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 104 8.2.6 Rela¸c˜ao entre Sensibilidade e Especificidade O teste diagn´ostico ideal seria aquele na qual a sensibilidade e a especificidade fossem 100%, ou seja, n˜ao existiria erro em seu resultado. Entretando, na pr´atica, isso n˜ao ´e poss´ıvel. Ao contr´ario, freq¨uentemente, existe uma contra-balan¸co (trade-off ) entre essas duas propriedades de tal modo que, quando um delas aumenta a outra diminui e vice-versa. Assim, para um teste expresso em uma escala cont´ınua (glicemia, por exemplo) ´e necess´ario determinar um ponto de corte (cut off ) entre os valores considerados normais e os anormais. Neste caso, uma determinada propriedade do teste (por exemplo, a sensibilidade) somente pode ser aumentada `as custas da diminui¸c˜ao da especificidade e vice-versa. Freq¨uentemente, na pr´atica cl´ınica, escolhe-se um ponto de corte onde exista o menor erro poss´ıvel, tanto de falsos positivos quanto de falsos negativos (Figura 8.3). Figura 8.3: Ponto de corte com o m´ınimo erro poss´ıvel 8.2.7 Curva ROC Uma forma de expressar graficamente a rela¸c˜ao entre a sensibilidade e a especificidade ´e atrav´es da con- stru¸c˜ao da curva ROC (receiver operating characteristic curve). Esta curva foi primariamente desenvolvida na d´ecada de 1950 para avaliar a detec¸c˜ao de sinais de radar (da´ı a sua denomina¸c˜ao), embora somente recentemente tenha se tornado comum o seu uso na ´area m´edica. Sua constru¸c˜ao ´e feita colocando-se os valores da sensibilidade (propor¸c˜ao de verdadeiros positivos) no eixo Y (ordenadas) e o complemento da especificidade (1 - e), ou seja, a propor¸c˜ao de fal- sos positivos no eixo X (abscissas) para diferentes pontos de corte. A partir dos dados apresentados na Tabela 8.12 foi constru´ıda a curva ROC (8.4). Note que quanto mais pr´oxima a curva estiver do canto superior esquerdo do gr´afico, melhor ser´a o poder discriminat´orio do teste diagn´ostico e quanto mais distante, at´e o limite da diagonal do gr´afico, pior ser´a o seu poder de discriminar doentes e n˜ao doentes. A curva ROC pode servir como orienta¸c˜ao para a escolha do melhor ponto de corte de um teste diagn´ostico que, em geral, se localiza no extremo da curva pr´oximo ao canto superior esquerdo do gr´afico. As curvas ROC, al´em de auxiliarem na identifica¸c˜ao do melhor ponto de corte, s˜ao muito utilizadas para comparar dois (ou mais) testes diagn´osticos para a mesma doen¸ca. Nesse caso, o poder discriminat´orio do teste, ou seja, a acur´acia global, pode se mensurado atrav´es do c´alculo da ´area sob a curva ROC; quanto maior for a ´area tanto melhor ser´a o teste diagn´ostico. Um teste diagn´ostico ideal, com 100% de sensibilidade e 100% de especificidade, a ´area total seria igual a 1 (um), ou seja, a “curva” seria coincidente com o lado esquerdo e o topo do gr´afico. Neste caso, o teste n˜ao possuiria erro, identificando perfeitamente todos os indiv´ıduos sadios e doentes (gold test). Para um teste sem nenhuma utilidade, a “curva” seria uma linha reta em diagonal, partindo do canto inferior esquerdo at´e o canto superior direito. Neste caso, o teste diagn´ostico n˜ao possuiria nenhum poder para discriminar doentes de n˜ao-doentes.
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 105 Tabela 8.12: Trade-off entre Sensibilidade e Especificidade no tratamento de Diabetes (Glicemia p´os-prandial 2(h) mg/100 ml). Glicemia p´os-prandial Sensibilidade (%) Especificidade (%) 1 - Especificidade (%) (2h) mg/100 ml 70 98,6 8,8 91,2 80 97,1 25,5 74,5 90 94,3 47,6 52,4 100 88,6 69,8 30,2 110 85,7 84,1 15,9 120 71,4 92,5 7,5 130 64,3 96,9 3,1 140 57,1 99,4 0,6 150 50,0 99,6 0,4 160 47,1 99,8 0,2 170 42,9 100,0 0 180 38,6 100,0 0 190 34,3 100,0 0 200 27,1 100,0 0 Sensibilidade 1 - Especificidade 0% 20% 40% 60% 80% 100% 0% 50% 100% Figura 8.4: Curva ROC da Glicemia p´os-prandial (2h) mg/100 ml Exemplo 8.7. Os dados da Tabela 8.13 foram obtidos na UEM/HU - Hospital Universit´ario da Universidade Estadual de Maring´a, em um estudo para avalia¸c˜ao de equipamentos para dosagem glicˆemica capilar O objetivo do trabalho foi o de escolher o melhor equipamento entre trˆes analisados: Glucotrend, Precision e Advantage. Os testes foram realizados em 21 indiv´ıduos. O teste Colorim´etrico foi ser utilizado como Gold Standard (Teste Ouro), que classifica sem erro doentes e n˜ao-doentes. Obs.: Valores de referˆencia: 60 a 120 mg/dl (Consideram-se anormais os valores abaixo de 60 (hi- poglicemia) e acima de 120 (hiperglicemia)). Obs.: 1. *1 foram utilizadas duas fitas por falha na leitura do equipamento; 2. *2 foram utilizadas quatro fitas por falha na leitura do equipamento; 3. *3 equipamento apresentou erro.
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 106 Tabela 8.13: Resultados da avalia¸c˜ao de equipamentos para dosagem glicˆemica capilar. Indiv´ıduo Gold-Calorim´etrico G-Glucotrend P-Precision A-Advantage 1 282 310 336 283 2 121 115 143 137 3 71 71 76 66 4 101 *3 85 99 5 161 *3 215 177 6 192 215 134 *2 211 7 99 97 123 134 8 105 152 156 *1 136 9 190 200 208 205 10 64 69 76 69 11 108 125 105 115 12 99 97 95 116 *1 13 107 107 109 108 14 68 75 81 64 15 81 86 94 91 16 82 84 49 *1 89 17 88 90 93 93 18 71 76 88 77 19 76 90 91 96 20 98 107 89 *1 105 21 87 86 90 96 Exerc´ıcio 8.1. Utilize o banco de dados referentes a Tabela 8.13 e: 1. Determine as Tabelas Cruzadas: Gold X G; Gold X P e Gold X A. 2. Determine a sensibilidade e especificidade de cada testes acima . Baseado nestes resultados qual (quais) o(s) melhor(es) teste(s) ? 3. Determine os valores de predi¸c˜ao positiva (VPP) e negativa (VPN) assim como o PFP e o PFN para cada um dos testes, usando a prevalˆencia da doen¸ca obtida atrav´es da Tabela Cruzada. Interprete-os. 4. Considerando que a prevalˆencia para a doen¸ca em quest˜ao ´e de 1%, recalcule os itens anteriores. 5. Combine os testes: G x P, G x A e P x A de forma paralela e em s´erie, considerando uma prevalˆencia de 1%. Qual a melhor combina¸c˜ao ? porquˆe ?
    • Referˆencias Bibliogr´aficas [1] ARANGO, H.G.. Bioestat´ıstica: Te´orica e computacional. Guanabara Koogan S.A. RJ, 2001. [2] CALLEGARI-JACQUES, S. M.. Bioestat´ıstica: Princ´ıpios e Aplica¸c˜oes. Ed. Artmed. RS, 2003. [3] CAMPOS, H.. Estat´ıstica Experimetal N˜ao-Param´etrica. 4a Ed. USP/ESALQ, 1983. [4] CARVAJAR, S. S. R.. Elementos de Estat´ıstica (com aplica¸c˜oes `as ciˆencias m´edicas e biol´ogicas). Rio de Janeiro: UFRJ, 1970. [5] CASTELLANOS, R. S e MERINO, A. P.. Psicoestadistica-Contrastes Param´etricos y no Param´etricos. Ediciones Piramide S.A., Madrid, 1989. [6] CENTENO, A. J. Curso de Estat´ıstica aplicada `a Biologia. Goiˆania: Ed. Universidade Federal de Goi´as, 1981. [7] CARVAJAR, S. S. R. Elementos de Estat´ıstica (com aplica¸c˜oes `as ciˆencias m´edicas e biol´ogicas). Rio de Janeiro: UFRJ, 1970. [8] COLLET, D..Modelling survival data in medical research. Tests in statistical science. 4a Ed. Chapman & Hall. London, 1994. [9] DANIEL, W. W. Bioestatistics: a foundation for analysis in the health sciences. 2 Ed. New York: John Wiley, 1999. [10] DOWNING, D e CLARK, J.. Estat´ıstica aplicada. 2a Ed. Saraiva. SP, 2002. [11] FORANTTINI, O. P.. Epidemiologia Geral. 1a Ed. Artes M´edicas, Ltda., 1980. [12] GAUVREAU, K. e PAGANO.. Principios de Bioestat´ıstica. 2a Ed. Thonson, 2004. [13] GUEDES, M. L. S. e GUEDES, J. S.. Bioestat´ıstica - Para profissionais de sa´ude. 1a Ed. Ao livro t´ecnico S.A. RJ, 1988. [14] MEDRONHO, R. A.. Epidemiologia. Ed. Atheneu. SP, 2003. [15] PEREIRA, M. G.. Epidemiologia: Teoria e Pr´atica. Ed. Guanabara & Koogan, 1995. [16] RODRIGUES, P. C.. Bioestat´ıstica. EdUFF, RJ, 2002. [17] SIEGEL, S.. Estat´ıstica n˜ao-param´etrica. 1a Ed. RJ, Editora McGraw Hill do Brasil Ltda, 1981. [18] SOARES, J. F e BARTMAN, F. C.. M´etodos estat´ısticos em medicina e biologia. 14o Col´oquio Brasileiro de Matem´atica. IMPA/CNPq. RJ, 1983. [19] SOARES, J. F. e SIQUEIRA, A.L.. Introdu¸c˜ao `a estat´ıstica m´edica. Ed. UFMG. 1999. [20] SOKAL, R.R. Biometry: The Principles and Practice of Statistics in Biological Research. New York: W.F. Freeman, 1995. [21] SOUNIS, E. Bioestat´ıstica. Princ´ıpios fundamentais, metodologia, estat´ıstica, aplica¸c˜ao `a ciˆencias biol´ogicas. 2a Ed. Revisada, McGraw-Hill, 1975. 107
    • 8.2 Testes Diagn´osticos ROSSI, Robson M. 108 [22] STEEL, R.G.D. Principles and Procedures of Statistics a Biometrical Approach. 2. Ed. New York: Mc Graw-Hill, 1980. [23] WAYNE, W. D.. Biostatistics. A foundation for analysis in the health sciences. 7a Ed. J&S. NY, 1999. [24] VIEIRA, S.. Introdu¸c˜ao `a Bioestat´ıstica. 5a Edi¸c˜ao Revista e Ampliada. Editora Campus,1980. [25] VIEIRA, S.. Estat´ıstica Experimental. 2a Edi¸c˜ao. Ed Atlas S.A. SP,1999.