• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Bioestatistica
 

Bioestatistica

on

  • 4,240 views

 

Statistics

Views

Total Views
4,240
Views on SlideShare
4,240
Embed Views
0

Actions

Likes
3
Downloads
152
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Bioestatistica Bioestatistica Document Transcript

    • PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA BioestatísticaProf. Hélio Radke Bittencourt1. CONCEITOS BÁSICOS DE ESTATÍSTICA1.1 Conjuntos de dados. População e Amostra1.2 Tipos de variáveis1.3 Escalas de mensuração1.4 Estatística descritiva e inferencial2. ESTATÍSTICA DESCRITIVA2.1 Tabelas de freqüência simples e cruzadas2.2 Análise gráfica2.3 Medidas de Tendência Central2.4 Separatrizes2.5 Medidas de Variabilidade3. PROBABILIDADE3.1 Principais conceitos3.2 Variáveis aleatórias discretas3.3 Variáveis aleatórias contínuas4. AMOSTRAGEM4.1 Conceitos básicos4.2 Técnicas de amostragem probabilísticas4.3 Técnicas de amostragem não-probabilística5. DISTRIBUIÇOES AMOSTRAIS E ESTIMAÇÃO5.1 Parâmetros e Estimadores5.2 Distribuição amostral da média5.3 Estimação por ponto e por intervalo de confiança6. TESTES DE HIPÓTESES6.1 Teste t de Student para uma média6.2 Testes t de Student - duas amostras independentes6.3 Testes t de Student - duas amostras pareadas6.4 Teste Qui-quadrado7. CORRELAÇÃO E REGRESSÃO7.1 Coeficiente de correlação de Pearson7.2 Regressão Linear Simples
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 2Cap. 1. CONCEITOS BÁSICOS DE ESTATÍSTICA1.1 Conjunto de dados. População e amostraA Estatística pode ser definida como o conjunto de ferramentas para coleta,organização, análise e interpretação de dados experimentais. O objeto de estudo emEstatística é um conjunto de dados que pode constituir uma população ou umaamostra.População é um conjunto finito ou infinito de elementos.Amostra é um subconjunto da população. Geralmente buscamos amostrasrepresentativas. Uma amostra representativa é aquela que mantém ascaracterísticas da população.1.2 Tipos de VariáveisEm estatística não trabalhamos diretamente com os elementos que formam o conjuntode dados, mas sim com suas características. Variáveis são características doselementos que formam o conjunto de dados.As variáveis podem ser classificadas em qualitativas ou quantitativas: as variáveisqualitativas expressam uma classificação em categorias e, por isso, também sãochamadas de categóricas. As variáveis quantitativas expressam quantidades numéricase se dividem em discretas e contínuas. As variáveis discretas assumem apenasdeterminados valores num dado conjunto enumerável, enquanto as variáveis contínuaspodem assumir, ao menos teoricamente, qualquer valor num dado intervalo numérico.Exemplo – Listar variáveis qualitativas e quantitativas para um pacienteNa prática todas as variáveis são discretas, devido à limitação dos instrumentos demensuração.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 31.3 Escalas de MensuraçãoAs variáveis ainda podem ser classificadas de acordo com o nível ou escala demensuração: Nominal, Ordinal ou Intervalar/Razão.O nível nominal de mensuração é caracterizado por números que apenasdiferenciam ou rotulam as categorias.Exemplos:O nível ordinal de mensuração envolve números que, além de diferenciar,hierarquizam as categorias. Também são chamadas de escalas Likert em homenagemao americano Rensis Likert que publicou o artigo "A Technique For The Measurement ofAttitudes" em 1932, onde sugeriu escalas de 5 pontos com uma categoria neutra aocentro.Exemplos:O nível intervalar ou de razão apresenta números que expressam diretamente umaquantidade seguindo uma métrica. Podemos tranqüilamente realizar operaçõesmatemáticas com variáveis deste tipo.Exemplos:Figura – Resumo dos tipos de variáveis e escalas de mensuração
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 41.4 Estatística Descritiva e InferencialA estatística é um conjunto de ferramentas utilizadas para a coleta, tabulação, análise einterpretação de um conjunto de dados experimentais. A Estatística pode ser divididaem duas grandes áreas: Descritiva e Inferencial.A estatística descritiva é aquela que costumamos encontrar com maior freqüênciaem jornais, revistas, relatórios, etc. Essa parte da estatística utiliza números paradescrever fatos. Seu foco é a representação gráfica e o resumo e organização de umconjunto de dados, com a finalidade de simplificar informações. Nessa categoria seenquadram as médias salariais, taxas de inflação, índice de desemprego, etc.A estatística inferencial consiste na obtenção de resultados que possam serprojetados para toda população a partir de uma amostra da mesma. Ela fundamenta-sena teoria da amostragem e no cálculo de Probabilidades. Essa é a área mais importanteda Estatística.Figura - Esquema geral de um curso de Estatística Descritiva Estatística Inferencial Probabilidade Amostragem
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 5Cap. 2 ESTATÍSTICA DESCRITIVA2.1 Tabelas de freqüência simples e cruzadasVamos introduzir o tema de tabelas de freqüência simples construindo tabelas para obanco de dados contruído a partir de informações da turmaExemplo 1 – Gênero Tipo sangüíneo / Rh No de habitantes em seu domicílio AlturaCriar uma tabela de freqüências para cada uma das variáveis. Estes exemplos serãoconstruídos com dados coletados na sala de aula.Tabelas de freqüência são encontradas em jornais informativos (Zero Hora, Correio doPovo, etc.), relatórios técnicos, monografias, dissertações, teses e revistas científicas.As tabelas de freqüência simples apresentam de forma concisa o número deocorrências (absoluta e relativa) dos valores de uma variável.Uma tabela de freqüência genérica tem a seguinte configuração: Tabela 1 – Tabela de freqüências genérica i xi fi fri 1 x1 f1 fr1 2 x2 f2 fr2 M M M M k xk fk frk Σ n 100,0%A notação utilizada é a seguinte: X é uma variável qualquer x é um particular valor da variável X i é um índice útil para enunciar as expressões matemáticas k é o número de linhas da tabela
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 6Os componentes da tabela de freqüências são:Freqüência absoluta (fi): número de ocorrências do valor xi.Freqüência relativa (fri): percentual de ocorrências do valor xiAs Tabelas cruzadas apresentam a distribuição de freqüências de duas variáveissimultaneamente. As tabelas cruzadas são abundantes em jornais e revistasespecializadas.Exemplo 2 – Grupo sangüíneo e fator Rh.Preencher a tabela abaixo com os dados da turma. Calcule os percentuais em relaçãoaos totais das linhas.Tabela 2 – Distribuição da turma por grupo sangüíneo e fator Rh. Fator Rh Rh+ Rh- TotaisGrupoABABOTotais
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 72.2 Análise GráficaO tipo de gráfico adequado para cada variável depende do tipo de variável. Segue umarelação de exemplos de variáveis e tipos de gráficos adequados.Variável Qualitativa Nominal (com poucas categorias)GRÁFICO DE SETORES (Pizza ou Torta)Figura – Distribuição da turma por sexoBase:Fonte:Variável Qualitativa Nominal (com muitas categorias):GRÁFICO DE BARRASFigura – Principais causas de morte - EUA Cigarro 37,7% Obesidade 28,3% Ãlcool 9,4% Doenças infecciosas 8,5% Armas de fogo 3,3% Doenças venéreas 2,8% Acidente de carro 2,4% Drogas 1,9% Outras 5,7% 0% 20% 40% 60% 80% 100%Base: ???Fonte: Ie Estatísticas, ano não declarado
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 8Variável Qualitativa Ordinal:GRÁFICO DE BARRASFigura – Avaliação do atendimento da equipe de enfermagem por parte dos pacientes Ótimo 25% Muito Bom 35% Avaliação Bom 20% Regular 8% Ruim 5% Péssimo 2% 0% 10% 20% 30% 40% %Base: 100 pacientes.Fonte: Dados fictícios.Variável Quantitativa DiscretaGRÁFICO DE COLUNASFigura – Número de pessoas por domicílioBase:Fonte:
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 9Variável Quantitativa ContínuaHISTOGRAMAFigura – Distribuição de uma turma por altura 10 8 6 4 Freqüência 2 0 150,0 160,0 170,0 180,0 190,0 200,0 Altura (cm)Base: 20 observaçõesFonte: Alunos de uma turma de Estatística I. Gráfico construído no software SPSS.Exercício – Construir um Histograma para os dados de estatura da nossa turma.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 102.3 Medidas de Tendência CentralSão valores que trazem informação sobre a região em torno da qual os dados estãoposicionados. As medidas de tendência central mais utilizadas são: Média, Mediana eModa.2.3.1 – Média Aritmética (µ , X )A média aritmética é definida como a soma de todas observações da variável X,dividida pelo número de elementos do conjunto de dados. Freqüentemente a médiaaritmética é o valor que melhor representa um conjunto de dados.Quando os dados não estão organizados na forma de uma tabela de freqüências e,portanto, estão na forma isolada, as expressões genéricas para encontrar a médiasão: População Amostra N n ∑ xi ∑x i µ= i =1 X = i =1 N nQuando os dados estão organizados na forma de uma tabela de freqüências deve-seponderar os diferentes valores xi pelas respectivas freqüências fi. Procedendo destaforma o cálculo da média aritmética torna-se mais simples e rápido. População Amostra k k ∑x i × fi ∑x i × fi µ= i =1 X = i =1 N nExemplo 3 – Número de pessoas que mora em nosso domicílioCalcular a média aritmética para o exemplo do número de pessoas que mora nodomicílio.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 112.3.2 – Mediana (Md)A mediana é o valor que divide o conjunto de dados ordenado em duas partes comigual número de observações. Para calcular a mediana iremos utilizar uma novanotação. Seja x[1] , x[ 2 ] , K, x[ n ] um conjunto de dados ordenado (ordem crescente),onde o valor entre colchetes representa a posição no conjunto ordenado.Deduzindo a posição mediana: n ímpar n par n Fila Md n Fila Md 3 4 5 6 7 8As expressões genéricas para encontrar a média são: n ímpar n parQuando os dados estão organizados na forma de uma tabela de freqüências pode-seencontrar a posição mediana na coluna acumulada Fi.Exemplo 4 – Número de pessoas que mora em nosso domicílioEncontrar a Md para o exemplo do número de pessoas que mora no domicílio.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 122.3.3 – Moda (Mo)A moda é definida como o valor mais freqüente de um conjunto de dados. É possívelque o conjunto seja bimodal (duas modas) ou até mesmo multimodal (três os maismodas).Mo = {xi } com maior f iExemplo 5 – Número de pessoas que mora em nosso domicílioEncontrar a Mo para o exemplo do número de pessoas que mora no domicílio.Considerações IMPORTANTES sobre as MTC1. A média é a MTC mais influenciada por valores extremos, entretanto é a medidamais “rica”, porque considera todos valores do conjunto de dados.2. A mediana não é afetada por valores extremos.3. A moda é a MTC mais “pobre”, porque considera apenas os valores mais freqüentes.4. Existem outros tipos de média usadas em ocasiões especiais. A média harmônica émuito utilizada em concursos públicos e a geométrica pode ser usada em situações dealta variabilidade, visto que ela é mais estável. Discutiremos isto em aula. Média harmônica Média geométrica n Xh = n X G = n x1 × x 2 × K × x n 1 ∑x i =1 iPode-se estabelecer a seguinte relação entre as médias: Xh ≤ XG ≤ X
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 132.4 SeparatrizesSão valores que separam o conjunto de dados ordenado em partes com igual númerode observações.A Mediana é, portanto, uma separatriz porque divide o conjunto de dados em duaspartes iguais. Min |------------------------|------------------------| Máx MdOs Quartis (Qi) dividem o conjunto de dados em 4 partes iguais. Min |------------------------|------------------------| MáxOs Percentis (Pi) dividem o conjunto de dados em 4 partes iguais. Min |------------------------|------------------------| MáxExemplo 6 – Boletim de Desempenho do Provão do MECExemplo 7 – Distribuição de Renda no Rio Grande do SulA régua de percentis a seguir apresenta a distribuição de salários para a populaçãourbana em idade economicamente ativa no ano de 1999. R$ 238,00 R$ 400,00 R$800,00 R$ 1500,00 |-------------|-------------|-------------|---------|---| P25 P50 P75 P90
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 142.5 Medidas de VariabilidadeSão medidas que complementam as MTC trazendo informação sobre a dispersãoexistente no conjunto de dados. Para introduzi-las vamos recorrer a um exemplo ondetemos três diferentes equipes de vôlei, onde a variável X investigada é a estatura dosatletas (em cm). Todas equipes têm seis atletas titulares.Exemplo 8 – Entendendo as Medidas de VariabilidadeTabela – Medições de pressão arterial sistólica (mmHg) em três pacientes Paciente A Paciente B Paciente C 120 118 120 120 121 100 120 124 135 120 117 155 120 120 120 120 120 90 Média ( X ) Moda (Mo) Mediana (Md)Questões1 – O que aconteceu com as MTC na tabela acima?2 – Os três pacientes são iguais em relação a distribuição das PA Sistólica?3 – O que diferencia um paciente do outro?A partir de agora aprenderemos a calcular medidas capazes de quantificar avariabilidade existente num conjunto de dados
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 151.4.1 – Amplitude (R, do termo Range)É a diferença entre o maior e o menor valor de um conjunto de dados.R = máx{xi } − mín{xi }Calcular R nos três pacientes do Exemplo 8.1.4.2 – Variância (σ2 , s 2)A variância é uma medida da variação em torno da média. Por definição,variância é a média dos quadrados dos desvios em torno da média. População Amostra ∑ (x − X) N n ∑ (x − µ) 2 2 i i σ2 = i =1 s2 = i =1 N n −1A variância, ao contrário da Amplitude, considera todos elementos do conjunto dedados no seu cálculo. Quanto maior for a variação dos valores do conjunto de dados,maior será a variância.Quando os dados estão organizados na forma de uma tabela de freqüências, deve-se ponderar os quadrados dos desvios pela freqüência. Esse procedimento facilita ocálculo. População Amostra ∑ (x − X ) × fi k k ∑ (x − µ ) × fi 2 2 i i σ2 = i =1 s2 = i =1 N n −1Calcular s2 nos três pacientes do Exemplo 8.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 161.4.3 – Desvio-padrão (σ, s)O desvio-padrão é a raiz quadrada positiva da variância. Essa medida corrige oproblema de unidade que surge na variância. O desvio-padrão também é umamedida da variação em torno da média. População Amostra σ = σ2 s = s2O desvio-padrão expressa a variação média do conjunto de dados em torno da média,para mais ou para menos.Calcular s nos três pacientes do Exemplo 8.1.4.4 – Coeficiente de Variação (CV)O CV é a razão entre o desvio-padrão e a média de um conjunto de dados. Ele expressaa variação relativa (%) presente no conjunto de dados em relação à média. População Amostra σ s CV = × 100% CV = × 100% µ XQuanto maior o CV, mais heterogêneos serão os dados.Calcular o CV nos três pacientes do Exemplo 8.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 17Considerações sobre as Medidas de Variabilidade (MV)1. A Amplitude á a MV mais “pobre”, porque considera apenas os dois valoresextremos do conjunto de dados.2. A Variância não é interpretada na prática devido ao problema da unidade, que estáao quadrado.3. O Desvio-padrão é a MV mais conhecida, sendo amplamente utilizada.4. Dentre as MV estudadas, sugere-se que o CV seja utilizado para comparação davariabilidade entre diferentes conjuntos de dados. Por não ter unidade, o CV pode serutilizado até mesmo para comparar a variabilidade entre variáveis expressas emdiferentes unidades.Curiosidade I – III Consenso Brasileiro de Pressão Arterial – AdultosA pressão arterial para adultos pode ser categorizada de acordo com a seguinte tabela.Portanto, a medida quantitativa contínua pode ser transformada em qualitativa ordinal. ADULTOS (MAIORES DE 18 ANOS) Pressão Arterial (mmHg) Sistólica Diastólica Categoria < 130 < 85 Normal 130-139 85-89 Normal Limítrofe 140-159 90-99 Hipertensão Leve (estágio 1) 160-179 100-109 Hipertensão Moderada (estágio 2) > 180 > 110 Hipertensão Severa (estágio 3) > ou= 210 > ou=120 Hipertensão Muito Severa (4) > 140 < 90 Hipertensão Sistólica Isolada Fonte: http://www.cdof.com.br/avalia4.htm
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 18Exemplo 9 – APGARLogo que nascemos somos avaliados numa escala de 1-10 pontos no 1o e no 5o minutode vida. Os dados abaixo mostram os resultados obtidos em 10 recém-nascidos. Apgar 1 Apgar 5Bebê 1 8 9Bebê 2 4 8Bebê 3 8 9Bebê 4 8 9Bebê 5 3 8Bebê 6 8 9Bebê 7 8 9Bebê 8 4 9Bebê 9 9 9Bebê 10 7 9a) Encontrar as MTC para Apgar 1 e Apgar 5, separadamente.b) Encontrar as MV para Apgar 1 e Apgar 5, separadamente.c) Comente os resultados em termos de MTC e de Varabilidade.CURIOSIDADE II - Como funciona o APGARO APGAR é o primeiro escore que recebemos em nossa vida, logo após o nascimento(1o e 5o minuto de vida). Foi desenvolvido em 1952 por anestesiologista Virginia Apgar,sendo utilizado até os dias de hoje.Tabela - Cálculo do Apgar Pontos 0 1 2Freqüência cardíaca Ausente <100bpm >100bpmRespiração Ausente Fraca, irregular Forte, choroTônus muscular Flácido Flexão de pernas e braços Movimento ativo, Boa flexãoCor Cianótico, Pálido Cianose de extremidades RosadoIrritabilidade Reflexa Ausente Algum movimento Espirros, ChoroFonte: http://www.abcdasaude.com.br/artigo.php?254
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 19Exemplo 10 – Número de Pré-Natais realizadosOs dados a seguir apresentam o número de exames pré-natais realizados numaamostra de 21 mulheres cujos partos (normais) foram realizados num determinadohospital. 7 5 6 6 9 4 6 5 8 6 6 5 5 8 10 9 5 5 7 7 7a) Qual é a variável X deste exemplo.b) Construir uma tabela de freqüências para a variável X.c) Encontrar e interpretar as MTC.d) Calcular as Medidas de Variabilidade.Mais exercícios sobre o Capítulo 1 na LISTA DE EXERCÍCIOS.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 20Cap. 3 – Probabilidade3.1 Principais conceitosProbabilidade é o ramo da matemática que trata de fenômenos aleatórios. Aobservação de um fenômeno aleatório por parte do homem é chamada deexperimento aleatório.Características de um experimento aleatório:1ª) Não se conhece um particular valor do experimento antes dele ser executado,porém podemos descrever todos os possíveis resultados - as possibilidades;2ª) Quando o experimento é repetido algumas vezes, os resultados ocorrem de umaforma aparentemente acidental. Mas quando o número de repetições aumenta, umaregularidade aparecerá. E esta regularidade que torna possível construir um modelomatemático útil para análise do experimento.Exemplos de fenômenos aleatórios:1) Condições meteorológicas2) Produção de arroz anual numa cidade3) Resultado de uma cirurgia4) Lançamento de uma moeda5) Resultados de loteriasExemplos de experimentos aleatórios:E1: Jogue um dado e observe o n.º na face de cima.E2: Jogue uma moeda 3 vezes e observe o número de caras obtido.E3: Jogue uma moeda 3 vezes e observe a seqüência de caras e coroas obtida.E4: Uma mulher está grávida de gêmeos. O sexo dos bebês será verificado.E5: Numa propriedade com 100 árvores da espécie araucária angustifólia o número deárvores que apresentam um determinado parasita é verificado.E6: A temperatura de um paciente é verificada pela enfermeira.Nos seis exemplos anteriores não somos capazes de precisar o resultado, entretantoconseguimos listar os possíveis resultados.Espaço amostral de um experimento aleatório é o conjunto de todos os resultadospossíveis do experimento. É denotado por S ou Ω.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 21Exemplos de espaços amostrais relacionados aos experimentos anteriores.S1 =S2 =S3 =S4 =S5 =S6 =Um evento é um subconjunto de S. Em particular, S e ∅ (conjunto vazio) são eventos;S é dito o evento certo e ∅ o evento impossível.Exemplo de eventos no lançamento de um dadoS = {1,2,3,4,5,6}A: ocorre um n.º par A = {2,4,6}B: ocorre a face 6 B = {6}C: ocorre um n.º maior que 6 C=∅D: ocorre nº 6 ou nº par D = {2,4,6}E: ocorre nº par ou nº ímpar E = {1,2,3,4,5,6} = SÉ possível realizar operações com eventos que nada são do que operações comconjuntos já estudadas no Ensino Fundamental.Operações com eventosSejam A e B dois eventos associados a um espaço amostral S.1) União: A∪B → A ocorre ou B ocorre ou ambos ocorrem2) Interseção: A∩B → A ocorre e B ocorre3) Complementar: Ac ou A → não ocorre A
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 22Duas definições importantes:1) Dois eventos A e B são excludentes ou mutuamente exclusivos se a ocorrênciade um impedir a ocorrência de outro. Em outras palavras, não podem ocorrersimultaneamente.2) Eventos ou resultados equiprováveis têm a mesma probabilidade de ocorrência.Exemplo – Lançamento de um dado e uma moeda, ambos honestosEscreva o espaço amostral. Os resultados são todos equiprováveis? Qual aprobabilidade de um particular par (x,y) ser selecionado. Assinale os seguintes eventos:3.1.1 Conceitos de probabilidade⇒ Conceito AxiomáticoSeja A um evento de S. A probabilidade de ocorrência de A, denotada por P(A), deverásatisfazer os seguintes axiomas (propriedades fundamentais):Axioma 1: 0 ≤ P(A) ≤ 1Axioma 2: P(S) = 1⇒ Conceito clássicoEsse conceito só é válido se todos resultados de S forem equiprováveis. Para casosassim a probabilidade de ocorrência do evento A é obtida por: n( A) P ( A) = n(A) é o número de resultados favoráveis ao evento A Total ( S ) Total (s) é o número total de resultados em SExemplos – Conceito clássico1) Mega-sena, Lançamento de moedas e dados honestos.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 23⇒ Conceito freqüentistaEsse conceito só é válido se todos resultados de S forem equiprováveis. Para casosassim a probabilidade de ocorrência do evento A é obtida por:1º) O experimento é repetido n vezes.2º) Observa-se a freqüência relativa de ocorrência de um certo resultado A: n( A)fr(A) = , onde n(A) é o nº de vezes em que ocorre o resultado A em n realizações ndo experimento.3º) Probabilidade como limite. A medida que n aumenta, a fr(A) converge para a realprobabilidade P(A).Exemplos – Conceito freqüentista1) Verificando se um dado é honesto.2) Encontrando a probabilidade de ocorrência de um acidente aéreo.3) Qual a probabilidade de uma criança nascer com Síndrome de Down ?3.1.2 Probabilidade CondicionalA probabilidade de ocorrência de um evento pode ser influenciada pela ocorrência deum evento paralelo. Considere que A e B são eventos de um mesmo espaço amostral S.Chamaremos de P(A|B) a probabilidade de ocorrência do evento A dado que o eventoB já ocorreu.Graficamente:Olhando para o desenho podemos estabelecer as seguintes relações:P(A|B) = P(B|A) =
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 24Exemplo – Escolhendo alguém na sala de aulaSuponha que um aluno da turma será sorteado. Após saber o resultado o professor fazalgumas perguntas utilizando probabilidade condicional.Exemplo – Técnica cirúrgica e Resultado Resultado Técnica Sucesso Fracasso TotalA 30 50 80B 60 40 100C 50 50 100Total 140 140 280Resolver as seguintes probabilidades:3.1.3 IndependênciaDois eventos A e B são considerados independentes se a ocorrência de um nãointerfere na probabilidade de ocorrência do outro: P(A|B) = P(A) e P(B|A) = P(B)Isolando a intersecção na expressão de probabilidade condicional obtemos: P(A∩B) = P(A) x P(B)Esse conceito é fundamental para aplicações em Estatística.Exemplo - Uma mulher decide ter dois filhos numa localidade onde a probabilidade deser menino é estimada em 51%.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 25Exemplo – Tendo “certeza” de uma gravidezUma jovem suspeita que está grávida e decide comprar três diferentes testes degravidez em farmácias. As marcas escolhidas foram A, B e C. As probabilidades dosexames indicarem “falso-positivo” são de 3%, 5% e 6%, respectivamente, enquanto asprobabilidades de “falso-negativo” são de 1%, 2% e 4%, respectivamente. a) Se a jovem realmente está grávida, qual a probabilidade dos três exames confirmarem a gravidez? b) Se a jovem não estiver grávida, qual a probabilidade dela levar um susto com pelo menos um dos exame resultando positivo.Exemplo – Prole de SEIS filhosÉ fácil construir o espaço amostral e calcular as probabilidades de se ter ZERO, UM,DOIS, TRÊS, QUATRO, CINCO ou SEIS filhas meninas numa prole de seis filhos?Assume que a probabilidade de ser menino seja de 51%.3.2 – Variáveis aleatórias discretas – Distribuição BinomialO exercício acima pode ser resolvido pela Distribuição Binomial. Sempre que umexperimento que assume apenas dois possíveis resultados em cada repetição forrepetido n vezes e que a probabilidade de sucesso é constante em cada repetiçãopodemos modelar o número de sucessos pela distribuição Binomial.X = número de sucessos, variando de 1 até np = probabilidade de sucesso em cada repetição1-p = probabilidade de fracasso em cada repetiçãon = número de repetiçõesExpressão genérica da Binomial n!P( X = x) = × p x × (1 − p) n − x x!(n − x )!
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 26O número esperado ou esperança de sucessos na distribuição Binomial é facilmenteencontrado. Intuitivamente, responda as perguntas a seguir:1) Se lançarmos uma moeda honesta 100 vezes, qual o número esperado de caras?2) Se lançarmos um dado 600 vezes, qual o número esperado de faces “5”.3) No exemplo da prole de 6 filhos, qual o número esperado de meninos?E( X ) = n × p3.3 Variáveis aleatórias contínuas3.3.1 ConceitosAs variáveis contínuas podem, ao menos teoricamente, assumir qualquer valor numintervalo numérico. Sendo assim fica impossível representarmos variáveis contínuas damesma forma que as variáveis discretas.ImportanteAs variáveis contínuas são representadas por curvas, chamadas de funçãodensidade de probabilidade, e a área sob essa função representa a probabilidade deocorrência. Nas variáveis contínuas não existe a probabilidade de ocorrência de umvalor exato, mas sim de intervalos.A função densidade de probabilidade, denotada por fx(x), é a função que indica ocomportamento probabilístico da variável aleatória contínua X. A função densidade deprobabilidade deverá satisfazer as seguintes condições: a) f(x) ≥ 0, para todo x ∈ R. b) Área total sob a curva deve ser igual a 1.A área sob a curva fx(x) nos informa a probabilidade de ocorrência de valores davariável X.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 27Supondo que o gráfico acima represente a função de probabilidade de uma variávelaleatória X. Como sabermos a probabilidade de ocorrência de valores entre a e b ?Exemplo – Tempo para realização de uma cirurgia (Distribuição Uniforme)O tempo de realização de uma cirurgia é igualmente provável de ocorrer entre 60 e 120minutos.a) Esboce graficamente a função densidade de probabilidade para X = tempo de cirurgia.b) Calcular a probabilidade de levar mais de 90 minutos para terminar a cirurgia.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 283.3.2 A Distribuição Normal ou Curva de GaussA distribuição Normal ou Gaussiana é, sem dúvida, o modelo probabilístico maisconhecido. Várias técnicas estatísticas necessitam da suposição de que os dados sedistribuam normalmente para serem utilizadas. Na natureza uma grande quantidade devariáveis apresentam tal distribuição.Uma v.a.c. X tem distribuição normal com parâmetros µ e σ se sua função densidadede probabilidade é dada por: ( x−µ )2 1 −f (x ) = e , x ∈ ℜ, 2σ 2 σ 2πonde µ e σ são parâmetros,- ∞ < µ < +∞ ; σ > 0Notação X ∼ N(µ,σ) X tem distribuição Normal com média µ e desvio-padrão σ.Os parâmetros da Normal são a média e o desvio-padrão, que permitem infinitas curvasnormais com diferentes formatos (mas sempre simétricas). O gráfico da fX éapresentado a seguir:
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 29A distribuição Normal, independentemente dos valores dos parâmetros, apresentasempre a seguinte relação:Entendendo os parâmetros da Normal:A média µ informa o centro da distribuição. É um parâmetro de locação.O desvio-padrão σ informa o formato da curva. f(x) f(x) f(x) -10 -5 0 5 10 -10 0 10 -10 -5 0 5 10 Valores de X Valores de X Valores de XOs cálculos integrais envolvendo a distribuição Normal são bastante complicados.Felizmente, veremos a seguir uma relação que facilita muito nossa vida.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 30Exemplo – Aplicação práticaA altura de mulheres adultas no RS segue uma distribuição Normal com média de165cm e desvio-padrão de 6cm.a) Qual a probabilidade de uma mulher ter entre 159 e 171cm?b) Qual a probabilidade de uma mulher ter entre 153 e 177cm?c) Qual a probabilidade de uma mulher ter mais de 177cm?d) Qual a probabilidade de uma mulher ter menos de 180cm?Distribuição Normal-padrão ou Normal reduzidaSeja X uma variável aleatória normalmente distribuída com quaisquer parâmetros médiaµ e desvio-padrão σ. Se realizarmos a seguinte transformação obteremos uma novavariável Z com média 0 e desvio-padrão 1: X −µ X ∼ N(µ,σ) → Z= → Z (0,1) σQualquer variável com distribuição Normal pode ser padronizada para aNormal. A distribuição Normal padronizada (Z) é tabelada.O valor de Z indica quantos desvios acima ou abaixo nós estamos em relação à média.Exemplo – Aprendendo a usar a tabela1) Calcule:a) P(Z < 1,24) =b) P(Z < 1,67) =c) P (Z > 2,12) =d) P( -1,96 < Z < 1,96) =
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 31Cap. 4. - Amostragem4.1 Conceitos BásicosAmostragem é o nome dado ao conjunto de procedimentos e técnicas para extraçãode elementos da população para compor a amostra. O objetivo da amostragem é obteramostras representativas das populações em estudo. Um Censo seria a investigação dapopulação completa.Por que trabalhar por amostragem?________________________________________________________________________________________________________________________________________________________________A fração de amostragem é a razão entre o tamanho amostral e o tamanhopopulacional. Não existem regras fixas para tamanho de amostra, ou seja cada casomerece um cuidado especial. Frases como “20% da população é ideal”, quase semprenão são verdadeiras.As técnicas de amostragem se dividem em: probabilísticas e não-probabilísticas.As técnicas probabilísticas são aquelas onde todos elementos da população têm umaprobabilidade não nula de seleção. Nas técnicas não-probabilísticas não podemosgarantir que todos elementos têm probabilidade de serem selecionados para a amostra.4.2 Principais técnicas de amostragem probabilísticaGeralmente as técnicas probabilísticas produzem melhores resultados do que as nãoprobabilísticas. A seleção dos elementos envolve obrigatoriamente a utilização de algumdispositivo aleatório para seleção das unidades amostrais.Exemplo de dispositivos aleatórios:
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 324.2.1 Amostragem Aleatória Simples (AAS)Apesar de ser uma forma extremamente simples de seleção de elementos dapopulação, é considerada uma das melhores técnicas de amostragem.Na AAS cada elemento da população tem igual probabilidade de seleção e opesquisador não introduz nenhum vício no processo.Etapas:1) Enumerar a população de 1 até N.2) Sortear n números no intervalo de 1 até N. Caso haja números repetidos, sortearnovamente mais alguns valores.Probabilidade de seleção de um elemento na AAS:Número de amostras possíveis SEM reposição:Número de amostras possíveis COM reposição:Exemplo 23 – Amostra n=2 da população N=5Verificar quantas amostras são possíveis COM e SEM reposição da população detamanho 5 verificando também as probabilidades de seleção de cada unidade. A B C D E
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 334.2.2 Amostragem EstratificadaNa Amostragem estratificada a população é dividida em subpopulações ou estratos deforma que N1 + N2 + ... + NK = N.Um tamanho amostral n é repartido proporcionalmente entre os estratos, respeitandoas frações Ni / N. Depois de estabelecidos o valor de ni, procede-se uma seleçãoaleatória dentro de cada estrato.Exemplo 24 – Amostra estratificada na região sulDividir proporcionalmente uma amostra de 1300 pessoas em três estratos,correspondentes aos três estados da região sul. i Estado Pop. % Amostra 1 Rio Grande do Sul 9.637.682 2 Santa Catarina 4.875.244 3 Paraná 9.003.804 Total 23.516.7304.2.3 Amostragem SistemáticaA amostragem sistemática inicia com o cálculo do intervalo de amostragem f=N/n.Depois, selecionamos um número entre 1 e f e vamos indo sistematicamente de f em felementos, até o final.A amostragem sistemática é útil quando temos cadastros impressos que estãoordenados segundo algum critério que nada tem a ver com os interesses da pesquisa.Exemplo 25 – Escolhendo 8 leitos de um total de 40 Planta de leitos de um andar 1 11 21 31 2 12 22 32 3 13 23 33 4 14 24 34 5 15 25 35 6 16 26 36 7 17 27 37 8 18 28 38 9 19 29 39 10 20 30 40
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 344.3 Principais técnicas de amostragem não-probabilísticaA falta de cadastros, inacessibilidade à toda população, pressa ou ainda muitos outrosfatores, levam os pesquisadores a utilizar técnicas não-probabilísticas. Veremosrapidamente algumas técnicas encontradas na literatura.4.3.1 Amostragem por quotasUm dos procedimentos mais comuns onde o pesquisador estabelece quotas de acordocom a distribuição populacional, distribui os pesquisadores de forma geograficamenteestruturada e cumpre as quotas de forma intencional.Exemplo 26 – Pesquisa eleitoralEstabelecer as quotas de amostragem (n=800) a partir da distribuição populacionalabaixo. Sexo Classe Social Masculino Feminino Total A-B 1.082.538 1.122.223 2.204.761 C 1.257.140 1.303.227 2.560.367 D-E 1.152.379 1.194.625 2.347.004 Total 3.492.057 3.620.075 7.112.132Dados estabelecidos a partir dos dados TRE-2000 (No de eleitores)Classificação da classe social segundo critérios da ABIPEME-19964.3.2 Amostragem por correspondência4.3.3 Amostragem por tráfego4.3.4 Amostragem intencional
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 35Cap. 5. - Distribuições Amostrais e Estimação5.1 – Parâmetros e EstimadoresO que é inferência estatística ?Inferir consiste na retirada de informações para TODA população baseando-se numaamostra da mesma. Chamamos de parâmetros as quantidades populacionais e deestimadores as funções de dados amostrais que irão gerar as estimativas para osparâmetros populacionais.Tabela - Exemplos de parâmetros e seus respectivos estimadores Parâmetros Estimadores Média populacional Média amostral µ X Desvio-padrão populacional Desvio-padrão amostral σ s Proporção populacional Proporção amostral p pˆHá dois tipos de estimação de parâmetros: a estimação por ponto e por intervalo.Também existe uma outra forma de inferência estatística muito utilizada em situaçõespráticas: os testes de hipóteses.5.2 Distribuição Amostral das MédiasA base da estatística inferencial é o TEOREMA DO LIMITE CENTRAL.O teorema diz que se extrairmos TODAS as possíveis amostras de tamanho n de umapopulação de tamanho N a distribuição das médias amostrais X tende a se distribuircomo uma curva Normal com média igual ao parâmetro µ e desvio-padrão σ n .Exemplo – População de tamanho N = 5Considere a seguinte população de cinco elementos e X = Idade (anos) 20 30 40 50 60 70 A B C D E F a) Quais são os parâmetros populacionais? b) Quantas amostras diferentes de tamanho n=2 podemos extrair da população?
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 36Exemplo – Selecionando uma amostra na sala de aulaSuponha que seja necessário selecionar uma amostra de n=5 alunos da turma pararepresentar a nossa turma numa reunião na reitoria. Qual o número de amostraspossíveis de serem selecionadas?Exemplo – População com média 0,5Considere uma população infinitamente grande com média µ = 0,5 . Vamos avaliar asdistribuições amostrais da média amostral X com n = 30 e 300. 2,0 3,5 3,0 1,5 2,5 2,0 1,0 1,5 0,5 1,0 0,5 - - 0 0,2 0,4 0,6 0,8 1 0 0,2 0,4 0,6 0,8 1 Médias amostrais Médias amostrais n = 30 n = 300Percebemos claramente que com o aumento do tamanho amostral a distribuição de Xfica cada vez mais concentrada em torno do parâmetro µ. Isso quer dizer que, quantomaior amostra maior a possibilidade de acerto.RESULTADO σX tem distribuição Normal com Média = µ e Desvio-padrão = n
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 375.3 – Estimação por ponto e por intervalos de confiança5.3.1 – Estimação por pontoVisa estimar o valor do parâmetro através de estimativas pontuais (únicas). A vantagemé ser de fácil interpretação e rápida, mas a probabilidade de acerto “na mosca” épraticamente nula, pois os estimadores podem ser encarados como variáveis aleatóriascontínuas.Exemplo – World Trade CenterUm mês após o ataque ao WTC de NY perguntamos a 1000 americanos, escolhidos demaneira aleatória, se estão com medo de viajar em vôos domésticos em territórioamericano.Se 852 pessoas da amostra afirmam estar com medo, podemos estimar que 85,2% dosamericanos estão com medo de viajar de avião após os ataques terroristas de11/Set/2001.5.3.2 – ESTIMAÇÃO POR INTERVALO DE CONFIANÇAConsiste em cercar o valor da estimativa pontual por uma região cuja probabilidade deconter o verdadeiro parâmetro seja conhecida.NOTAÇÕES que serão utilizadas a partir de agoraα (alfa) = nível de significância 1 - α = nível de confiança αt α = valor da distribuição t de Student com n-1 graus de liberdade e área à n −1; 2 2direita. αz α = valor da distribuição normal padrão com área à direita. 2 2
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 381o ) Intervalo de Confiança para µ (teórico)Conhecendo o teorema do limite central podemos construir intervalos de confiança paraa média populacional. Para isso basta cercarmos a estimativa pontual X por umintervalo cuja probabilidade de conter o parâmetro seja conhecida.  σ N −nI.C. para µ com 1-α de confiança =  X ± z α × ×    2 n N −1  Na fórmula de IC acima percebemos a presença de um parâmetro (σ). Se estamosprocurando um intervalo de confiança para µ é porque NÃO conhecemos µ. Épraticamente impossível conhecermos σ e não conhecermos µ. Por isso esse resultadoacaba sendo INÚTIL na prática.2o ) Intervalo de Confiança para µ (prático)Ao substituirmos o parâmetro σ por seu estimador s , a distribuição amostral de Xdeixa de ter uma distribuição Normal e passa a ter uma distribuição t de Student. Destaforma os Intervalos de confiança podem ser utilizados em situações práticas.  s N −nI.C. para µ com 1-α de confiança =  X ± t α × ×    n −1, 2 n N −1   N −nObs: O fator de correção é omitido em caso de populações infinitas. O EXCEL N −1simplesmente ignora esse fator de correção.Exemplo:Numa amostra de 121 paciente hígidos, a taxa média de glicemia foi de 135mg/dl comum desvio-padrão de 13,69mg/dl.Construir um IC 95% para a verdadeira taxa de glicemia desta população. Ignore ofator de correção.  s I.C. 95% para µ =  X ± t α ×   n −1, 2 n
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 39O EXCEL constrói Intervalos de Confiança sem o fator de correção com o comandoEstatísticas Descritivas que fica dentro da opção “Análise de Dados” no Menu“Ferramentas”. Para incluir essa opção deve-se ir até “Ferramentas” → “Suplementos” eassinalar a opção “Ferramentas de Análise”.ATENÇÃO: é necessário ter o banco de dados digitado em EXCEL para fazerisso.Figura – Tela do Excel: Ferramentas > Análise de dados > Estatística DescritivaTabela - Saída do EXCEL: GlicemiaMédia 135,00Erro padrão 1,24Mediana 135,00Modo 146,00Desvio padrão 13,69Variância da amostra 187,32Intervalo 70,00Mínimo 110,00Máximo 180,00Soma 16335,00Contagem 121Nível de confiança(95,0%) 2,46
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 403o) Intervalo de Confiança para uma proporção populacional pA estimativa pontual para uma proporção é dada diretamente pela proporção amostral.É muito útil construirmos um intervalo em torno da estimativa pontual que possua umaprobabilidade conhecida de conter a verdadeira proporção populacional. ) p × (1 − p ) ˆ ˆ N −nI.C. para p com 1-α de confiança =  p ± z α × ×    2 n N −1  onde z 0,05 =1,645 (90%) z 0,025 = 1,96 (95%) z 0,005 = 2,576 (99%) N −nObs: O fator de correção é omitido em caso de populações infinitas. N −1O EXCEL NÃO faz intervalos de confiança para proporções.Exemplo – Proporção de canhotos da PUCRSNuma amostra de n=_______ alunos de uma população de N=30.000 de toda PUCRS,verificamos que _______ são canhotos.a) Qual a estimativa pontual de canhotos?b) Construa intervalos de confiança 95% e 99% para a proporção de canhotos. Agorause o fator de correção.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 41Cap. 6 Testes de HipótesesOs testes de hipótese constituem outra forma de inferência estatística. Hipóteses sãoafirmações sobre parâmetros populacionais. Agora iremos testar se essashipóteses podem ser consideradas verdadeiras ou não. Os testes de hipótese sãomuito objetivos, pois o resultado final é a ACEITAÇÃO ou REJEIÇÃO da hipóteseformulada.Etapas de um teste de hipóteses:1.Formular as hipóteses2.Definir qual o nível de significância será utilizado (alfa)3.Verificar qual o teste adequado e calcular a estatística de teste4.Decidir pela aceitação ou rejeição da hipótese de nulidade com base no p-value.5.Conclusão experimentalA hipótese nula (Ho) é a hipótese sob a qual a teste é realizado. Essa hipótese seráACEITA ou REJEITADA. Se os dados amostrais estiverem de acordo com a hipótesenula formulada, a estatística de teste nos levará a uma aceitação. Por outro lado, se osdados amostrais não estiverem em sintonia com a hipótese formulada, o teste noslevará a uma rejeição da hipótese nula.A hipótese alternativa (H1 ou Ha) é uma hipótese complementar a Ho. Por isso serejeitamos Ho, conseqüentemente aceitamos H1.O nível de significância do teste (α) é definido pelo pesquisador. Ele significa aprobabilidade de cometermos erro tipo I, ou seja, rejeitarmos Ho sendo a mesmaverdadeira.A decisão estatística é a REJEIÇÃO ou ACEITAÇÃO de Ho. Essa decisão está sujeitaaos seguintes erros:Tabela – Tipos de Erros RealidadeDecisão Ho Verdadeira Ho FalsaAceito Ho OK Erro tipo II βRejeito Ho Erro tipo I OK αO erro do tipo I ou nível de significância (α) é controlado pelo pesquisador. O erro dotipo II (β) é geralmente esquecido. Por esse motivo vamos sempre preferir umaREJEIÇÃO do que uma ACEITAÇÃO. No caso de uma REJEIÇÃO ou tomamos a decisãocorreta ou cometemos o erro com probabilidade α. Os valores de α mais utilizados são5%, 1% e eventualmente 10%.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 42A conclusão experimental consiste em explicar com palavras simples o resultado deum teste de hipóteses.Os testes que iremos estudar são os mais famosos e encontrados em praticamentetodos os livros de Estatística.• Teste t de Student para uma média• Teste t de Student para comparação de duas médias (amostras independentes)• Teste t de Student para comparação de duas médias (amostras emparelhadas)• Teste Qui-Quadrado (para variáveis organizadas na forma de uma tabela cruzada)6.1 - Teste t de Student para uma médiaÉ uma técnica que permite testarmos a hipótese de que a média populacional pode serconsiderada igual a um valor de referência, digamos µo.Apresentação das hipóteses:Ho : µ = µ o Ho : µ = µ o Ho : µ = µ o  Ha : µ ≠ µ o Ha : µ > µ o Ha : µ < µ o ↑↑Iremos estudar apenas os testes bilaterais, ou seja, onde as hipóteses não sãodirecionadas para um único sentido. As regiões de rejeição ficam nos dois lados dacurva.A estatística de teste é dada por: x - µot= s/ nApesar de ser um procedimento simples, o EXCEL não realiza esse tipo de teste. Já, oprograma estatístico SPSS, por exemplo, faz.As regiões de rejeição e aceitação do teste t são estabelecidas pelos valores de t,conforme mostra o desenho a seguir de uma curva t com n-1 graus de liberade.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 43Os valores de t são encontrados na tabela t entregue em sala de aula. Comparando ovalor da estatística de teste t calculado com os valores de t obtidos na tabela chegamosa decisão estatística e podemos enunciar a conclusão experimental.Apesar do EXCEL não fazer isso podemos utiliza-lo para calcular a média amostral e odesvio-padrão.Exercício:O INMETRO está investigando se a quantidade de Paracetamol num dado comprimidoestá de acordo com o valor nominal estampado no rótulo do medicamento (750mg).Numa amostra de 20 comprimidos a média encontrada foi de 738mg com um desvio-padrão de 11,85mg.Teste a hipótese de que a quantidade média de paracetamol é igual ao valor nominalinformado pelo fabricante.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 44Plus! Sobre o p-valueO p-value, valor de p ou significância da estatística é o valor informado na saídados softwares estatísticos. Esse número é, portanto, uma probabilidade que deve sercomparada ao nível de significância adotado. Se p-value > nível de significância adotado, então ACEITAMOS Ho. Se p-value < nível de significância adotado, então REJEITAMOS Ho.Exemplo – Saída do SPSS para o exercício do Paracetamol One-Sample Statistics Std. Std. Error N Mean Deviation Mean Paracetamol (mg) 20 738,0000 11,8544 2,6507 One-Sample Test Test Value = 750 95% Confidence Interval of the Sig. Mean Difference t df (2-tailed) Difference Lower Upper Paracetamol (mg) -4,527 19 ,000 -12,0000 -17,5480 -6,4520Exemplo – Regulando a máquina e re-inspecionandoSuponha que o fabricante tenha regulado a máquina e que a média agora seja de749mg com o mesmo desvio. One-Sample Statistics Std. Std. Error N Mean Deviation Mean PARECT 20 749,0000 11,8544 2,6507 One-Sample Test Test Value = 750 95% Confidence Interval of the Sig. Mean Difference t df (2-tailed) Difference Lower Upper PARECT -,377 19 ,710 -1,0000 -6,5480 4,5480
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 456.2 Teste t de Student - duas amostras independentesÉ uma técnica estatística que permite testarmos a hipótese de que duas médiaspopulacionais são idênticas. É extremamente utilizada para comparação de dois gruposindependentes.Apresentação das hipóteses (caso bilateral):Ho : µ1 = µ 2Ha : µ1 ≠ µ 2A estatística de teste tem uma forma um tanto “amigável”:t= (x1 - x2 ) s1 × (n1 - 1) + s2 × (n2 − 1)  1 2 2 1  × +  n n  (n1 + n2 − 2 )  1 2que deve ser comparado com uma distribuição t de Student com (n1+n2-2) graus deliberdadeAs regiões de rejeição e aceitação seguem a mesma lógica do teste anterior.No EXCEL: Ferramentas → Análise de Dados → Teste t: duas amostras presumindovariâncias equivalentesATENÇÃO: Esse teste só pode ser utilizado se a variância (ou desvios-padrão) dasduas populações em questão não forem muito diferentes.Exercício:Pesquisadores comportamentais criaram um índice para mensurar o grau de ansiedadede vestibulandos. Esse índice vai de 0 (ansiedade mínima) até 100 (ansiedade máxima).Dois grupos de vestibulandos foram investigados. O grupo 1 é formado porvestibulandos de universidades públicas e o grupo 2 é formado por vestibulandos deuniversidades privadas.Resultados do levantamento realizado pelos pesquisadores:Grupo 1 65 58 78 60 68 69 66 70 53 71 63 63 Média = 65,33 Desvio = 6,61Grupo 2 62 63 36 34 56 50 42 57 46 68 48 42 52 43 43 Média = 49,47 Desvio = 10,07
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 46Exemplo – Tela e saída do EXCEL para o exemplo da AnsiedadeTeste-t: duas amostras presumindo variâncias equivalentes Grupo 1 Grupo 2Média 65,333 49,467Variância 43,697 101,410Observações 12,000 15,000Variância agrupada 76,016Hipótese da diferença de média 0,000gl 25,000Stat t 4,699P(T<=t) uni-caudal 0,000t crítico uni-caudal 1,708P(T<=t) bi-caudal (p-value) 0,000t crítico bi-caudal 2,060
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 476.3 Teste t de Student - duas amostras pareadasUtilizado para testarmos a hipótese de que a média populacional ANTES e DEPOIS dealgum determinado “tratamento” ou “situação” sofreu alteração significativa.Ho : µ Antes = µ DepoisHa : µ Antes ≠ µ DepoisHipóteses:A estatística de teste baseia-se nas diferenças DEPOIS – ANTES para cada elemento daamostra.Estatística de teste: dt= sd / nonde d é a média das diferenças e sd é o desvio-padrão das diferenças.As regiões de rejeição e aceitação do teste t são estabelecidas pelos valores de t.No EXCEL: Ferramentas → Análise de Dados → Teste t: duas amostras em parExercício:Deseja-se investigar o efeito do álcool sobre o reflexo na direção. Uma amostra de 10motorista foi convidada a utilizar um simulador de direção antes e depois de ingerirbebida e o tempo até uma reação (pisar no freio) foi verificado.Motorista Antes Depois 1 10 20 2 80 70 3 45 50 4 60 80 5 45 90 6 100 120 7 45 55 8 80 90 9 25 50 10 50 60
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 48Exemplo – Tela e saída do Microsoft EXCELTeste-t: duas amostras em par para médias Antes DepoisMédia 54,000 68,500Variância 726,667 778,056Observações 10,000 10,000Correlação de Pearson 0,862Hipótese da diferença de média 0,000gl 9,000Stat t -3,179P(T<=t) uni-caudal 0,006t crítico uni-caudal 1,833P(T<=t) bi-caudal 0,011t crítico bi-caudal 2,262
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 496.4 TESTE DO QUI-QUADRADO (χ2)O teste do qui-quadrado é uma importante prova para verificar associação entre duasvariáveis qualitativas (categóricas). A técnica verifica se há ou não associação entre asvariáveis linha e coluna de uma tabela cruzada.Hipóteses do teste:Ho: As variáveis linha e coluna da tabela são INDEPENDENTES.Ha: Existe uma relação de dependência entre as variáveis linha e coluna da tabelaPara exemplificar o cálculo das estatística de teste nada melhor do que um exemplo. Aestatística de teste Qui-quadrado baseia-se na diferença entre os valores observados eesperados em cada célula da tabela cruzada. Os valores esperados são calculados sob ahipótese de independência.Estatística de teste: χ ( l −1)( c −1) = ∑ 2 (Obs. − Esp.)2 que deve ser comparado com o valor Esp.tabelado da qui-quadrado com (l-1)(c-1) graus de liberade.ExemploInvestigar se o fato de fumar ou não está relacionado com a presença do fator fumo.Tabela – Presença de câncer versus fator fumo Câncer Sim Não TotalFumoSim 50 100 150Não 20 130 150Total 70 230 300O EXCEL não faz o teste qui-quadrado. O SPSS e o MINITAB fazem.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 50Exemplo – Tabela e saída do SPSS Fuma? * Cancer Crosstabulation Cancer Sim Não Total Fuma? Sim Count 50 100 150 % within Fuma? 33,3% 66,7% 100,0% Não Count 20 130 150 % within Fuma? 13,3% 86,7% 100,0% Total Count 70 230 300 % within Fuma? 23,3% 76,7% 100,0% Chi-Square Tests Asymp. Sig. Exact Sig. Exact Sig. Value df (2-sided) (2-sided) (1-sided) Pearson Chi-Square 16,770b 1 ,000 Continuity Correctiona 15,671 1 ,000 Likelihood Ratio 17,207 1 ,000 Fishers Exact Test ,000 ,000 Linear-by-Linear 16,714 1 ,000 Association N of Valid Cases 300 a. Computed only for a 2x2 table b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 35,00.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 51Cap. 7. CORRELAÇÃO E REGRESSÃO7.1 O COEFICIENTE DE CORRELAÇÃO DE PEARSONO coeficiente de correlação de Peason ( R ) é uma medida que varia no intervalo de –1até +1 que visa quantificar o grau de relacionamento linear entre variáveisquantitativas.Valores próximos de +1 indicam forte correlação direta entre as variáveis enquanto quevalores próximos de –1 indicam forte correlação inversa. Valores em torno de zeroindicam ausência de correlação. Não vamos nos deter no cálculo do coeficiente decorrelação de Pearson, mas sim no seu funcionamento.Vejamos na forma de gráficos de dispersão os possíveis tipos de correlação entre asvariáveis:Vamos verificar a correlação existente entre as variáveis no arquivo exemplo a seguir: Número de Horas de Indivíduo erros (X) Sono (Y) 1 8 12 2 7 13 3 9 9 4 12 6 5 14 5 Média 10,00 9,00 Desvio 2,92 3,54No EXCEL podemos utilizar o comando CORREL.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 52Exemplo – Correlação usando o EXCELExemplo – Outra forma de fazer correlação usando o EXCELAnálise de dados > Correlação
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 537.2 – Regressão Linear SimplesA técnica de Regressão Linear Simples estabelece uma relação de dependência entreuma variável dependente Y e uma única variável independente X, supondo que orelacionamento seja da forma linear: Y = bo + b1X (clássica equação da reta)Os termos bo e b1 são os parâmetros do modelo. Eles são estimados de forma amaximizar a habilidade preditiva do modelo, conforme será mostrado no exemplo aseguir.Exemplo – Peso X Altura de indivíduos adultos
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 54Lista de ExercíciosCap. 2 – Estatística Descritiva1. Os dados a seguir referem-se ao número de cirurgias realizadas diariamente durantea última quinzena do mês de julho em um determinado centro cirúrgico. 2 1 2 3 2 2 0 2 1 2 0 1 2 1 0a) Organize os dados na forma de uma tabelas de freqüências.b) Encontre as MTCs e interprete-as.c) Encontre as Medidas de Variabilidade e interprete-as.2. Os dados a seguir indicam a taxa média de calorias diárias ingeridas pela populaçãode países da América Central. País Calorias País CaloriasCosta Rica 2760 Haiti 1965Domincan Republic 2310 Honduras 2200El Salvador 2270 Nicaragua 2215Guatemala 2190 Panama 2490Fonte: OMS, 1995. (dados arredondados)a) Encontrar as MTC´s e as Medidas de Variabilidade.b) Suponha que, subitamente, todos os países passem a consumir 100 calorias a maisna sua dieta diária. Quais seriam os novos valores das MTCs e das MV?c) Suponha que, subitamente, todos os países aumentem a sua dieta calórica em 10%.Quais seriam os novos valores das MTCs e das MV?3. O índice de massa corporal (IMC) é o resultado da divisão entre o peso (em kg) e oquadrado da altura (em m). A OMS classifica o IMC da seguinte forma: magro, normal,sobrepeso e obesidade. O gráfico a seguir apresenta a distribuição do peso de 200bailarinas gaúchas. Os dados são inspirados em um TCC do curso de Psicologia. 60 56 50 40 38 Freqüência Relativa (fri) 30 20 10 6 0 M agro Normal Sobrepeso Categorias do IMCa) Construa uma tabela de freqüências completa a partir do gráfico.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 554. A tabela a seguir informa as estatísticas descritivas para a estatura (em cm) deadolescentes na faixa dos 10-11 anos, separadamente para o sexo masculino efeminino. Os dados fazem parte de um banco de dados real. Masculino Feminino (n=97) (n=79)Mean (Média) 155,17 146,41Median (Mediana) 160,30 151,00Range (Amplitude) 72,30 55,70Variance 282,55 205,71Std. Deviation (Desvio-padrão) 16,81 14,34Minimum 112,30 111,80Maximum 184,60 167,50a) Comente os resultados. Qual sexo apresenta maior variação na altura?b) Interprete os percentis apresentados na tabela abaixo. Sexo P25 P50 P75 P90Masculino 143.9 160.3 167.3 173.6Feminino 136.0 151.0 155.5 162.15. Uma amostra de 20 borboletas de uma determinada espécie revelou os seguintescomprimentos de asas (em cm) 3,0 3,0 3,1 3,1 3,2 3,3 3,4 3,5 3,5 3,6 3,6 3,6 3,6 3,6 3,7 3,7 3,8 3,8 3,9 4,0a) Organize os dados numa tabela de freqüências.b) Encontre as MTC´s e interprete-as.c) Encontre as Medidas de Variabilidade e interprete.d) Qual gráfico seria apropriado para esse tipo de variável?6. Considere uma amostra de 9 árvores e que os números a seguir representem aaltura das árvores (cm) após um ano de plantio. 152 142 190 154 165 175 157 157 148a) Encontre as MTC´s.b) Encontre as Medidas de Variabilidadec) Aumente o tamanho de todas as árvores em 10cm. Quais seriam os novos valoresdas MTC´s e das MV´s?d) Aumente o tamanho de todas as árvores em 10%. Quais seriam os novos valoresdas MTC´s e das MV´s?
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 56Cap. 3 - Probabilidade7. (Probabilidade) Numa determinada população existem 200 pessoas, sendo 120 dosexo feminino e o restante do sexo masculino. Sabe-se que existe nessa população 40fumantes, dos quais 25 são homens. Se eu escolher uma pessoa dessa população aoacaso, encontre:a) A probabilidade de ser não-fumante.b) Se a pessoa que eu sortear for do sexo feminino, qual a probabilidade dela serfumante?8. (Probabilidade) A probabilidade de um exame resultar num falso-negativo em casosde AIDS é de 10%. Se uma pessoa com AIDS faz exame em três diferenteslaboratórios, qual a probabilidade de que os três exames resultem negativos?9. Uma caixa (caixa A) contém três ratos brancos e 1 preto. Outra caixa (caixa B)contém 4 ratos pretos e 1 branco. Você retira aleatoriamente um rato de cada caixa:a) Escreva o espaço amostral S.b) Calcule as probabilidades de cada resultado possível.10. (Binomial) A probabilidade de nascer um cão labrador cor chocolate no cruzamentode um labrador amarelo com um preto é de 1 em 8. Admita que uma fêmea amarelaficou prenha de um labrador preto e teve 8 filhotes:a) Defina o que será considerado um sucesso para calcular via binomial.b) Defina a variável X e os parâmetros "n" e "p".c) Qual a probabilidade que não nasça labrador chocolate?d) Qual a probabilidade de nascer no máximo dois labradores chocolate?e) Qual o número esperado de labradores chocolate. Utilize o seguinte resultado parafacilitar os cálculos: na binomial E(X) = n . p11. (Normal) A altura de meninos americanos adolescentes segue uma distribuiçãonormal com média de 1,70m e desvio-padrão de 12,2m. Você sabe tem um amigoamericano, com o qual se comunica pela Internet, e que é adolescente. Qual aprobabilidade desse rapaz ter mais de 1,80m?12. (Normal) A expectativa de vida na Índia é de 58 anos e em Bangladesh é de 53anos, segundo dados da ONU (1995). Admita que a expectativa de vida siga umadistribuição aproximadamente normal e que o desvio-padrão na Índia seja de 12 anos eem Bangladesh seja de 7 anos.a) Em qual país é mais provável de encontrarmos um habitante com mais de 65 anos?13. O que é mais provável: acertar na Mega-Sena jogando um único cartão ou acertartodas as questões da prova de Biologia do vestibular da UFRGS (30 questões, 5alternativas cada) chutando todas as respostas aleatoriamente e não permitindo que aresposta dada a uma questão influencie na outra...
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 57Cap 5 – Estimação por Ponto e por Intervalo14. Suponha que temos uma população composta de 10 animais, cujos valores deanticorpos de cada animal são os seguintes: Animal 1 2 3 4 5 6 7 8 9 10Anticorpos 1700 1500 1800 1600 1600 1800 1700 1900 1900 1500 a) Quais são os parâmetros média e desvio-padrão dessa população? b) Você só tem tempo de analisar 4 animais para estimar a média de anticorpos nessa população. Quantas possíveis amostras de 4 animais você pode obter a partir dessa população (amostragem sem reposição)? c) Como ficaria a distribuição das médias amostrais?15. O FBI quer investigar a verdadeira proporção de casos de ANTRAZ dentre os 450funcionários que trabalham no prédio dos Correios de Washington. Como oprocedimento de análise é caro e demorado, eles decidem trabalhar por amostragem. a) Quantas amostras de 30 funcionários poderiam ser obtidas nessa população (sem reposição)? b) Qual o comportamento probabilístico esperado das proporções amostrais p ? ˆ16. Você está estudando a concentração de coliformes fecais em determinada lagoa.Para isso define 10 pontos de amostragem com objetivo de estimar a concentraçãomédia da lagoa. Os valores encontrados em (ppm) foram os seguintes:12 15 32 14 25 28 25 12 14 16a) Estime por ponto a concentração média de coliformes fecais nessa lagoa.b) Estime por intervalo de confiança de 95% a concentração média (...)c) Interprete o intervalo17. Dizem que a proporção de homens fumantes é semelhante a proporção demulheres fumantes. Numa amostra de 240 mulheres, 35 se declararam fumantes,enquanto que dentre os 300 homens investigados, 54 eram fumantes.a) Calcule um IC de 95% para a proporção de homens fumantes.b) Calcule um IC de 95% para a proporção de mulheres fumantes.c) Interprete os resultados. Há chance das duas proporções de fumantes serem iguais?18. No exercício 14 retire uma amostra de tamanho 4 e construa um I.C. 95% para overdadeiro valor médio de anticorpos da população.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 5819. Suponha que no exercício 15, uma amostra de n=30 funcionários levou a estimativade 26,67% de casos positivos. a) Construa um I.C. 95% para a proporção de casos positivos. b) Qual o tamanho amostral necessário para estimarmos essa proporção com 5% e 3% de margem de erro, mantendo o nível de confiança em 95%.20. A Dra. Lizanka Marinheiro da FIOCRUZ-RJ estudou o comportamento da variável“Receptor de Estrogênio” em pacientes do sexo feminino sujeitas a dois diferentes tiposde tratamentos:1o) A base de Estrogênio e Progesterona;2o) A base de Estrogênio.As estatísticas descritivas para essa variável, após os dois tratamentos, encontram-se aseguir. Desvio- Tratamento n Média padrãoEstrogênio eProgesterona 19 12,37 32,85Estrogênio 31 15,77 15,25 a) Construa I.C. 95% para as médias do Receptor de Estrogênio nos dois grupos. b) Qual seria o tamanho amostral necessário para estimar a média de receptor de Estrogênio com margem de erro de apenas 5 unidades? c) Faça um gráfico que esboce a relação margem de erro versus tamanho amostral.Cap. 6 – Testes de Hipóteses21. Teste a hipótese de que no exercício 5 nós temos uma concentração média decoliformes fecais de 20 ppm na lagoa. Utilize um nível de significância bilateral de 5%.22. A tabela a seguir informa as estatísticas descritivas para a estatura (em cm) deadolescentes na faixa dos 15 a 16 anos, separadamente para o sexo masculino efeminino. Os dados fazem parte de um banco de dados real. Masculin Feminino o (n=79) (n=97)Mean (Média) 155,17 146,41Std. Deviation (Desvio- 16,81 14,34padrão)a) Faça um teste para comparação da altura média por sexo, utilizando um nível designificância de 10%.
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 5923. (Teste t para amostras emparelhadas) Foi realizado um experimento com 5 atletasonde foi solicitado que eles fizessem uma corrida de 100m sem a utilização deanabolizantes e numa outra ocasião com a utilização dos estimulantes. Compare osresultados pelo teste t ao nível de 5%.Atleta 1 2 3 4 5Sem anabol. 12,1 12,6 13,0 14,1 12,9Com anabol. 10,8 12,5 12,7 13,8 12,424. O EAT-26 é um teste para atitudes alimentares que indica padrão anormal dealimentação quando o escore ultrapassa 20 pontos. O Dr. Barros na revista Aletheia(1999) mostrou que, dentre os 367 adolescentes do sexo feminino, 92 apresentaramtranstornos alimentares, enquanto que dentre os 439 do sexo masculino, 24apresentaram. a) Realize um teste qui-quadrado ao nível de 1% e indique se existe diferença significativa entre os dois sexos. b) Você achou o tamanho amostral suficiente para fazer esse teste?25. Uma escala de auto-estima bastante utilizada em Psicologia é composta de 10 itens,cuja soma da pontuação obtida nesses itens indica nível de auto-estima da pessoanuma escala que vai de 10 (mínimo) até 50 (máximo).O TCC da aluna de psicologia Suzana de 1999 mostrou um comparativo entre doisgrupos de pessoas com problemas de alcoolismo: Tempo de Abstinência n Média D.P.Até 6 meses 44 23,86 5,07Mais de 6 meses 39 30,36 3,38a) Compare os grupos pelo teste t adotando um nível de significância de 1%.26. Para os dados da tabela abaixo, composta de 100 fumantes, realize um teste qui-quadrado. Os dados foram extraídos de Everitt (1992). Quantidade diária de cigarros Idade Mais de 40 Até 40 anos anos TotalMenos de 20 cigarros 50 15 6520 cigarros ou mais 10 25 35Total 60 40 100
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 6027. Estudantes de fisioterapia estão estudando a evolução da flexão de tronco com arealização de um dado tratamento. Ao todo, sete pacientes participaram do estudo e aflexão inicial e a final foram anotadas. Paciente 1 2 3 4 5 6 7Antes 45 60 40 42 60 55 47Depois 52 70 60 52 65 63 57a) O Tratamento é eficiente? Realize um teste t apropriado.28. Num estudo sobre o metabolismo do citrato no fígado foram tomadas amostras desangue da veia hepática de dez indivíduos normais e de indivíduos com uma certadeficiência, obtendo-se os seguintes resultados de citrato (em mg/ml). Indivíduos Indivíduos com normais deficiência Média 22,08 29,94Desvio-padrão 5,58 4,14Obs.: Dados fictíciosa) Compare os dois grupos ao nível de significância de 5%.29. Os dados a seguir indicam o Volume de Oxigênio por kg em dois grupos de jovens(asmáticos e não-asmáticos). Desvio- Grupo n Média padrãoNão Asmáticos 18 32,57 4,67Asmáticos 17 43,10 4,21 a) Os grupos diferem de acordo com o teste t ao nível de significância de 5%?30. O medicamento FULCIN 500mg diz ter essa quantidade da substância ativaGriseofulvina. Numa amostra de 100 comprimidos de FULCIN chegamos a uma médiade 470mg com um desvio-padrão de 45mg. a) Realize um teste t contra o valor de referência e tire a sua conclusão.Cap. 7 - Correlação e Regressão (?)31. Os dados a seguir apresentam o tempo que pedaços de tecido permaneceramembebidos numa determinada substância e o grau de absorção verificado.Tempo (s) 10 20 30 40 50Absorção 120 190 330 370 490
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 61 TABELA ZTabela: Probabilidades acumuladas associadas aos valores críticos (z) da distribuição normalreduzida z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,98172,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,99903,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,99933,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,99953,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,99973,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 62TABELA t
    • Bioestatística – Prof. Hélio Radke Bittencourt Pág. 63Bibliografia:Além deste material, os seguintes livros podem ser consultados.VIEIRA, Sonia. Introdução à Bioestatística. Editora Campus.LEVIN, Jack. Estatística Aplicada a Ciências Humanas. Editora Harbra.