• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Ipaee capitulo3 2
 

Ipaee capitulo3 2

on

  • 1,249 views

Material integrante do curso "Introdução ao Planejamento e Análise Estatística de Experimentos" - Prof. Pedro Ferreira Filho e Profa. Estela Maris P. Bereta - UFSCar

Material integrante do curso "Introdução ao Planejamento e Análise Estatística de Experimentos" - Prof. Pedro Ferreira Filho e Profa. Estela Maris P. Bereta - UFSCar

Statistics

Views

Total Views
1,249
Views on SlideShare
1,249
Embed Views
0

Actions

Likes
2
Downloads
44
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Ipaee capitulo3 2 Ipaee capitulo3 2 Document Transcript

    • UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA DEPARTAMENTO DE ESTATÍSTICAINTRODUÇÃO AO PLANEJAMENTO E ANÁLISE ESTATÍSTICA DE EXPERIMENTOS CAPÍTULO # 3 INTRODUÇÃO A PROBABILIDADE E A INFERÊNCIA ESTATÍSTICA PARTE # 2 PROF. PEDRO FERREIRA FILHO PROFa. ESTELA MARIS P. BERETA 2º SEMESTRE DE 2010
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística3.4. INFERÊNCIA ESTATÍSTICA:3.4.1. INTRODUÇÃO: O campo da inferência estatística consiste naqueles métodos usados para tomar decisões outirar conclusões acerca de uma população. Esses métodos utilizam a informação contida em umaamostra da população para tirar conclusões. Mostramos na Fig. 3.10 a relação entre uma populaçãoe uma amostra. Este ponto inicia nosso estudo dos métodos estatísticos usados para a inferência e atomada de decisões. Figura 3.10. Relação entre uma população e uma amostra Inferência estatística pode ser dividida em duas grandes áreas: estimação de parâmetros e testede hipóteses. Como um exemplo de um problema de estimação de parâmetros, suponha que umengenheiro de estruturas esteja analisando a resistência a tensão de um componente usado em umchassi de automóvel. Uma vez que a variabilidade da resistência à tração esta naturalmente presenteentre componentes individuais, devido às diferenças nas bateladas da matéria-prima nos processosde fabricação e nos procedimentos de medidas (por exemplo), o engenheiro está interessado naestimação da resistência média a tração dos componentes. Na pratica, o engenheiro usara dados daamostra para calcular um número que e, de algum modo, um valor razoável (ou tentativa) da médiaverdadeira. Esse número é chamado de estimativa. Veremos que e possível estabelecer a precisão daestimativa.Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 2
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Considere agora uma situação em que duas temperaturas diferentes de reação, como t1 e t2possam ser usadas em um processo químico. O engenheiro conjectura que t1 resulta em rendimentosmaiores que t2 o teste estatístico de hipóteses e a estrutura para resolver problemas desse tipo.Nesse caso, a hipótese seria que o rendimento médio usando a temperatura t1 é maior que orendimento médio usando a temperatura t2. Note que não há ênfase na estimação de rendimentos;em vez disso, o foco esta na tirada de conclusões acerca de uma hipótese estabelecida.3.4.2. DEFINIÇÕES E PROPRIEDADES BÁSICAS: Na maioria dos problemas de inferência estatística, é impossível ou impraticável observar apopulação inteira. Por exemplo, não poderíamos testar à resistência a tração de todos os elementosestruturais dos chassis, pois consumiria muito tempo e seria muito caro. Além disso, alguns (talvezmuitos) desses elementos estruturais não existam mais no tempo em que a decisão deve ser feita;assim, para uma larga extensão, temos de visualizar a população como conceitual. Logo,dependemos de um conjunto de observações da população para ajudar a tomar decisões à cerca dapopulação. Para que nossas inferências sejam validas, a amostra tem que ser representativa dapopulação. É freqüentemente tentador selecionar uma amostra com as observações que sejam maisconvenientes ou exercer julgamento na seleção da amostra. Esses procedimentos podemfreqüentemente introduzir alguma tendência na amostra e, como resultado, o parâmetro de interesseserá consistentemente subestimado (ou superestimado) por tal amostra. Alem disso, ocomportamento de uma amostra de julgamento não pode ser estatisticamente descrito. Para evitaressas dificuldades, é desejável selecionar uma amostra aleatória como o resultado de algummecanismo de chance. Conseqüentemente, a seleção de uma amostra e um experimento aleatório ecada observação na amostra e o valor observado de uma variável aleatória. As observações napopulação determinam a distribuição de probabilidades da variável aleatória. Para definir uma amostra aleatória, faça X ser uma variável aleatória que represente o resultadode uma seleção de uma observação proveniente da população. Faça f(x) denotar a função densidadede probabilidade de X Suponha que cada observação na amostra seja obtida independentemente,sob condições inalteradas. Ou seja, as observações para a amostra são obtidas, observando-se Xindependentemente, sob condições inalteradas, isto é, n vezes. Faça X denotar a variável aleatóriaque representa a i-ésima replica. Então, X1, X2, ..., Xn é uma amostra aleatória e os valores numéricosobtidos são denotados por x1, x2,...,xn. As variáveis aleatórias em uma amostra aleatória sãoindependentes, com a mesma distribuição de probabilidades f(x), por causa das condições idênticassob as quais cada observação é obtida. Isto é, a função densidade de probabilidade marginal de X1,Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 3
    • Capítulo 3 – Introdução a Probabilidade e a Inferência EstatísticaX2, ...,Xn e fx1,x2,...,xn(x1, x2,...,xn), respectivamente, e pela independência, a função densidade deprobabilidade conjunta da amostra aleatória é f(x1)f(x2)...f(xn).Definição 1: As variáveis aleatórias (X1,X2,...,Xn) são uma amostra aleatória de tamanho n, se: (a)os X’s são variáveis aleatórias independentes (b) todos os Xi’s tiverem a mesma distribuição deprobabilidade. Para ilustrar essa definição, suponha que estejamos investigando a vida efetiva de serviço de umcomponente eletrônico usado em um marca-passo cardíaco e que a vida do componente sejanormalmente distribuída. Então, esperaríamos que cada uma das observações da vida docomponente Xl, X2, ..., Xn em uma amostra aleatória de n componentes fosse uma variável aleatóriaindependente com, exatamente, a mesma distribuição normal. Depois dos dados serem coletados, osvalores numéricos dos tempos de vida observados são denotados por x1,x2,...,xn. A finalidade principal de tomar uma amostra aleatória e obter informação sobre osparâmetros desconhecidos da população.Definição 2: Uma estatística é qualquer função das observações de uma amostra aleatória. Encontramos estatísticas anteriormente. Por exemplo, se X1, X2, ...,Xn. for uma amostra aleatóriade tamanho n, então a média da amostra X , a variância da amostra S2 e o desvio-padrão S daamostra são estatísticas. O processo de tirar conclusões sobre a população, baseando-se nos dadosda amostra, faz uso considerável dessas estatísticas. Desde que uma estatística seja uma variável aleatória, ela terá uma distribuição de probabilidades.Chamamos a distribuição de probabilidades de uma estatística de distribuição amostral. A noção deuma distribuição amostral é muito importante e será discutida e ilustrada mais adiante neste capitulo. Uma aplicação muito importante de estatísticas e a obtenção das estimativas dos parâmetros, taiscomo a media da população e a variância da população. Em problemas de inferência, é convenienteter um símbolo geral para representar o parâmetro de interesse. Usaremos o símbolo grego θ (teta)para representar o parâmetro. O objetivo da estimação e selecionar um único número baseado nosdados da amostra, sendo esse o valor mais plausível para θ. Um valor numérico de uma estatísticaamostra será usado como a estimativa.Definição 3: Uma estimativa pontual de algum parâmetro θ da população é um único valornumérico de uma estatística θ . ˆIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 4
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Como um exemplo, suponha que a variável aleatória X seja normalmente distribuída com umamédia desconhecida µ. A média da amostra é um estimador da média desconhecida µ da população.Isto é µ = X . Depois de a amostra ter sido selecionada, o valor numérico x e a estimativa de ˆ µ.Assim, se x1 = 25, x2 = 30, x3 = 29 e x4 = 31, então a estimativa de µé 25 + 30 + 29 + 31 X = = 28.75 4Similarmente, se a variância da população σ2 for também desconhecida, um estimador para σ2será a variância da amostra S2 e o valor numérico s2 = 6.9, calculado a partir dos dados amostrais,é chamado de estimativa de σ2. Problemas de estimação ocorrem freqüentemente em engenharia. Geralmente, necessitamosestimar: • A média µ de uma única população; • A variância σ2 (ou desvio-padrão σ) de uma única população; • A proporção p de itens em uma população que pertence a uma classe de interesse;. • A diferença nas médias de duas populações, µ1 - µ2;. • A diferença nas proporções de duas populações, p1 – p2; Estimativas razoáveis desses parâmetros são dadas a seguir: • Para µ, a estimativa é µ = x , a média da amostra. ˆ • Para σ2 a estimativa é σ 2 = s 2 a variância da amostra. ˆ • Para p, a estimativa é p 2 = x ˆ n a proporção da amostra, sendo x o numero de itens em uma amostra aleatória de tamanho n que pertence a classe de interesse. • Para µ1 - µ2, a estimativa é µ1 − µ 2 = x1 − x 2 ˆ ˆ a diferença entre as médias de duas amostras aleatórias independentes. • Para p1 – p2 a estimativa é p1 − p 2 , a diferença entre duas proporções amostrais, calculadas ˆ ˆ a partir de duas amostras aleatórias independentes. Podemos ter varias escolhas diferentes para o estimador pontual de um parâmetro. Porexemplo, se desejarmos estimar a média de uma população, podemos considerar comoIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 5
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticaestimadores a média ou a mediana da amostra ou talvez a média das observações menores emaiores da amostra. De modo a decidir qual estimador de um parâmetro particular é o melhorpara se usar, necessitamos examinar suas propriedades estatísticas e desenvolver algum critériopara comparar os estimadores. Os critérios para escolha do “melhor” estimador para um determinado parâmetro populacionalsão definidos a partir de “propriedades” desejáveis destes estimadores. As propriedades maisconsideradas são:Propriedade 1: Um estimador θ é não viciado (ou não tendencioso) para um parâmetro ˆpopulacional θ se: () Eθ =θ ˆ Essa propriedade diz que um estimador deve estar "perto", de algum modo, do valor ver-dadeiro do parâmetro desconhecido. Formalmente, dizemos que θ é um estimador não tendencioso ˆde θ, se o valor esperado de θ for igual a θ. Isso é equivalente a dizer que a média da distribuição ˆde probabilidades de θ (ou a media da distribuição amostral de θ) é igual a θ.Propriedade 2: Sejam θ1 e θ 2 dois estimadores não viciados de um parâmetro θ. θ1 é mais eficiente do ˆ ˆ ˆque θˆ2 se: Var( θ1 ) < Var( θ 2 ) ˆ ˆou seja, um estimador é mais eficiente quanto menor for a sua variância, ou ainda, quanto maispreciso (menor dispersão) ele for.Definição 4: Se considerarmos todos os estimadores não viciados de um parâmetro θ, aquele commenor variância será denominado de estimador não viciado de menor variância. A interpretação das propriedades acima pode ser observada a partir da seguinte situação: Deseja-se comprar um rifle, e após algumas seleções, restaram quatro alternativas quedenominamos de rifles A, B, C e D. Realiza-se um teste para cada um dos rifles que consistiu emfixá-lo num cavalete, mirar o centro de um alvo e disparar 15 tiros. Os resultados estão na figura3.11.Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 6
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Figura 3.11 Resultados de 15 tiros dados por 4 riflesQuestão: Qual o melhor rifle?Características:Rifle A: Não viciado com baixa precisão (grande dispersão ou variância);Rifle B: Viciado com baixa precisão;Rifle C: Não viciado com boa precisão;Rifle D: Viciado com alta precisão;3.4.3. MÉTODOS DE ESTIMAÇÃO: A forma de obtenção de um estimador para um dado parâmetro populacional, de preferênciacom as propriedades desejáveis, pode ser feita utilizando-se diferentes procedimentos chamados demétodos de estimação. Esses métodos não serão aqui apresentados e podem ser vistos, porexemplo, em Montgomery e Runger (ver bibliografia do curso). Destacamos que os principaismétodos de estimação são: • Métodos dos Momentos; • Método da Máxima Verossimilhança; • Método dos Mínimos Quadrados;Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 7
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística3.5. DISTRIBUIÇÕES AMOSTRAIS: A inferência estatística como vimos anteriormente, tem por objetivo tomar decisões acerca deuma população, baseando-se na informação contida em uma amostra aleatória proveniente daquelapopulação. Por exemplo, podemos estar interessados no volume médio de enchimento de uma latade refrigerante. O volume médio de enchimento na população e 300 ml. Um engenheiro considerauma amostra aleatória de 25 latas e calcula o volume médio amostral de enchimento como x = 298ml. 0 engenheiro decidirá, provavelmente, que a média da população é µ = 300 ml, muito embora amédia amostral tenha sido 298 ml, porque ele sabe que a média amostral é uma estimativa razoávelde µ e que com a média amostral de 298 ml é muito provável de ocorrer, mesmo se a médiaverdadeira da população for µ = 300 ml. De fato, se a média verdadeira for 300 ml, então os testesde 25 latas feitos repetidamente, talvez a cada 5 minutos, produzirão valores de x que variarãoacima e abaixo de µ = 300 ml. A média amostral e uma estatística; isto e, ela e uma variável aleatória que depende dosresultados obtidos em cada amostra particular. Uma vez que uma estatística e uma variável aleatória,ela tem uma distribuição de probabilidades.Definição: A distribuição de probabilidades de uma estatística e chamada de uma distribuiçãoamostral. Por exemplo, a distribuição de probabilidades de X é chamada de distribuiçãoamostral da média. A distribuição amostral de uma estatística depende da distribuição da população, do tamanhoda amostra e do método de seleção da amostra. A próxima seção deste capítulo apresenta talvez amais importante distribuição amostral. Outras distribuições amostrais e suas aplicações serãoilustradas quando necessárias (por exemplo, a distribuição amostral da variância amostral).3.5.1. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA:3.5.1.1. DISTRIBUIÇÃO AMOSTRAL PARA UMA MÉDIA: Considere a determinação da distribuição amostral da média X da amostra. Suponha queuma amostra aleatória de tamanho n seja retirada de uma população normal com média µ eIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 8
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticavariância σ2. Então, pela propriedade reprodutiva da distribuição normal, concluímos que a média da σ2amostra tem uma distribuição normal com média µ X = µ e variância σ X = 2 , ou seja, a ndistribuição da média da amostra tem como média o mesmo valor da média da populacional dacaracterística em estudo (estimador não viciado) e variância igual à variância populacional divididapelo tamanho da amostra.Notação: Se X i ~ N ( µ , σ 2 ) então X ~ N ( µ , σ 2 ) nObservação: Propriedade reprodutiva ⇒ Uma combinação linear de variáveis aleatórias normais étambém normal. Se estivermos amostrando de uma população que tenha uma distribuição desconhecida deprobabilidades, a distribuição amostral da média da amostra será aproximadamente normal, commédia µ e variância σ2/n, se o tamanho n da amostra for grande. Esse é um dos mais úteisteoremas em estatística, o chamado teorema central do limite.3.5.1.2. TEOREMA DO LIMITE CENTRAL: Se X1, X2 ,..., Xn representa uma amostra aleatória de tamanho n de uma variável Xcom média e variância finita σ2, obtida em uma população (finita ou infinita) e se X for amédia da amostra, então a forma limite da distribuição para n grande é dada por X − µ) Z= σ nInterpretação: O Teorema Central do Limite nos diz que, independente da distribuição quea característica em estudo pode ser representada, a medida que o tamanho da amostraaumenta, a distribuição amostral da média X pode ser representada pelo modelo normal. A qualidade da aproximação normal para X depende do tamanho n da amostra. AFig. 3.12(a) mostra a distribuição obtida para o arremesso de um único dado verdadeiro comseis faces. As probabilidades são iguais a (1/6) para todos os valores obtidos, 1,2,3,4,5 ou 6.A Fig. 3.12(b) mostra a distribuição das pontuações médias obtidas quando arremessandotrês, cinco e dez vezes o dado, respectivamente. Note que, embora a população (um dado)esteja relativamente longe da normal, a distribuição das medias será aproximadaIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 9
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticarazoavelmente bem pela distribuição normal, para amostras de tamanho tão pequenoquanto cinco. (As distribuições dos arremessos dos dados são discretas, enquanto a normale continua.) Embora o teorema central do limite trabalhe bem para pequenas amostras (n =4, 5) na maioria dos casos, particularmente onde a população seja continua, unimodal esimétrica, amostras maiores serão necessária em outras situações, dependendo da forma dapopulação. Em muitos casos de interesse prático, se n ~ 30, a aproximação normal serásatisfatória, independente da formal da população. Se n < 30, o teorema central do limitefuncionara, se a distribuição da população não for muito diferente da normal.Exemplo: Uma companhia eletrônica fabrica resistores que têm uma resistência média de 100Ω eum desvio padrão de 10Ω. A distribuição das resistências pode ser representada pelo modelo normal.Encontre a probabilidade de uma amostra aleatória de tamanho n = 25 resistores ter uma resistênciamédia menor que 95Ω?Solução:X = resistência dos resistores ⇒ X ~ N (100,10 2 )X = Média da amostra de n = 25 resistores⇒ X ~ N ( µ ,σ 2 2 ) ⇒ X ~ N (100,10 = 2) n 25Conseqüentemente a probabilidade desejada é dada por:  X − µ ) 95 − 100)  [ P X < 95 = P  ] <  = P[Z < −2.5] = 0.0062  σ 2   n Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 10
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Figura 3.12 Distribuição das pontuações médias obtidas quando arremessamos dadosIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 11
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística3.5.1.3. DISTRIBUIÇÃO AMOSTRAL PARA DIFERENÇA DE DUAS MÉDIAS:Agora consideremos o caso em que temos duas populações independentes. Faça a primeirapopulação ter uma média 1 e variância σ 12 e a segunda população ter uma média 2 e variânciaσ 2 . Suponha que ambas as populações possam ser representadas pelo modelo normal. Então, 2usando o fato de que combinações lineares de variáveis aleatórias normais têm distribuição normal,podemos dizer que a distribuição amostral de X 1 − X 2 é normal, com média µ X − X = µ X − µ X = µ1 − µ 2 1 2 1 2e variância σX 2 σX 2 σ 2 X1 − X 2 =σ 2 X1 +σ 2 X 21 = 1 + 2 n1 n2Portanto: σ 12 σ2 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2 Se as duas populações não forem normalmente distribuídas, porem se ambos os tamanhos daamostra n1 e n2 forem maiores que 30, podemos usar o teorema central do limite e considerar queX 1eX 2 sigam aproximadamente distribuições normais independentes. Por conseguinte, a distribuiçãoamostral de X 1 − X 2 é aproximadamente normal, com média e variância dadas acima. Se n1 ou n2forem menores que 30, então a distribuição amostral de X 1 − X 2 será aproximadamente normal,com média e variância dadas acima, desde que a população da qual a amostra e retirada não sejadrasticamente deferente da normal.Exemplo: A vida efetiva de um componente usado em um motor de uma turbina de um avião a jatoé uma variável aleatória, com media de 5.000 h e desvio-padrão de 40 h. A distribuição da vida efe-tiva é razoavelmente próxima da distribuição normal. 0 fabricante do motor introduz uma melhoriano processo de fabricação para esse componente, que aumenta a vida media para 5.050 h e diminuio desvio-padrão para 30 h. Suponha que uma amostra aleatória de n1= 16 componentes sejaselecionada do processo "antigo" e uma amostra aleatória de n2 = 25 componentes seja selecionadado processo "melhorado". Qual é a probabilidade de que a diferença nas duas médias amostraisX 2 − X 1 I seja no mínimo de 25 h? Considere que o processo antigo e o melhorado possam serconsiderados como populações independentes.Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 12
    • Capítulo 3 – Introdução a Probabilidade e a Inferência EstatísticaSolução:X1 = tempo de vida do processo antigo ⇒ X 1 ~ N (5000,40 2 )X2 = tempo de vida do processo melhorado ⇒ X 2 ~ N (5050,30 2 )Logo: 2 2X 1 ~ N (5000, 40 = 10) X 21 ~ N (5050, 30 = 6) 16 25e X 2 − X 1 ~ N (5050 − 5000,6 2 + 10 2 ) = N (50,136)Desta forma: 25 − 50) P[X 2 − X 1> 25] = P  Z >   = P[Z > −2.14] = 1 − P[Z < −2.14] = 1 − 0.001617 = 0.9838  136 3.6. INTERVALOS DE CONFIANÇA:3.6.1. INTRODUÇÃO: Em muitas situações, uma estimativa pontual de um parâmetro, como foi vista até omomento, não fornece informação completa para um engenheiro. Por exemplo, considere oproblema da condutividade térmica de ferro Armco. Usando uma temperatura de 100ºF e umapotência de 550w, 10 medidas foram observadas obtendo-se uma média amostral de x = 41.924 BTU/h.ft.oF. É improvável que a média verdadeira da condutividade térmica sejaexatamente igual a esse valor; assim, uma questão relevante aparece: quão próximo esta x damédia verdadeira? Calcular o erro-padrão da estimativa (desvio do estimador) é um guia aproximadopara a precisão da estimação. Outra abordagem é usar um intervalo de confiança para expressar ograu de incerteza associado com uma estimativa. Uma estimativa do intervalo de confiança de um parâmetro desconhecido θ é um intervalo daforma l ≤ θ ≤ s em que os pontos finais l e s dependem do valor numérico da estatística θ da ˆamostra para uma amostra particular. Uma vez que amostras diferentes produzirão valoresdiferentes de θ e , conseqüentemente, valores diferentes dos pontos finais l e s, esses pontos finais ˆsão valores de variáveis aleatórias, como L e S, respectivamente. Da distribuição amostral da mediaestatística e, seremos capazes de determinar valores de L e S, tal que a seguinte afirmação sobreprobabilidade seja verdadeira:Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 13
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística P[L≤θ≤S]=1-αsendo 0 < α < 1. Assim, temos uma probabilidade de 1 - α de selecionar uma amostra queproduzira um intervalo contendo o valor verdadeiro de θ. O intervalo resultante: l≤θ≤sé chamado de intervalo com 100(1 - α)% de confiança para o parâmetro θ . As grandezas l e s sãochamadas de limites inferior e superior de confiança, respectivamente, e (1 - α) é chamado decoeficiente de confiança. A interpretação de um intervalo de confiança é que se um número infinitode amostras aleatórias for calculado e um intervalo com 100(1 - α)% de confiança para θ forcalculado a partir de cada amostra, então 100(1 - α)% desses intervalos conterão o valor verdadeirode θ. A situação e ilustrada na Figura 3.13, que mostra vários intervalos com 100(1 - α)% deconfiança para o parâmetro θ de uma distribuição. Os pontos nos centros dos intervalos indicam aestimativa pontual de θ (ou seja, θ ). Note que um dos 25 intervalos não contém θ. Se esse fosse um ˆintervalo com 95%, no final das contas, somente 5% dos intervalos não conteriam θ. Figura 3.13. Construção repetida de um intervalo de confiança para θIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 14
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Agora, na prática, obtemos somente uma amostra aleatória e calculamos um intervalo deconfiança. Uma vez que esse intervalo conterá ou não o valor verdadeiro de θ, não é razoável fixarum nível de probabilidade a esse evento específico. A afirmação apropriada é: O intervalo observado[l, s] contém o valor verdadeiro de θ, com 100(1 - α) de confiança. Essa afirmação tem umainterpretação de freqüência; ou seja, não sabemos se a afirmação é verdadeira para essa amostraespecifica, mas o método usado para obter o intervalo [l, s] resulta em afirmações corretas em 100(1- α)% do tempo. O comprimento θ - l do intervalo observado de confiança é uma importante medida da qualidadeda informação obtida a partir da amostra. A metade do comprimento do intervalo θ - l ou s - θechamada de precisão do estimador. Quanto maior for o intervalo de confiança, mais confiantesestaremos de que o intervalo realmente contém o valor verdadeiro de θ. Por outro lado, quantomaior for o intervalo, menos informação teremos a respeito do valor verdadeiro de θ. Em umasituação ideal, gostaríamos de obter um intervalo relativamente pequeno com alta confiança. Em muitas situações práticas, é fácil encontrar os pontos finais que definem o intervalo deconfiança para um parâmetro. Por exemplo, os pontos finais para o intervalo de confiança para amédia µ de uma distribuição normal envolvem o erro-padrão da média amostral X . Na verdade, ointervalo de confiança para µ é encontrado adicionando e subtraindo um múltiplo do erro-padrãoσ ou do erro-padrao estimado S , para a média amostral. n n Intervalos de confiança estão intimamente relacionados à outra técnica estatística de tomada dedecisão, chamada de teste de hipóteses. As hipóteses são apenas afirmações sobre os parâmetrosdas distribuições de probabilidades. O objetivo é tomar decisões a respeito dessas afirmações.Freqüentemente, essas decisões podem ser tomadas examinando a faixa de valores razoáveis paraum parâmetro a partir de um intervalo de confiança. A seguir, discutiremos e ilustraremos teste dehipóteses relacionado à média populacional.3.6.2. INTERVALO DE CONFIANÇA PARA MÉDIA µ: A estimação pontual fixa um valor numérico que esteja satisfatoriamente próximo doverdadeiro valor do parâmetro. A estimação intervalar, como apresentado no tópico anterior,Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 15
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticadetermina intervalos com limites aleatórios, que contenham o valor do parâmetro, com uma margemde segurança prefixada. Vimos ainda que para uma amostra suficientemente grande, independente da distribuição dacaracterística em estudo, a distribuição das médias amostrais em torno da média populacional é σnormal com desvio padrão n (erro padrão (EP) da média). Quanto menor o valor de EP maispróximas estarão às médias amostrais da média populacional . Um estimador pontual com base em uma amostra especifica um único valor como estimativado parâmetro de interesse. Esse procedimento não permite julgar qual a possível magnitude do erroque estamos cometendo. A forma usual de se considerar conjuntamente o estimador e a precisãocom que se estima o parâmetro é através dos intervalos de confiança que são baseados nadistribuição amostral do estimador pontual. Qualquer intervalo de confiança tem duas partes: um intervalo calculado a partir dos dados e um de nível confiança de 100(1 - α)%. Um intervalo usualmente assume a seguinte forma: Estimativa Pontual ± margem de erro O nível (ou coeficiente) de confiança (100(1 - α)%) é a taxa de sucesso do método que produz o intervalo, ou ainda a cada n amostras (100(1 - α)%) irão conter o verdadeiro valor do parâmetro. Para toda estatística de interesse, é possível encontrar um intervalo de confiança da forma acima apresentada. Nesse curso, nos limitaremos a estudar o caso onde o interesse é o estudo da média da população.3.6.2.1. INTERVALO DE CONFIANÇA PARA MÉDIA µ COM VARIÂNCIACONHECIDA: Nossa primeira situação é aquela onde temos interesse em construir um intervalo deconfiança para a média µ, de uma característica que pode ser representada pelo modelo normal eque a variância deste modelo é conhecida (situação pouco usual em termos práticos!). Para estimar a média de uma população usamos a média X da amostra observada.Qualquer que seja a amostra coletada, no intervalo de confiança definiremos um “erro” observadoem torno do valor médio, este “erro” é dado por e = ( x − µ ) , ou seja, o desvio da média amostralIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 16
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticaem relação a verdadeira média populacional. Consideremos a variável aleatória “erro” dadapor ε = ( X − µ ) . Dividindo esta última expressão por σ n temos pelo Teorema Central do Limite que, ε ( X − µ) σ = σ ~ N (0;1) n nAssim, fixado um valor (100(1 - α)%) tal que 0 < α < 1, podemos encontrar um valor de Zα/2 talque P( ε < zα / 2 σ n ) = 1−αO índice de Zα/2 apresenta o valor α dividido por 2 uma vez que a “massa” α deve ser distribuídaigualmente em torno de 0. O valor de Zα/2 pode ser obtido da tabela da normal padrão. (100(1 - α)%) Podemos determinar a probabilidade de a estimativa pontual estar a uma determinadadistância da média verdadeira, ou seja, determinar a probabilidade de cometermos erros dedeterminada magnitude. Por exemplo, α = 5% ⇒ (1-α)=0.95 P( ε < zα / 2 σ n ) = 1−α P( ε < 1,96 σ n ) = 0,95 P( X − µ < 1,96 σ n ) = 0,95 P(−1,96 σ n < X − µ < 1,96 σ n ) = 0,95Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 17
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística P( X − 1,96 σ n < µ < X + 1,96 σ n ) = 0,95 Portanto, o intervalo de confiança para , com coeficiente de confiança (100(1 - α)%) é dadopor σ σ IC ( µ ; (1 - α %) = [ X − zα / 2 , X + zα / 2 ] n nValores para zα / 2 mais usuais:Nível de Confiança 90% 95% 99%Valor crítico: zα / 2 1.645 1.960 2.576Amplitude do intervalo: A amplitude do intervalo de confiança é dada pela diferença entre o extremo inferior esuperior, isto é, σ σ σ X + zα / 2 - ( X − zα / 2 ) = 2 zα / 2 n n n É usual se referir à semi-amplitude, como o erro envolvido na estimação.Exemplo 1: Um cientista descobriu que uma doença que afeta indivíduos de certa região estárelacionada com a concentração da substância A no sangue, sendo considerado doente todoindivíduo para o qual a concentração de A é menor que 1,488 mg/cm3. Com o intuito de conhecer aconcentração da substância A no sangue em indivíduos desta região afetados pela moléstia emestudo, o cientista avaliou um grupo 867 pessoas. Supondo que a concentração da substância A nosangue, em indivíduos com a doença em estudo, tem distribuição normal com média desconhecidae desvio padrão 0,4 mg/cm3 determine uma estimativa intervalar com 95% de confiança para o nívelmédio da concentração de substância, sabendo que para esta amostra de 867 pessoas obteve-sex =1,23.Determinação do tamanho da amostra: Este assunto pertence ao que na Estatística se denomina Teoria de Amostragem que não éobjeto deste curso, no entanto podemos calcular para algumas situações especiais, o tamanho daamostra necessário, como uma aplicação de intervalos de confiança. Se o objetivo é estimar a médiapodemos usar os intervalos anteriormente estabelecidos, para obter o tamanho da amostra. Para istoprecisamos fixar o maior erro da estimativa aceitável e o nível de confiança com o qual desejamosIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 18
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística σtrabalhar. À medida que n cresce o erro padrão da média , decresce. Conseqüentemente o nintervalo de confiança torna-se mais estreito. Com isto, a média é estimada com maior precisão. Em muitas situações, aumentar o tamanho da amostra implica em aumento de custo, porexemplo, tempo, recursos financeiros, etc. Tem-se desta forma um impasse entre precisão naestimativa de e o custo desta estimação. Idealmente, seria interessante analisarmos o problemasob o ponto de vista de estimar µ, com precisão desejada e de acordo com os recursos disponíveis.Entretanto, ignoraremos o fator custo e apenas consideraremos o problema de determinação dotamanho da amostra para uma precisão pré-estabelecida. Durante a fase do planejamento do experimento, o pesquisador pode estabelecer o errotolerável, e na estimação de . Esta margem de erro pode ser expressa como: e = (x − µ) Como já visto anteriormente o intervalo de confiança aleatório para é dado por: σ σ X − zα / 2 ≤ µ ≤ X + zα / 2 n n que pode ser reescrito como µ − X ≤ zα / 2 σ n (1) σ O fator zα / 2 n é na verdade a precisão usada na estimação de através de x . Observeque E = ( x − µ ) é a variável aleatória erro. Reescrevendo (1) como E ≤ zα / 2σ / n Igualando zα / 2σ / n ao erro e, pré-estabelecido pelo pesquisador, na pior das hipótesestemos: e = zα / 2σ / n Portanto, o tamanho mínimo necessário da amostra para estimar com precisão e, é dadopor:  z ∗σ  2 n=   e Sendo z* o valor crítico para o nível de confiança desejado.3.6.2.2. INTERVALO DE CONFIANÇA PARA MÉDIA µ COM VARIÂNCIADESCONHECIDA:Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 19
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Nas situações praticas é usual conhecermos o modelo probabilístico (usualmente o normal,nos problemas de Engenharia) associado à variável aleatória em estudo. Porém os parâmetros dessemodelo são desconhecidos na situação em estudo, portanto devem ser estimados a partir dos dadosda própria amostra. No caso do modelo normal, nessa situação tanto a média µ e a variância σ2 nãosão conhecidos e seus valores serão estimados pela média e variância amostral. Agora se a distribuição de X, variável em estudo é normal, então a média amostral X temdistribuição N(µ, σ2/n). Se σ2 é conhecido, como vimos no tópico anterior, um intervalo de confiançapara µ, é dado por [X ± z * σ n ] . Embora a situação de normalidade seja razoável em muitoscasos práticos, dificilmente se conhece a variância de uma população quando sua média édesconhecida. Quando σ2 é desconhecido, e a nossa amostra aleatória (X1,..., Xn) é constituída devariáveis aleatórias independentes com densidade normal de média e variância σ2, utilizamos o“melhor” estimador para σ2 que é por s2. Nesse caso, o intervalo de confiança é obtido utilizando-seuma nova estatística: X −µ T= Sx nsendo s o estimador do desvio padrão σ . Temos que T também é uma variável aleatória, masapesar de X ter distribuição normal, o denominador de T envolve a variável aleatória S2, que farácom que a função de densidade de T seja diferente da normal. Essa estatística tem distribuiçãoconhecida como t-Student com n-1 graus de liberdade, sendo n o tamanho da amostra. A forma dadistribuição t-Student é parecida com a da normal. É simétrica em relação a zero, mas apresentacaudas “grossas”, ou seja, maior variância do que a normal. Aumentando-se o tamanho de amostran, a distribuição t de Student aproxima-se do modelo normal. Pode-se observar, pela figura abaixo, que a distribuição t –Student é muito semelhante àcurva normal. À medida que aumentam os graus de liberdade, a distribuição t-Student aproxima-seda distribuição normal padronizada (média = 0, desvio-padrão = 1). A curva normal padronizada éum caso particular da distribuição t quando graus de liberdade tende ao infinito. Para os propósitospráticos, os valores da distribuição t-Student aproximam-se dos valores da distribuição normalpadronizada relativamente depressa, tal que quando graus de liberdade= 30 esses valores são quaseidênticos.Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 20
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Para cada valor de graus de liberdade temos uma distribuição diferente. O procedimento para a obtenção do intervalo é semelhante ao desenvolvido anteriormente.Utilizando a estatística, X −µ T= Sx ~ tn −1 nque nos permite construir o intervalo de confiança para µ. Para isto através da tabela da distribuiçãotn-1, obtemos um valor de t* tal que X −µ P ( −t * ≤ Sx ≤ t*) = (1 − α ) n Ou seja, P( - t*≤ tn-1 ≤ t*)= 1-α P( X − t * ≤ µ ≤ X +t* ) =1−α Sx Sx n nAssim, um intervalo de confiança para µ com nível de confiança de 100(1-α) % é dado por: IC ( µ ; (1 − α )) : [ X − t n −1, (α / 2) ; X + t n −1, (α / 2 ) Sx Sx n n ]tn −1, (α / 2 ) denota o percentil α/2 (que é equivalente ao percentil (1-(α/2) )da distribuição t-Student com n-1 graus de liberdade. Assim, o intervalo de confiança para µ é centrado na estimativaIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 21
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticado efeito, e varia de uma quantidade t * desvios padrão para baixo até o mesmo número de desviospadrão para cima. Exemplo 3: Em uma pesquisa para toxinas produzidas por um parasita que infecta as safras demilho, um bioquímico preparou extratos da cultura do parasita com solventes orgânicos e mediu aquantidade de substância tóxica por grama de solução. Para uma amostra de 9 culturas encontrouuma quantidade média de substância tóxica igual a 1,02 miligramas e um desvio padrão de 0,26miligramas. Seja µ a verdadeira quantidade média de substância tóxica. Construir um Intervalo de95% de confiança para µ.Observação: • Se variância σ2 for desconhecida e a variável não tem densidade normal, é necessário considerar um tamanho de amostra suficientemente grande. Pois, nesse caso, é sabido que S2 se aproxima de σ2 de tal forma que seu uso, juntamente com aplicação do Teorema Central do Limite, X −µ permite considerar X como tendo distribuição Normal. Conseqüentemente Sx ~ N (0,1) , e n um intervalo de confiança γ para é dado por: IC ( µ ; (1 − α )) : [ X − z(α / 2 ) ; X + z(α / 2 ) Sx Sx n n ]Exemplo 4: Para estimar o rendimento semanal de operários de construção de uma grande cidade,um sociólogo seleciona uma amostra aleatória de 75 operários. A média amostral é dada por x =427,00 reais e s= 15,00 reais. Determine um intervalo de confiança para µ considerando coeficientesde confiança 0,90 e 0,95.3.6.3. INTERVALO DE CONFIANÇA PARA DIFERENÇAS DEMÉDIAS:Engenheiros e cientistas estão freqüentemente interessados em comparar duas condições diferentes,com o objetivo de determinar se as mesmas produzem diferentes resultados na resposta que estasendo observada. Essas condições são chamadas na maioria das vezes de tratamentos.Consideremos a seguinte situação: Dois tratamentos são definidos por duas diferentes formulaçõesde tinta (formulação padrão e uma nova formulação) e a resposta é o tempo de secagem. O objetivodo estudo é determinar se a nova formulação resulta redução do tempo de secagem.Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 22
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Nesse caso, o objetivo do estudo passa pelo estudo das médias observadas em amostras deunidades de observação submetidas aos dois tratamentos em estudos (diferentes formulações, noexemplo). Uma das formas possíveis de analisar o comportamento de dois tratamentos é o estudo dadiferença de suas médias. A partir do valor estimado, a partir da amostra, podermos identificar quetratamento apresenta melhor desempenho na resposta de interesse. Portanto, para análise do problema utilizaremos a distribuição da estatística “diferença deduas médias” apresentada emLembrando:Se o primeiro tratamento tem uma media 1 e variância σ 12 e o segundo tratamento tem umamedia 2 e variância σ 2 . Supondo que ambas as populações possam ser representadas pelo 2modelo normal ou que as condições do Teorema Central do Limite são satisfeitas, podemos dizer quea distribuição amostral de X 1 − X 2 é normal, com media µ X − X = µ X − µ X = µ1 − µ 2 1 2 1 2e variância σX 2 σX 2 σ 2 X1 − X 2 =σ 2 X1 +σ 2 X 21 = 1 + 2 n1 n2Portanto: σ 12 σ2 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2 A distribuição amostral da diferença entre duas médias nos leva a considerar, para fins deobtenção de um intervalo de confiança, as seguintes situações: • Variâncias dos diferentes grupos (tratamentos) são conhecidas; • Variâncias dos diferentes grupos (tratamentos) são desconhecidas e portanto também precisam ser estimadas na amostra;Mas temos ainda que, para ambos os casos precisamos considerar se as variâncias são iguais oudiferentes nos diferentes tratamentos, surge ai também duas alternativas: • Variâncias Iguais;Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 23
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística • Variâncias Diferentes;3.6.3.1. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COMVARIÂNCIAS CONHECIDAS: Considerando o resultado acima apresentado: σ 12 σ2 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2e utilizando os mesmos procedimentos utilizados no caso de uma amostra, podemos facilmentemostrar que um intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dadopor:  σ 12 σ 2 2 σ 12 σ 2  2  X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 − z α / 2 +    n1 n2 n1 n2  ou seja:  σ 12 σ 2 2 σ 12 σ 2  2 P  X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 − z α / 2 +  = 1−α   n1 n2 n1 n2  Exemplo: Testes de resistência à tensão foram realizados em duas estruturas contendo dois teores dealumínio. Essas estruturas foram usadas na fabricação das asas de um avião comercial. Deexperiências passadas com o passado de fabricação dessas estruturas e com o procedimento detestes, os desvios-padrão das resistências a tensão são considerados conhecidos e dados por 1.0 nocaso da estrutura 1 e de 1.5 na estrutura 2. Uma amostra de 10 unidades da estrutura 1 resultaramem uma resistência a tensão média de 87.6 enquanto que uma amostra de 12 unidades da estrutura2 resultou em uma média de 74.5. Encontre um intervalo de confiança de 90% para a diferença dasmédias de resistência a tensão das duas estruturas.Solução: Seja:X1 = resistência a tensão na estrutura 1X2 = resistência a tensão na estrutura 2Considerando ainda que em ambos os casos a resistência a tensão pode ser representada por ummodelo normal, temos que:Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 24
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística σ 12 σ2 2 1 1 .5 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) ⇒ X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2 10 12e o intervalo de confiança é dado por:  σ 12 σ 2 2 σ 12 σ 2  2  X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 + zα / 2 + =   n1 n 2 n1 n2    1 1 .5 2 1 1 .5 2  87.6 − 74.5 − zα / 2 + ≤ µ1 − µ 2 ≤ 87.6 − 74.5 + zα / 2 + =   10 12 10 12    1 1 .5 2 1 1 .5 2  13.1 − 1.645 + ≤ µ1 − µ 2 ≤ 13.1 + 1.645 + =   10 12 10 12   [13.1 − 0.88 ≤ µ1 − µ 2 ≤ 13.1 + 0.88] = [12.22 ≤ µ1 − µ 2 ≤ 13.98]Questão: Qual o significado destes intervalos ser todo positivo?Observação:Se as variâncias dos diferentes tratamentos (grupos) além de conhecidas forem iguais, temos que:σ 12 = σ 2 = σ 2 então a expressão do intervalo de confiança fica simplificada da seguinte forma: 2  1 1 1 1   X 1 − X 2 − z α / 2σ + ≤ µ1 − µ 2 ≤ X 1 − X 2 − zα / 2σ +   n1 n 2 n1 n 2 3.6.3.2. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COMVARIÂNCIAS DESCONHECIDAS E IGUAIS: Nessa situação consideramos que a variância dos dois tratamentos em estudo sãodesconhecidos, logo devem também ser estimados pela amostra. Porém, embora desconhecidas,têm-se a informação que as variâncias dos dois tratamentos são iguais. Nesse caso temos:   σ 2 σ 2   1 1  X 1 − X 2 ~ N   µ1 − µ 2 ,  1 + 2   ⇒  X 1 − X 2 ~ N ( µ1 − µ 2 , σ 2  +    n  n n     1 n2        1 2 Problema:Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 25
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Considerando que as variância são desconhecidas, porém iguais e que é possível obter umaestimativa para variância amostral em cada um dos tratamentos, como estimamos, a partir dessesvalores, a variância que é igual para ambos os tratamentos?Consideremos: • uma amostra de tamanho n1 do tratamento 1 com variância estimada denotada por S12 ; • 2 uma amostra de tamanho n2 do tratamento 2 com variância estimada denotada por S 2 ;Parece ser razoável combinar as duas variâncias da amostras S12 e S 2 para se obter um estimador 2único para variância. Este estimador, denominado estimador combinado (pooled estimator) deσ2 é definido por: (n1 − 1) S12 + (n 2 − 1) S 2 2 Sp = 2 n1 + n 2 − 2conseqüentemente, pelos mesmos motivos expostos quando do estudo para a situação de uma únicamédia com variância desconhecida temos que      (X 1 − X 2 ) − (µ1 − µ 2 ) ~ t  n1 + n2 − 2  1 1   Sp +    n1 n2  e assim o intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dado por: 1 1 1 1  X 1 − X 2 − t n1 + n2 − 2,(α / 2 ) S p + ≤ µ1 − µ 2 ≤ X 1 − X 2 − t n1 + n2 − 2,(α / 2 ) S p +  n1 n2 n1 n2 Exemplo: As análises de dois lotes de carbono de cálcio mostraram as cinzas (%) indicadas na tabela aseguir. Construir um intervalo de confiança de 95% para à diferença de médias destes dois lotes. Amostras Lote 1 Lote 2 1 1.7 5.9 2 5.9 6.9 3 1.5 3.6 4 4.1 4.3 5 5.9 8.0 6 1.7 2.0 7 3.7 4.8Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 26
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 8 3.1 6.8 9 1.7 9.1 10 3.2 1.5 Média Amostral xi 3.25 5.29 Variância Amostral S i2 2.805 6.263Assim: (n1 − 1) S12 + (n 2 − 1) S 2 9 * 2.805 + 9 * 6.263 2 Sp = 2 = = 4.53 n1 + n 2 − 2 10 + 10 − 2e o intervalo de confiança é dado por: 1 1 1 1 3.25 − 5.29 − t18 (5%) 4.53 + ≤ µ1 − µ 2 ≤ 3.25 − 5.29 + t18 (5%) 4.53 +  10 10 10 10   1 1 1 1 = − 2.04 − 2.101 4.53 + ≤ µ1 − µ 2 ≤ −2.04 + 2.101 4.53 +   10 10 10 10 = [− 6.93 ≤ µ1 − µ 2 ≤ −2.85]Observação: Qual o significado do intervalo conter apenas valores negativos?3.6.3.3. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COMVARIÂNCIAS DESCONHECIDAS E DIFERENTES: Nessa situação temos que variância dos dois tratamentos em estudo são desconhecidas ediferentes e a estimativa da variância amostral de cada grupo será utilizada como estimador dasmesmas. • na amostra de tamanho n1 do tratamento 1, a variância estimada denotada por S12 será o estimador de σ 12 ; • 2 na amostra de tamanho n2 do tratamento 2, a variância estimada denotada por S 2 será o estimador de σ 2 ; 2Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 27
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Dessa forma, pelos mesmos motivos expostos quando do estudo para a situação de umaúnica média com variância desconhecida temos que     ( X 1 − X 2 ) − ( µ1 − µ 2 ) ~ t   1 1 v   Sp +    n1 n2  com v dado por: 2  S12 S 2  2 n +n    v=  1 2  −2 2 2 2  S12   S2    n       1  +  n2  n1 + 1 n2 + 1e assim o intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dado por: S12 S 2 2 S12 S 2  2 X 1 − X 2 − t v , (α / 2 ) + ≤ µ1 − µ 2 ≤ X 1 − X 2 − t v , ( α / 2 ) +  n1 n2 n1 n2  Exemplo: Refazer o exemplo anterior considerando variâncias diferentes.Variâncias Amostrais S12 = 2.805 S 2 = 6.263 2 2  S12 S 2  2  2.805 6.263  2  n +   +  n2  (0.2805 + 0.6263)2 − 2v =  12   10 10  −2= −2=  S1  2 2 2  S2   2.805  2  6.263  2 (0.2805)2 + (0.6263)2   n           1  +  n2   10  +  10  11 11 n1 + 1 n2 + 1 11 11 .82= − 2 = 14.4 .01 + .04eIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 28
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 2.805 6.263 2.805 6.263 3.25 − 5.29 − t14 (5%) + ≤ µ1 − µ 2 ≤ 3.25 − 5.29 + t14 (5%) +  10 10 10 10  [= − 2.04 − 2.145 .2805 + .6263 ≤ µ1 − µ 2 ≤ −2.04 + 2.145 .2805 + .6263 ]= [− 2.04 − 1.44 ≤ µ1 − µ 2 ≤ −2.04 + 1.44]= [− 3.48 ≤ µ1 − µ 2 ≤ −.60]Interpretação:Observações: • Em todas as situações, temos que as expressões apresentadas são simplificadas quando n1=n2. • Como identificar do ponto de vista estatístico se as variâncias dos dois grupos são iguais ou não? Veremos no próximo ponto.Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 29
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Anexo 1 t table with right tail probabilities dfp 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0005 1 0.324920 1.000000 3.077684 6.313752 12.70620 31.82052 63.65674 636.6192 2 0.288675 0.816497 1.885618 2.919986 4.30265 6.96456 9.92484 31.5991 3 0.276671 0.764892 1.637744 2.353363 3.18245 4.54070 5.84091 12.9240 4 0.270722 0.740697 1.533206 2.131847 2.77645 3.74695 4.60409 8.6103 5 0.267181 0.726687 1.475884 2.015048 2.57058 3.36493 4.03214 6.8688 6 0.264835 0.717558 1.439756 1.943180 2.44691 3.14267 3.70743 5.9588 7 0.263167 0.711142 1.414924 1.894579 2.36462 2.99795 3.49948 5.4079 8 0.261921 0.706387 1.396815 1.859548 2.30600 2.89646 3.35539 5.0413 9 0.260955 0.702722 1.383029 1.833113 2.26216 2.82144 3.24984 4.7809 10 0.260185 0.699812 1.372184 1.812461 2.22814 2.76377 3.16927 4.5869 11 0.259556 0.697445 1.363430 1.795885 2.20099 2.71808 3.10581 4.4370 12 0.259033 0.695483 1.356217 1.782288 2.17881 2.68100 3.05454 4.3178 13 0.258591 0.693829 1.350171 1.770933 2.16037 2.65031 3.01228 4.2208 14 0.258213 0.692417 1.345030 1.761310 2.14479 2.62449 2.97684 4.1405 15 0.257885 0.691197 1.340606 1.753050 2.13145 2.60248 2.94671 4.0728 16 0.257599 0.690132 1.336757 1.745884 2.11991 2.58349 2.92078 4.0150 17 0.257347 0.689195 1.333379 1.739607 2.10982 2.56693 2.89823 3.9651 18 0.257123 0.688364 1.330391 1.734064 2.10092 2.55238 2.87844 3.9216 19 0.256923 0.687621 1.327728 1.729133 2.09302 2.53948 2.86093 3.8834 20 0.256743 0.686954 1.325341 1.724718 2.08596 2.52798 2.84534 3.8495 21 0.256580 0.686352 1.323188 1.720743 2.07961 2.51765 2.83136 3.8193 22 0.256432 0.685805 1.321237 1.717144 2.07387 2.50832 2.81876 3.7921 23 0.256297 0.685306 1.319460 1.713872 2.06866 2.49987 2.80734 3.7676 24 0.256173 0.684850 1.317836 1.710882 2.06390 2.49216 2.79694 3.7454 25 0.256060 0.684430 1.316345 1.708141 2.05954 2.48511 2.78744 3.7251 26 0.255955 0.684043 1.314972 1.705618 2.05553 2.47863 2.77871 3.7066 27 0.255858 0.683685 1.313703 1.703288 2.05183 2.47266 2.77068 3.6896 28 0.255768 0.683353 1.312527 1.701131 2.04841 2.46714 2.76326 3.6739 29 0.255684 0.683044 1.311434 1.699127 2.04523 2.46202 2.75639 3.6594 30 0.255605 0.682756 1.310415 1.697261 2.04227 2.45726 2.75000 3.6460 inf 0.253347 0.674490 1.281552 1.644854 1.95996 2.32635 2.57583 3.2905Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 30
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística3.7. TESTE DE HIPÓTESES:3.7.1. INTRODUÇÃO: Inferir significa tirar uma conclusão. A inferência estatística oferece-nos métodos paratirarmos conclusões para a população a partir dos dados amostrais disponíveis, conclusões estas quedevem levar em conta a variabilidade natural dos dados. Na verdade, nos tópicos anteriores jáestabelecemos algumas formas de se obter conclusões a partir dos dados amostrais. O que será novoa partir de agora é que recorremos à probabilidade para descrever a variação que se produz peloacaso. Definimos anteriormente que a inferência estatística pode ser realizada a partir da estimação(pontual e por intervalos) e através de testes de hipóteses. Na parte de estimação, vimos que osintervalos de confiança são um dos tipos mais comuns de inferência estatística. Eles são apropriadosquando nosso objetivo é estimar um parâmetro populacional. Por outro lado, os testes de hipóteses,também chamados de testes de significância, são direcionados a um objetivo diferente: avaliar aevidência fornecida pelos dados sobre alguma afirmação feita sobre a população. Especificamente, em problemas de Engenharia, muitos problemas exigem uma tomada dedecisão entre aceitar ou rejeitar uma afirmação a cerca de uma característica populacional. Aafirmação a ser investigada é denominada de hipótese e o procedimento de tomada de decisãosobre a hipótese é o que denominamos de teste de hipótese. Por exemplo, suponha que estamosinteressados na taxa de queima de um propelente sólido, usado para fornecer energia aos sistemasde escapamento de aeronaves. A taxa de queima é uma variável aleatória que pode ser descrita porum modelo de probabilidade. O interesse no problema consiste em verificar se a taxa média dequeima (parâmetro do modelo de probabilidade) é ou não equivalente a 50 cm/s. Os testes de hipóteses é um dos aspectos mais úteis da inferência estatística, uma vez quemuitos tipos de problemas de tomada de decisão, teste ou experimentos, no mundo da engenharia,podem ser formulados como um problema desse tipo. Podemos considerar o teste estatístico dehipóteses como o estágio da análise de dados de um experimento comparativo, em que oengenheiro, como no exemplo acima, deseja comparar a média de uma população a dado valorespecifico de interesse no problema. Esses experimentos comparativos simples são freqüentementeencontrados na prática e fornecem uma boa base para problemas mais complexos deplanejamento de experimentos que serão discutidos as seguir. Considerando que os métodos de inferência baseiam-se nas distribuições amostrais, elesrequerem um modelo probabilístico para os dados. Modelos probabilísticos confiáveis podemaparecer de muitas maneiras, e a segurança do modelo e a confiabilidade da inferência são máximasquando os dados são provenientes de um modelo apropriadamente aleatorizado. Quando utilizamosIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 31
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticaa inferência estatística estamos considerando os dados como se eles fossem provenientes de umaamostra aleatória ou de um experimento onde em alguma etapa de sua execução, houve uma formade atribuição ou sorteio aleatório. Caso isto não se verifique as nossas conclusões poderão ser objetode contestação. Um teste de significância é um procedimento formal para comparar dados observados comuma hipótese, cuja veracidade procura-se avaliar. A hipótese constitui-se em uma afirmação que sefaz sobre os parâmetros de uma população ou de um modelo. Os resultados de um teste sãoexpressos em termos de uma probabilidade que mede quão bem os dados e a hipótese concordamentre si.3.7.2. DEFINIÇÕES E CONCEITOS BÁSICOS:Definição 1: Em estatística, uma hipótese, é uma afirmativa sobre uma propriedade da população,ou ainda, uma afirmação sobre os parâmetros de uma ou mais populações.Definição 2: Um teste de hipótese (ou teste de significâncias), é um procedimento para severificar a veracidade ou não de uma hipótese estatística. Consideremos o exemplo da taxa de queima de um propeleno sólido, acima apresentado.Nesse problema a tomada de decisão significa concluir por uma das duas seguintes alternativas.H1 : A taxa média de queima do propeleno sólido é 50 cm/s.H2 : A taxa média de queima do propeleno sólido não é 50 cm/s. Sob ponto de vista estatístico, considerando que representa a taxa média de queimapopulacional, as hipóteses acima são definidas como.H0 : = 50 cm/sH1 : ≠ 50 cm/s A alternativa H1 ou Hipótese H0 é chamada de hipótese nula enquanto que a alternativa H2ou hipótese H1 é chamada de hipótese alternativa.Definição 3: A Hipótese Nula é a afirmativa de que o parâmetro populacional é igual a uma valorespecífico.Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 32
    • Capítulo 3 – Introdução a Probabilidade e a Inferência EstatísticaDefinição 4: A Hipótese Alternativa é a afirmativa de que o parâmetro populacional tem um valorque, de alguma forma, difere da hipótese nula. No exemplo, temos que a hipótese alternativa especifica valores de que podem ser maioresou menores que 50 cm/s, nessa situação dizemos que a hipótese alternativa é bilateral. Emdeterminadas situações, podemos desejar formular uma hipótese unilateral, ou seja, verificar se ovalor de é especificamente maior ou menor que o valor definido pela hipótese nula. No exemplo: H0 : = 50 cm/s ou H0 : = 50 cm/s H1 : > 50 cm/s H1 : < 50 cm/s O valor do parâmetro especificado da população na hipótese nula (50 cm/s, no exemplo), égeralmente definido a partir de uma das três maneiras: 1. Pode ser resultado de experiências passadas ou de conhecimento do processo ou mesmo de testes ou experimentos prévios; 2. O valor pode ser determinado, a partir de alguma teoria ou modelo relativo ao processo em estudo; 3. O valor de parâmetro da população resulta de considerações externas, tais como valor de projeto ou especificações de engenharia ou a partir de obrigações contratuais. A partir de um teste de hipóteses verificamos se os dados provenientes da amostra sãoconsistentes com a hipótese em estudo. A medida que os dados forem consistentes com a hipótese,concluiremos que a hipótese é verdadeira; no entanto se essa informação for inconsistente com ahipótese, concluiremos que a hipótese é falsa. Destacamos que a veracidade ou falsidade de umahipótese especifica nunca pode ser conhecida com certeza, exceto se toda população fosseobservada, o que é usualmente impossível na prática. A estrutura de problemas de testes de hipóteses será idêntica em todas as aplicações queiremos considerar. A hipótese nula é aquela que se deseja testar. A rejeição dessa hipótese leva aaceitação da hipótese alternativa. Testar a hipótese envolve considerar uma amostra aleatória,calcular uma estatística de teste a partir dos dados amostrais e, então a partir da estatística de testetomar uma decisão com respeito à hipótese nula.Definição 5: Uma estatística de teste é um valor calculado a partir dos dados amostrais e éusada para tomar a decisão sobre a rejeição ou não da hipótese nula. Para isso faz-se necessário aIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 33
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística comparação da estatística com um valor de referência a fim de ser possível a tomada de decisão de rejeição ou não da hipótese. Com o objetivo de ilustrar as definições e conceitos acima, considere o problema da taxa de queima do propelente, introduzido anteriormente. A hipótese nula e a taxa média de queima ser 50 cm/s; a alternativa é: essa taxa não é igual a 50 cm/s. Ou seja, desejamos testar H0 : = 50 cm/s H1 : ≠ 50 cm/s Suponha que uma amostra de n = 10 espécimes seja testada e que a taxa media de queima da amostra x seja observada. A média amostral é uma estimativa da media verdadeira da população. Um valor da media amostral x que caia próximo ao valor da hipótese de = 50 cm/s é uma evidência de que a media verdadeira é realmente 50 cm/s; isto é, tal evidencia suporta a hipótese nula Ho. Por outro lado, uma média amostral que seja consideravelmente diferente de 50 cm/s evidencia de que a hipótese alternativa H1 é valida. Assim, a média amostral é a estatística de teste nesse caso. A média amostral pode assumir muitos valores. Suponha que se 48,5 < x < 51,5, não rejeitaremos a hipótese nula Ho: = 50. Se x < 48,5 ou x > 51,5, rejeitaremos a hipótese nula em favor da hipótese alternativa H1: ≠ 50. Isso é ilustrado na Fig. 3.14. Os valores de x que forem menores do que 48,5 e maiores do que 51,5 constituem a região critica para o teste, enquanto todos os valores que estejam no intervalo 48,5 < x < 51,5 formam uma região para a qual falharemos em rejeitar a hipótese nula. Por convenção, ela geralmente e chamada de região de aceitação. O limite entre as regiões critica e a região de aceitação é chamada de valores críticos. Em nosso exemplo, os valores críticos são 48,5 e 51,5. E comum estabelecer conclusões relativas a hipótese nula Ho. Logo, rejeitaremos Ho em favor de H1 se a estatística de teste cair na região crítica e deixamos de rejeitar H0 caso contrário.Região Crítica 1 Região de não Rejeição de Ho Região Crítica 2 Figura 3.13 Critério de decisão no teste de H0 contra H1 Definição 6: Região crítica é definida pelo conjunto de valores para os quais a hipótese H0 é rejeitada. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 34
    • Capítulo 3 – Introdução a Probabilidade e a Inferência EstatísticaDefinição 7: Valor (ES) crítico (s) valor a partir do(s) qual(is) a hipótese H0 é rejeitada, ou seja,valores limites da região crítica. O procedimento de decisão acima estabelecido pode conduzir a uma de duas conclusõeserradas. Por exemplo, a verdadeira taxa media de queima do propelente poderia ser igual a 50cm/s. Entretanto, para os espécimes de propelente selecionados aleatoriamente que são testados,poderíamos observar um valor de estatística de teste x que caísse na região crítica.Rejeitaríamos então a hipótese nula Ho em favor da alternativa H1 quando, de fato, Ho seriarealmente verdadeira. Esse tipo de conclusão errada é chamado de erro tipo I.Definição 8: O erro tipo I é definido quando rejeitamos a hipótese Ho, quando ela é de fatoverdadeira. Agora, suponha que a taxa media de queima seja diferente de 50 cm/s, mesmo que a mediaamostral x caísse na região de aceitação. Nesse caso, não rejeitaríamos H0, isto é, falharíamos emrejeitar H0 quando ela de fato não é verdadeira. Esse tipo de conclusão errada é chamado de errotipo II.Definição 9: O erro tipo II é definido quando não rejeitamos a hipótese Ho, quando ela é de fatofalsa. Assim, testando qualquer hipótese estatística, quatro situações diferentes determinam se a decisãofinal esta correta ou errada. Essas situações técnicas estão apresentadas na Tabela 3.1. Tabela 3.1. Decisões em um teste de Hipóteses DECISÃO SITUAÇÃO NA POPULAÇÃO BASEADA NA H0 Verdadeira H0 Falsa AMOSTRA Não rejeitar H0 Decisão correta Erro Tipo II Rejeitar H0 Erro Tipo I Decisão corretaIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 35
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Pelo fato de a nossa decisão estar baseada em variáveis aleatórias, probabilidades podem serassociadas aos erros tipo I e tipo II da Tabela 3.1. A probabilidade de cometer o erro tipo I é,usualmente denotada pela letra grega α. Ou seja,α = P(erro tipo I) = P(rejeitar H0 quando H0 é verdadeira) Em algumas referências, a probabilidade do erro tipo I é chamada de nível de significância outamanho do teste. No exemplo da taxa de queima do propelente, um erro tipo I ocorrerá quando x > 51 ou x < 48 .5 para a taxa media de queima do propelente = 50 cm/s. Suponha que odesvio-padrao da taxa de queima seja σ = 2,5 cm/s e que a taxa de queima tenha uma distribuiçãopara a qual as condições do teorema central do limite se apliquem, de modo que a distribuição damedia amostral seja aproximadamente normal, com media = 50 e desvio-padrãoσ = 2 .5 = 0.79 . A probabilidade de cometer o erro tipo I (ou o nível de significância n 10de nosso teste) é igual à soma das áreas que foram sombreadas nas extremidades da distribuiçãonormal na figura 3.14. Figura 3.14. Região Crítica para o testeLembremos que o cálculo da área sombreada é dada por:α = P (X < 48 .5 ) + P (X > 51 .5 ) = P (Z < −1.90 ) + P (Z > 1.90 )= 2 P (Z < −1.90 ) = 2 * 0.028717 = 0.057434Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 36
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Isso significa que 5,76% de todas as amostras aleatórias conduziriam a rejeição da hipótese H0:= 50 cm/s, quando a verdadeira taxa media de queima fosse realmente 50 cm/s. Da inspeção da Fig. 3.14, notamos que podemos reduzir α alargando a região de aceitação. Porexemplo, se considerarmos os valores críticos 48 e 52, o valor de α será: α = P (X < 48 ) + P (X > 52 ) = P (Z < −2.53 ) + P (Z > 2.53 ) = 2 P (Z < −2.53 ) = 2 * 0.0057 = 0.0114 Poderíamos também reduzir α, aumentando o tamanho da amostra. Se n=16, entãoσ = 2 .5 = 0.625 e usando a região critica original da Fig. 3.14, encontramos n 16 α = P ( X < 48 .5 ) + P ( X > 51 .5 ) = P (Z < −2.40 ) + P (Z > 2.40 ) = 2 P (Z < −2.40 ) = 2 * 0.0082 = 0.0164 Na avaliação de um procedimento de teste de hipóteses também é importante examinar aprobabilidade de um erro tipo II, que denotaremos por β, isto é:β= P(erro tipo II)= P(não rejeitar Ho quando Ho é de fato falsa) O procedimento para calculo de β é análogo ao calculo de α, exceto que nesse caso faz-senecessário fixar diferentes valores de fora da região critica pré-estabelecida, considerando que amédia amostral ocorre dentro da região de não rejeição, por exemplo, podemos calcular βconsiderando =52. Nesse caso teríamos:β = P (não rejeitar H 0 dado que µ = 52 ) == P (48 .5 < X < 51 .5 / µ = 52 ) )= P (− 4.43 < Z < −0.63 )= 0.2643 Valores de α e β, calculados para diferentes regiões de aceitação, com diferentes tamanhosde amostra são apresentados na tabela 3.2.Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 37
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Tabela 3.2. Valores para α e β em diferentes situações Tamanho da α = Erro tipo β=Erro tipo II β=Erro tipo II Região não Rejeição Amostra I =52 =50.5 48 .5 < x < 51 .5 10 0.0576 0.2643 0.8923 48 < x < 52 10 0.0114 0.5000 0.9705 48 .5 < x < 51 .5 16 0.0164 0.2119 0.9445 48 < x < 52 16 0.0014 0.5000 0.9918 Os valores acima, bem como a discussão anterior nos apontam quatro importantes pontos aserem observados. • O tamanho da região critica, e conseqüentemente a probabilidade do erro tipo I, α, pode sempre ser reduzido através da seleção apropriada dos valores críticos; • Os erros tipo I e tipo II estão relacionados. Uma diminuição na probabilidade de um tipo de erro sempre resulta em um aumento da probabilidade do outro, desde que o tamanho da amostra n não varie; • Um aumento no tamanho da amostra reduzira, geralmente, α e β, desde que os valores críticos sejam mantidos constantes; • Quando a hipótese nula é falsa, β aumenta à medida que o valor do parâmetro se aproxima do valor usado na hipótese nula. O valor de β diminui à medida que aumenta a diferença entre a média verdadeira e o valor utilizado na hipótese. Usualmente o pesquisador controla a probabilidade a do erro tipo I quando ele ou ela seleciona osvalores críticos. Assim, geralmente é fácil para o analista estabelecer a probabilidade de erro tipo Iem (ou perto de) qualquer valor desejado. Uma vez que o analista pode controlar diretamente aprobabilidade de rejeitar erroneamente Ho, sempre pensamos na rejeição da hipótese nula Ho comouma conclusão forte. Por outro lado, a probabilidade β do erro tipo II não e constante, mas depende do valorverdadeiro do parâmetro. Ela depende também do tamanho da amostra que tenhamos selecionado.Pelo fato de a probabilidade β do erro tipo II ser uma função do tamanho da amostra e da extensãocom que a hipótese nula Ho e falsa, costumam-se pensar na aceitação de Ho como uma conclusãofraca, a menos que saibamos que β seja aceitavelmente pequena. Conseqüentemente, em vez dedizer "aceitamos Ho", preferimos a terminologia "falhamos em rejeitar Ho". Falhar em rejeitar H0,implica que não encontramos evidencia suficiente para rejeitar Ho, ou seja, para fazer uma afirmaçãoIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 38
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticaforte. Falhar em rejeitar H0, não significa necessariamente que haja uma alta probabilidade dc queHo seja verdadeira (isso pode significar simplesmente que mais dados são requeridos para atingiruma conclusão forte (isso pode ter implicações importantes para a formulação das hipóteses. Um importante conceito de que faremos uso e o do poder de um teste estatístico.Definição 10: O Poder de um teste estatístico é a probabilidade de rejeitar a hipótese nula H0,quando a hipótese alternativa é verdadeira. O poder do teste é calculado como 1 - β e pode ser interpretada como a probabilidade derejeitar corretamente uma hipótese nula falsa. Freqüentemente, comparamos testesestatísticos através da comparação de suas propriedades de poder Por exemplo, considere oproblema da taxa de queima de propelente, quando estamos testando Ho: = 50 cm/s contra H1:≠ 50 cm/s. Suponha que o valor verdadeiro da media seja = 52. Quando n = 10, encontramos queβ = 0,2643; assim, o poder deste teste é 1 - β ~ 1 - 0,2643 = 0.7357 quando ~ 52. O poder do teste é uma medida muito descritiva e concisa da sensibilidade de um testeestatístico em que por sensibilidade tendemos a habilidade do teste de detectar diferenças. Nessecaso. a sensibilidade do teste para detectar a diferença entre a taxa media de queima de 50 cm/s e52 cmls é 0.7357. Isto é, se a média verdadeira for realmente 52 cm/s esse teste rejeitarácorretamente Ho: = 50 e "detectara" essa diferença em 73.57% das vezes. Se esse valor de poderfor julgado como sendo muito baixo, o analista poderá aumentar tanto α como o tamanho daamostra n. 3.7.3. PROCEDIMENTO GERAL PARA UM TESTE DE HIPÓTESES: A seqüência de etapas necessárias para aplicação de um teste de hipóteses pode ser definidada seguinte forma:Procedimento Padrão: • Estabelecer as hipóteses nula (H0) e alternativa (H1) de interesse no problema; • Escolha um nível de significância α (Probabilidade de erro tipo I) para o problema; • Identifique a estatística apropriada às hipóteses estabelecidas inicialmente; • Definir a forma da região crítica, ou seja, valores para os quais a hipótese nula é rejeitada; • Calcule, a partir dos dados amostrais, o valor da estatística de teste;Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 39
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística • Decidir se H0 deve ser rejeitada ou não, ou seja, verificar se a estatística de teste acima calculada pertence ou não a região critica.Procedimento Alternativo: Uso do valor “p” (p-value) • Estabelecer as hipóteses nula (H0) e alternativa (H1) de interesse no problema; • Escolha um nível de significância α (Probabilidade de erro tipo I) para o problema; • Identifique a estatística apropriada às hipóteses estabelecidas inicialmente; • Definir a forma da região crítica, ou seja, valores para os quais a hipótese nula é rejeitada; • Calcule, a partir dos dados amostrais, o valor da estatística de teste e o seu respectivo valor p; • Decidir se H0 deve ser rejeitada ou não, ou seja, verificar se o valor p é menor ou maior que o nível de significância α. Se: Valor p < α ⇒ rejeitar H0 Valor p > α ⇒ não rejeitar H03.7.4. TESTE DE HIPÓTESES PARA MÉDIA COM VARIÂNCIADESCONHECIDA: O problema está restrito ao estudo de um único tratamento sobre o qual existe interesse emse verificar o grau de eficiência com respeito a uma dada medida de interesse. Em geral, problemasnesta situação têm por objetivo fazer inferência sobre uma característica especifica da população emestudo.EXEMPLO: Uma máquina produz peças cujo controle de qualidade é realizado com base no diâmetro dapeça. Para a peça ser considerada sob controle o diâmetro da mesma deve ser igual a µ0.Problema: Como verificar se a produção diária da peça pode ser considerada sob controle ou não?Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 40
    • Capítulo 3 – Introdução a Probabilidade e a Inferência EstatísticaSolução Usual: Observa-se uma amostra aleatória de n peças da produção diária registrando-se o valor dodiâmetro de cada uma. Com os dados observados é verificado se o diâmetro médio das peças podeser ou não considerado igual a µ0.ANÁLISE ESTATÍSTICA:Seja: X : medida de interesse – diâmetro da peça no exemplo; (X1, X2, ... , Xn) é uma amostra aleatória simples desta característica; ondição muitoimportante)Suposição Usual:X1, X2, ... , Xn ~ N (µ, σ2) µ A medida de interesse pode ser representada por um modelo normal com parâmetros µ eσ2.e a distribuição seja pequena.Consideremos: ∑ (X i − X ) 1 1 2 X= ∑ Xi S2 = α = erro tipo I n n−1No exemplo:Hipótese Nula: A produção diária de peças esta sob controle.Sob ponto de vista estatístico: O diâmetro médio das peças é igual a µ0.Ho : µ = µoPossíveis Alternativas:i) H1 : µ ≠ µo ( o diâmetro médio é diferente de µo – teste bilateral)ii) H1 : µ > µo (o diâmetro médio é maior que µo – teste unilateral)iii) Ho : µ < µo (o diâmetro médio é menor que µo – teste unilateral) Considerando σ2 desconhecido, a estatística de teste para H0 é dada por: X − µotc = ~ tn-1 S/ nlogo, rejeita-se Ho se:Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 41
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticai) | tc | > tn-1; α/2ii) tc > tn-1; αiii) tc < - tn-1; αALTERNATIVA: Associado a tc é possível determinar o “valor p” (nível mínimo de significância) dado por P[|t| > tc]. O valor p é a probabilidade, calculada sob a suposição de que H0 é verdadeira, de que aestatística de teste assumirá um valor que seja ao menos tão ou mais extremo do que o valorrealmente observado. Valores pequenos de P indicam uma forte evidência contra H0. Extremoaqui significa “distante do que seria de se esperar caso H0 fosse verdadeira”. As direções em que semede essa “distância do valor esperado” são determinadas pela hipótese alternativa H1. O cálculodos valores de P requer que se conheça a distribuição amostral da estatística de teste quando H0 éverdadeira. Uma maneira de avaliar se o valor P é pequeno o suficiente ao ponto de rejeitarmos H0 é fixarantecipadamente quanta evidência é necessária para se rejeitar H0. Esse nível decisivo é α. Se ovalor P for tão pequeno ou menor do que um valor especificado α, os dados são estatisticamentesignificantes ao nível de significância α. Assim rejeita-se H0 se:i) p-valor < αii) (p-valor)/2 < αiii) (p-valor)/2 < αCuidado: Verificar a forma que o software utilizado calcula o p-valor.Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 42
    • Capítulo 3 – Introdução a Probabilidade e a Inferência EstatísticaVantagem: Não é necessário o conhecimento do valor de referência tn-1;α/2, tn-1;α ou - tn-1;α. α α αOBSERVAÇÃO: Os valores de P são exatos se a distribuição populacional for normal, e nos demais casos, sãoaproximadamente corretos para grandes amostras (uso do TLC).Exemplo: A resistência do concreto a compressão esta sendo testada por um engenheiro civil. Foramtestados 12 corpos de prova com o objetivo de verificar se a resistência do concreto pode serconsiderada igual a 2250 psi. Os resultados obtidos nos 12 corpos foram:2216; 2237; 2249; 2204; 2225; 2301;2281;2263; 2318; 2255; 2275; 2295; a) Enuncie e teste a hipótese de interesse; a.1) Considere nível de significância α=5% a.2) Calcule o p valor para a estatística a.3) Qual a conclusão para a hipótese definida? b) Como ficaria a análise do item a) se o interesse for em verificar se a resistência do concretopode ser superior a 2250?3.7.5. TESTE DE HIPÓTESES PARA MÉDIA COM VARIÂNCIACONHECIDA: Neste caso, são validos todos os pressupostos apresentados no tópico anterior exceto que: Considerando σ2 conhecido, a estatística de teste para H0 é dada por: X − µoZc = ~Z onde Z ~N (0,1) S/ nlogo, rejeita-se Ho se:Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 43
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticai) | Zc | > Z α/2ii) Zc > Z αiii) Zc < - Zα3.7.6. TESTE DE HIPÓTESES PARA VARIÂNCIA: No problema de um tratamento usualmente estamos interessados em medir a eficiência domesmo segundo uma medida de interesse. Porém em várias situações, particularmente emproblemas de controle de qualidade, além de uma medida de eficiência do tratamento, existeinteresse no comportamento da variabilidade da medida de interesse. Nestes casos surge anecessidade de teste de hipóteses a cerca da variância da medida de interesse, ou seja: Ho : σ = σ2o σ ≠ σ 2 o   H1 :  σ > σ o 2 σ < σ 2   oA estatística de teste, neste caso é dada por:χ =2(n − 1)/S 2 ~ χ n −1 2 c 2 σosendo: ∑ ( X i − X )  1 n 2S2 =   n−1Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 44
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística χ n−1 = modelo quiquadrado 2 com n-1 graus de liberdadeFixando α Rejeita-se Ho sei) χ c2 > χ n −1; α / 2 ou χ c2 < χ 2 2 α n -1; 1− 2ii) χ c2 > χ n −1; α 2iii) χ c2 < χ n −1; 1- α 2 De forma análoga ao caso do teste de hipótese da média, podemos obter o p-valorassociado a χ c dado por P χ n −1 > χ c . 2 2 2 [ ]Exemplo: No exemplo anterior verifique se a variância da resistência do concreto é ou não superiora 34?3.7.7. TESTE DE HIPÓTESES PARA DIFERENÇA DE MÉDIAS: Comparar duas populações ou dois tratamentos é uma das situações mais comuns na práticaestatística. Uma pergunta que aparece freqüentemente em qualquer problema de experimentação éa seguinte: O tratamento (método) A é melhor (mais eficiente) que o tratamento (método) B? Sob ponto de vista estatístico, isto significa comparar dois tratamentos a partir de doisconjuntos de números resultantes das medidas obtidas da aplicação dos mesmos às unidadesexperimentais (objetos, indivíduos,...). Para comparar as respostas de dois tratamentos oupopulações pode-se usar planos de pares equiparados ou comparar amostras aleatórias selecionadasseparadamente de cada população ou tratamento, não tendo nenhuma equiparação das unidadesIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 45
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticadas duas amostras. Os procedimentos de inferência para dados de duas amostras e paresequiparados são diferentes.OBJETIVO: A investigação de interesse tem por objetivo a comparação do efeito produzido por doistratamentos (grupos, tratamentos, populações, ...). Consideremos o seguinte Exemplo: Dois diferentes métodos (tratamentos) são submetidosaleatoriamente a um grupo de unidade experimentais.Hipótese: Qual dos métodos é mais eficiente: B é mais eficiente que A?y1 = nota do método Ay2 = nota do método BHo : µA = µBH1 : µB > µAConsideremos os seguintes resultados: Tratamentos Estatísticas A B amostra ni 8 8 Média y 5.0 7.0 variância S2 4.0 1.71 Diferença da média = YB − Y A = 7 − 5 = 2 , ou seja, a média de B é 40% superior à de A.Uma primeira conclusão: B é mesmo superior a A !Seja:yij = observação i-ésimo tratamento para o j-ésimo indivíduo. i = 1,2; j = 1, ... , 8Suposição yi ~ N (µi, σ2i) (*). µProblema: Sob a suposição acima, nosso problema consiste na comparação de médias de duaspopulações normais, ou seja, para o problema acima temos:Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 46
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Variâncias são iguais ?3.7.7.1. TESTE DE HIPÓTESES PARA DUAS VARIÂNCIAS:Situações: σ 2 = σ 2  1 σ i2 conhecidos  2 2 σ 1 ≠ σ 2  2 σ 2 = σ 2  1 σ i2 desconhecidos  2 2 σ 1 ≠ σ 2  2 Suponha que temos duas amostras aleatórias independentes, de tamanhos n e m, selecionadas de duas populações normais com a mesma variância σ2. Indiquemos os estimadores de σ2 obtidos das amostras por S A e S B , respectivamente 2 2 Sejam U e V duas variáveis aleatórias independentes, cada uma com distribuição qui-quadrado, com n-1 e m-1 graus de liberdade, respectivamente, isto é, a v.a. U = (n − 1)/S2A ~ χ 2 e a v.a. V = (m − 1)/S2 B ~ χ m−1 2 2 n −1 σ σ2 U / (n − 1) S2 / σ 2 Então, a v.a. = 2 A ~ Fn−1;m−1 A V /(m − 1) S B / σ 2 B Suposições: • As duas populações são independentes.Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 47
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística • Cada uma das populações é normalmente distribuída. Esta suposição é importante porque os procedimentos para variância são muito sensíveis a distribuições não normais. A forma da distribuição é exatamente: Forma Geral da Distribuição F • É assimétrica; • Valores da distribuição F são positivos; • As distribuições F são umas famílias de distribuições com dois parâmetros. Os parâmetros são os números de graus de liberdade das variâncias amostrais no numerador e denominador da estatística F. Essa variável é usada no teste para variância apresentado a seguir. • Teste para igualdade de duas variâncias: H0 : σ A = σ B = σ 2 2 2 σ A ≠ σ B 2 2  2 H1 : σ A > σ B 2 σ 2 < σ 2  A BSob a suposição de H0 é verdadeira, isto é, σ A = σ B = σ 2 temos que a estatística de teste neste caso 2 2é dada por: 2 SAFc = 2 ~ Fn−1;m−1 SBFixando α, encontramos os pontos críticos (tabelado) para a distribuição F, assim rejeita-se Ho se:Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 48
    • Capítulo 3 – Introdução a Probabilidade e a Inferência EstatísticaFc > Fn−1;m −1;α / 2 ou Fc < Fn −1;m −1;(1−α ) 2 2 SAFc = 2 > Fn−1;m−1;α SB 2 SAFc = 2 < Fn−1;m−1;(1−α ) SBO intervalo de confiança é obtido a partir da expressão:P ( f1 ≤ Fn−1;m−1 ≤ f 2 ) = 1 − α S2 σ 2 P ( f1 ≤ 2 2 ~ ≤ f 2 ) = 1 − α A B SB σ A σB 2Assim, IC( ; 1-α ): σA 2 S2 S2 B B[ f1 2 ; 2 f 2 ] SA SATabelas de pontos críticos da F são mais difíceis de manejar, pois precisamos de uma tabelaseparada para diferentes valores de α. A tabela fornecida apresenta os pontos críticos p superioresdas distribuições F para p=0,10; 0,05; 0,025; 0,01 e 0,001Em geral, só temos tabelas da distribuição F correspondente à cauda à direita. Ou seja, não temosdisponível tabela que forneça F(12,6;0,90).Pode-se mostrar que F(n-1, m-1; α)= 1/ F( m-1,n-1; (1-α)). Assim, f1 =F(12,6;0,90)=1/F(6,12;0.10)Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 49
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística3.7.7.2. TESTE DE HIPÓTESES PARA DIFERENÇA DE MÉDIAS:Consideremos a situação em que os são σ i2 desconhecidos : a) σ2i = σ22 = σ2Fixado α = erro tipo I = Prob [ rej. H0/H0 é V], temos que a estatística de teste para:Ho : µA = µBH1 : µB ≠ µAé dada por: tc = (Y B − YA ) − (µ B − µ A ) 1 1 Sp + n1 n 2 S2 = (n1 − 1)S 1 + (n2 − 1)S 2 2 2 p n1 + n 2 − 2 ∑ ( yi − yi ) i= 1,2 1 2 Si2 = ni − 1Hipótese alternativa no caso geral,H1 : µB ≠ µAH1 : µB > µAH1 : µB < µAIntrodução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 50
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticatemos que a estatística de teste tc ~ tn1+n2-2, portanto, rejeita-se Ho se • i)| tc | > tn1+n2-2; α/2 • tc > tn1+n2-2; α • tc < - tn1+n2-2; αAlternativa: Cálculo do p-valor conforme apresentado anteriormente.Intervalo de confiança para a diferença µ B − µ AAssim, IC( µ B − µ A ; 1-α ): [( xB − x A ) − t *s p 1 n1 + n12 ; ( xB − x A ) + t *s p 1 n1 + n12 ] b) σ2i ≠ σ22 Nas situações onde a hipótese de igualdade das variâncias dos diferentes tratamentos érejeitada, temos que a estatística para se testar:Ho : µA = µBH1 : µA > µBé dada por: tc = (Y B − Y A ) − (µ B − µ A ) 2 2 S A SB + n1 n2 ∑ ( yi − yi ) 1 2 Si2 = ni − 1Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 51
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticaa diferença é que neste caso podemos mostrar que: tc ~ tv sendo: 2  S2 S2   A + B   n1 n2 v=   2 2 S2  S2   A   B   n1   n2    +  n1 − 1 n2 − 1Hipótese alternativa no caso geral,H1 : µB ≠ µAH1 : µB > µAH1 : µB < µAe rejeita-se Ho se • | tc | > tv; α/2 • tc > tv; α • tc < - tv; αRetornando ao exemplo 1: a) Teste de igualdade de variâncias: 2 SA 4Fc = = = 2.339 2 1.71 SB [ ] p − valor = 2 * (P F7 ,7 > 2.339 ) = 2 * 0.142 = 0.284logo: b) Teste de Igualdade de Médias:S2 = (n1 − 1)S 1 (n2 − 1)S 2 2 2 = 7 * (4 + 1.71) = 2.855 ⇒ S p = 1.689 p n1 + n 2 − 2 8+8−2Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 52
    • Capítulo 3 – Introdução a Probabilidade e a Inferência Estatísticatc = (YB − Y A ) − (µ B − µ A ) = 7−5 = 2.368 1 1 1 1 Sp + 1.689 + n1 n 2 8 8 p − valor = (P [t14 > 2.368]) = 0.0164Observação: Nos casos de variâncias conhecidas as estatísticas de teste são as mesmas substituindo-se S(estima da amostra) por σ (valor conhecido) e a distribuição de referência passa da t para a normal.Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 53