Your SlideShare is downloading. ×

12 correlação e regressão

1,351

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,351
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
29
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Correlação e Regressão LinearMede o grau de dependência entre duasvariáveis X e YCov(X,Y)=ECov(X,Y)= - . =Se X e Y são independentes, entãocov(X,Y) = 0.Coeficiente de correlação linear dePearson: = e = →
  • 2. Exemplo:Calcular o coeficiente r para os dados:Pessoa Altura (cm) Peso (kg) 1 174 73 2 161 66 3 170 64 4 180 94 5 182 79 6 164 72 7 156 62 8 168 64 9 176 90 10 175 81
  • 3. Testes do Coeficiente de Correlação : = : ≠Este teste pode ser feito através daestatística : = ,Exemplo:Verificar, ao nível de 5% de significância,se existe a correlação positiva entre aaltura e o peso das pessoas na populaçãodo exemplo anterior.
  • 4. Para testar valor não nulo de :Fisher sugere a transformação :£= Esta transformação faz com queos valores de £ tenham distribuiçãobastante próxima da normal com média:μ(£)= e σ(£)=Exemplo:Considerando o exemplo anterior, construirum intervalo de 95% de confiança para ocoeficiente de correlação populacionalentre a altura e o peso das pessoasconsideradas.
  • 5. Regressão Linear SimplesA linha teórica de regressão: .Os parâmetros e serão estimadosatravés dos pontos experimentaisfornecidos pela amostra, obtendo-se umareta estimativa na forma: = a + bx onde a é a estimativa doparâmetro e b, também conhecido comocoeficiente de regressão linear, é aestimativa do parâmetro . O símbolo éutilizado para uma conveniente distinçãodos valores dados pela reta estimativa, emrelação às ordenadas dos pontos amostrais
  • 6. Método de mínimos quadradosOs valores a e b que minimizam estaexpressão serão aqueles que anulam suasderivadas parciais =0 e =0 →→→
  • 7. Algumas vezes é interessante fazercodificações lineares nos valores dasvariáveis para simplificar os cálculos. Porexemplo, se fizermos as transformações e . Obteremos areta na forma →→ExemploObter a equação da reta de mínimos quadradospara os seguintes pontos experimentais:X 1 2 3 4 5 6 7 8Y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0Calcular o coeficiente de correlação linear.Reta passando pela origemO modelo é da forma: A reta estimativa será
  • 8. → → →→ →Exemplo :Se considerássemos que a reta deregressão devesse passar pela origem noexemplo anterior, o coeficiente seria:Funções linearizáveisExemplo:Teste de βH0 : orH1 : or , or , orPode-se demonstrar que: e , VariânciaResidual
  • 9. Como não conhecemos , usamos , → Teste de uma médiapopulacional com variância desconhecida→ usa-se a estatísticap/ →O mesmo vale para e →e o teste do fica: p/ →
  • 10. Exemplo do teste de βVerificar se podemos afirmar, ao nível de5% de significância, que a reta teórica doexemplo anterior tem uma inclinaçãosuperior a 10%. Caso afirmativo, construirum intervalo de confiança de 95% para ocoeficiente angular da reta real daregressão. Ainda, ao nível de 5% designificância, verificar se podemos eliminara possibilidade de a reta teórica passarpela origem.I.C. para eExemplo:Construir Intervalos de 95% de confiançapara o valor médio de y e para a previsão , quando , para exemplo anterior.
  • 11. Regressão PolinomialExemploAjustar a parábola de mínimos quadradosaos dados do exemplo anterior.Regressão Linear MultiplaExemploUma reação química foi realizada sob seispares de condições de pressão etemperatura. Em cada caso, foi medido otempo necessário para que a reação secompletasse. Os resultados obtidos foram:Condição Temp. Press. tempo 1 20 1,5 9,4 2 30 1,5 8,2 3 30 1,2 9,7 4 40 1,0 9,5
  • 12. 5 60 1,0 6,9 6 80 0,8 6,5Obter a equação da regressão linear dotempo em função da Temp. e Pressão.Correlação Linear MultiplaCoeficiente de Correlação Linear Multipla édefinida como:A Variância residual :É n-k-1 pois foram estimados k+1 variáveis.ExemploCalcular o coeficiente de correlação linearmúltipla de y em relação a e noexemplo anterior. Calcular também avariância residual em torno da regressão.Correlação Parcial
  • 13. Diferença entre manter constante ouignorar . ignora enquanto definida comocoeficiente de correlação parcial entre e com respeito aExemploAnalisar as correlações totais e parciais noexemplo anterior.Problema1)Oito alunos sorteados entre os dasegunda série de um curso de engenhariaobtiveram as seguintes notas nos examesde Cálculo e FísicaAluno 1 2 3 4 5 6 7 8Cálc 4,5 6,0 3,0 2,5 5,0 5,5 1,5 7,0Fis. 3,5 4,5 3,0 2,0 5,5 5,0 1,5 6,0
  • 14. Com base nestes dados, pode-se terpraticamente 99% de certeza de que osalunos mais bem preparados em Cálculotambém o sejam em Física?2) Dados os valores a seguir de t (horas detratamento térmico) e de R (resistência àtração de um aço em kg/mm2), a)pode-seafirmar, ao nível de 2% de significância,que R depende de t? b)Admitida umadependência linear, qual seria a equaçãoda reta de regressão de R em função de t?c)Construir intervalos de 90% de confiançapara o valor médio de R e para a previsãoR’, quando t=9.3)Um banco possui oito agências em certapraça. Desejando verificar a afirmação deque um maior número de funcionários levaa uma ineficiência maior no serviço, ogerente geral relacionou o número defuncionários por agencia (x) e a
  • 15. classificação das agências segundo suaeficiência dentre todas as agências dobanco (y). Ao nível de 5% de significância,qual a conclusão?x 9 15 12 12 13 20 22 17y 8 13 6 22 15 36 29 314)Numa determinada experiência, foramobtidos os seguintes pares de valores (x,y):a)escreva a equação da melhor reta deregressão de y em relação a x.b)verifique, ao nível de 5% de significância,se existe evidência suficiente a partir dosdados experimentais para contradizer ahipótese de que a reta de (a) é paralela àreta y = 1,5 – 0,45x.

×