Análise de regressão linear entre razão e teor de albumina
1. Scatterplot (Albunima_Regressao_PPGEP 2v*26c)
TeorY = -1,4724+2,936*x
0,47
0,46
0,45
0,44
0,43
0,42
0,41
0,40
0,39
0,632 0,634 0,636 0,638 0,640 0,642 0,644 0,646 0,648 0,650 0,652
RazãoX
0,38
TeorY
1) Observa-se na figura que existe uma relação linear e positiva
entre X e Y, ou seja, quanto maior a razão X, maior o teor de
impureza Y.
Neste caso, qual o valor e a significãncia estatística do coeficiente
de correlação?
Correlations (Albunima_Regressao_PPGEP)
Marked correlations are significant at p < ,05000
(Casewise deletion of missing data)
Var. X &
Var. Y
Mean Std.Dv. r(X,Y) r² t p N Constant
dep: Y
Slope
dep: Y
Constant
dep: X
RazãoX
TeorY
0,642577 0,005508
0,414231 0,018799 0,860206 0,739955 8,263879 0,000000 26 -1,47240 2,936045 0,538181
2) Observando os resultados, pode-se dizer que o valor de rxy é
0,8602 e que esta correlação é positiva, forte e significativa (p
<0,05).
3) Existe uma equação de regressão que possa explicar o teor em
função da razão?
Analysis of Variance; DV: TeorY (Albunima_Regressao_PPGEP)
Effect
Sums of
Squares
df Mean
Squares
F p-level
Regress.
Residual
Total
0,006537 1 0,006537 68,29169 0,000000
0,002297 24 0,000096
0,008835
Analisando a significância do teste ANOVA, observa-se que ele foi
2. significativo (p<0,05), indicando que existe uma equação de regressão
que pode explicar o relacionamento entre estas duas variáveis.
4) Qual é esta equação?
Summary Statistics; DV: TeorY (Albunima_Regressao_PPGEP)
Statistic Value
Multiple R
Multiple R²
Adjusted R²
F(1,24)
p
Std.Err. of Estimate
0,86021
0,73995
0,72912
68,29169
0,00000
0,00978
Regression Summary for Dependent Variable: TeorY (Albunima_Regressao_PPGEP)
R= ,86020633 R²= ,73995493 Adjusted R²= ,72911972
F(1,24)=68,292 p<,00000 Std.Error of estimate: ,00978
N=26
Beta Std.Err.
of Beta
B Std.Err.
of B
t(24) p-level
Intercept
RazãoX
-1,47240 0,228307 -6,44923 0,000001
0,860206 0,104092 2,93605 0,355287 8,26388 0,000000
Teor = a + b Razão
Y = -1,472 + 2,936 X
Teor = -1,472 + 2,936 Razão, sendo os dois coeficientes, a e b,
significativos (p<0,05).
5) Como interpretar este resultado?
Esta equação indica que, em média, para cada aumento de uma unidade
na razão, o teor na albumina aumenta 2,936%.
Como a razão jamais assumirá valor zero no processo, o valor do
coeficiente a = -1,473 não tem interpretação.
Na prática, a equipe técnica pode concluir que deveria reduzir os
valores da razão utilizados na produção, com o objetivo de minimizar
o teor de Na20 ocluído na alumina.
6) Qual seria o valor estimado para o teor se a razão fosse 0,60?
Predicting Values for (Albunima_Regressao_PPGEP)
variable: TeorY
Variable
B-Weight Value B-Weight
* Value
RazãoX
Intercept
Predicted
-95,0%CL
+95,0%CL
2,936045 0,600000 1,76163
-1,47240
0,28922
0,25775
0,32069
O valor estimado do percentual de teor seria igual a 0,28922.
3. 7) Qual o valor do coeficiente de determinação R2?
Neste caso foi, aproximadamente igual a 74%, de acordo com a tabela
que aparce na questão 2.
Isto indica que 74% da variação nos valores do teor (Y) pode ser
explicada pela variável regressora (razão), segundo o modelo
ajustado.
8) Análise de resíduos:
Predicted & Residual Values (Albunima_Regressao_PPGEP)
Dependent variable: TeorY
Case No.
Observed
Value
Predicted
Value
Residual Standard
Pred. v.
Standard
Residual
Std.Err.
Pred.Val
Mahalanobis
Distance
Deleted
Residual
1234567891
0
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Minimum
Maximum
Mean
Median
0,430000 0,427217 0,002783 0,80308 0,28443 0,002480 0,644943 0,002974
0,420000 0,421345 -0,001345 0,43995 -0,13747 0,002103 0,193556 -0,001410
0,440000 0,436025 0,003975 1,34778 0,40625 0,003261 1,816521 0,004472
0,430000 0,412537 0,017463 -0,10475 1,78488 0,001930 0,010973 0,018170
0,420000 0,415473 0,004527 0,07682 0,46270 0,001925 0,005901 0,004709
0,460000 0,438961 0,021039 1,52935 2,15034 0,003555 2,338913 0,024239
0,430000 0,406665 0,023335 -0,46788 2,38506 0,002126 0,218915 0,024492
0,440000 0,438961 0,001039 1,52935 0,10616 0,003555 2,338913 0,001197
0,430000 0,430153 -0,000153 0,98465 -0,01565 0,002719 0,969536 -0,000166
0,420000 0,412537 0,007463 -0,10475 0,76279 0,001930 0,010973 0,007765
0,410000 0,415473 -0,005473 0,07682 -0,55938 0,001925 0,005901 -0,005693
0,410000 0,421345 -0,011345 0,43995 -1,15956 0,002103 0,193556 -0,011895
0,400000 0,403729 -0,003729 -0,64945 -0,38111 0,002301 0,421786 -0,003947
0,390000 0,386113 0,003888 -1,73885 0,39734 0,003906 3,023601 0,004625
0,400000 0,412537 -0,012537 -0,10475 -1,28138 0,001930 0,010973 -0,013044
0,420000 0,430153 -0,010153 0,98465 -1,03774 0,002719 0,969536 -0,011003
0,400000 0,403729 -0,003729 -0,64945 -0,38111 0,002301 0,421786 -0,003947
0,400000 0,400793 -0,000793 -0,83102 -0,08102 0,002515 0,690589 -0,000849
0,410000 0,409601 0,000399 -0,28632 0,04080 0,001999 0,081977 0,000417
0,390000 0,394921 -0,004921 -1,19415 -0,50293 0,003024 1,425995 -0,005440
0,390000 0,400793 -0,010793 -0,83102 -1,10311 0,002515 0,690589 -0,011556
0,420000 0,436025 -0,016025 1,34778 -1,63792 0,003261 1,816521 -0,018029
0,430000 0,433089 -0,003089 1,16622 -0,31574 0,002982 1,360062 -0,003405
0,400000 0,403729 -0,003729 -0,64945 -0,38111 0,002301 0,421786 -0,003947
0,390000 0,386113 0,003888 -1,73885 0,39734 0,003906 3,023601 0,004625
0,390000 0,391985 -0,001985 -1,37572 -0,20284 0,003306 1,892598 -0,002240
0,390000 0,386113 -0,016025 -1,73885 -1,63792 0,001925 0,005901 -0,018029
0,460000 0,438961 0,023335 1,52935 2,38506 0,003906 3,023601 0,024492
0,414231 0,414231 -0,000000 0,00000 -0,00000 0,002638 0,961538 0,000043
0,415000 0,412537 -0,001069 -0,10475 -0,10925 0,002498 0,667766 -0,001130
Considerando o gráfico a seguir, conclui-se que não existem
evidências de que os resíduos não atendam ao pressuposto de
normalidade, pelo fato de que todos os pontos se apresentam em torno
da linha vermelha.
4. Normal Probability Plot of Residuals
2,5
2,0
1,5
1,0
0,5
0,0
-0,5
-1,0
-1,5
-2,0
-0,020 -0,015 -0,010 -0,005 0,000 0,005 0,010 0,015 0,020 0,025
Residuals
-2,5
Expected Normal Value
Pela análise do gráfico a seguir (valores preditos versus resíduos),
não se observa que a variabilidade dos resíduos 'aumenta" "ou
"diminua", ou seja, conclui-se que os resíduos atendem ao pressuposto
de homocedasticidade.
Predicted vs. Residual Scores
Dependent variable: TeorY
0,025
0,020
0,015
0,010
0,005
0,000
-0,005
-0,010
-0,015
0,38 0,39 0,40 0,41 0,42 0,43 0,44 0,45
Predicted Values
-0,020
Residuals
95% confidence
Analisando-se os valores dos "resíduos padronizados" verifica-se dois
valores (obs. 6 e 7) maiores do que "2", indicando uma possível
presença de ouliers, considernado-se um intervalo (-2, +2). na
prática, as observações devem ser "confirmadas" ou "corrigidas", ou
ainda eliminadas da base de dados, quando houver certeza de que
resultaram de erro de registro, de medição ou cálculo.
5. Para verificar a independência dos resíduos, ou seja, verificar se
são descorrelacionados, procedeu-se ao teste de Durbin-Watson.
Comparando o valor calculado (0,968088) com o tabelado (dl=1,288; du=
1,454), para alpha=5%, n=25 e k=1, tem-se:
Decisão: [0; dl[ = [0; 1,288[, ou seja, rejeita-se Ho, concluindo-se
que há dependência entre os resíduos, não tendo sido atendido este
pressuposto.
Durbin-Watson d (Alunima_Regressao_PPGEP)
and serial correlation of residuals
Durbin-
Serial
Watson d
Corr.
Estimate 0,968088 0,514295
A presença de correlação pode ser devido à omissão de alguma variável
regressora e se esta variável puder ser identificada e incluída no
modelo, a autocorrelação provavelmente será eliminada.
Se isto não resolver, uma alternativa é adotar outro tipo de modelo
que incorpore a estrutura de autocorrelação, tipo um AR (1).