Aula 15b:Análise de regressão linear sem repetições (R, excel, calculadora)

Equipe de autores: Alcinei Mistico Azevedo; 

 Karla Sabrina Magalhães Andrade Padilha; 

Nermy Ribeiro Valadares;

Rafaela Pereira de Lima; 

Sabrina Maihave Barbosa Ramos.

Aula 15b: Análise de regressão linear sem repetições (R, excel, calculadora)

Nesta aula iremos verificar como podemos realizar a análise de regressão simples em experimentos sem repetição. Considere que em uma pesquisa foram amostradas 10 plantas de palma forrageira a fim de ajustar uma regressão a fim de se chegar na produtividade da planta (Kg) a partir de sua altura, chegando-se na tabela 1.

Primeiramente temos que ajustar o modelo, iremos testar inicialmente um modelo polinomial de primeiro grau (regressão linear) : yi=a+bxi+ei. Em que, yi corresponde aos valores observados, a é o intercepto, b é o coeficiente angular da reta, ei é o erro experimental. Para facilitar a estimativa desses coeficientes de regressão, podemos estimar os valores apresentados na tabela 2.

Substituindo os valores da tabela no estimador do coeficiente de regressão é o possível chegar a:

Após estimar o coeficiente angular da reta, é possível estimar o intercepto:

Para a análise de variância teremos as fontes de variação “Regressão” (Efeito linear), “Resíduo” e “Total”. Primeiramente, vamos estimar os graus de liberdade para cada fonte de variação. Se temos 2 coeficientes, o GL da regressão será 1. Para o total vamos considerar o número de observações menos 1 (10-1=9).  O GL do resíduo é obtido pela diferença entre o total e a regressão (9-1=8).

Para a soma de quadrado da regressão devemos considerar cada valor predito:

Para a soma de quadrado total devemos considerar todas as observações:

Já a soma de quadrado do resíduo obtemos por diferença (SQresíduo = SQtotal - SQreg). Com estes valores chegamos ao quadro da análise de variância (Tabela 4) e podemos fazer o teste de hipóteses.

Teste de hipótese

Ho: A regressão não é significativa (A variação dos valores preditos pelo modelo ajustado deve-se ao acaso)

Ha: A regressão é significativa (A variação dos valores preditos pelo modelo ajustado não se deve ao acaso)

 

Conclusão: Como o valor de Fcalc foi maior que Ftab, rejeita-se Ho. Logo, variação dos valores preditos pelo modelo ajustado não se deve ao acaso. Em outras palavras, o modelo ajustado consegue explicar as variações da variável resposta em função da variável independente.

 

Teste de hipótese para o intercepto

Ho: O intercepto não é significativo (a=0)

Ha: O intercepto é significativo (a≠0)

 

Primeiro precisamos encontrar a variância do intercepto, sendo que o denominador usado (n) refere-se ao número de repetições.  Usando aquela mesma tabela auxiliar podemos substituir os termos. Encontrando a variância do intercepto: 

Encontrando a t calculado

 

Teste de hipótese para o intercepto

Ho: O intercepto não é significativo (a=0)

Ha: O intercepto é significativo (a≠0)

Na tabela do teste t, verificamos o valor tabelado

T calculado: (tcalc(a)= -2.9976)

 

Conclusão: Como o valor de Ftab, foi menor Fcalc não rejeita-se Ho.

 

Teste de hipótese para o coeficiente angular

Ho: O coeficiente angular não é significativo (b=0)

Ha: O coeficiente angular é significativo (b≠0)

Encontrando a variância do coeficiente angular da reta

Na tabela do teste t, verificamos o valor tabelado (tcalc(a)=

 

Teste de hipótese para o coeficiente angular

Ho: O coeficiente angular não é significativo (b=0)

Ha: O coeficiente angular é significativo (b≠0)

Na tabela do teste t, verificamos o valor tabelado

T Calculado: (tcalc(a)=

 

Conclusão: Como o valor de Fcalc foi maior que Ftab, rejeita-se Ho.

 

Coeficiente de determinação (r²)

O coeficiente de determinação é uma medida que indica a qualidade do ajuste e pode variar entre 0 e 1, ou 0% e 100%, se multiplicado por 100. Em um experimento sem repetições ele pode ser estimado por:

Este valor indica que 82,16% da variação da produtividade pode ser explicada pela altura da planta. Quanto maior for esta estimativa, melhor foi o ajuste do modelo de regressão.