Equipe de autores: Alcinei Mistico Azevedo;
Karla Sabrina Magalhães Andrade Padilha;
Nermy Ribeiro Valadares;
Rafaela Pereira de Lima;
Sabrina Maihave Barbosa Ramos.
Aula 15b: Análise de regressão linear sem repetições (R, excel, calculadora)
Nesta aula iremos verificar como podemos realizar a análise de regressão simples em experimentos sem repetição. Considere que em uma pesquisa foram amostradas 10 plantas de palma forrageira a fim de ajustar uma regressão a fim de se chegar na produtividade da planta (Kg) a partir de sua altura, chegando-se na tabela 1.
Primeiramente temos que ajustar o modelo, iremos testar inicialmente um modelo polinomial de primeiro grau (regressão linear) : yi=a+bxi+ei. Em que, yi corresponde aos valores observados, a é o intercepto, b é o coeficiente angular da reta, ei é o erro experimental. Para facilitar a estimativa desses coeficientes de regressão, podemos estimar os valores apresentados na tabela 2.
Substituindo os valores da tabela no estimador do coeficiente de regressão é o possível chegar a:
Após estimar o coeficiente angular da reta, é possível estimar o intercepto:
Para a análise de variância teremos as fontes de variação “Regressão” (Efeito linear), “Resíduo” e “Total”. Primeiramente, vamos estimar os graus de liberdade para cada fonte de variação. Se temos 2 coeficientes, o GL da regressão será 1. Para o total vamos considerar o número de observações menos 1 (10-1=9). O GL do resíduo é obtido pela diferença entre o total e a regressão (9-1=8).
Para a soma de quadrado da regressão devemos considerar cada valor predito:
Para a soma de quadrado total devemos considerar todas as observações:
Já a soma de quadrado do resíduo obtemos por diferença (SQresíduo = SQtotal - SQreg). Com estes valores chegamos ao quadro da análise de variância (Tabela 4) e podemos fazer o teste de hipóteses.
Teste de hipótese
Ho: A regressão não é significativa (A variação dos valores preditos pelo modelo ajustado deve-se ao acaso)
Ha: A regressão é significativa (A variação dos valores preditos pelo modelo ajustado não se deve ao acaso)
Conclusão: Como o valor de Fcalc foi maior que Ftab, rejeita-se Ho. Logo, variação dos valores preditos pelo modelo ajustado não se deve ao acaso. Em outras palavras, o modelo ajustado consegue explicar as variações da variável resposta em função da variável independente.
Teste de hipótese para o intercepto
Ho: O intercepto não é significativo (a=0)
Ha: O intercepto é significativo (a≠0)
Primeiro precisamos encontrar a variância do intercepto, sendo que o denominador usado (n) refere-se ao número de repetições. Usando aquela mesma tabela auxiliar podemos substituir os termos. Encontrando a variância do intercepto:
Encontrando a t calculado
Teste de hipótese para o intercepto
Ho: O intercepto não é significativo (a=0)
Ha: O intercepto é significativo (a≠0)
Na tabela do teste t, verificamos o valor tabelado
T calculado: (tcalc(a)= -2.9976)
Conclusão: Como o valor de Ftab, foi menor Fcalc não rejeita-se Ho.
Teste de hipótese para o coeficiente angular
Ho: O coeficiente angular não é significativo (b=0)
Ha: O coeficiente angular é significativo (b≠0)
Encontrando a variância do coeficiente angular da reta
Na tabela do teste t, verificamos o valor tabelado (tcalc(a)=
Teste de hipótese para o coeficiente angular
Ho: O coeficiente angular não é significativo (b=0)
Ha: O coeficiente angular é significativo (b≠0)
Na tabela do teste t, verificamos o valor tabelado
T Calculado: (tcalc(a)=
Conclusão: Como o valor de Fcalc foi maior que Ftab, rejeita-se Ho.
Coeficiente de determinação (r²)
O coeficiente de determinação é uma medida que indica a qualidade do ajuste e pode variar entre 0 e 1, ou 0% e 100%, se multiplicado por 100. Em um experimento sem repetições ele pode ser estimado por:
Este valor indica que 82,16% da variação da produtividade pode ser explicada pela altura da planta. Quanto maior for esta estimativa, melhor foi o ajuste do modelo de regressão.