Aula 11b: Esquema fatorial (Conceitos, ANOVA, testes de médias e análise no R)

Equipe de autores: Alcinei Mistico Azevedo; 

 Karla Sabrina Magalhães Andrade Padilha; 

Nermy Ribeiro Valadares;

Rafaela Pereira de Lima; 

Sabrina Maihave Barbosa Ramos.


Aula 11b: Esquema fatorial (Conceitos, ANOVA, testes de médias e análise no R) 

O objetivo desta aula é abordar profundamente a respeito do esquema fatorial de forma a conceituá-lo, exemplificar sua aplicabilidade através de um exemplo composto por sua análise de variância e teste de médias além da rotina do R para esse caso.  

Os experimentos fatoriais são utilizados quando se tem dois ou mais tipos de tratamentos (fatores), e deseja estudar seus efeitos principais e suas interações. Não é considerado um delineamento experimental, mas sim um esquema de análise, podendo ser conduzido no delineamento inteiramente casualizado (DIC), delineamento em blocos casualizados (DBC), delineamento em quadrado latino etc. 

Neste esquema se estuda simultaneamente dois ou mais fatores, cada um deles com dois ou mais níveis. Nos esquemas fatoriais completos os tratamentos são constituídos por todas as combinações entre os níveis dos fatores estudados. Sua principal aplicação é quando se quer saber sobre o efeito de diversos fatores que influenciam na variável estudada e o relacionamento entre eles (interação). 

A análise de dados considerando o esquema fatorial apresenta várias vantagens, como possibilitar estudar os efeitos principais e saber se há interação entre esses fatores. Mas apresentam também desvantagens como o aumento rápido do número de tratamentos à medida que se aumenta o número de fatores ou o número de níveis dos fatores. E a dificuldade de interpretação quando se tem mais de dois fatores. 

Para o esquema fatorial teremos no modelo estatístico a média geral, o efeito do fator A, do fator B e de sua interação, além dos demais efeitos dos delineamentos estatísticos utilizados. Abaixo são apresentados os modelos estatísticos para o esquema fatorial em diferentes delineamentos estatísticos. 

DIC:   Yijk = µ + αi + βj + γij + eijk 

DBC: Yijk = µ + αi + βj + γij + bk + eijk 

DQL:  Yijlm = µ + αi + βj + γij + ll + cm + eijlm 

Onde: Yijk refere-se ao valor observado na parcela que recebeu o nível i do fator A, nível j do fator b na repetição/bloco k. Yijlm refere-se ao valor observado na parcela que recebeu o nível i do fator A, nível j do fator B na linha l e coluna m. αi é o efeito do nível i do fator A; βj é o efeito do nível j no fator B; γij é o efeito da interação entre os níveis dos fatores A e B; bk é o efeito do bloco k; ll é o efeito da linha l; cm é o efeito da coluna m;  eijk é o erro experimental associado à parcela que recebeu o nível i do fator A, nível j do fator b na repetição/bloco k; E, eijlm é o efeito do erro experimental associado à parcela que recebeu o nível i do fator A, nível j do fator b na linha l e coluna m. 

Imagine, como exemplo prático, um experimento em que se avaliou o número de insetos em 3 cultivares de tomate com dois manejos de desbrota, conduzido no delineamento inteiramente casualizado, com 4 repetições. A tabela abaixo (Tabela 1) apresenta o número de insetos observados em cada tratamento. 

Tabela 1: Dados experimentais (simulados) de um experimento avaliando-se cultivares e manejos sobre o número de insetos na cultura do tomate. 

A partir dos dados supracitados podemos efetuar uma análise de variância. Para fins didáticos, vamos imaginar inicialmente a ANOVA do DIC. Nela temos como fonte de variação os “Tratamentos”,”Resíduo” e Total. Como temos um fatorial 3x2 temos 6 combinações (tratamentos). Logo, o número de graus de liberdade para tratamentos será 5 (6-1). Para a fonte de variação “total”, temos 24 observações (6x4), logo, o número de graus de liberdade será 23. Já o resíduo é obtido por diferença (GLtotal – GLtratamento=18). Para obter a soma de quadrado de tratamentos, precisamos do total de cada uma das combinações (tratamentos). 

Para obter a soma de quadrados do total, devemos considerar cada observação chegando a:  

Já o resíduo pode ser obtido por diferença, chegando-se na tabela 2. 

Tabela 2. Número de graus de liberdade e soma de quadrados considerando o delineamento inteiramente casualizado. 

Na análise de variância de um experimento em esquema fatorial o grau de liberdade e a soma de quadrado de tratamentos devem ser decompostos para o “Fator A“, “Fator B” e “AxB” (interação). Como o fator A tem 3 níveis (3-1) o número de graus de liberdade será 2. Já o fator B com 2 níveis terá graus de liberdade igual a 1 (2-1). Já para a interação é obtida por diferença (GLAxB=GLTratamento-GLA-GLB = 2). Para obter as somas de quadrado, podemos organizar os totais de tratamentos em uma tabela de dupla entrada, chegando-se na tabela 3. 

Tabela 3 Tabela de dupla entrada com os totais de tratamentos. 

Dessa forma, chegamos na soma de quadrados do Fator A considerando os totais do fator A. O Fator B considerando os totais do fator B e a interação por diferença (SQAB=SQtratamento-SQA-SQB). 

Perceba que para chegar no somatório dos níveis do fator A foi preciso somar 8 observações na tabela 1 (2 manejos x 4 repetições). Logo o denominador da primeira parte do SQA foi igual a 8. Já para chegar nos totais de cada um dos níveis do fator B somaram-se 12 parcelas (3 cultivares x 4 repetições), por isso o denominador da primeira parte foi igual a 12. Assim, conseguimos chegar na ANOVA da tabela 4. Perceba que calculamos anteriormente a soma de quadrados e graus de liberdade de tratamentos apenas para obter o “Fator A”, “Fator B” e “AxB”. Pois nossa intenção não é saber se há diferença entre os tratamentos. Mas se há diferença entre os níveis do fator A, do fator B e se há interação. 

Tabela 4 Análise de variância de um experimento em esquema fatorial 3x2 conduzido no delineamento inteiramente casualizado. 

Logo, podemos realizar os seguintes testes de hipóteses. 

Fator A: 

Ho: Não há diferença entre as médias cultivares em relação ao número de insetos. 

Ha: Pelo menos a média de uma cultivar se difere das demais em relação ao número de insetos.  

 Conclusão: Como a estimativa de Fcalculado foi maior que o valor de Ftabelado, rejeita-se H0. Logo, pelo menos um nível do fator A se difere dos demais pelo teste F ao nível de 5% de significância. 

Fator B: 

Ho: Não há diferença entre os manejos em relação ao número de insetos. 

Ha: O manejo influência no número de insetos.  

 Conclusão: Como a estimativa de Fcalculado foi maior que o valor de Ftabelado, rejeita-se H0. Logo, pelo menos um nível do fator B se difere dos demais pelo teste F ao nível de 5% de significância. 

Interação (Cultivares e manejos) 

Ho: Não há interação entre as cultivares e os manejos para o número de insetos. 

Ha: há interação entre as cultivares e os manejos para o número de insetos. 

Conclusão: Como a estimativa de Fcalculado para a interação foi menor que o valor de Ftabelado, não se rejeita H0. Logo, não há interação significativa entre os fatores cultivar e manejo, pelo teste F ao nível de 5% de significância.  

 A partir dessas significâncias tomamos as decisões a seguir. Como não houve interação significativa não precisa fazer o desdobramento. Logo, como há diferença entre os níveis do fator A, vamos comparar suas médias. Por meio do Teste de Tukey, classificamos as médias em uma tabela. 

Para calcular a DMS aplicamos seguinte equação. 


Tabela 12.5. Teste de médias entre os níveis do fator cultivar. 

Médias seguidas de mesma letra na coluna não se diferem entre si pelo teste Tukey ao nível de 5% de significância. 

Como houve efeito significativo do fator B também deveremos comparar as médias dos níveis deste fator.  

Perceba que para o cálculo do DMS para comparar os níveis do fator A o denominador foi 8. Isso porque para chegar em cada uma das médias considerou-se a soma de 8 parcelas (2 manejos x 4 repetições). Já para o DMS para comparar os níveis do fator B o denominador foi 12 pelo mesmo raciocínio (3 cultivares x 4 repetições). 

É importante salientar que quando se tem apenas dois níveis como no fator B o teste F na ANAVA é conclusivo. Ou seja, se houver significância uma média sempre receberá a letra “a” e o outro a letra “b”. Em outras palavras, quando se tem apenas um grau de liberdade na ANOVA, todos os testes apresentaram a mesma conclusão de rejeição ou não da Ho (Teste t, Tukey, Duncan, Scott-Knott). 

Roteiro do R Studio 

# 1° Apagar a memória:  

remove (list=ls()) 

# 2° Indicar a pasta que contém os dados a serem utilizados:  

# setwd ("nome da pasta com o conjunto de dados") 

# 3° Criar um objeto para análise estatística:  

D=read.table("”,head=TRUE) 

# 4° Ativar o pacote:  

library(easyanova) 

#  5° Abrir manual do pacote:  

?ea2 

#  6° Executar o pacote: 

ea2(D[,-3],desing = 1) 


Lista de Exercícios 

a) Quando este esquema de avaliação deve ser utilizado. 

b) Vantagens e desvantagens. 

 

 

a) Escreva o modelo estatístico e especifique a que se refere cada parâmetro do modelo. 

b) Faça a análise de variância.           

c) Calcule o coeficiente de variação residual. 

d) Cite a hipótese nula e alternativa para cada fonte de variação considerada no teste F. 

e) Faça os testes de hipótese e redija suas conclusões. 

f) Compare as médias recorrendo-se aos testes Tukey. 

 

a) Qual o valor de F calculado da interação? 

b) Se considerarmos a interação como sendo não significativa e formos comparar as médias dos níveis do fator A qual será o DMS (teste Tukey a 5% de significância)? 

c) Se considerarmos a interação como sendo não significativa e formos comparar as médias dos níveis do fator B qual será o DMS (teste Tukey a 5% de significância)? 

d) Se considerarmos a interação como sendo significativa e formos desdobrar os níveis do fator A dentro do fator B qual será o DMS (teste Tukey a 5% de significância)? 

e) Se considerarmos a interação como sendo significativa e formos desdobrar os níveis do fator B dentro do fator A qual será o DMS (teste Tukey a 5% de significância)?