ANOVA: o modelo mais simples

A
finalidade da experimentação é comparar os efeitos de diferentes tratamentos.
Nas ciências agrárias, é usual comparar diversos tratamentos ou situações e
utilizar, para a avaliação estatística, uma análise de variância. No entanto, para que os
resultados da análise de variância sejam válidos, é preciso que os erros sejam variáveis aleatórias independentes com distribuição normal de média
zero e variância constante.
Mas o que são erros? Antes de definir erro, convém entender como se avaliam os
efeitos de tratamentos.


Os efeitos dos tratamentos podem ser estimados fazendo a diferença entre suas
médias e a média geral. Representando os efeitos de tratamentos por ti podemos escrever:

tratamentos com efeitos positivos (acima da média) e tratamentos com efeitos
negativos (abaixo da média). A soma dos efeitos dos tratamentos é,
evidentemente, zero. 
 Exemplo:
para comparar os efeitos de quatro tratamentos (A, B, C, D) sobre a
produtividade de milho, um pesquisador sorteou os tratamentos para 20 parcelas.
Terminado o experimento e colhidos os resultados, o pesquisador obteve os dados
apresentados na Tabela 1. As médias dos tratamentos estão no rodapé dessa
tabela.

Tabela 1: Produtividade de milho em kg/100 m2
segundo o tratamento

A
média geral é dada pela soma de todos os valores dividida por 20:


Para
os dados da Tabela 1, as estimativas dos efeitos dos tratamentos são:


Essas estimativas estão apresentadas
na Figura 1. Fica então fácil ver que, em média, o tratamento D teve o maior
efeito.

    Figura 1. Estimativas dos efeitos de tratamento


Unidades
experimentais que recebem o mesmo tratamento não têm, exatamente, a mesma resposta.
No exemplo que estamos desenvolvendo, as parcelas de milho que receberam o
mesmo tratamento apresentam produtividade diferente. Essas diferenças são
explicadas pela variação, mesmo que pequena, da fertilidade do solo e da
umidade entre uma parcela e outra, da variação da profundidade da semeadura, da
variação da capacidade germinativa das sementes, da variação na aplicação do
tratamento às parcelas, de erros de pesagem do milho colhido e outros fatores,
que não foram não considerados pelo pesquisador. Há sempre variabilidade.

Então a produtividade de determinada parcela Yij é dada pela média obtida
no experimento, mais o efeito do i-ésimo
tratamento, acrescida de um desvio ou resíduo eij. Podemos então escrever:
Esta equação representa o
que o pesquisador coletou, ou seja, os resultados do experimento que temos em
mãos. Mas poderiam ser feitos outros experimentos nas mesmas condições. Se
imaginarmos “infinitos” experimentos conduzidos nas mesmas condições, teríamos
os valores verdadeiros – que o estatístico chama de parâmetros – da média de produtividade de milho (
m) e
dos efeitos de tratamentos (
ti). Teríamos, também, os
erros (
eij) e não simplesmente os
desvios, isto é, teríamos a diferença verdadeira entre um dado medido em uma
parcela e a média do tratamento que essa parcela recebeu.

 Você
pode até estar pensando que tudo isso são teorias e que, na verdade, todo
pesquisador tem uma boa ideia da produtividade média de milho na região em que
trabalha devido a sua experiência e seu conhecimento da literatura. Mas nenhum
pesquisador sabe o valor exato de
m. E todo
pesquisador que faz um experimento para estudar o efeito de diferentes tratamentos
sobre a produtividade de milho, sabe que está apenas estimando esses efeitos.


   Então, imagine um experimento inteiramente ao acaso. Os
valores obtidos, ou seja, as respostas das unidades aos tratamentos seguem
um modelo. São dadas pela soma de:
  • Média de todos os valores
    possíveis para a variável em análise, representada por
     m (lê-se mi),
  • Efeito do i-ésimo tratamento sobre as unidades que
    receberam esse tratamento, representado por ti (lê-se tau índice i)
  • Erro” aleatório eij (lê-se épsilon índice ij).


Escrevemos:


Para
que os resultados da análise de variância sejam válidos, é preciso que os erros
eij sejam variáveis aleatórias independentes com
distribuição normal de média zero e variância constante.
Mas acabamos de
ver: não conhecemos os erros. Temos apenas suas estimativas, os desvios eij.  obtidos experimentalmente.
Mas
podemos usar os valores dos desvios para testar a hipótese de que os erros são variáveis aleatórias independentes com
distribuição normal de média zero e variância constante.
Vamos por partes. C
onsideraremos esses achados nossas pressuposições para proceder a uma análise de variância se pudermos aceitar – com base na nossa amostra de desvios – que os erros são


As
estimativas dos erros, ou seja, os desvios, mais conhecidos como resíduos são obtidos fazendo as
diferenças entre os valores observados e as médias dos tratamentos que receberam.
Para os
dados
da Tabela 1, foram
calculados os resíduos apresentados na Tabela 2.

Tabela 2- Cálculo dos resíduos dos dados apresentados na Tabela 1

  A
análise de resíduos permite estabelecer se uma análise de variância dos dados apresentado na Tabela 1 é aceitável. Logo, é preciso
ver como se faz a análise dos resíduos, pois é
essa análise que diz se as pressuposições feitas para proceder à análise de
variância são razoáveis.

Tags: No tags

8 Responses

Add a Comment

Your email address will not be published. Required fields are marked *