Teste de Tukey para comparação de médias

Uma análise de
variância (ANOVA) rejeita ou não a hipótese de igualdade de médias
populacionais de diversos grupos, mas não
determina quais
grupos têm médias estatisticamente diferentes. Por essa razão, o teste F feito na análise de variância é
considerado um teste global (omnibus test). Terminada a análise de variância, o pesquisador busca um novo
teste para  comparar as médias de grupos.
Vamos tratar
aqui
o teste de Tukey, muito conhecido dos
pesquisadores brasileiros. V
ocê aplica o teste de Tukey para comparar
médias duas a duas (pairwise comparison). Veja isso como uma vantagem do teste: você compara todos os pares de médias que tiver.
O teste de Tukey é, portanto, um
teste a posteriori ou post-hoc. Faz comparações
não planejadas (unplanned comparisons), ou seja, o pesquisador não
precisa estabelecer as comparações de
médias que irá fazer 
sem ter visto os dados. Veja isto como vantagem do teste.
Para proceder ao teste de Tukey, é preciso calcular a diferença mínima que deve haver entre duas médias para
que elas possam ser consideradas diferentes ao nível de significância 
a. No Brasil, essa diferença é conhecida
como diferença mínima
significante
 e, em geral,
indicada pela letra grega ∆ (lê-se
delta), mas, na língua inglesa, Least
Significant Difference
(LSD), ou seja,
diferença mínima significante
é terminologia usada no teste de Fisher. John W. Tukey, autor do teste de Tukey,
chamou a diferença mínima que deve haver entre duas médias para
que elas possam ser consideradas diferentes ao nível de significância 
a de honestly
significant difference
(HSD), ou
seja, diferença honestamente significante.

De qualquer
forma, para obter o valor da diferença honestamente significante (∆ ou HSD) pelo teste de Tukey é preciso
calcular:
Nessa
fórmula:
  • q(k,gl,a) é
    denominado amplitude estudentizada e é encontrado na tabela de amplitude
    estudentizada q, ao
    nível de significância a, para k tratamentos e gl graus de liberdade do resíduo da ANOVA.
  • QMR é o quadrado médio do resíduo da análise de variância;
  • r é o número de repetições de cada um dos grupos.

Para entender como se usa a
tabela de amplitude estudentizada q,
observe uma 
parte dela, dada abaixo. O valor em negrito deve ser utilizado para comparar as
médias de um experimento com seis tratamentos e 24 graus de liberdade no
resíduo, ao nível de significância de 5%.
Valor de q para o nível de significância de 5% 

Graus de liberdade
Nº de médias em comparação
2
3
4
5
6
7
8
9
10
20
2,9500
3,5779
3,9583
4,2319
4,4452
4,6199
4,7676
4,8954
5,0079
21
2,9410
3,5646
3,9419
4,2130
4,4244
4,5973
4,7435
4,8699
4,9813
22
2,9329
3,5526
3,9270
4,1959
4,4055
4,5769
4,7217
4,8469
4,9572
23
2,9255
3,5417
3,9136
4,1805
4,3883
4,5583
4,7019
4,8260
4,9353
24
2,9188
3,5317
3,9013
4,1663
4,3727
4,5413
4,6838
4,8069
4,9153
25
2,9126
3,5226
3,8900
4,1534
4,3583
4,5258
4,6672
4,7894
4,8969
26
2,9070
3,5142
3,8796
4,1415
4,3451
4,5115
4,6519
4,7733
4,8800
27
2,9017
3,5064
3,8701
4,1305
4,3329
4,4983
4,6378
4,7584
4,8645
28
2,8969
3,4992
3,8612
4,1203
4,3217
4,4861
4,6248
4,7446
4,8500
29
2,8924
3,4926
3,8530
4,1109
4,3112
4,4747
4,6127
4,7319
4,8366
30
2,8882
3,4865
3,8454
4,1021
4,3015
4,4642
4,6014
4,7199
4,8241
Fonte: http://davidmlane.com/hyperstat/sr_table.html

De acordo com o teste, duas médias são estatisticamente
diferentes ao nível de significância 
a toda vez que o valor absoluto da
diferença entre elas for igual ou maior do que a diferença honestamente significante,
ou seja, igual ou maior do que o valor HSD.
                 
                     
           EXEMPLO
Considere os dados de diminuição da pressão arterial segundo
o grupo, apresentados na Tabela 1. Esses dados foram submetidos à
análise de variância apresentada na Tabela 2. Como o valor de 
F é significante ao nível de 5%, existe pelo menos uma média
diferente das demais. As médias de grupos estão apresentadas na Tabela 3.

Tabela 1 – Diminuição da pressão arterial, em milímetros de mercúrio, segundo o
grupo
Tabela 2 – Análise de variância 

Tabela 3 – Médias da diminuição de pressão
arterial, em milímetros de mercúrio, segundo o grupo

Quais
são as médias estatisticamente diferentes? A pergunta pode ser respondida
com a aplicação do teste
de
Tukey. Considerando um nível de significância de 5%, tem-se que:
q = 4,3727 é o valor dado na tabela de amplitude estudentizada q ao nível de significância de 5%, associado a k = 6 grupos e gl =24 graus de liberdade de resíduo; QMR = 36,00 é o quadrado
médio de  resíduo da ANOVA; 
r = 5 é o número de repetições.
É
preciso calcular as diferenças de médias, duas a duas e compará-las com a
diferença honestamente significante. Veja a Tabela 4: os
tratamentos e as médias estão nas duas primeiras linhas e nas duas primeiras
colunas, em negrito. As diferenças significantes ao nível de 5% estão assinaladas
com um asterisco. 
Tabela 4 – Diferenças de médias de diminuição da
pressão arterial
 
Pode ser mais fácil ver as comparações
como mostra a tabela dada em seguida.
Tabela 5 – Diferenças de médias de diminuição da
pressão arterial 
 
De
acordo com o teste de Tukey, ao nível de 5%:
  • a média
    do tratamento A é maior do que a de B e a do controle;
  • a média
    do tratamento D é maior do que as médias de B, C, E e controle. 

Estes resultados também podem ser
indicados por letras, como é dado em seguida e é usual nas “saídas” de
programas de computador:
 
  • quando letras diferentes aparecem em frente a duas médias, a diferença entre essas
    médias é estatisticamente significante; 
  • quando a mesma letra aparece em frente
    a duas médias, a diferença
    entre essas médias não é estatisticamente significante.

Tabela 6 – Comparação das médias de diminuição da
pressão arterial


“Saída”
do Minitab
Tukey Pairwise Comparisons 
 Grouping Information Using the
Tukey Method and 95% Confidence
Treatment  N  
Mean  Grouping
D         
     5   29,00     A
A         
     5   21,00     A
 B
E          
    5   13,00  
      B  C
C          
    5   10,00   
     B  C
B          
    5  
  8,00     
      C
Control   
   5     2,00    
       C

Means that do not share a
letter are significantly different.



Saída do
SAS
                  
       Error Mean
Square                         36
                         
Critical Value of Studentized Range  4.37265
                         
Minimum Significant Difference        11.733
                 
Means with the same letter are not significantly different.
                     
Tukey Grouping         
Mean      N    trat
       
                     
       A              
 29.000      5    4
       
                     
       A 
                             
B    A               21.000     
5    1
                             
B
                             
B    C               13.000     
5    5
                             
B    C
                             
B    C              
10.000      5    3
       
                     
       C
       
                     
       C  
             
8.000      5    2     
                     
      

       
                             C        
        2.000     
5    6


**************************************************************
NOTA: Também se pode calcular estatística q para cada comparação de médias.Veja o exemplo de 


              ZAR, J. H. BIOSTATISTICAL ANALYSIS, 4th. ed. P. 210




Calcule: 







Tags: No tags

15 Responses

Add a Comment

Your email address will not be published. Required fields are marked *