Uma análise de
variância (ANOVA) rejeita ou não a hipótese de igualdade de médias
populacionais de diversos grupos, mas não determina quais
grupos têm médias estatisticamente diferentes. Por essa razão, o teste F feito na análise de variância é
considerado um teste global (omnibus test). Terminada a análise de variância, o pesquisador busca um novo
teste para comparar as médias de grupos.
variância (ANOVA) rejeita ou não a hipótese de igualdade de médias
populacionais de diversos grupos, mas não determina quais
grupos têm médias estatisticamente diferentes. Por essa razão, o teste F feito na análise de variância é
considerado um teste global (omnibus test). Terminada a análise de variância, o pesquisador busca um novo
teste para comparar as médias de grupos.
Vamos tratar
aqui o teste de Tukey, muito conhecido dos
pesquisadores brasileiros. Você aplica o teste de Tukey para comparar
médias duas a duas (pairwise comparison). Veja isso como uma vantagem do teste: você compara todos os pares de médias que tiver.
aqui o teste de Tukey, muito conhecido dos
pesquisadores brasileiros. Você aplica o teste de Tukey para comparar
médias duas a duas (pairwise comparison). Veja isso como uma vantagem do teste: você compara todos os pares de médias que tiver.
O teste de Tukey é, portanto, um
teste a posteriori ou post-hoc. Faz comparações não planejadas (unplanned comparisons), ou seja, o pesquisador não
precisa estabelecer as comparações de
médias que irá fazer sem ter visto os dados. Veja isto como vantagem do teste.
teste a posteriori ou post-hoc. Faz comparações não planejadas (unplanned comparisons), ou seja, o pesquisador não
precisa estabelecer as comparações de
médias que irá fazer sem ter visto os dados. Veja isto como vantagem do teste.
Para proceder ao teste de Tukey, é preciso calcular a diferença mínima que deve haver entre duas médias para
que elas possam ser consideradas diferentes ao nível de significância a. No Brasil, essa diferença é conhecida
como diferença mínima
significante e, em geral,
indicada pela letra grega ∆ (lê-se
delta), mas, na língua inglesa, Least
Significant Difference (LSD), ou seja, diferença mínima significante
é terminologia usada no teste de Fisher. John W. Tukey, autor do teste de Tukey,
chamou a diferença mínima que deve haver entre duas médias para
que elas possam ser consideradas diferentes ao nível de significância a de honestly
significant difference (HSD), ou
seja, diferença honestamente significante.
que elas possam ser consideradas diferentes ao nível de significância a. No Brasil, essa diferença é conhecida
como diferença mínima
significante e, em geral,
indicada pela letra grega ∆ (lê-se
delta), mas, na língua inglesa, Least
Significant Difference (LSD), ou seja, diferença mínima significante
é terminologia usada no teste de Fisher. John W. Tukey, autor do teste de Tukey,
chamou a diferença mínima que deve haver entre duas médias para
que elas possam ser consideradas diferentes ao nível de significância a de honestly
significant difference (HSD), ou
seja, diferença honestamente significante.
De qualquer
forma, para obter o valor da diferença honestamente significante (∆ ou HSD) pelo teste de Tukey é preciso
calcular:
forma, para obter o valor da diferença honestamente significante (∆ ou HSD) pelo teste de Tukey é preciso
calcular:
Nessa
fórmula:
fórmula:
- q(k,gl,a) é
denominado amplitude estudentizada e é encontrado na tabela de amplitude
estudentizada q, ao
nível de significância a, para k tratamentos e gl graus de liberdade do resíduo da ANOVA. - QMR é o quadrado médio do resíduo da análise de variância;
- r é o número de repetições de cada um dos grupos.
Para entender como se usa a
tabela de amplitude estudentizada q,
observe uma parte dela, dada abaixo. O valor em negrito deve ser utilizado para comparar as
médias de um experimento com seis tratamentos e 24 graus de liberdade no
resíduo, ao nível de significância de 5%.
tabela de amplitude estudentizada q,
observe uma parte dela, dada abaixo. O valor em negrito deve ser utilizado para comparar as
médias de um experimento com seis tratamentos e 24 graus de liberdade no
resíduo, ao nível de significância de 5%.
Valor de q para o nível de significância de 5%
Graus de liberdade
|
Nº de médias em comparação
|
||||||||
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
20
|
2,9500
|
3,5779
|
3,9583
|
4,2319
|
4,4452
|
4,6199
|
4,7676
|
4,8954
|
5,0079
|
21
|
2,9410
|
3,5646
|
3,9419
|
4,2130
|
4,4244
|
4,5973
|
4,7435
|
4,8699
|
4,9813
|
22
|
2,9329
|
3,5526
|
3,9270
|
4,1959
|
4,4055
|
4,5769
|
4,7217
|
4,8469
|
4,9572
|
23
|
2,9255
|
3,5417
|
3,9136
|
4,1805
|
4,3883
|
4,5583
|
4,7019
|
4,8260
|
4,9353
|
24
|
2,9188
|
3,5317
|
3,9013
|
4,1663
|
4,3727
|
4,5413
|
4,6838
|
4,8069
|
4,9153
|
25
|
2,9126
|
3,5226
|
3,8900
|
4,1534
|
4,3583
|
4,5258
|
4,6672
|
4,7894
|
4,8969
|
26
|
2,9070
|
3,5142
|
3,8796
|
4,1415
|
4,3451
|
4,5115
|
4,6519
|
4,7733
|
4,8800
|
27
|
2,9017
|
3,5064
|
3,8701
|
4,1305
|
4,3329
|
4,4983
|
4,6378
|
4,7584
|
4,8645
|
28
|
2,8969
|
3,4992
|
3,8612
|
4,1203
|
4,3217
|
4,4861
|
4,6248
|
4,7446
|
4,8500
|
29
|
2,8924
|
3,4926
|
3,8530
|
4,1109
|
4,3112
|
4,4747
|
4,6127
|
4,7319
|
4,8366
|
30
|
2,8882
|
3,4865
|
3,8454
|
4,1021
|
4,3015
|
4,4642
|
4,6014
|
4,7199
|
4,8241
|
Fonte: http://davidmlane.com/hyperstat/sr_table.html
De acordo com o teste, duas médias são estatisticamente
diferentes ao nível de significância a toda vez que o valor absoluto da
diferença entre elas for igual ou maior do que a diferença honestamente significante,
ou seja, igual ou maior do que o valor HSD.
diferentes ao nível de significância a toda vez que o valor absoluto da
diferença entre elas for igual ou maior do que a diferença honestamente significante,
ou seja, igual ou maior do que o valor HSD.
EXEMPLO
Considere os dados de diminuição da pressão arterial segundo
o grupo, apresentados na Tabela 1. Esses dados foram submetidos à
análise de variância apresentada na Tabela 2. Como o valor de F é significante ao nível de 5%, existe pelo menos uma média
diferente das demais. As médias de grupos estão apresentadas na Tabela 3.
o grupo, apresentados na Tabela 1. Esses dados foram submetidos à
análise de variância apresentada na Tabela 2. Como o valor de F é significante ao nível de 5%, existe pelo menos uma média
diferente das demais. As médias de grupos estão apresentadas na Tabela 3.
Tabela 1 – Diminuição da pressão arterial, em milímetros de mercúrio, segundo o
grupo
grupo
Tabela 2 – Análise de variância
Tabela 3 – Médias da diminuição de pressão
arterial, em milímetros de mercúrio, segundo o grupo
arterial, em milímetros de mercúrio, segundo o grupo
Quais
são as médias estatisticamente diferentes? A pergunta pode ser respondida
com a aplicação do teste de
Tukey. Considerando um nível de significância de 5%, tem-se que:
são as médias estatisticamente diferentes? A pergunta pode ser respondida
com a aplicação do teste de
Tukey. Considerando um nível de significância de 5%, tem-se que:
q = 4,3727 é o valor dado na tabela de amplitude estudentizada q ao nível de significância de 5%, associado a k = 6 grupos e gl =24 graus de liberdade de resíduo; QMR = 36,00 é o quadrado
médio de resíduo da ANOVA; r = 5 é o número de repetições.
médio de resíduo da ANOVA; r = 5 é o número de repetições.
É
preciso calcular as diferenças de médias, duas a duas e compará-las com a
diferença honestamente significante. Veja a Tabela 4: os
tratamentos e as médias estão nas duas primeiras linhas e nas duas primeiras
colunas, em negrito. As diferenças significantes ao nível de 5% estão assinaladas
com um asterisco.
preciso calcular as diferenças de médias, duas a duas e compará-las com a
diferença honestamente significante. Veja a Tabela 4: os
tratamentos e as médias estão nas duas primeiras linhas e nas duas primeiras
colunas, em negrito. As diferenças significantes ao nível de 5% estão assinaladas
com um asterisco.
Tabela 4 – Diferenças de médias de diminuição da
pressão arterial
pressão arterial
Pode ser mais fácil ver as comparações
como mostra a tabela dada em seguida.
como mostra a tabela dada em seguida.
Tabela 5 – Diferenças de médias de diminuição da
pressão arterial
pressão arterial
De
acordo com o teste de Tukey, ao nível de 5%:
acordo com o teste de Tukey, ao nível de 5%:
- a média
do tratamento A é maior do que a de B e a do controle; - a média
do tratamento D é maior do que as médias de B, C, E e controle.
Estes resultados também podem ser
indicados por letras, como é dado em seguida e é usual nas “saídas” de
programas de computador:
indicados por letras, como é dado em seguida e é usual nas “saídas” de
programas de computador:
- quando letras diferentes aparecem em frente a duas médias, a diferença entre essas
médias é estatisticamente significante; - quando a mesma letra aparece em frente
a duas médias, a diferença
entre essas médias não é estatisticamente significante.
Tabela 6 – Comparação das médias de diminuição da
pressão arterial
pressão arterial
“Saída”
do Minitab
do Minitab
Tukey Pairwise Comparisons
Grouping Information Using the
Tukey Method and 95% Confidence
Tukey Method and 95% Confidence
Treatment N
Mean Grouping
Mean Grouping
D
5 29,00 A
5 29,00 A
A
5 21,00 A
B
5 21,00 A
B
E
5 13,00
B C
5 13,00
B C
C
5 10,00
B C
5 10,00
B C
B
5
8,00
C
5
8,00
C
Control
5 2,00
C
5 2,00
C
Means that do not share a
letter are significantly different.
letter are significantly different.
Saída do
SAS
SAS
Error Mean
Square 36
Critical Value of Studentized Range 4.37265
Minimum Significant Difference 11.733
Means with the same letter are not significantly different.
Tukey Grouping
Mean N trat
A
29.000 5 4
A
B A 21.000
5 1
B
B C 13.000
5 5
B C
B C
10.000 5 3
C
C
8.000 5 2
C
2.000
5 6
**************************************************************
NOTA: Também se pode calcular estatística q para cada comparação de médias.Veja o exemplo de
ZAR, J. H. BIOSTATISTICAL ANALYSIS, 4th. ed. P. 210
Calcule:
Boa tarde professora Sônia
Por que há dois procedimentos para executar o teste de Tukey. Por exemplo o R não calcula o HSD; ele apenas compara a diferença entre as médias diretamente com o valor de q. Ele naõ calcula delta = q. RQ(QMR/r). Esse mesmo procedimento é seguido no livro do Zar, J.H. no livro do Zar, JH.2010. Biostatistical Analysis. 5a. edição. Prentice Hall. E daí as conclusões de cada procedimento são diferentes, o calculo com delta é mais conservador. Estranho!
A senhora poderia me explicar?
Boa tarde professora Sônia
Por que há dois procedimentos para executar o teste de Tukey? Por exemplo o R não calcula o HSD; ele apenas compara a diferença entre duas médias diretamente com o valor de q. Ele não calcula delta = q. RQ(QMR/r). Esse mesmo procedimento é seguido no livro no livro do Zar, JH.2010. Biostatistical Analysis. 5a. edição. Prentice Hall. E daí as conclusões de cada procedimento são diferentes, o calculo com delta é mais conservador. Estranho!
A senhora poderia me explicar?
This comment has been removed by the author.
Só agora entendi a dúvida. Veja Teste de Tukey: procedimentos. Obrigada pela excelente dica.
Boa tarde Professora Sônia,
Obrigado pela excelente explicação.
Bom dia Sonia. Parabéns pela página.
A explicação esta muito boa de se entender. Estou conseguindo fazer vários exercícios por causa das suas explicações. Página muito agregadora.
Parabéns por dividir com tanta habilidade seus conhecimentos estatísticos.
Vc pode me dá uma resposta, é possível haver 3feito significativo sabendo q 2 experimentos possuem o mesmo numero de tratamentos e a mesma variável de resposta?
Desculpe, mas não entendi a pergunta. Pode refazer?
Ótimo post. Auxiliou bastante meu processo de aprendizagem.
Abs
Boa tarde professora Sônia, gosto muito mesmo do seu blog e é de grande utilidade. Gostaria de saber por que o teste de Tukey tem que ser feito só depois do ANOVA ser significativo.
Muito obrigada!
Ivanna
Como os testes post hoc são executados para confirmar as diferenças que ocorreram entre os grupos, eles só devem ser executados quando houver diferença estatisticamente significante global das médias dos grupos (ou seja, um resultado de ANOVA estatisticamente significante).É um teste conservador.
Muito obrigada Sônia! Professores como você fazem toda a diferença.
Boa noite! Gostaria de saber para comparação de medias qual eh o tamanho mínimo…ou qual deve ser a diferença entre os grupos a comparar…
This comment has been removed by the author.
O cálculo do tamanho da amostra exige várias informações como, por exemplo, a variância da variável de interesse.