Amplitude estudentizada (studentized range)

   Seja Y uma
variável aleatória com distribuição normal de média 
m e desvio padrão s.  Uma
amostra de tamanho r dessa variável fornece uma estimativa
s
do desvio padrão
s. Se os dados dessa amostra forem organizados em
ordem crescente, você acha facilmente o valor
mínimo
e o valor máximo. A
diferença entre esses dois valores é a amplitude,
que tem a mesma unidade de medida dos dados. Dividindo a amplitude pelo desvio
padrão s, você obtém a amplitude estudentizada,
que se indica pela letra q e é adimensional porque as unidades de medida da amplitude e do desvio
padrão são as mesmas. Então:
 




















Imagine agora que você tem k amostras
de tamanho r da variável aleatória Y que tem distribuição normal de média 
m  e variância s2. Cada amostra fornece uma estimativa da média m  e uma estimativa da variância s2. Haverá uma média maior e uma média menor. A amplitude das médias das k amostras é
 Como estamos considerando apenas o caso de amostras
de mesmo tamanho, a variância ponderada


 das estimativas

 (i =
1, 2, …, k)
da variância s2 é a média das
estimativas fornecidas por cada uma das k
amostras.

Então, a estimativa da variância da amplitude estudentizada das k médias
independentes, é

                       
             
A distribuição da estatística

                    

depende do nível de significância a, do número k de
amostras e do número n – k  de graus de liberdade associados à estimativa
da variância ponderada, em que n = kr


John W. Tukey, um dos grandes
estatísticos do século XX, considerava “cientificamente desonesto” fazer
uma análise de variância e depois aplicar o teste t de Fisher para comparar médias duas a duas, porque o erro tipo I
aumenta com o número de médias em comparação. Ele propôs então a HSD, ou diferença honestamente
significante (Honestly Significant
Differences
).

Para achar a diferença honestamente significante (honestly significant difference), ou
seja, a diferença que deve haver entre duas médias para que elas possam ser
consideradas estatisticamente diferentes a determinado nível de significância
a, calcule:

    Nessa fórmula, a variância ponderada das k amostras é estimada pelo quadrado
médio do resíduo QMR da ANOVA, que está associado a n-k graus de liberdade. Mas na HDS,
o valor de qa,k,n-k incorpora a √2. É a amplitude estudentizada q
de Tukey.


As tabelas que exibem a distribuição da
amplitude estudentizada q de Tukey
são mais comuns, mas também há tabelas que
exibem a distribuição da amplitude estudentizada q sem estar
multiplicado por √2. Ocorrem as duas formas em tabelas. Então preste atenção,
porque ambas usam o mesmo símbolo.

  Exemplo de procedimento para o
teste de Tukey

 São dadas as concentrações de
estrôncio (mg/ml) na água de cinco locais diferentes[1].
Vamos fazer a análise de variância e comparar as médias pelo teste de Tukey,
usando o programa SAS.  

Concentrações
de estrôncio (mg/ml) na água de cinco locais diferentes




Análise de
variância

Como o quadrado médio do resíduo obtido na análise de variância é QMR = 9,765, a variância da média é:
                                           






















           Logo, o erro padrão da média
é:

         
          Para comparar as médias obtidas no exemplo duas a duas, no
nível de significância de 5%, como
k =
5 e
n-k = 25, temos:


                            Saída do SAS




Mas para
comparar duas médias usando a amplitude total estudentizada, é possível
proceder de outra forma. Dado contraste de médias:


A
variância do contraste, desde que as médias sejam independentes, é
  
                

        Para o exemplo:
        



e o  erro padrão do contrate de médias é
  



Então para comparar a
média do Local 1 com o Local 2, calcule:





       O valor de q aqui calculado não
pode ser comparado com o valor de q da tabela de amplitude estudentizada de
Tukey. Para isso, precisa ser multiplicado por  
√2. Você tem
então

                           4,517 x √2 = 6,388


maior
que o valor crítico da amplitude estudentizada de Tukey. Logo, há mais
estrôncio no Local 2 que no Local 1.   

Veja
agora a saída do SPSS. Note que está indicado como erro padrão é o erro padrão de um contraste
de duas médias. Compare com a saída do SAS, em que o que se identifica como erro padrão é o 
erro padrão de uma média.                

Saída do SPSS

NOTAS


1.O exemplo apresentado é de
Zar,
J.J.H. Biostatistical Analysis. New
Jersey, Prentice Hall. 4ª ed. 1999, p.210.


2.Você encontra a Tabela de amplitude estudentizada de Tukey, por exemplo, em


3. Amplitude estudentizada: amplitude é a diferença entre valor máximo e valor mínimo de um conjunto de dados. Estudentizada, porque está dividida por s. O adjetivo é uma homenagem a Student, pseudônimo de William S. Gosset, que propôs o teste t.

Tags: No tags

Add a Comment

Your email address will not be published. Required fields are marked *