A distribuição gaussiana dos erros de medida

O conhecimento
do mundo em que vivemos é obtido por meio de experimentos e medições. Mas já
sabemos que não é possível obter resultados exatos quando medimos. Também sabemos
que é preciso minimizar erros e indicar o grau de incerteza dos resultados das
medições, ou seja, para que as medidas tenham significado, devemos escrever:
                                       X + DX,
em que X é nossa melhor estimativa da medida
e
DX é a incerteza associada ao
resultado
. Ficamos assim conscientes de que, se fizermos novas medições, é
bastante provável que os novos valores caiam no intervalo X +
DX.
Não há como zerar
os erros das medições. No entanto, a distribuição dos erros tem uma aparência
típica. Conta a lenda que os assistentes de Gauss, o grande matemático e
astrônomo do século XIX, estavam tomando algumas medidas, mas não eram capazes
de obter o mesmo resultado, em medições repetidas. Gauss ficou muito zangado e
começou a gritar, dizendo que iria mostrar àquela gente que quem sabe medir obtém
repetidamente o mesmo valor, todas as vezes. Só que ele não conseguiu fazer
isso.  
Mas Gauss era
gênio. Desenhou um histograma e percebeu que o desenho tinha o aspecto de uma
curva muito conhecida, a “curva do sino”, que depois passou a ser conhecida
como a lei gaussiana dos erros. Os estatísticos em geral se referem à “curva do
sino” como distribuição normal, mas os físicos preferem a denominação
distribuição de Gauss. Vamos então entender a distribuição normal, por meio de
um exemplo.   
EXEMPLO
Com um
cronômetro na mão para medir o período de oscilação de um pêndulo, você faz n=20 medições. Os resultados estão
na tabela dada em seguida.
Leituras do período de oscilação de um pêndulo, em
segundos

A média aritmética das n=20
medidas é a melhor estimativa para o
período de oscilação:
Então os
desvios da média, apresentados na tabela abaixo, estimam os erros de medida. 
Desvios da média das leituras do período
 de
oscilação de um pêndulo, em segundos
Vamos contar quantas vezes ocorreu cada valor de desvio
da média
, isto é, organizar os dados em uma tabela de
distribuição de frequências e depois desenhar um histograma.
Tabela de distribuição de frequências

Histograma para os desvios da média das leituras do período
 de
oscilação de um pêndulo, em segundos

O que mostra o exemplo? Que desvios ocorrem ao acaso, às vezes
maiores, às vezes menores, às vezes positivos, às vezes negativos, mas
distribuídos em torno da média aritmética. O grau de dispersão dos desvios em
torno da média é dado pelo desvio padrão. No caso do exemplo:

Toda distribuição de frequências é construída com os dados de uma amostra.
À medida que aumentamos a amostra, os histogramas começam a se assemelhar
à 
distribuição normal, uma distribuição teórica, dada em
gráfico na figura abaixo.

Distribuição normal

Mas reveja o histograma que desenhamos.
Não parece razoável considerar que se as medições fossem repetidas muitas e
muitas vezes, teríamos um histograma com aspecto muito similar ao da “curva do
sino”?

Vamos estudar um pouco mais a distribuição normal, que tem
características bem conhecidas:

·                  Graficamente,
é uma curva em forma de sino.
·                A
média, a mediana e a moda coincidem e estão no centro da distribuição.
·          A
curva é simétrica em torno da média. Logo, 50% dos valores são iguais ou
maiores do que a média e 50% dos valores são iguais ou menores do que a média.
·                
A
curva abriga 100% da população. Isto equivale dizer que a área total sob a
curva é 1. 


Simetria da distribuição normal

A distribuição normal é definida quando são dados dois
parâmetros
: a média, que se representa pela letra grega 
m (lê-se mi) e o desvio padrão, que se representa pela letra
grega 
s (lê-se
sigma). Quando muda a média e/ou o desvio padrão, muda a configuração da curva.
Veja a figura abaixo, que mostra distribuições normais com a mesma média e
diferentes desvios padrões.

Distribuições normais: média zero, desvios padrões diferentes

Nenhuma distribuição de dados reais tem
características 
idênticas às da distribuição normal. No
entanto, se você puder
pressupor
que a variável que estuda tem
distribuição aproximadamente normal, pode
considerar que os dados obedecem à chamada “regra empírica”. Veja a figura: de
acordo com essa “regra empírica”, cerca de

·     68% (pouco mais de ) dos resultados das medições  estarão a menos de um desvio padrão de distância
da média, para mais ou para menos.
·       95% dos resultados das medições estarão a menos de dois
desvios padrões de distância da média
, para mais ou para menos.
·        99,7% dos resultados das medições estarão a menos de três
desvios padrões de distância da média
, para mais ou para menos.

Na prática, o que isso significa? Se você tiver muitas e muitas
medições de um mesmo mensurando, é bastante provável que a média aritmética
esteja perto da medida real e que os resultados das medições tenham distribuição
aproximadamente normal.
 


Nota: 1.o uso da distribuição normal para avaliar incerteza da medição, é comum na prática. Mas há críticas. Veja, por exemplo,Hulme e Symms, The law of error and the combinationof observations. Royal Astronomic Society.
           2. Veja a avaliação tipo A de incerteza em outra postagem
VEJA
1.         
ISO International
Organization for Standardization
2.         
O exemplo do cronômetro é de Physics
Laboratory Tutorial : Error Analysis – Columbia …
3.         
http://reference.wolfram.com/applications/eda/ExperimentalErrorsAndErrorAnalysis.html
4.         
Uncertainties
& Error Analysis Tutorialhttp://physics.wustl.edu/introphys/Phys117_118/Lab_Manual/Tutorials
/ErrorAnalysisTutorial.pdf 
6.          




Tags: No tags

Add a Comment

Your email address will not be published. Required fields are marked *