Está en la página 1de 12

O PAPEL DOS MNIMOS QUADRADOS NA DESCOBERTA

DOS PLANETAS1
Nuno Crato2

Um dos problemas maiores com que se sempre debateram os astrnomos foi o da


combinao de observaes, feitas necessariamente com erro, para a estimao
de parmetros de posio dos corpos celestes. O problema ter sido sentido
pelos primeiros a introduzir medidas na astronomia: os astrnomos da Grcia
antiga. Tal como muitos outros, Hiparco (c. 180125 a.C.), que mediu o brilho e
posio das estrelas visveis a olho nu, Eratstenes (c. 276194 a.C.), que mediu
pela primeira vez o raio da Terra, e Aristarco (c. 310230 a.C.), que mediu as
distncias relativas do Sol e da Lua, tero reparado que as suas medidas eram
falveis e variavam ligeiramente de momento para momento e de observador para
observador. Mas esses astrnomos aceitavam uma medida aproximada, que lhes
parecia mais rigorosa, e no se preocupavam com os problemas estatsticos das
suas mensuraes ou, pelo menos, no escreveram sobre esses problemas.

1 A preocupao renascentista com a medida

Tycho Brahe (15461601), o ltimo grande astrnomo da era pr-telescpica, de-


senvolveu um programa de medida dos cus que ultrapassou em muito o rigor
dos antigos. As suas observaes sobre a posio dos astros, o movimento dos
planetas e as distncias serviram de base ao trabalho do seu colaborador Jo-
hannes Kepler (15711630), para o estabelecimento das clebres leis sobre as r-
bitas dos planetas. Sem as medidas rigorosas de Tycho Brahe, pouco provvel
que Kepler pudesse ter estabelecido as leis que levam o seu nome.
Tycho Brahe, homem do renascimento, estava preocupado com a medida.
Sabia que o progresso da cincia apenas poderia resultar de um conhecimento
emprico mais rigoroso. Essa sua preocupao levou-o a reflectir sobre o rigor
das observaes. Tycho foi o primeiro, ou um dos primeiros, a perceber esse
1 Adaptado de uma conferncia proferida pelo autor no Museu de Cincia da Universidade de
Lisboa. Uma verso ligeiramente mais pormenorizada ser simultaneamente publicada no Boletim
da Sociedade Portuguesa de Estatstica.
2 Instituto Superior de Economia e Gesto, Lisboa, e Dept. of Math. Sci., New Jersey Institute of

Technology, Newark, NJ 07102, USA, ncrato@m.njit.edu

1
princpio maior da estatstica que to importante como obter uma estimativa
obter uma ideia do seu rigor. Hoje, esses conceitos esto perfeitamente claros
na mente de estatsticos e de cientistas. Fala-se, por exemplo, em estimativa pon-
tual e em varincia da estimativa. Esta dualidade de conceitos to importante e
to importante transmiti-la aos que pela primeira vez estudam probabilidades
e estatstica, que se pode dizer que constitui o aspecto central da estatstica mod-
erna.
Tycho Brahe utilizava mtodos estatsticos rudimentares, hoje considerados
primitivos. Tirava vrias medidas de um mesmo parmetro, juntava essas obser-
vaes, purgava-as de erros grosseiros (omitia o que hoje chamamos outliers
ou observaes esprias), obtinha mdias, que utilizava para as suas estima-
tivas, e acompanhava essas estimativas de uma qualificao do seu rigor. Se, a
certo momento, por exemplo, tirava cinco medidas da altura de uma estrela como
sendo, em graus, 23, 23, 24, 25 e 25, dizia que a altura era 24 graus, mais grau
menos grau. Se, por exemplo, tirava dez medidas da altura de um cometa como
sendo, em graus, 20, 21, 21, 23, 24, 24, 25, 27, 27 e 28, dizia que a sua altura era
24 graus, mais ou menos 3 graus. Estava-se ainda longe dos mtodos modernos,
de utilizao de desvios padres e construo de intervalos de confiana. Mas o
sistemtico controle da preciso da medida era uma novidade para a poca.
O estudo matemtico da combinao de observaes comeou muito mais
tarde a ser empreendido de forma sistemtica, seguindo o estmulo inicial de
Roger Joseph Boscovich (17111787). Outros grandes vultos desse estudo foram
Pierre Simon, Marquis de Laplace (17491827), o Newton francs, Adrien-Marie
Lgendre (17521833), outro matemtico francs, e Carl Friedrich Gauss (1777
1855), o prncipe dos matemticos. Foi uma procura que ocupou geraes,
tentando encontrar um mtodo ideal de combinao de medidas.
Em particular, tornava-se premente calcular os parmetros das rbitas dos
cometas a partir de medidas pontuais, tiradas em diferentes momentos. O prob-
lema bastante mais difcil do que o do clculo de uma medida ou parmetro
nico como, por exemplo, o peso de um objecto. Mas mesma a conjugao
de observaes diferentes que est em causa; neste caso para a estimao do
conjunto de parmetros que define a rbita de um corpo celeste.
No dobrar do sculo XVIII para o XIX foram apresentadas vrias solues para
este problema (V. Hald 1998 ou Stigler 1986). A soluo mais eficaz, e aquela
que teria um maior desenvolvimento terico e maior aplicao prtica, seria o

2
mtodo dos mnimos quadrados, publicado por Lgendre em 1805 na sua obra
Nouvelles Mthodes pour la Dtermination des Orbites des Comtes, e por Gauss
em 1809 na Theoria Motus Corporum Coelestium. Com publicaes em datas
to prximas, estes dois matemticos vieram a envolver-se em polmica sobre a
autoria da descoberta. Se bem que Lgendre tenha divulgado primeiro os seus
resultados, sabe-se que Gauss os tinha obtido muito antes, em 17941795, pelo
que hoje se atribui a este ltimo a prioridade da criao do mtodo (V. Plackett
1972).

2 Gauss determina a rbita de Ceres

Gauss chamado a resolver o problema da estimao de uma rbita numa ocasio


decisiva para o progresso da astronomia. Em 1 de Janeiro de 1801, Giuseppi Pi-
azzi (17461826), director do Observatrio de Palermo, tinha descoberto o aster-
ide Ceres, que na altura se pensou ser um planeta em falta, entre Marte e Jpiter.
Seria o planeta que h muito se procurava e que iria completar o sistema solar.
No entanto, em 11 de Fevereiro, depois de Piazzi ter conseguido registar apenas
10 observaes desse corpo celeste, Ceres desapareceu, ofuscado pelo Sol.
Passaram-se semanas e o astrnomo de Palermo no conseguiu reencontrar
Ceres quando este deveria ter aparecido do outro lado do Sol. Ao que parece,
Piazzi estava preocupado com a concorrncia de outros astrnomos e queria
assegurar a prioridade da descoberta, pelo que apenas queria divulgar os seus
dados depois de voltar a encontrar Ceres e calcular com preciso a sua rbita (V.
Sheehan 1992, pp. 102-106). No o conseguindo, foi obrigado a divulgar as suas
observaes e a confessar a sua dificuldade em reencontrar o objecto celeste.
Mas s o fez sete meses depois da descoberta. Numa carta para o astrnomo
alemo Johann Bode (17471826), escrita no princpio de 1801, refere-se ao seu
achado como tratando-se de um cometa, e apenas aos seus colaboradores mais
prximos revelou a suspeita de se tratar do almejado planeta. Entretanto, outros
astrnomos procuraram reencontrar o cometa de Piazzi. No vero de 1801,
William Herschel (17381822), que em 1781 tinha descoberto o planeta Urano,
juntou-se corrida pela descoberta. Tornava-se claro que as poucas observaes
registadas pelo astrnomo de Palermo no eram suficientes para calcular a sua r-
bita com a necessria preciso. At data, os mtodos utilizados pelos matemti-

3
cos e astrnomos necessitavam de muito mais observaes e espalhadas ao longo
de um perodo muito mais longo.
Foi ento que entrou em cena um matemtico alemo, na altura com 24 anos,
mas j ento considerado um dos maiores gnios da histria da matemtica: Carl
Friedrich Gauss. O jovem Gauss exultou com a possibilidade de pr em prtica
os seus estudos tericos, pois j h alguns anos que tinha vindo a estudar o
problema do clculo de rbitas sem quaisquer pressupostos tericos, a partir de
observaes que no englobassem um perodo de tempo longo, como escreveu
na altura (Cf. Taff 1985, p. 220). Mais tarde, em Theoria Motus, voltaria a explicar
a importncia da oportunidade que Ceres lhe proporcionou.

a descoberta de um novo planeta, no primeiro dia de Janeiro desse


ano com o telescpio de Palermo, era o tema universal de conversa
[...] Em altura alguma nos anais da astronomia nos encontrmos per-
ante to grande oportunidade e oportunidade maior ser difcil de
imaginar para mostrar to claramente a importncia deste problema
[...] quando todas as esperanas de descoberta nos cus deste planeta
atmico [minsculo], no meio de estrelas inumerveis e depois de ter
passado um ano, repousavam apenas num conhecimento muito aprox-
imado, baseado em poucas observaes. (citado por Sheehan 1992,
p. 105).

Gauss determinou uma rbita para Ceres com base num mtodo que no se
conhece exactamente e que se suspeita no ser o mtodo que acabaria por desen-
volver. O que certo, que os seus estudos o levaram a estabelecer um mtodo de
combinar observaes e, com base nelas, estimar os parmetros de uma funo
neste caso uma rbita. Esse mtodo veio a ser conhecido como o mtodo dos
mnimos quadrados e resolveu um problema com o qual h dcadas se debatiam
as melhores mentes europeias.
Os clculos de Gauss forneceram estimativas para a rbita de Ceres com pre-
ciso suficiente para o astrnomo hngaro Franz Xaver von Zach, na altura di-
rector do Observatrio de Seeburgo o redescobrir a 31 de Dezembro de 1801,
praticamente um ano depois de Piazzi o ter encontrado. O asteride encontrava-
se a meio grau de distncia angular da posio prevista por Gauss. Na noite
seguinte, foi o astrnomo alemo Heinrich Olbers (17581840) que visualizou
Ceres.

4
3 Porqu os mnimos quadrados?

Vale a pena reproduzir sinteticamente e com inevitveis simplificaes o


processo com que Gauss derivou o seu mtodo (V. Plackett 1972, Hald 1998 e
Stigler 1986). Qual era exactamente a natureza do problema, na sua forma mais
simples, tal como Tycho Brahe e outros o tinham defrontado? Era a estimao
de um parmetro nico, por exemplo, a altura de uma estrela em determinado
momento e em determinado local, com base em medidas repetidas com valores
ligeiramente diferentes. Para simplificar ainda mais, considere-se a medida do
peso de um objecto, efectuado vrias vezes pela mesma balana. de esperar
que as medidas no sejam todas absolutamente idnticas e que haja pequenas
diferenas, pois todas as medidas so tiradas com erro.
O mtodo mais usual para combinar essas observaes e obter uma estimativa
mais fivel do peso do objecto o de tirar uma mdia aritmtica das diferentes
medidas e utilizar essa mdia como a melhor estimativa que essas observaes
permitem obter. Este mtodo utilizado h sculos e era utilizado h scu-
los quando Gauss estudou o problema da determinao das rbitas. Nas suas
prprias palavras,

tem sido costume encarar como um axioma a hiptese de que, se uma


quantidade foi determinada por vrias observaes directas, feitas nas
mesmas circunstncias e com igual cuidado, ento a mdia aritmtica
dos valores observados fornece o valor mais provvel, se no rigorosa-
mente, pelo menos com grande aproximao (citado por Farebrother
1999, p. 78).

Qual seria a razo estatstica e probabilstica, perguntou Gauss, que levaria a


utilizar esse mtodo e no outro? E seria possvel generalizar os princpios desse
mtodo a um problema mais complexo, como o da determinao simultnea de
vrios parmetros, tais como os parmetros de uma rbita?
As perguntas parecem ingnuas, mas a verdade que, ainda hoje, se encon-
tra muita gente culta e com formao cientfica e matemtica que no sabe as
respostas. Nestas perguntas est a chave do desenvolvimento do mtodo dos
mnimos quadrados.
H pelo menos duas linhas bsicas para ataque ao problema; e Gauss seguiu as
duas. A primeira, mais elementar, consiste em perguntar qual a funo perca,

5
ou qual a mtrica, que leva a escolher a mdia aritmtica. A segunda, mais
complexa, consiste em perguntar qual a distribuio dos erros que leva a que a
mdia fornea a estimativa ptima.
A primeira linha de ataque pretende determinar em que sentido a mdia
fornece a aproximao ptima a um conjunto de observaes. Trata-se de uma
questo estatstica ou matemtica, que no envolve qualquer abordagem prob-
abilstica. Regressando ao exemplo do peso, admita-se que trs medidas suces-
sivas x obtm 21, 21 e 18 kg. A mdia x = 20. Considerem-se agora duas
medidas diferentes da proximidade desta estimativa s trs observaes. Podem-
se considerar os desvios, medidos todos com sinal positivo, como se dizia no
tempo de Gauss e como o recomendava Laplace. Esses desvios so 1, 1 e 2. A
P
soma desses desvios absolutos |xi x| = 4. No entanto, se se considerar uma
outra estimativa, a mediana, x = 21, por exemplo, consegue-se obter uma maior
P
proximidade: |xi x| = 3, pelo que a mediana parece fornecer uma estimativa
prefervel.

xi x x |xi x| |xi x| (xi x)2 (xi x)2


21 20 21 1 0 1 0
21 20 21 1 0 1 0
18 20 21 2 3 4 9
P
4 3 6 9

Table 1: A mdia aritmtica x minimiza a soma dos quadrados dos desvios,


enquanto a mediana x minimiza a soma dos desvios absolutos.

A situao inverte-se quando se considera o critrio dos mnimos quadrados.


P P
As somas dos erros quadrados so (xi x)2 = 6, no caso da mdia e (xi
x)2 = 9, no caso da mediana.
Este simples exemplo apenas ilustra uma propriedade fcil de demonstrar:
dado um conjunto de observaes, a mdia aritmtica o valor que minimiza
a soma dos quadrados dos desvios (enquanto a mediana minimiza a soma dos
desvios absolutos).
Gauss observou esta propriedade da mdia e perguntou-se se no a poderia
generalizar a outro tipo de estimadores. Se a mdia aritmtica se tinha revelado
como uma medida de localizao muito til e eficaz, seria desejvel encontrar

6
estimadores que tivessem a mesma propriedade, isto , que minimizassem igual-
mente os quadrados dos erros. No caso da determinao de rbitas, por exemplo,
seria til encontrar processos de estimar os parmetros das trajectrias, de forma
a que as diferenas entre as observaes e as rbitas estimadas fossem mnimas,
no sentido dos mnimos quadrados. Gauss derivou ento as equaes que deter-
minavam os parmetros ptimos das funes segundo esse critrio. O mtodo
dos mnimos quadrados encontrado segundo este processo um mtodo estats-
tico sem fundamentao probabilstica. No h qualquer raciocnio nem qualquer
pressuposto que incida sobre o carcter da aleatoriedade das medidas.
Mas Gauss foi mais longe. Perguntou-se o que se passaria com os erros que
tornasse ptimo esse mtodo. Ou seja, voltando ao exemplo dos pesos e sabendo
que o peso do objecto em causa constante, os erros nas observaes devero
ter uma determinada distribuio de probabilidades. Qual ser a distribuio
desses erros que faz com que a estimativa dada pela mdia seja a que com maior
probabilidade se aproxima do verdadeiro peso? Por outras palavras, qual a dis-
tribuio dos erros que faz do mtodo dos mnimos quadrados o mtodo ptimo.
O que Gauss perguntava a si mesmo era qual a distribuio que faria com que os
estimadores dos mnimos quadrados fornecessem a moda, o valor mais provvel
dos verdadeiros parmetros, se os virmos como quantidades aleatrias.
O raciocnio de Gauss levou-o a uma distribuio de probabilidade que justifica
matematicamente o uso da mdia aritmtica e do mtodo dos mnimos quadra-
dos. Essa distribuio a normal ou distribuio de Gauss, bem conhecida pela
sua forma simtrica e pelas suas abas, com um aspecto grfico que relembra um
sino.
Chegado a este ponto, Gauss encontra uma outra justificao para o uso dos
mnimos quadrados. que a lei normal aparece como limite da distribuio de
erros independentes, fornecendo uma boa aproximao quando estes so da or-
dem das vrias dezenas. o clebre Teorema do Limite Central, talvez o resultado
mais importante de toda a teoria das probabilidades.

Quando a lei do erro desconhecida impossvel encontrar o resul-


tado mais provvel[...]. Chegamos ao mtodo dos mnimos quadra-
dos, independentemente da lei dos erros, quando o nmero de obser-
vaes suficientemente largo. Mas, com um nmero moderado de
observaes, fica-se completamente no escuro se a lei do erro de-

7
sconhecida. Carta de Gauss a Olbers, 22 de Fevereiro de l819, (citado
por Plackett, 1972).

Alguns anos mais tarde, em 1839, Gauss generaliza o mtodo dos mnimos
quadrados e coloca o problema da estimao em outra das bases tericas funda-
mentalmente admissveis, a da minimizao de uma forma funcional dos erros.
Pode mesmo dizer-se que Gauss, numa carta a Bessel datada de 28 de Fevereiro
desse ano, prefigura o ponto de vista da teoria da deciso. Vale a pena citar um
extracto completo dessa carta.

menos importante determinar o valor do parmetro para o qual


a probabilidade maior, ainda que infinitamente pequena, do que
aquele valor no qual nos apoiando jogamos o menos desvantajoso
jogo; ora, se f a denota a probabilidade de a incgnita x ter o valor a,
R
ento menos importante que f a tenha um mximo do que f x F (x
a) dx, tomado sobre todos os valores possveis de x, seja um mn-
imo, onde para F escolhida uma funo que seja sempre positiva e
que seja sempre crescente com argumentos crescentes, de uma forma
apropriada. Escolher o quadrado para esta funo puramente ar-
bitrrio e essa arbitrariedade est na natureza do tema. No fossem
conhecidas as largas vantagens da escolha do quadrado e qualquer
outra funo poderia ser escolhida.

4 Os planetas extra-solares

Duzentos anos depois da derivao de Gauss, o mtodo dos mnimos quadra-


dos voltou a ser decisivo para uma descoberta astronmica de alcance semel-
hante ao da descoberta do primeiro asteride. Trata-se da descoberta dos plan-
etas que orbitam outras estrelas que no o nosso Sol. Conhecem-se hoje duas
dezenas de planetas que orbitam estrelas afastadas. Essa descoberta deve-se
a extraordinrios progressos na tcnica da espectroscopia e, mais uma vez, ao
mtodo dos mnimos quadrados.
Ningum ainda observou visualmente um planeta extra-solar, o que impos-
svel com a actual tecnologia. No entanto, a existncia de vrios destes planetas
hoje aceite pelos astrnomos, com base em medidas muito precisas de oscilaes
peridicas da velocidade de algumas estrelas.

8
Velocidade Radial da Estrela R Coroa Boreal (desvios mdia em
m/s)
40

-40

-80

-120

-160
observaes

Figure 1: Dados de Noyes et al. 1997.

Todas estas medies baseiam-se no chamado efeito de Doppler, assim de-


nominado em referncia ao fsico austraco que primeiro o formulou claramente.
Num trabalho publicado em 1842, Christian Johann Doppler (180353), ento
professor em Praga, explicou que a frequncia observada da energia ondulatria
varia conforme a fonte se aproxima ou se afasta do observador. Assim, por ex-
emplo, um observador parado junto a uma linha de caminho de ferro nota que
a frequncia do silvo de um combio diferente conforme este se aproxima ou
se afasta do observador. Quando o combio se aproxima, o silvo mais agudo;
quando se afasta, mais grave. O mesmo fenmeno se passa com a luz. Se uma
estrela se aproxima de ns, a sua luz desloca-se para o azul, que corresponde a
frequncias mais elevadas. Se a estrela se afasta, a luz que observamos desloca-se
para o vermelho, que corresponde a frequncias mais baixas. O efeito de Doppler
tem sido profusamente utilizado em astronomia para medir as deslocaes rel-
ativas das estrelas e a expanso do universo. a medio rigorosa deste efeito
que tem permitido detectar as oscilaes de algumas estrela e da deduzir que
essas oscilaes so devidas atraco de planetas que as circundam.
Os novos espectrgrafos so extraordinariamente precisos. Conseguem de-
tectar variaes na velocidade radial (na direco estrela-observador) da ordem

9
dos 10 metros por segundo (36 quilmetros por hora). Como elemento de com-
parao, sabe-se que Jpiter provoca oscilaes no nosso Sol com uma velocidade
da ordem dos 12 metros por segundo (43,2 quilmetros por hora), pelo que per-
feitamente possvel detectar planetas mais massivos ou orbitando uma estrela a
distncia mais reduzida.
Utilizando as leis da mecnica celeste e tendo calculado o perodo orbital,
pode-se estimar a distncia a que um planeta orbita uma estrela. Considerando
a massa da estrela e a velocidade das suas oscilaes, pode estimar-se a massa
do planeta em causa.

Figure 2: Reproduzido de Noyes et al. 1997.

No se tem acesso aos dados de Piazzi que Gauss utilizou e muito provvel
que estejam irremediavelmente perdidos. Mas os dados que revelaram a existn-
cia de planetas extra-solares so fceis de obter a partir dos trabalhos originais.
A Figura 1 mostra as medidas da velocidade radial da estrela R da constelao
Coroa Boreal, que foram obtidas por Noyes et al. 1997. primeira vista, nada se
observa. Poder mesmo admitir-se que as medidas de velocidade parecem estar

10
distribudas aleatoriamente e sem obedecer a nenhum padro.
No entanto, aplicando um mtodo de regresso no linear que encontra a si-
nuside mais prxima no sentido dos mnimos quadrados, revela-se um padro
de oscilaes muito ntido. A evidncia visual da existncia de oscilaes peridi-
cas gritante. Com a anlise dessas oscilaes,os astrnomos puderam inferir
da existncia de um planeta orbitando esta estrela, assim como puderam estudar
muitas das suas caractersticas. Dois sculos depois da sua descoberta, o mtodo
dos mnimos quadrados continua a prestar servios inestimveis astronomia.

Referncias

Baum, Richard e Sheehan. William. In Search of Planet Vulcan: The Host in


Newtons Clockwork Universe. Nova Iorque: Plenum; 1997.

Farebrother, Richard William. Fitting Linear Relationships: A History of the


Calculus of Observations 17501900. Nova Iorque: Springer; 1999.

Grosser, Morton. The Discovery of Neptune. Nova Iorque: Dover; 1979. Reim-
presso, publicado originalmente em 1962 por Harvard University Press.

Hald, Anders. A History of Mathematical Statistics from 1750 to 1930. Nova


Iorque: Wiley; 1998.

Levy, David H. Clyde Tombaugh Discoverer of Planet Pluto. Tucson, Arizona:


The University of Arizona Press; 1991.

Noyes, Robert W. et al. "A Planet Orbiting the Star Rho Coronae Borealis", As-
trophysical Journal 483, p. L111; 1997.

Pannekoek, Anton. A History of Astronomy. Mineola, Nova Iorque: Dover;


1989. Reimpresso, publicado originalmente em George Allen and Unwin Ltd;
1961.

11
Plackett, R. L., "The discovery of the method of least squares", Biometrika 59,
239251; 1972.

Sheehan, William. The Planet Mars: A History of Observation and Discovery.


Tucson, Arizona: University of Arizona Press; 1996.

Sheehan, William. Worlds in the Sky: Planetary Discovery from Earliest Times
through Voyager and Magellan. Tucson, Arizona: University of Arizona Press;
1992.

Stern, Alan and Mitton, Jacqueline. Pluto and Charon: Ice Worlds on the
Ragged Edge of the Solar System. Nova Iorque: Wiley; 1998.

Stigler, Stephen M. The History of Statistics: The Measurement of Uncertainty


before 1900. Cambridge, Massachusetts: Harvard University Press; 1986.

Taff, Lawrence G. Celestial Mechanics. Nova Iorque: Wiley; 1985.

12