Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Poltica y Cultura
Departamento de Poltica y Cultura
Universidad Autnoma Metropolitana, Unidad Xochimilco
polcul@cueyatl.uam.mx
ISSN: 0188-7742
Mxico
2002
Claramarta Adalid Diez de Urdanivia
POR QU PROBAR EN ECONOMETRA?
Poltica y Cultura, primavera, nmero 017
Universidad Autnoma Metropolitana - Xochimilco
Distrito Federal, Mxico
pp. 362-378
Matemticas
y ciencias sociales
El propsito de este artculo es ofrecer una descripcin de los usos de las pruebas de hiptesis en
la investigacin economtrica, es decir, de las pruebas acerca de las teoras econmicas, de la
validez del modelo y de las pruebas de diagnstico. Se consideran particularmente los enfoques de
los autores clsicos de la metodologa de pruebas de hiptesis: Fisher, y Neyman y Pearson. Por
otra parte, se mencionan algunos de los errores que se cometen con ms frecuencia en la presentacin de artculos, en el marco de modelos no anidados.
364
POLTICA Y CULTURA
riables econmicas, pero tambin en la medicin de las mismas, que en aquella poca
dio como resultado la construccin de los nmeros ndice.
Con el desarrollo de la estadstica matemtica y sus mtodos, no slo descriptivos sino inferenciales, la econometra, y otras ciencias aplicadas como la biometra y
la psicometra, pudieron ir adaptndolos a sus propias necesidades. Un avance muy
importante en la metodologa economtrica fue la introduccin del concepto de
probabilidad.
La definicin para el trmino econometra desde la fundacin de la Sociedad
Economtrica, en 1930, se propuso que entre los objetivos principales de esta disciplina est el avance de la teora econmica en su relacin con la estadstica y la matemtica.
Samuelson, Koopmans y Stone la definen como el anlisis cuantitativo de fenmenos econmicos del mundo real, a partir del desarrollo concurrente de la teora y
la observacin, relacionados mediante mtodos apropiados de inferencia.2
Para Spanos, a esta disciplina le concierne el estudio sistemtico de los fenmenos econmicos, para lo cual se emplean datos que se observan, en el marco en el
que la teora econmica, as como la inferencia estadstica, desempean un papel
importante.3
Para llegar al estado actual que guarda la econometra, muchos problemas tuvieron que ser resueltos en el camino. Faltaban datos relevantes, ya que en muchos casos
no existan mediciones para las variables a considerar en el modelo econmico. El carcter no experimental de los datos impona restricciones de naturaleza estadstica, problema que fue tericamente resuelto por Haavelmo en 1944 cuando introdujo el concepto de probabilidad en la prctica economtrica. Haavelmo argumentaba que los
economistas no estn en posicin de aislar, controlar y manipular las condiciones econmicas: no pueden realizar experimentos. En vez de eso, deben improvisar con observaciones pasivas (aquellas de los experimentos de la naturaleza) que se ven influidas por
una gran cantidad de factores no tomados en cuenta por la teora.4
De este modo, la econometra, en un principio, establece las relaciones entre
variables econmicas como cantidades y precios, ingresos y ventas, etc., abstrayendo
2
3 A. Spanos. Statistical foundations of econometric modelling: Cambridge University Press, Cambridge, 1986.
4
M. Morgan. The history of econometric ideas: Cambridge University Press, Cambridge, 1990.
365
el fenmeno que se considera y estableciendo teoras en forma matemtica. La utilidad emprica de los modelos resultantes es evaluada con los distintos mtodos estadsticos. Las teoras econmicas, en general, mejoran considerablemente en calidad y
credibilidad cuando se contrastan con los datos econmicos.5 Podemos decir que
una razn muy importante por la que se confrontan modelos y datos es que ste es
uno de los procedimientos del mtodo cientfico.
As pues, usar pruebas estadsticas en la prctica econmica forma parte relevante del mtodo economtrico que usa las herramientas del anlisis estadstico, no
slo descriptivo, sino principalmente inferencial. Entre los mtodos inferenciales, las
pruebas de hiptesis han desempeado un papel fundamental, pues establecen el
puente entre la teora y el mundo real.
366
POLTICA Y CULTURA
Pearson, por la otra. Las teoras desarrolladas por estos autores se denominaron de
manera distinta como: pruebas de significancia para el enfoque de Fisher y pruebas
de hiptesis para el de Neyman-Pearson.7
Fisher propone la prueba de una hiptesis nula H 0 : 0 usando el valor
probabilstico o valor p para decidir acerca de la fuerza de la estadstica de prueba:
si el valor p es pequeo, esto implica que, o la realizacin observada de la estadstica
de prueba constituye un evento raro, o que la hiptesis nula postulada es invlida.
Cuando no se rechaza la hiptesis nula slo significa que es aceptada por el momento
sobre una base provisional. ste es, en esencia, el argumento de las pruebas de
significancia: Fisher consideraba que la estadstica era la ciencia de la incertidumbre
inferencial capaz de ofrecer la clave que permitira resolver el largamente debatido
problema de induccin.8 Sin embargo, cmo escoger entre las distintas estadsticas
de prueba?, por qu unas y no otras?
Para resolver esta pregunta, Neyman y Pearson desarrollaron la teora para calcular y derivar pruebas de significancia ptimas. Segn la teora de Neyman y Pearson,
al establecimiento de la hiptesis nula H 0 : 0 se le agrega la hiptesis alternativa,
que en realidad es un conjunto de posibles alternativas, H 1: 1 = 0 . La introduccin de lo que conocemos como la hiptesis alternativa da por resultado el
establecimiento de los errores de tipo I, falso rechazo, y de tipo II, falsa aceptacin;
as como la eleccin de una estadstica de prueba ptima aparece como el resultado
de maximizar la funcin potencia en el espacio de parmetros 1. En esta teora se
reemplaza el valor p con una regla de decisin apoyada en la nocin del nivel de
significancia (o tamao) de la prueba.
Neyman y Pearson resolvieron, el caso de la prueba de una hiptesis simple
contra otra hiptesis simple con el lema de Neyman-Pearson, que en versin moderna establece: La prueba de la razn de verosimilitud es la prueba ms poderosa de la
hiptesis H 0 : = 0 en contra de la posibilidad simple H 0 : = 1 .9
7 Un buen desarrollo de las diferencias y los usos de estos dos enfoques se puede encontrar en H.
Roberts.
For what use are tests and hypotheses and tests of significance, en O. Kempthorne y J. Pratt. Communications
in statistics, 1976, VA5 N 7.9.
8 E. L. Lehman. The Fisher, Neyman-Pearson theories of testing hypotheses: one theory or two?, en
Journal of the American Statistical Association, vol. 88, nm. 424 (Theory and Methods), 1993.
9 H. D. Brunk. Introduccin a la estadstica matemtica: Trillas, Mxico, 1979, p. 415.
367
ibidem, 1990.
Probability theory and statistical inference: Cambridge University Press, Cambridge, 1995.
12 En un interesante artculo, los autores ofrecen una revisin de las pruebas de hiptesis. T. W. Nix
y B. Jackson. The data analysis dilemma: ban or abandon, en Research in the Schools, vol. 5, nm. 2, 1998,
pp. 3-14.
13 S. L. Zabell, R. A. Fisher and the fiducial argument, en Statistical Science: 7, 1992, pp. 369-387,
citado en Lehman, 1993, ibidem.
11 A. Spanos.
368
POLTICA Y CULTURA
k N
= f ( x;0) =
1
2
1
exp 2 ( x ) , x R
2
= E ( X k ) 2 = Var(X k )
los supuestos probabilsticos a probar son:
14
G. Gigerenzer. The empire of chance: How probability changed science and everyday life: Cambridge
University Press, Cambridge, 1987, en Spanos, 1995, ibidem, p. 727.
369
X k N (, 2 ) k = 1,2,...
(X1, X2,..., Xn) es una muestra independiente15
(X1, X2 ,..., Xn) es una muestra idnticamente distribuida
370
POLTICA Y CULTURA
E ( t ) = 0 para toda t ;
371
s = t
E ( t s ) =
0 s t
20 W. Charemza y D. F. Dreadman.
372
POLTICA Y CULTURA
cionan las ms comunes, aunque debe indicarse que este tema es mucho ms complejo de lo que aqu se presenta.
Problemas con los errores:
1)
2)
373
problema se presentara tambin en el contexto de las series de tiempo y particularmente en el pronstico de series de tipo financiero, como precios de acciones, tasas
de inflacin, etc. Engle desarroll el modelo autorregresivo de heteroscedasticidad
condicional (ARCH), en donde la idea central es que la varianza del error en el
tiempo t, depende del tamao del error al cuadrado en el tiempo t 1, apoyando la
nocin de que el pasado reciente puede ofrecer informacin acerca de la varianza
condicional del error:
2 = 0 + 1ut21 + ... + put2 p
donde la impresin es que la varianza est correlacionada.
Una varianza como la anterior puede provenir de una perturbacin definida por:
2
ui = t 0 + 1ut1
+ ...+ p ut2 p
donde {t} es un proceso de ruido blanco con varianza uno. Este modelo se denomina
ARCH( p).
Las pruebas de diagnstico del modelo
En el enfoque tradicional se considera que en un anlisis economtrico se deben
estudiar los siguientes aspectos:
a)
b)
c)
d)
e)
La teora econmica.
Los datos estadsticos.
La formulacin del modelo sobre la base de la teora o de investigaciones
economtricas recientes.
El clculo de los parmetros del modelo usando informacin estadstica relevante.
La inspeccin de los resultados estadsticos obtenidos para juzgar cun adecuado es el modelo.
En este contexto, la inspeccin consiste en medir la bondad del ajuste del modelo, que en forma general se hace a travs del coeficiente de determinacin R2:
verificar que los estimadores de los coeficientes de regresin sean significativos, con
374
POLTICA Y CULTURA
los signos esperados a priori, y que el modelo tenga poder de prediccin, dentro y
fuera de la muestra dada. Entre las pruebas que existen para detectar errores de especificacin estn la prueba de Durbin, la RESET de Ramsey y la del multiplicador de
Lagrange.
Si despus de aplicar la batera de pruebas el modelo se considera satisfactorio,
entonces se tiene en cuenta y se usa en las predicciones. Pero si el modelo se considera
insatisfactorio, entonces el investigador debe encontrar la mejor especificacin, probando quiz mltiples formulaciones con docenas de corridas y pruebas en la computadora, en un afn por dar con la ecuacin satisfactoria. Este proceso de bsqueda se ha denominado, peyorativamente, data-mining.
Frente a esta posicin existen opiniones encontradas. Algunos autores, como
Darnell,22 consideran que si se modifica un poco la metodologa tradicional, puede
continuar siendo la metodologa preferida por los investigadores.
La otra posicin es la que desarrolla Hendry y es conocida como metodologa
de lo general a lo particular; en ella se parte de un modelo general y con la ayuda de una
batera de pruebas de diagnstico se reduce a un modelo particular. No se piense que
esta bsqueda es automtica: el investigador requiere tener una idea clara de la forma
especfica del modelo, que es el hilo conductor de la investigacin. Si no es as, modelar de lo general a lo particular puede convertirse en un mtodo de simplificacin
de modelos, es decir, un mtodo de descubrimiento ms que de confirmacin.23
Confirmacin de la prueba
Finalmente, se menciona que un objetivo de una prueba es realizar alguna toma de
decisiones, como en los procesos de control de calidad, pero tambin con fines polticos, en los que se puede considerar la variable independiente como variable de
control y la dependiente como variable objetivo.24
Si el modelo es capaz de resistir el cmulo de pruebas y salir bien librado, podemos decir que la hiptesis o la teora en consideracin se ha confirmado, y entonces
puede utilizarse para pronstico o con fines de control o de poltica.
22 A.
23 W. Charemza y D. Dreadman. New directions in econometric practice, 2a. ed.: Edward Elgar Publishing,
375
25 G. R. Loftus. On the tyranny of hypothesis testing in the social sciences, en Contemporary Psychology,
vol. 36, nm. 2, 1991, p. 102. En este artculo se hace una crtica, en general, al uso de las pruebas de hiptesis
y, en particular, a los conceptos usados en stas.
26 Spanos. On theory tTesting in econometrics modelling with non experimental data, en Journal of
Econometrics, vol. 67, 1995, p. 190.
27 Charemza et al.
28 M. McAleer. The significance of testing empirical non-nested models, en Journal of Econometrics,
vol. 67, 1995, pp. 149-171.
376
4)
5)
POLTICA Y CULTURA
del tipo de pruebas no anidadas que estaban considerando, y una mala interpretacin de los resultados en las pruebas estadsticas (como decir que un valor que resultaba estadsticamente significativo se interpretaba como insignificante).
No considerar las propiedades de muestra finitas para algunas pruebas. (Encontr doce artculos en los que la muestra era menor a 25, y dos en que las muestras eran de 15 y 16 observaciones.)
El uso de modelos inadecuados que no han pasado algunas pruebas, como las
de correlacin serial.