Está en la página 1de 3

APUNTES DE CLASE ECONOMETRA I UDI ECONOMETRA E INFORMTICA Prof. Ramn Maha ramon.mahia@uam.

es HIPTESIS ESTRUCTURALES: MUESTRAS PEQUEAS Como todo ejercicio de inferencia estadstica, y el anlisis economtrico lo es, el tamao del conjunto de datos utilizados condiciona la fiabilidad de los resultados. Debe sealarse, en el caso concreto de la modelizacin economtrica, que el asunto de inters no es tanto el nmero de datos disponibles n, sino el tamao muestral en relacin con el nmero de parmetros a estimar en el ejercicio global de anlisis, es decir, los grados de libertad n-k. Ms all de las implicaciones tcnicas concretas, debe resaltarse la inconsistencia conceptual de un ejercicio de inferencia elaborado sobre la base de una muestra pequea de informacin ; el ejercicio economtrico es un ejercicio de exploracin de una muestra de datos que debe reflejar una estructura poblacional de relaciones desconocida, parece pues evidente que la utilizacin de una muestra reducida se contrapone con el deseo de aproximar, en la mayor medida posible la estructura real del fenmeno analizado. Analticamente, lo anterior se refleja en muchos casos de forma muy evidente complicando el contraste estadstico de hiptesis. La aplicacin de contrastes en la etapa de evaluacin de los resultados de un modelo es siempre un ejercicio en el que el valor obtenido en los contrastes (t, F, Chi.) se compara siempre con el valor terico sealado por las tablas de distribucin estadstica de las distribuciones correspondientes con el fin de aceptar o rechazar la hiptesis nula de turno. En la seleccin de esa valor de tablas el nmero de grados de libertad del modelo N-k determina el valor dado un determinado nivel de confianza: el valor de tablas, de referencia para cualquier contraste se vuelve ms exigente cuantos menos grados de libertad hemos empleado para la estimacin. En este sentido, en presencia de escasos grados de libertad, los ejercicios de contraste de parmetros son siempre menos concluyentes : las varianzas de los parmetros estimados son demasiado amplias y los valores crticos de tablas muy elevados, por tanto, los intervalos de variacin obtenidos para enmarcar los valores de los parmetros reales son igualmente amplios, impidiendo el rechazo de la hiptesis nula contrastada an cuando esto sea cierto (elevado porcentaje de errores de tipo II).1 Adems de problemas operativos asociados, como se dijo, al contraste de hiptesis, un escaso tamao muestral pone en cuestin algunas de las virtudes expuestas para el MBRL estimado por MCO, en concreto, todos aquellos que como la consistencia de los estimadores, se formulan y derivan en el contexto terico de un tamao muestral elevado. Dadas las premisas anteriores, la conclusin que podra extraerse sera aparentemente simple: el analista debe garantizar la mayor cantidad de

Ver ejercicio de Montecarlo sobre esta cuestin realizado M..S. Common (1976) y reproducido ntegramente, entre otros textos, en el libro Modelos Economtricos de Antonio Pulido y Julin Prez, pg. 405.

informacin posible, el tamao muestral ms amplio, ya que de ese modo evitaremos los problemas. Sin embargo, esta afirmacin merece algunas matizaciones: o La cuestin del tamao muestral debe estar siempre en relacin con el concepto de variabilidad: a mayor variabilidad observada en la realidad, mayor debe ser el tamao de la muestra seleccionada para representarla. No hay, por tanto, receta vlida alguna: ni 15, ni 20, ni 10 grados de libertad,. el analista debe tener la suficiente sensibilidad como para determinar si la muestra de datos seleccionada permite garantizar una mnima fiabilidad al ejercicio economtrico. Ni siempre hay muestras de datos amplias disponibles para el anlisis, bien por defectos en el sistema estadstico, bien por que el fenmeno analizado es relativamente reciente2 o, estructuralmente, por definicin, de dimensiones reducidas.3 recopilarla desde el inicio de los datos ya que corremos el riesgo de mezclar estructuras de anlisis diferentes cuando, en realidad, quiz nos interese analizar la realidad actual o ms reciente sin mezclar esta realidad, con perodos lejanos en el tiempo cuya estructura o dinmica se ha abandonado ya y carece, por tanto, de inters analtico4.

o En ocasiones, an existiendo informacin histrica amplia, no interesa

o En modelos temporales, la utilizacin de frecuencias de datos elevadas


(trimestrales, mensuales, semanales) garantiza un elevado nmero de observaciones. Sin embargo, la seleccin de datos de alta frecuencia slo tiene sentido si el anlisis es un anlisis de alta frecuencia en el que interesa la dinmica ms reciente del fenmeno (por ejemplo, los ltimos 28 trimestres) pero no es una estrategia vlida si se utiliza con el nico fin de inflar artificialmente la muestra de datos5 an cuando el anlisis de base es un anlisis que exigira una muestra de datos que recogiese el medio o el largo plazo de un determinado fenmeno.

o La utilizacin de datos de panel (es decir, muestras combinadas de


observaciones temporales y transversales) es una estrategia que, en lnea con lo sealado en el punto anterior, permite reunir con facilidad amplios conjuntos de datos. Nuevamente, sin embargo, slo tiene sentido como estrategia de seleccin muestral si est justificada

Suponga, por ejemplo, que debe realizar un anlisis de los efectos de la incorporacin de los 10 nuevos pases del este en la Unin Europea.
3

As, por ejemplo, si deseamos realizar un anlisis transversal sobre los efectos diferenciales de la inversin extranjera en el 2002 en los distintos pases del MERCOSUR, no podremos tener una muestra de 20 datos dado que slo hay 4 pases en esa asociacin de libre mercado.
4

Por ejemplo, aunque podramos disponer de series de comercio exterior desde hace casi 50 aos, lo cierto es que la estructura del comercio exterior actual no tiene demasiado que ver con la de hace 25 aos lo cual aconsejara reducir el foco del anlisis a un perodo ms reciente.
5

No es poco habitual que un analista que quiere, por ejemplo, realizar un anlisis de convergencia (esencialmente a largo plazo) haga algo como esto: dado que slo tengo 5 aos para el anlisis, y son pocos, tomo datos mensuales y as tengo 60 observaciones para cada serie. La realidad es que este investigador sigue disponiendo slo de 5 aos y, por tanto, poco o nada podr decir sobre el proceso de convergencia, un proceso que se observa, quiz, a lo largo de 10 o 15 aos. Es como tener 5 observaciones repetidas 12 veces cada una; es, ridiculizando la idea, como tener slo 5 encuestados pero haber preguntado a cada uno lo mismo 12 veces: se tienen 60 respuestas?.

analticamente: es decir, si el inters del analista se centra tanto en la dinmica temporal del fenmeno como en su dinmica transversal6. o Ante un reducido nmero de grados de libertad, y agotada la va de aumentar n siempre cabe la posibilidad de intentar disminuir k. En principio, y ms all de la cuestin del tamao muestral, reducir al mximo el nmero de variables relevantes es siempre, por razones de utilidad del instrumento economtrico, un consejo a tener en cuenta. Adems de una cuidada seleccin de variables relevantes que permita reducir al mximo el nmero de parmetros a estimar, existen procedimientos de combinacin de variables que permiten comprimir el conjunto de variables sin renunciar a una excesiva variabilidad (anlisis factorial, por ejemplo) .

Si decido tomar datos de los pases del MERCOSUR (4 pases) a lo largo de los ltimos 5 aos, tendra 20 observaciones para cada variable. Este conjunto de datos tiene inters si se desea observar la dinmica de, por ejemplo, la inversin extranjera, en lo referente a su evolucin temporal y en lo referente a las diferencias en su comportamiento en los distintos pases. Si slo inters la cuestin temporal o slo al transversal, el conjunto de datos de panel podra resolver algunas deficiencias analticas pero sera conceptualmente poco defendible.

También podría gustarte