Está en la página 1de 3

Woolridge

La econometría se ha desarrollado como una disciplina distinta de la estadística matemática ya


que se centra en los problemas inherentes a la recopilación y al análisis de datos económicos no
experimentales. Los datos no experimentales no se recogen mediante experimentos controlados
con individuos, empresas o segmentos de la economía (los datos no experimentales se denominan
a veces datos de observación para enfatizar el hecho de que el investigador recopila datos de
forma pasiva). Los datos experimentales se recopilan a menudo en entornos de laboratorio en las
ciencias experimentales, pero son mucho más difíciles de obtener en las ciencias sociales. 2

Un conjunto de datos de corte transversal es una muestra compuesta por individuos, familias,
empresas, ciudades, estados, países u otro tipo de unidades muy variadas recogida en un
momento determinado. En ocasiones, los datos de cada unidad no son exactamente del mismo
periodo de tiempo. Por ejemplo, podrían hacerse encuestas a diversas familias durante semanas
distintas de un mismo año. En un análisis de corte transversal, dejaríamos de lado cualquier
pequeña diferencia en el tiempo de recopilación de los datos. Una característica importante de los
datos de corte transversal es que, a menudo, podemos suponer que se han obtenido mediante un
muestreo aleatorio de la población subyacente

Un conjunto de datos de series temporales consiste en observaciones sobre una variable o


distintas variables a 1o largo del tiempo. Los precios de las acciones, la oferta monetaria. los
índices de precios al consumo, el producto interior bruto, las tasas anuales de homicidio o las
cifras de venta de automóviles son ejemplos de series temporales. Dado que los acontecimientos
pasados pueden tener influencia sobre acontecimientos futuros, y los efectos retardados en el
comportamiento de los individuos son frecuentes en ciencias sociales, el tiempo es un parámetro
importante en los conjuntos de series temporales. Por oposición al orden de los datos de corte
transversal, la disposición cronológica de las observaciones de una serie temporal sí transmite
información potencialmente importante. Una característica importante de las series temporales
que hace que éstas sean más difíciles de analizar que los datos de corte transversal es el hecho de
que rara vez, si no nunca, podemos suponer que las observaciones económicas son
temporalmente independientes. Otra característica de los datos de series temporales que puede
requerir especial atención es la frecuencia de los datos, es decir, la frecuencia con la que se
recogen los datos. En economía, las frecuencias más comunes son las frecuencias diarias,
mensuales, trimestrales y anuales. 10

Algunos conjuntos de datos tienen características tanto de datos de corte transversal como de
datos de series temporales. Por ejemplo, supongamos que se hacen dos encuestas de corte
transversal sobre familias en Estados Unidos, una en 1985 y otra en 1990. En 1985. se hace una
encuesta con una muestra aleatoria para obtener variables como el nivel de ingresos, de ahorro, el
tamaño de las familias, etc. En 1990, se hace un nuevo muestreo aleatorio de las familias y se
emplean las mismas preguntas que en 1985 para hacer la encuesta. Para aumentar el tamaño de
la muestra, podemos formar un conjunto de datos fusionados de sección cruzada combinando los
datos de dos años.

Los conjuntos de datos de panel (o longitudinales) consisten en series temporales para cada
unidad de corte transversal del conjunto de datos. Como ejemplo, supongamos que tenemos un
registro de datos sobre el salario, la educación y el historial de empleo de un conjunto de
individuos seguidos durante un periodo de diez años. La característica clave de los datos de panel
que los diferencia de los datos fusionados de sección cntzada es el hecho de que se mantiene un
registro de Ias mismas unidades de sección cftrzada (individuos, empresas o condados de los
ejemplos anteriores) durante un periodo de tiempo determinado.

En la mayoría de los contrastes de la teoría económica y, sin duda alguna, al evaluar políticas
económicas públicas, el objetivo de los economistas es inferir si una variable (como la educación)
tiene un efecto causal sobre otras variables (como la productividad de los trabajadores). El
encontrar una relación entre dos o más variables puede ser algo sugerente, pero rara vez pasa de
eso, a no ser que se pueda establecer una relación de causalidad. La noción de ceteris paribus [que
significa <otros factores (relevantes) siendo iguales>] desempeña un papel importante en el
análisis causal

Al crear un modelo que <explique y en términos de p, nos enfrentamos a tres problemas. En


primer lugar, dado que nunca se da una relación exacta entre dos variables, ¿cómo permitir que
otros factores afecten a y? En segundo lugar, ¿cuál es la relación funcional existente entre ,v y x?
Y, finalmente, ¿cómo podemos asegurarnos de estar captando una relación ceteris paribus entre y
y x (siempre y cuando éste sea el objetivo buscado)?

Y = B0 + B1x + u  Modelo regresión lineal simple

Cuando están relacionadas por (2.1), las variables y y x tienen diferentes nombres que se emplean
indistintamente: y recibe el nombre de variable dependiente, de variable explicada. de variable de
respuesta, de variable predicha o de regresando; y a x se la denomina variable independiente,
variable explicativa, variable de control, variable predictor o regresor. (El término covariable
también se emplea para x. La variable z, denominada término de error o perturbación en la
relación, representa factores distintos de x que afectan a y. En el análisis de regresión simple se
tratan en efecto todos los factores que afectan a y y que no sean r como si fueran no observados.
Podemos pensar en a como no observado.

De esta manera, el cambio en y es simplemente B1 multiplicado por el cambio en x. Esto significa


que B1 es el parámetro de la pendiente en la relación entre y y x manteniendo los demás
factores de u fijos; este parámetro es de mucho interés en economía aplicada. El término
constante fn también se emplea en algunos casos, aunque rara vez es esencial para el análisis.

wage = B0 + B1educ -u

Si wage (la variable <salario>) se mide en dólares por hora y educ corresponde al número de años
de formación, f' mide el cambio en el salario por hora cuando se introduce un ., año de formación
adicional manteniendo todos los demás factores fijos. Entre los demás i factores se incluyen la
experiencia en el trabajo, la habilidad innata, la antigüedad en el :: empleo actual, y una larga lista
de otros factores25

La linealidad de (2.1) implica que el cambio de una unidad en x tiene el mismo efecto sobre y,
independientemente del valor inicial de x.
En la Sección 2.5 mostraremos que sólo podemos obtener estimadores fiables de B0 y B1
partiendo de un muestreo aleatorio de datos cuando establecemos supuestos que restringen el
modo en que el error no observable u se relaciona con la variable explicativa x.

Relación u y x: coeficiente de correlación: si no están correlacionadas, entonces, como variables


aleatorias, no están relacionadas linealmente. Correlación solo mide dependencia lineal entre u y
x. 26

También podría gustarte