Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Un conjunto de datos de corte transversal es una muestra compuesta por individuos, familias,
empresas, ciudades, estados, países u otro tipo de unidades muy variadas recogida en un
momento determinado. En ocasiones, los datos de cada unidad no son exactamente del mismo
periodo de tiempo. Por ejemplo, podrían hacerse encuestas a diversas familias durante semanas
distintas de un mismo año. En un análisis de corte transversal, dejaríamos de lado cualquier
pequeña diferencia en el tiempo de recopilación de los datos. Una característica importante de los
datos de corte transversal es que, a menudo, podemos suponer que se han obtenido mediante un
muestreo aleatorio de la población subyacente
Algunos conjuntos de datos tienen características tanto de datos de corte transversal como de
datos de series temporales. Por ejemplo, supongamos que se hacen dos encuestas de corte
transversal sobre familias en Estados Unidos, una en 1985 y otra en 1990. En 1985. se hace una
encuesta con una muestra aleatoria para obtener variables como el nivel de ingresos, de ahorro, el
tamaño de las familias, etc. En 1990, se hace un nuevo muestreo aleatorio de las familias y se
emplean las mismas preguntas que en 1985 para hacer la encuesta. Para aumentar el tamaño de
la muestra, podemos formar un conjunto de datos fusionados de sección cruzada combinando los
datos de dos años.
Los conjuntos de datos de panel (o longitudinales) consisten en series temporales para cada
unidad de corte transversal del conjunto de datos. Como ejemplo, supongamos que tenemos un
registro de datos sobre el salario, la educación y el historial de empleo de un conjunto de
individuos seguidos durante un periodo de diez años. La característica clave de los datos de panel
que los diferencia de los datos fusionados de sección cntzada es el hecho de que se mantiene un
registro de Ias mismas unidades de sección cftrzada (individuos, empresas o condados de los
ejemplos anteriores) durante un periodo de tiempo determinado.
En la mayoría de los contrastes de la teoría económica y, sin duda alguna, al evaluar políticas
económicas públicas, el objetivo de los economistas es inferir si una variable (como la educación)
tiene un efecto causal sobre otras variables (como la productividad de los trabajadores). El
encontrar una relación entre dos o más variables puede ser algo sugerente, pero rara vez pasa de
eso, a no ser que se pueda establecer una relación de causalidad. La noción de ceteris paribus [que
significa <otros factores (relevantes) siendo iguales>] desempeña un papel importante en el
análisis causal
Cuando están relacionadas por (2.1), las variables y y x tienen diferentes nombres que se emplean
indistintamente: y recibe el nombre de variable dependiente, de variable explicada. de variable de
respuesta, de variable predicha o de regresando; y a x se la denomina variable independiente,
variable explicativa, variable de control, variable predictor o regresor. (El término covariable
también se emplea para x. La variable z, denominada término de error o perturbación en la
relación, representa factores distintos de x que afectan a y. En el análisis de regresión simple se
tratan en efecto todos los factores que afectan a y y que no sean r como si fueran no observados.
Podemos pensar en a como no observado.
wage = B0 + B1educ -u
Si wage (la variable <salario>) se mide en dólares por hora y educ corresponde al número de años
de formación, f' mide el cambio en el salario por hora cuando se introduce un ., año de formación
adicional manteniendo todos los demás factores fijos. Entre los demás i factores se incluyen la
experiencia en el trabajo, la habilidad innata, la antigüedad en el :: empleo actual, y una larga lista
de otros factores25
La linealidad de (2.1) implica que el cambio de una unidad en x tiene el mismo efecto sobre y,
independientemente del valor inicial de x.
En la Sección 2.5 mostraremos que sólo podemos obtener estimadores fiables de B0 y B1
partiendo de un muestreo aleatorio de datos cuando establecemos supuestos que restringen el
modo en que el error no observable u se relaciona con la variable explicativa x.