Está en la página 1de 16

Cmo sabemos si una variable afecta a otra variable?

X Y
Idea: Observar si cuando x vara entonces observamos
tambin una variacin en y.

X Y
Supongamos que tenemos datos de las variables X e Y de una
poblacin. Queremos ver la relacin entre esta variables (si
cuando vara X tambin vara Y).

Puedo pensar que la relacin entre estas variables es lineal,


por lo que puedo describir esta relacin mediante el
siguiente modelo:
Y= + 1 +U
Esta relacin no es determinstica: en los problemas que nos
interesan la relacin entre X e Y no es exacta. Por qu?
Porque existen muchas otras variables que pueden afectar a Y.
Por el momento supondremos que estas variables son
poco importantes (su efecto sobre Y es muy dbil, o
ocurren muy rara vez). A todas estas las agrupamos en el
trmino U (conocido como el error o disturbancia).
Suponemos que en promedio estas otras variables afectan
(aumentan) la variable y en la constante 0 . Dado que 0 ya
se ha incorporado a la ecuacin, podemos pensar que en
promedio las dems variables son cero (no afectan a la
variable Y).
=0
Pero si vamos a encontrar la verdadera relacin entre Y y X,
entonces no deberan existir otras variables que afecten a X. Es
decir, podemos descubrir la verdadera relacin de Y y de X al
observar si las variaciones de X son acompaadas por
variaciones de Y solamente si suponemos que las variaciones
de todas las dems variables que afecta a Y no afectan a X. Si U
resume al efecto de todas las dems variables sobre Y, esto
equivale a:
/ =0
Imponiendo las anteriores condiciones sobre el modelo se obtiene
los estimadores de 0 y de 1 .
(Por ello este mtodo se conoce ms generalmente como el mtodo de
momentos).

El resultado de esta operacin es:


0 = 1 1 =

Estos tambin son los estimadores mnimo cuadrticos (MCO)

Obtengo los estimadores MCO minimizando los errores o disturbancias


al cuadrado:

2
Y
.
.
U error
.

. .
.
. 1
Valor
Ajustado
. .
0

X
Dependiendo del problema tener datos de toda la poblacin es
imposible (existen datos censurados) o es muy costoso recoger todos
los datos.

Por ello casi nunca trabajamos sobre todos los datos (poblacionales),
sino solamente sobre una muestra de stos. Por ello en realidad
contamos solamente con un subconjunto de todos los datos
(realizaciones) de las variables.
Nos interesa encontrar estimadores (relaciones) vlidas para la
Poblacin, a partir de una muestra.

Por ejemplo:
Si queremos saber cul el promedio de edad de un pas, podemos
tomar una muestra, y a partir de ella (calculando el promedio de la
muestra) estimar el promedio de edad del pas.
Si queremos estimar la relacin entre el precio del oro y la inflacin,
slo tendremos los datos de una pequea muestra en el tiempo.
Caractersticas de una buena muestra:
Que se obtenga aleatoriamente.
Que sea representativa.

Una muestra es aleatoria si genera datos que no estn


correlacionados entre s: los datos se extraen independientemente de
la misma poblacin.
Los datos que se extraen son generalmente:
Series Transversales (Cross Section): un nmero de observaciones
que se extrae en un momento del tiempo.
Series de Tiempo (Time Series): un conjunto de observaciones que la
misma unidad en diferentes momentos de tiempo.
Datos de Panel: datos del mismo corte transversal observados en
varios puntos del tiempo.
El mtodo de estimacin no cambia, pero trabajamos con datos
muestrales y no poblacionales. Por ello pondremos una pestaa a
los estimadores y errores muestrales.
Y
. Regresin Poblacional
.
error U error
. poblacional
muestral
. . Regresin Muestral

.
. 1
Valor
Ajustado
. .
0

X
Por ello no obtendremos la verdadera relacin entre Y y X, sino una
estimacin de esta relacin, basada en la muestra con la que
contamos. Es evidente que los parmetros de esta estimacin sern
diferentes a los parmetros de la verdadera regresin.

Hay que notar que los estimadores muestrales son ahora variables
aleatorias, que dependen de la muestra que tomemos. Si un
investigador toma una muestra diferente, obtendr estimadores
diferentes.
Si la muestra ha sido aleatoria (tpica), entonces nuestros
estimadores estarn cerca del valor poblacional.
Si nuestros supuestos fallan, no estamos encontrando (en
promedio) la verdadera relacin.
Si U est correlacionada con X tendremos una relacin esprea.

También podría gustarte