Está en la página 1de 9

COMPARACIN DE DOS MODELOS ECONOMTRICOS

Un problema que puede presentarse en la prctica es la comparacin de dos modelos economtricos. Por ejemplo, se desea analizar si el precio de la vivienda en dos barrios difiere significativamente, o si se ha producido un cambio significativo en este precio en el ao en curso respecto al precio vigente hace tres aos, o tambin, si las calificaciones obtenidas por los chicos que estudian una carrera se diferencian de las notas obtenidas por las chicas, o bien, si el beneficio de una empresa que actua en dos mercados distintos difieren entre s . !n principio se podr a pensar que estas cuestiones se abordan estad sticamente con contrastes de hiptesis como los de comparacin de las medias de dos poblaciones "los dos barrios, las dos pocas, los dos se#os, etc$, o con contrastes de comparacin de otros parmetros de estas poblaciones, o incluso con tests de ajuste o identidad entre las dos poblaciones investigadas. %in embargo, al planificar un e#perimento muestral para responder a las preguntas planteadas, sin duda se pretender que la respuesta sea realista, en el sentido de adaptarse de forma lo mas adecuada posible a las condiciones del mercado o de las poblaciones investigadas. &s , al comparar el precio medio de la vivienda en dos zonas de una ciudad, ha' que tener en cuenta otras variables que condicionan o e#plican esta variable "por ejemplo la superficie de un piso, el n(mero de habitaciones, su equipamiento, la zona de la ciudad donde se ubica, etc.$, o al comparar las notas obtenidas por estudiantes de ambos se#os, cabe tener en cuenta otros factores e#genos que determinan, al menos en parte, las calificaciones "por ejemplo, el n(mero de horas de estudio semanales, la asistencia o no a clase, su capacidad intelectual, etc.$. Para simplificar el problema, vamos a considerar un modelo para e#plicar las variaciones de una variable endgena, y, en funcin de una sola variable e#gena, x, ' de un factor no numrico, d, binario, que se va a codificar mediante los n(meros ) ' * "podr a codificarse tambin con los valores +* ' ,*$. !n el caso que el factor tuviese mas de dos niveles "por ejemplo, tres barrios de una ciudad, se necesitar an dos variables artificiales binarias como la variable artificial d anterior$. %ea pues, y la nota obtenida en una asignatura por un estudiante, x, las horas de estudio, ' d su se#o "d - ) para un chico ' d - * para una chica$. %e parte de la suposicin que la variable endgena y va a depender linealmente de las variables e#genas x ' d. !sta suposicin es discutible, pues posiblemente al aumentar mucho las horas de estudio el efecto marginal sobre la calificacin va a ir decreciendo, lo que implica una no linealidad. .amos a plantear dos modelos alternativos/ y - ) + * x + 0 d + en el que el coeficiente 0 representa el efecto aditivo sobre la nota asociado al se#o del estudiante, ' el modelo y - ) + * x + 0 d + 1 x d +

en el que se inclu'e un efecto aditivo 0, ' uno multiplicativo cuantificado en el coeficiente 1, que afecta a la pendiente de la recta asociada a cada se#o, es decir al rendimiento marginal de cada hora de estudio, que, hipotticamente podr a ser distinto para chicos ' chicas. %i se utiliza el primer modelo, la comparacin de las calificaciones obtenidas para cada se#o, se puede realizar con el test 2 sobre el coeficiente 0, es decir, planteando las hiptesis 3)/ 0 - ) 3*/ 0 ) %i se acepta 3*, a un nivel de significacin , se estar aceptando que e#isten diferencias entre los rendimientos acadmicos en funcin del se#o, ' estas diferencias sern iguales "efecto aditivo$ para estudiantes que dediquen diferentes n(meros de horas de estudio, mientras que si se acepta 3), se considera, al nivel de significacin empleado, que no e#isten diferencias asociadas al se#o. %i se sospecha que, por ejemplo, las chicas obtienen mejores notas con la misma intensidad de estudio, cabe plantear la hiptesis alternativa como unilateral, es decir, 3*/ 0 4 ), "ma'or, pues se ha codificado d - ) para hombres ' d - * para mujeres$. !sto afecta a la regla de decisin a utilizar con el estad stico 2 asociado al parmetro 0, que tambin ser unilateral. !n el caso que se utilice el segundo modelo, la comparacin entre los dos se#os implica realizar dos contrastes 2, es decir, realizar los tests 3)/ 0 - ) 3*/ 0 ) 3)/ 1 - ) 3*/ 1 )

%i se aceptan ambas hiptesis nulas, se podr considerar que no e#isten diferencias, ' si se acepta al menos una hiptesis alternativa, que s e#isten diferencias entre los dos se#os. !l problema de proceder de esta forma es que si se realizan los dos tests a un cierto nivel de significacin , como ambos tests estn relacionados, el nivel de significacin conjunto para la decisin global sobre los dos parmetros, no es conocido. Por ello, es preferible plantear el contraste 5 sobre los dos parmetros que estn asociados al efecto atribuible al se#o, es decir, realizar el contraste 3)/ 0 - ) 3*/ 0 ) ' o6'

1 - ) 1 )

basado en el correspondiente estad stico 5, cu'a distribucin muestral, si 3 ) es cierta, es de tipo 5 de %nedecor. !l planteamiento anterior puede e#tenderse sin dificultad si se dispone de mas de una variable e#plicativa, x, de la calificacin, como puede ser la proporcin de clases a las que asiste, o incluso alguna variable artificial adicional "por ejemplo, si es o no repetidor$. !n todo caso, las variables que se introduzcan como e#plicativas "numricas o artificiales$, deben ser e#genas, es decir, que su variacin dependa de causas e#ternas al modelo.

UN EJEMPLO NUMRICO: EFECTO ADITIVO


%e dispone de una muestra aleatoria de 0) estudiantes, *) chicos ' *) chicas tomada en una facultad, ' se les pregunta su calificacin en una asignatura, y, ' las horas de estudio semanales, x, dedicadas a sta. 7os datos disponibles son
Chicos Nota 5.7 6.1 7.25 4.1 8.7 5.7 8.9 5.7 5.3 9.5 Horas 2 3 5 1 6 4 7 3 2 8 Chicas Nota 5.3 4.6 4.1 3 4.1 6.8 7.8 4.8 7.2 4.4 Horas 5 4 2 1 3 6 8 4 7 3

Por lo tanto se dispone de n - 0) datos, ' la variable artificial, Sexo, se ha codificado con los valores ) ' *. &l realizar un diagrama de dispersin con los datos de las notas respecto al n(mero de horas de estudio, se obtiene
10 9 8 7 NOTA 6 5 4 3 2 0 1 2 3 4 5 6 7 8 9 Chicos Chicas

HORAS

!n el grfico se observa que la evolucin de las notas de las chicas con respecto a las de los chicos tiende a ser superior en relacin al n(mero de horas estudiadas. &l estimar el primer modelo se obtiene Nota - 0.**8 + ).90 Horas + *.:1 Sexo + e
").0*:$ ").);*$ ").*99$

7a salida obtenida con !.ie<s es la siguiente/


Dependent !a"ia#$e% NOTA &ethod% 'east S()a"es *nc$)ded o#se"+ations% 20 !a"ia#$e Coe,,icient C 2.115618 HORAS 0.719624 S-0O 1.628925 R.s()a"ed 0.957139 Ad1)sted R.s()a"ed 0.952096 S.-. o, "e2"ession 0.394852 S)4 s()a"ed "esid 2.650437 'o2 $i3e$ihood .8.168693 D)"#in.8atson stat 2.595677

Std. -""o" t.Statistic 0.215843 9.801674 0.040944 17.57570 0.176773 9.214786 &ean dependent +a" S.D. dependent +a" A3ai3e in,o c"ite"ion Sch5a"6 c"ite"ion 7.statistic /"o#97.statistic:

/"o#. 0.0000 0.0000 0.0000 5.952500 1.804051 1.116869 1.266229 189.8136 0.000000

%e tiene pues que ambas variables e#genas muestran una clara influencia sobre la nota obtenida, pues si se realizan los tests 2 sobre los coeficientes del modelo terico, es decir 3)/ * - ) 3)/ 0 - ) 3*/ * ) 3*/ 0 ) se obtienen respectivamente los valores t*- *9.89, ' t0 - =.0*, es decir valores mu' elevados. &l tomar la decisin a niveles de significacin - *>, - ).*>, e incluso para niveles mas pequeos, en ambos casos se acepta la hiptesis alternativa. 7a probabilidad l mite de ambos valores se muestra en la (ltima columna de la salida, ' para ambos estad sticos es menor a ).)))*, por lo que incluso hasta este nivel de significacin se aceptar a, para los dos contrastes la hiptesis 3*. !n el modelo estimado, el coeficiente de la variable Horas muestra la productividad marginal de una hora adicional de estudio/ un incremento de ).90 puntos, por trmino medio, en la nota final. 2ambin se conclu'e que en el caso de las chicas, por trmino medio, obtienen casi *.:1 puntos mas que los chicos, para cualquier cantidad de horas estudiadas. !l efecto estimado es de tipo aditivo. !l coeficiente de determinacin es R0 - ).=89/ el =8.9> de la varianza de las notas es e#plicada por el modelo, ' el resto se integra en la varianza residual, esto es, la parte de la nota no e#plicada por las dos variables consideradas.
0.8 0.4 Resid)os

0.0

.0.4

.0.8 .1.2 2 4 Chicos 6 8 10 12 Chicas 14 16 18 20

7os residuos correspondiente a los 0) datos se muestran en el grfico anterior, ' no parecen seguir ninguna pauta. ?inguno es ma'or que la unidad, en valor absoluto, ' solo cuatro superan el medio punto, es decir, que el poder predictivo del modelo es bueno.

EJEMPLO NUMRICO: EFECTOS ADITIVO Y MULTIPLICATIVO


!n el pr#imo ejemplo se va a estimar el segundo tipo de modelo, inclu'endo como variables e#plicativas adems del n(mero de horas de estudio ' el se#o del alumno, una variable producto de estas dos, que representa la interaccin entre ambas, ' cu'o coeficiente estimado corresponde a un efecto multiplicativo del se#o sobre la nota final. 7os datos disponibles son
Chicos Nota 5.3 5.5 6.25 3.9 7.5 4.9 7.5 5.1 4.9 7.9 Horas 2 3 5 1 6 4 7 3 2 8 Chicas Nota 5.3 4.6 4.1 3.0 4.1 6.8 7.8 4.8 7.2 4.4 Horas 5 4 2 1 3 6 8 4 7 3

Por lo tanto se dispone de n - 0) datos, ' la variable artificial, Sexo, se ha codificado con los valores ) ' *. !l modelo a estimar es ahora Nota - ) + * Horas + 0 Sexo + 1 Notas Sexo + &l utilizar los datos se llega a Nota - 0.08 + ).:= Horas + *.1@ Sexo , ).*; Horas Sexo + e
").0@@$ ").):$ ").1=1$ ").)@1$

7a salida de !.ie<s es la siguiente


Dependent !a"ia#$e% NOTAS !a"ia#$e Coe,,icient C 2.248753 HORAS 0.688662 S-0O 1.381309 HORAS;S-0O .0.141116 R.s()a"ed 0.936316 Ad1)sted R.s()a"ed 0.924376 S.-. o, "e2"ession 0.400783 S)4 s()a"ed "esid 2.570037 'o2 $i3e$ihood .7.860649 D)"#in.8atson stat 2.431805 Std. -""o" t.Statistic 0.288807 7.786345 0.060352 11.41079 0.393307 3.512040 0.083230 .1.695506 &ean dependent +a" S.D. dependent +a" A3ai3e in,o c"ite"ion Sch5a"6 c"ite"ion 7.statistic /"o#97.statistic: /"o#. 0.0000 0.0000 0.0029 0.1093 5.542500 1.457402 1.186065 1.385211 78.41411 0.000000

!l coeficiente de determinacin R0 - ).=1:, es decir, el =1.:> de la varianza de las notas es e#plicada por el modelo. 7os estad sticos 2 para realizar los contrastes sobre

los coeficientes del modelo toman los valores t* - **.;, t0 - 1.8*, ' t1 - A*.:=8. %i se realizan los tests 2 para contrastar cada una de las hiptesis siguientes 3)/ * - ) 3*/ * ) 3)/ 0 - ) 3*/ 0 ) 3)/ 1 - ) 3*/ 1 )

en los dos primeros casos, incluso para niveles de significacin - *>, se aceptar an las correspondientes hiptesis alternativas, esto es, se acepta que ha' que mantener las variables Horas ' Sexo en el modelo. !n el caso del efecto multiplicativo o interaccin entre estas dos variables, se tiene que la probabilidad l mite del estad stico t1 es p ).*)=1, por lo que incluso a un nivel de significacin - *)> se acepta 3). !n el grfico siguiente se observa que este efecto multiplicativo parece e#istir con bastante claridad, ' si se toma - **>, como p es inferior, a este nivel se acepta la hiptesis 3 * del tercer test, esto es, se acepta la e#istencia del efecto multiplicativo. Bomo el nivel de significacin del test representa la probabilidad de cometer error de tipo C "rechazar 3) siendo cierta, o dicho de otro modo, incluir una variable no relevante$, mientras que el error de tipo CC se comete cuando se omite una variable relevante, es aconsejable tomar valores de que no sean pequeos, para conseguir disminuir la probabilidad de cometer error de tipo CC, pues, de forma general, parece mas DgraveE e#cluir alguna variable e#gena relevante, que incluir alguna variable sobre la que e#ista duda si debe estar o no incluida una variable que puede no ser importante. &s pues, el tomar en este caso un valor de - **>, ' decidir mantener la tercera variable "el efecto multiplicativo$ en el modelo, parece la solucin mas razonable. !n todo caso ha' que resaltar que la decisin sobre el nivel de significacin, ', en definitiva sobre la inclusin o e#clusin de variables en un modelo economtrico, es de naturaleza e#traAestad stica, ' debe estar basada en el conocimiento econmico de la situacin modelizada. Una alternativa a los tests 2 sobre la inclusin de las dos variables en las que figura la variable Sexo, es realizar el test 5 de anlisis de la varianza en la que se contrasta conjuntamente la inclusin o e#clusin de estas dos variables. &l hacerlo, la conclusin a que se llega, incluso a niveles de significacin mu' bajos es que deben mantenerse, al aceptarse la hiptesis 3*/ 0 ) o6' 1 ). !l modelo estimado da origen a un modelo distinto para cada se#o. &s para los chicos, es Nota - 0.08 + ).:= Horas + e ' para las chicas, Nota - 1.:1 + ).88 Horas + e !l efecto aditivo a favor de las chicas, de *.1@ puntos adicional en la nota final, independientemente de las horas estudiadas, se ve compensado en parte por el efecto multiplicativo que afecta a la pendiente, disminu'endo el valor de esta en ).*; puntos por hora, es decir, por una menor productividad marginal de cada hora e#tra de estudio.

9 8 7 6 5 4 3 2

Notas

Chicas Chicos

Ho"as 0 1 2 3 4 5 6 7 8 9

7as l neas "rectas$ sealadas por los puntos en rojo corresponden a los dos modelos estimados. 7a pendiente de ambos modelos es distinta "efecto multiplicativo$, ' las ordenadas en el origen "efecto aditivo$ tambin.

COMETARIOS FINALES SOBRE LOS MODELOS !n ambos modelos se debe realizar un anlisis de los posibles problemas economtricos que se pueden presentar/ A A A A 3eterocedasticidad/ en los grficos de residuos no se detecta tendencia en variabilidad, ' puede realizarse alg(n test, como el de Fhite o el de GoldfeldA Huandt "tomando como posible variable e#plicativa el se#o$. &utocorrelacin/ no procede, pues son datos de corte transversal, en los que no tiene sentido el que e#ista autocorrelacin ?ormalidad de las perturbaciones aleatorias "i, i -*,0,...,0)$, realizando el test de IarqueAJera usando los residuos ei, i - *,0,...,0). Kulticolinealidad/ en este caso es inmediato comprobar que la redundancia de informacin no es importante/ los coeficientes de correlacin entre las tres variables e#plicativas son ,).;)0, ).);: ' ).9=8. !ste (ltimo, algo mas elevado es la correlacin entre la variable Horas ' la variable interaccin Sexo Horas. ?o es posible evitarla, ' es claro, que la relacin entre stas no es lineal. 2ambin se puede obtener el n(mero de condicin. Cncorrecta especificacin del modelo/ es obvio que puede pensarse en otras posibles variables e#plicativas e#genas que no se han incluido/ el coeficiente de inteligencia de cada alumno o algunas facetas de ste, el grado de asistencia a clase, la atencin en sta, su regularidad en el estudio, etc. 2ambin cabe cuestionar si la forma funcional seleccionada es la adecuada. !l rango de valores de la variable horas de estudio, en el que es aplicable el modelo/ para realizar predicciones de la nota estimada, ha' que considerar posibles nuevos alumnos que ha'an estudiado un n(mero de horas similar a la de los 0) usados para estimar el modelo.

COMETARIOS SOBRE LA SALIDA EViews !l listado de salida obtenido con la orden 'S Notas c Ho"as Se<o Se<o;Ho"as proporciona una informacin e#tensa.

7as desviaciones t picas estimadas de los coeficientes de regresin "%td. !rror$ se obtienen a partir de los elementos de la diagonal principal de la matriz Sb = se0 " X'X$ * = se0 A %i se numeran las filas a partir del n(mero ), "pues al primer coeficiente del modelo se le ha llamado ), por ejemplo, la desviacin t pica estimada del estimador del parmetro * de la variable Horas es sb* = se a** = ).;))9@1 a** = ).):)180 Le igual forma se obtienen las dems desviaciones t picas. ?tese que la cuasiA desviacin t pica residual, se , aparece en el listado en la parte inferior "%.!. of regresin$, ' se calcula a partir de los 0) residuos, ei, i - *,0,...,0)
0.574847 .0.920245 .0.392063 0.419274 0.227301 0.037117 .0.403401 0.041950 .0.117791 .0.172699 0.473923 .0.203401 .0.277607 0.174847 0.062585 0.130612 0.584663 .0.110429 .0.214739 0.085261

mediante la e#presin * 0) 0 * * ei = Se = 0.89))19 = ).;))9@10 0) ; i =* *: *: "pues en el modelo se han estimado ; coeficientes de regresin$. se0 =

7a suma de cuadrados residual tambin aparece en el listado de salida, en la parte inferior, as como la media de los valores de la variable endgena, Notas, ' su cuasiA desviacin t pica * 0) * sy = " Notasi 8.8;08$ 0 = S y = *.;89;)0 0) * i =* *= !l estad stico F - 9@.;*;** es para realizar el test de anlisis de la varianza sobre todos los coeficientes, poco (til en la prctica, pues no parece imaginable el plantear un modelo en el que ninguna de las variables e#plicativas tenga poder predictivo sobre Y. 7os estad sticos 2 se obtienen, para cada test de la forma 3)/ j - ) 3*/ j ) dividiendo el coeficiente estimado por su respectiva desviacin t pica estimada. Por ejemplo, para la tercera variable, j - 1, es ).*;***: t1 = = *.:=88): ).)@101) ' la probabilidad l mite asociada a este valor es p - 0 PrMT 4 NA*.:=88):N O - ).*)=1 siendo 2 una variable aleatoria t de %tudent con 0) , ; - *: grados de libertad. Le igual forma se calculan las probabilidades l mite de los restantes estad sticos. !stas probabilidades l mite son (tiles, pues permiten realizar los tests 2 a cualquier nivel de significacin sin necesidad de disponer de unas tablas estad sticas de esta distribucin t"*:$/ valores de p conducen a aceptar "a este nivel $ la hiptesis 3), ' valores de p P a aceptar 3*. !l coeficiente de determinacin R0 se define a partir del teorema de descomposicin de la varianza de la variable endgena "y - Notas$/ la suma de cuadrados total, Sy, se divide en dos sumandos Sy - Smodelo + Se la suma de cuadrados e#plicada por el modelo ' la residual. &s es R0 - Smodelo 6 Se . !n el listado de salida aparece directamente la suma de cuadrados residual, Se - 0.89))19, la cual tambin se puede obtener directamente a partir de la cuasiAdesviacin t pica residual, se = ).;))9@1 , como se vio anteriormente. 7a suma de cuadrados total se deduce directamente de la e#presin de la cuasiAdesviacin t pica de la variable endgena. !n este caso la descomposicin anterior es Sy - *= *.;89;)00 - Smodelo + 0.89))19 de donde se deduce el valor de R0. !n la ventana en la que !.ie<s muestra el modelo estimado ha' varios botones/ el primero ".ie<$ permite visualizar varios aspectos del modelo estimado/ la salida anterior, los grficos de residuos ' de valores estimados, el listado de los residuos, as como varios contrastes de hiptesis para realizar una vez estimado el modelo ' validar distintos aspectos del mismo.

También podría gustarte