Está en la página 1de 10

UNIVERSIDAD NACIONAL DE CHIMBORAZO.

FACULTAD DE CIENCIAS POLITICAS Y ADMINISTRATIVAS.

ESCUELA DE ECONOMÍA.

ECONOMETRÍA II.

DOCENTE:

PhD. YADIER TORRES

ELABORADO POR:

BRAVO MARLON.

NIVEL:

SÉPTIMO.

TRABAJO AUTÓNOMO.
Ejercicio N°1 Regresión Lineal Múltiple.
Metodología.
El tema a investigar es el rendimiento académico en los estudiantes de la carrera de
artes de la UA, para realizar dicho análisis correlacional se han implementado como
principales variables explicativas al ingreso, las horas destinadas al estudio y el
porcentaje de asistencia. La regresión es modelada usando un panel de datos de 30
observaciones obtenidas de una muestra significativa del total de la población en
estudio.

La variable rendimiento académico es de tipo cuantitativa continua y esta expresada


en números naturales, la variables dependientes son de tipo cuantitativa continua, la
variable ingresos (Y) representa los ingresos mensuales percibidos por los estudiantes
por parte de sus tutores legales estos ingresos están expresados en dólares americanos.
La variable horas destinadas al estudio (HE) esta expresado en minutos mientras que a
la variable porcentaje de asistencia (PA) se la convirtió a números naturales. En base a
dichas especificaciones el modelo queda expresado de la siguiente manera:

RA=β 0+ β 1 PA + β 2 Y + β 3 HE + ε i

Para identifica la relación existente entre todas las variables inmersas en la regresión
lineal múltiple se aplicará la correlación de Pearson con lo cual se determinara si la
correlación entre las variables es significativa.

Una vez corrido el modelo lineal múltiple en el paquete estadístico profesional SPSS
V.25 se verificaran los supuestos de MCO a través de la aplicación de los distintos test
disponibles en el paquete estadístico. Para verificar el supuesto de Homocedasticidad se
aplica el Test de Rho-Spearman, para el supuesto de Independencia se aplica el test de
Rachas y para la validación del supuesto de normalidad se aplicara el contraste de
Shapiro-Wilk debido a la cantidad de datos disponibles.
Cuadro 1. Correlaciones de las variables en estudio.
Variables RA Y HE PA
RA 1 0,982** 0,967** 0,984**

Y 0,982** 1 0,963** 0,971**

HE 0,967** 0,963** 1 0,968**

PA 0,984** 0,971** 0,968** 1


N 30 30 30 30
Nota: **La correlación es significativa en el nivel 0,01. N es el número de
observaciones.
Fuente: elaboración propia.

En base a los resultados obtenidos a través de la aplicación de la correlación de


Pearson se puede identificar que todas las variables mantienen una relación fuerte con el
rendimiento académico (variable dependiente), consecuentemente el rendimiento
académico está altamente relacionado con el porcentaje de asistencia, las horas
destinadas al estudio y los ingresos percibidos. La variable determinística que más se
relaciona con el rendimiento académico es el porcentaje de asistencia pues con un nivel
de significancia de 0,01 el coeficiente de Pearson es de 0,984 siendo el más alto de entre
todas las relaciones existentes entre las demás variables.

Cuadro 2. Estadísticos obtenidos del modelo de regresión lineal múltiple.


Modelo 1 Modelo 2 Modelo 3
LINEAL LIN-LOG INVERSO
Variable dependiente RA RA RA
Variable independiente Coeficientes
Y 0,010 2,166 -359,357
(0,003)** (0,416)** (62,643)**
HE 0,001 -0,209 50,345
(0,001)** (0,166)** (15,27)**
PA 2,633 1,854 -1,313
(0,720)** (0,730)** (0,639)**
N (Observaciones) 30 30 30
R2 0,980 0,977 0,973
F 429,190** 361,360** 315,056**
Durbin – Watson 1,321 1,512 1,94
Notas: errores estándares están entre paréntesis. ***p<0,01; **p<0,05; *p<0,1. **F-
Fisher al 5%
Fuente: elaboración propia.
Al examinar los resultados finales de las estimaciones de los distintos modelos de
regresión presentados en el Cuadro 1, se puede apreciar que en el modelo 1 existe una
relación positiva y significativa entre las variables determinísticas y la variable
dependiente, dentro de este modelo la variable que más significancia aporta al modelo
es el porcentaje de asistencia (PA) siendo esta la que más se relaciona en complemento
y con coeficientes menores se encuentran las variables ingreso y horas destinadas al
estudio.
Para el modelo 2 se obtiene que la variable horas destinadas al estudio presenta una
relación inversa y significativa con respecto al rendimiento académico, por lo cual se
viola el supuesto de esperanza matemática ya que se espera que mientras más horas se
destinen al estudio el rendimiento académico crezca, en este modelo el rendimiento
académico depende significativamente de los ingresos percibidos y en menos relevancia
depende del porcentaje de asistencia y las horas destinas al estudio respectivamente.
En cuanto a los resultados obtenidos para el modelo 3 se puede apreciar que las
variables determinísticas ingreso y porcentaje de asistencia presentan una relación
inversa y significativa respecto al rendimiento académico, incumpliendo así el supuesto
de esperanza matemática pues se esperaba obtener de ambas variables una relación
positiva y significativa. En este modelo la variable más significativa y con mayor aporte
hacia la variable dependiente son las horas de estudio, seguido con una menor
significancia por el porcentaje de asistencia y los ingresos percibidos respectivamente.

Cuadro 3. Supuesto de MCO.


Modelo 1 Modelo 2 Modelo 3
LINEAL LIN-LOG INVERSO
Supuestos MCO
Homocedasticidad
Test Rho-Spearman 0,951 0,834 0,210
Independencia
Test de Rachas 0,577 0,577 0,200
Normalidad
Contraste Shapiro-Wilks 0,514 0,965 0,537
Fuente: elaboración propia

Al comprobar los supuestos de homocedasticidad, independencia y normalidad de


los distintos modelos se obtuvo que para el primer modelo el valor de significancia en el
Test Rho-Spearman es igual a 0,951 valor que es mayor al p.valor 0,05, otorgando
suficiente evidencia a favor de Ho por ende no se rechaza la hipótesis nula y se puede
afirmar que existe homocedasticidad. Posterior a la aplicación del Test de Rachas se
obtuvo una significancia de 0,577 valor que es mayor a p.valor de 0,05 por lo que no se
rechaza Ho y se puede afirmar que existe independencia en los residuos. Para identificar
si los residuos siguen una distribución normal se aplicó el contraste de Shapiro-Wilks
obteniendo un valor de 0,514 siendo mayor al p.valor 0,05 siendo evidencia a favor de
Ho, por ende no se rechaza Ho y se puede afirmar que existe normalidad.

Para el modelo 2 se obtuvieron los siguientes resultados, al verificar el supuesto de


Homocedasticidad el valor de significancia en el Test Rho-Spearman es igual a 0,834
valor que es mayor al p.valor 0,05 siendo evidencia a favor de Ho por ende no se
rechaza Ho y se puede afirmar que existe homocedasticidad. Para la verificación de
supuesto de independencia se aplicó el Test de Rachas a través del cual obtuvo una
significancia de 0,577 valor que es mayor a p.valor de 0,05 otorgando suficiente
evidencia a favor de Ho por lo que no se rechaza la hipótesis nula y se puede afirmar
que existe independencia en los residuos. Para identificar si los residuos siguen una
distribución normal se aplicó el contraste de Shapiro-Wilks obteniendo un valor de
0,514 siendo mayor al p.valor 0,05 siendo evidencia a favor de Ho, por ende no se
rechaza Ho y se puede afirmar que existe normalidad.

En el último modelo al verificar los supuestos de MCO se obtuvieron los siguientes


resultados al verificar el supuesto de Homocedasticidad el valor de significancia en el
Test Rho-Spearman es igual a 0,210 valor que es mayor al p.valor 0,05 siendo evidencia
a favor de Ho por ende no se rechaza Ho y se puede afirmar que existe
homocedasticidad. Para la verificación de supuesto de independencia se aplicó el Test
de Rachas a través del cual obtuvo una significancia de 0,200 valor que es mayor a
p.valor de 0,05 otorgando suficiente evidencia a favor de Ho por lo que no se rechaza la
hipótesis nula y se puede afirmar que existe independencia en los residuos. Para
identificar si los residuos siguen una distribución normal se aplicó el contraste de
Shapiro-Wilks obteniendo un valor de 0,537 siendo mayor al p.valor 0,05 siendo
evidencia a favor de Ho, por ende no se rechaza Ho y se puede afirmar que existe
normalidad.
Gráfico 1. Gráfico P-P de normalidad para la regresión.

Fuente: elaboración propia.


El gráfico P-P al contrastar las proporciones acumuladas de la variable más
significativa (porcentaje de asistencia) con la de una distribución normal nos muestra
que los datos siguen una distribución normal ya que los puntos se concentran en torno a
la línea de tendencia, por ende y sustentado por los test previamente realizados de
normalidad se puede afirmar que si existe normalidad en los residuos.
Ejercicio N°2 Regresión logística (LOGIT).

Metodología.
El tema a investigar es la Asignación de Cupos a los nuevos postulantes a la
UNACH en el presente periodo académico, para realizar dicho análisis se ha convertido
a la variable dependiente como una variable DUMMY asignándole los valores de O =
Si y 1=NO. Para poder explicar el comportamiento de la asignación de cupos se
plasman distintas variables determinísticas como edad, ingresos, procedencia, estado
civil y el promedio del bachillerato.

La relación existente entre la asignación de cupos con las variables explicativas es


modelada usando una base de datos de 278 observaciones, esta muestra representativa
se obtuvo a través del cálculo estadístico de la muestra, teniendo una población de 1000
individuos.

La variable Asignación de cupos (AC) es de tipo cualitativa binaria, para explicar su


comportamiento se han considerado diversas variables explicativas que buscan analizar
diversos atributos que son necesarios conocer del individuo. En lo concerniente a las
variables estado civil (EC) y lugar de procedencia (LP) se ha procedido a
transformarlas en variables Dummy, quedando de la siguiente manera, para la variable
lugar de procedencia se toma el valor de 0 si proviene del cantón Riobamba y el valor 1
si proviene de un lugar diferente. En cuanto al Estado Civil, se tomará valores de 0 si es
soltero y un valor de 1 si está casado o tiene otro tipo de unión.

Respecto a la variable ingresos recibidos mensualmente (Y) es de tipo cuantitativa y


busca explicar la disponibilidad de recursos económicos con los que cuenta el
postulante para estudiar en la universidad. En cuanto a la variable promedio del
bachillerato (PB) es de tipo cuantitativo y esta busca explicar la relación existente entre
el rendimiento previo a la universidad del estudiante con la probabilidad de asignación
de un cupo para cursar la carrera a la que ha postulado. En complemento para la
regresión la variable edad (ED) aporte datos cuantitativos significativos para el modelo.
Cuadro 4. Resumen del modelo logístico.
Paso Logaritmo de Verosimilitud -2 R2 de Cox y Snell R2 de Nagelkerke
1 352,788* 0,024 0,033
2 346,365* 0,047 0,064
3 339,365* 0,070 0,097
Nota: *la estimación ha terminado en el número de iteración 4 porque las estimaciones
de parámetros han cambiado en menos de 0,001.
Fuente: elaboración propia.

Los coeficientes de determinación tienen valores pequeños por un lado (0,070) y


(0,097), indicando que el 7 % o el 9,7 % de la variación de la variable dependiente
(rendimiento académico) es explicada por las variables incluidas en el modelo, y debe
mejorar cuando se vayan incluyendo variables más explicativas del resultado o términos
de interacción. El resultado del logaritmo de verosimilitud -2 hasta es de 339,365 por lo
que los datos se ajustan hasta el paso 3 ya que las estimaciones de parámetros han
cambiado en menos de 0,001.

Cuadro 5. Coeficientes obtenidos con la aplicación del modelo LOGIT.


Modelo LOGIT.

Coeficientes Wald Exp (B)


ED -0,404*** 0,668 0,668
(0,157)
Y -0,007*** 0,993 0,993
(0,003)
EC -0,763*** 0,466 0,466
(0,273)
CONSTANTE 8,686*** 8,416 5920,315
(2,994)
N (Observaciones) 278 278 278
Nota: errores estándar entre paréntesis. ***p<0,01; **p<0,05;*p<0,1
Fuente: elaboración propia.

La interpretación del modelo Logit es el siguiente: β2, la pendiente, mide el cambio


en L ocasionado por un cambio unitario en X, es decir, dice como el logaritmo de las
probabilidades de que a un individuo le asignen un cupo a la UNACH cambia a medida
que el ingreso cambia en una unidad. El intercepto β1 es el valor del logaritmo de las
probabilidades a favor de que a un postulante le asignen un cupo si el ingreso es cero.
Los resultados obtenidos en este cuadro nos permite formular el modelo logístico por lo
que el modelo se representará de la siguiente manera:

1
p= −8,686+0,404 X 1+0,007 X 2+ 0,763 X 3
1+e
Al aplicar la formula antes mencionada se podrá predecir si a un individuo con
ciertas características especificadas en el modelo se le otorgará o no un cupo en la
Universidad Nacional de Chimborazo.

Cuadro 6. Tabla de Clasificación.

Pronosticado
CUPO
Porcentaje correcto
Observado SI NO
Paso 1 CUPO SI 181 0 100,0
NO 97 0 ,0
Porcentaje global 65,1
Paso 2 CUPO SI 170 11 93,9
NO 90 7 7,2
Porcentaje global 63,7
Paso 3 CUPO SI 159 22 87,8
NO 77 20 20,6
Porcentaje global 64,4
Nota: El valor de corte es 0,500
Fuente: elaboración propia.

En base a los resultados obtenidos se puede identificar que el modelo de regresión


logístico ha clasificado correctamente el 64,4% de los casos. Por defecto se ha
empleado un valor de corte de 0,5 de la probabilidad de la variable dependiente para
clasificar a los individuos. Esto significa que aquellos individuos para los que la
ecuación calcula una probabilidad <0,5 se clasifican como Y=0 es decir Asignación de
cupo = Si, mientras que si la probabilidad resultante es ≥ 0,5 se clasifica como Y=1, es
decir, Asignacion de cupo = No. El modelo tiene una especificidad alta de 87,8% y una
sensibilidad baja del 20,6%.

Cuadro. 7 Prueba de Hosmer y Lemeshow.

Paso Chi-cuadrado gl Sig.


1 ,000 0 .
2 18,152 8 ,020
3 33,692 8 ,000
Fuente: Elaboración propia.

La bondad de ajuste ha resultado medianamente buena, pues existe gran similitud


entre entre los valores observados y esperados en el procedimiento de Hosmer y
Lemeshow. Se puede apreciar que en el paso 3 el p valor de Chi-Cuadrado es 33,692
con 8 grados de libertad, siendo significativa esta prueba para el modelo, por ende si el
ajuste es bueno, un valor alto de la probabilidad predicha (p) se asociará con el resultado
Y=1 (Asignación de cupo= Si), mientras que un valor bajo de p (próximo a cero)
corresponderá con el resultado Y=0 (Asignación de cupo = No)

También podría gustarte