Está en la página 1de 18

Resultados

Diseño del modelo econométrico

Para el diseño de los modelos econométricos es indispensable realizar una revisión teórica de

manera sistemática de las variables en estudio, y confrontar la teoría con la práctica. En el

presente trabajo se ha considerado referentes conceptuales de varios autores acerca del nivel

sosioeconómico (NSE) y su medición, pero para efectos del diseño del modelo econométrico

está fundamentado en el marco conceptual descrito por la asociación peruana de empresas de

investigación de mercados APEIM 2003 – 2010 quienes consideran el NSE como una variable

teóricamente controvertida por lo que es importante aproximar el estatus socioeconómico de las

familias a través de un indicador práctico. Por otra parte, se considera al modelo econométrico

que se desprende del concepto de econometría planteado por Goldberger (1964), quien la define

como una Ciencia social en la cual las herramientas de la Teoría Económica, las Matemáticas y la

Inferencia Estadística son aplicadas al análisis de los fenómenos económicos.

Para la elaboración del presente modelo, se seguirán los siguientes pasos:

1. Presentación de variables

1.1 Variable explicada o dependiente

La variable dependiente es Nivel Socioeconómico (NSE)

1.2 Variables independientes o explicativas

Las variables explicativas o independientes son:

X1: Grado de estudio de los padres (GEP)

X2: Atención en los servicio de la salud


X3: Ingresos familiares

X4: Comodidad familiar

X5: Características de la vivienda

2. Supuestos considerados

a. Normalidad

b. No autocorrelación

c. Homocedasticidad o varianza constante

d. Debe haber variación en los valores de las variables X.

e. No debe haber colinealidad exacta entre las variables X. No hay relación lineal exacta entre Xi

y Xi+1

f. El número de observaciones n debe ser mayor que el de parámetros por estimar.

3. Prueba de supuestos

3.1 Prueba de normalidad

Para que el estimador sea eficiente, los residuos deben seguir una distribución normal, lo cual se

verifica en el gráfico 1 y prueba de Kolmogorov – Smirnov de la tabla 1.


3.2 Prueba del supuesto no autocorrelación

Para probar la no autocorrelación se utiliza el estadístico de prueba de Durbin Watson con la

siguiente hipótesis nula (H0) y alternativa (H1)

H0: No hay autocorrelación

H1: Sí hay autocorrelación

Decisión:

Si d < 1.18 se rechaza H0

Si d > 1.18 se acepta H0


Si 1.18 < d < 1.4 No es concluyente

Tabla 2
Prueba de no autocorrelación
R cuadrado Error estándar
Modelo R R cuadrado ajustado de la estimación Durbin-Watson
1 ,859a ,738 ,705 ,293 2,521
a. Predictores: (Constante), Características de la vivienda, Grado de estudios de los padres,
Ingresos familiares, Comodidad familiar, Atención en salud
b. Variable dependiente: NSE
De acuerdo al resultado de la tabla 2, el valor d = 2,521 que es mayor a 1.18, razón por la cual se

acepta la hipótesis nula. Esto significa que las variables consideradas no están

autocorrelacionadas.

3.3 Prueba del supuesto de Homocedasticidad o varianza constante

La homocedasticidad será analizada a través de los diagramas de dispersión de las estimaciones

(valores predichos por el modelo) tipificadas (ZPRED) frente a los residuos tipificados

(ZRESID).

En el gráfico no se presenta ningún patrón, razón por la cual se acepta la igualdad de varianzas.
3.4 Debe haber variación en los valores de las variables Xi

Este supuesto se prueba en la data anexa en la cual existen valores diferentes para las variables

explicativas o independientes.

3.5 No debe haber colinealidad exacta entre las variables X. No hay relación lineal exacta

entre Xi y Xi+1

Para probar este supuesto, se realizan los diagramas de dispersión entre las combinaciones de las

variables independientes, así:


En todos los gráfico 3 – 12 se observa que los puntos están dispersos, no son colineales. Esto

significa que no hay relación lineal exacta entre las variables independientes.

f. El número de observaciones n debe ser mayor que el de parámetros por estimar

Este supuesto puede observarse en la data que se anexa.

4. Selección de variables a considerar

Para la selección de variables a considerar en el modelo se determina el p – valor correspondiente

a los valores tipificados y así comparar los efectos de las variables. La regla de decisión a aplicar

es:

H0: La variable no aporta información significativa en el modelo realizado (Bj = 0)

H1: La variable aporta información significativa en el modelo realizado (Bj ≠ 0)


Tabla 3.
Aporte de las variables al modelo

Se observa en la tabla 3 que a un nivel de significancia del 0.05, el p – valor (Sig)

correspondiente a la constante 𝛽0 es mayor que 0.05, por lo tanto se considera que no aporta

información significativa al modelo realizado. Por consiguiente no se debe incluir la constante en

el modelo.

Asimismo, se tiene que todas las variables explicativas o dependientes que se consideraron,

aportan información significativa, lo que prueba de hecho las hipótesis específicas del presente

trabajo.

5. Presentación del modelo adecuado

Teniendo en cuenta las consideraciones del apartado anterior, el modelo ajustado para el NSE es:

NSE = 0,118(GEP) + 0,140(AS) + 0,209(IF) + 0,067 (CF) + 0,131 (CV)


Cabe recordar que en esta expresión, el nivel socioeconómico (NSE) queda expresado

numéricamente, con valores entre 1 y 5 así;

1punto: Marginal

2 puntos: Bajo inferior

3 puntos: Bajo superior

4 puntos: Medio

5 puntos: Alto

Asimismo, las puntuaciones de las variables explicativas o independientes toman las siguientes

puntuaciones:

a. Grado de estudios de los padres (GEP)

1 punto: Primaria Completa / Incompleta

2 puntos: Secundaria Incompleta

3 puntos: Secundaria Completa

4 puntos: Superior No Universitario (p. ej. Instituto Superior, otros)

5 puntos: Estudios Universitarios Incompletos

6 puntos: Estudios Universitarios Completos (Bachiller, Titulado)

7 puntos: Postgrado

b. Atención en salud (AS)

1 punto: Posta médica / farmacia / naturista

2 puntos: Hospital del Ministerio de Salud / Hospital de la Solidaridad


3 puntos: Seguro Social / Hospital FFAA / Hospital de Policía

4 puntos: Médico particular en consultorio

5 Puntos: Médico particular en clínica privada

c. Ingresos familiares (IF)

1 punto: Menos de 750 soles/mes aproximadamente

2 puntos: Entre 750 – 1000 soles/mes aproximadamente

3 puntos: 1001 – 1500 soles/mes aproximadamente

4 puntos: > 1500 soles/mes aproximadamente

d. Comodidad familiar (CF)

1 punto: 1 cuarto y más de una persona para dormir

2 puntos: 1 cuarto y 1 persona para dormir

3 puntos: 2 cuartos y más de dos personas para dormir

4 Puntos: 2 cuartos y dos personas para dormir

5 puntos: 3 cuartos y más de una persona por cuarto

6 puntos: 3 cuartos y una persona por cuarto

7 puntos: cuatro cuartos y más de una persona por cuarto

8 puntos: Cuatro cuartos y una persona por cuarto

e. Características de la vivienda, material de los pisos (CV)

1 punto: Tierra / Arena

2 puntos: Cemento sin pulir (falso piso)

3 puntos: Cemento pulido / Tapizón

4 puntos: Mayólica / loseta / cerámicos

5 puntos: Parquet / madera pulida / alfombra / mármol / terrazo


6. Otras inferencias del modelo

6.1 Bondad de ajuste

Esta inferencia sobre el modelo permite determinar en qué porcentaje el NSE queda explicado

con las variables explicativas o independientes. El estadístico de prueba para esta inferencia es el

coeficiente de determinación explicada (R2)

Tabla 4.
Resumen del modelob – Bondad de ajuste
R cuadrado Error estándar de
Modelo R R cuadrado ajustado la estimación
1 ,859a ,738 ,705 ,293
a. Predictores: (Constante), Características de la vivienda, Grado de estudios de los
padres, Ingresos familiares, Comodidad familiar, Atención en salud
b. Variable dependiente: NSE

Se observa en la tabla 4 que R2 = 0.738, esto significa que el NSE queda explicado en un 73.8%

por las variables predictoras o explicativas (GEP, AS, IF, CF, CV), según el modelo considerado.

Asimismo es de notar que el coeficiente de Pearson R = 0.859, lo que indica que la correlación

entre el NSE y las variables predictoras es positiva alta.

6.2 Contraste de regresión ANOVA

Esta inferencia sobre el modelo sirve para verificar que (de forma conjunta) las variables

explicativas (GEP, AS, IF, CF, CV) aportan información en la explicación de la variable

explicada (NSE).

El contraste de regresión ANOVA se realiza considerando las siguientes hipótesis y regla de

decisión:

H0: las variables explicativas o predictoras (GEP, AS, IF, CF, CV) no están relacionadas

linealmente con la variable dependiente o explicada (NSE).


H1: las variables explicativas o predictoras (GEP, AS, IF, CF, CV) están relacionadas linealmente

con la variable dependiente o explicada (NSE).

Nivel de significancia 0.05

Regla de decisión:

Sig > 0.05 se acepta H0 y se rechaza H1

Sig < 0.05 se rechaza H0 y se acepta H1

Tabla 5.
Contraste de regresión ANOVAa
Suma de
Modelo cuadrados gl Media cuadrática F Sig.
1 Regresión 9,450 5 1,890 22,005 ,000b
Residuo 3,350 39 ,086
Total 12,800 44
a. Variable dependiente: NSE
b. Predictores: (Constante), Características de la vivienda, Grado de estudios de los padres, Ingresos
familiares, Comodidad familiar, Atención en salud

En la tabla 5 se observa que Sig < 0.05 por lo que se acepta la hipótesis alternativa H1. Esto

indica que a un nivel de significancia de 0.05, las variables explicativas o predictoras (GEP, AS,

IF, CF, CV) están relacionadas linealmente con la variable dependiente o explicada (NSE).

7. Información descriptiva de la población estudio

En las siguientes tablas se consigna la información descriptiva de los encuestados

Tabla 6.
Edades de la muestra
Porcentaje
Frecuencia Porcentaje Porcentaje válido acumulado
Válido 17 -20 años 39 86,7 86,7 86,7
21 - 25 años 6 13,3 13,3 100,0
Total 45 100,0 100,0
Tabla 7.
Sexo de los encuestados
Porcentaje
Frecuencia Porcentaje Porcentaje válido acumulado
Válido Hombre 43 95,6 95,6 95,6
Mujer 2 4,4 4,4 100,0
Total 45 100,0 100,0

Tabla 8.
Procedencia de los encuestados
Porcentaje
Frecuencia Porcentaje Porcentaje válido acumulado
Válido Ancash 1 2,2 2,2 2,2
Barranca 4 8,9 8,9 11,1
Cajabamba 1 2,2 2,2 13,3
Huacho 8 17,8 17,8 31,1
Hualmay 2 4,4 4,4 35,6
Huánuco 1 2,2 2,2 37,8
Huaral 3 6,7 6,7 44,4
Huarmey 1 2,2 2,2 46,7
Huaura 9 20,0 20,0 66,7
Paramonga 1 2,2 2,2 68,9
San Juan de Lurigancho 1 2,2 2,2 71,1
San Martín 1 2,2 2,2 73,3
Santa María 6 13,3 13,3 86,7
Satipo 1 2,2 2,2 88,9
Sayan 1 2,2 2,2 95,6
Sayán 2 4,4 4,4 93,3
Vegueta 2 4,4 4,4 100,0
Total 45 100,0 100,0
Tabla 9.
NSE
Porcentaje
Frecuencia Porcentaje Porcentaje válido acumulado
Válido Marginal (5 - 12 puntos) 5 11,1 11,1 11,1
Bajo inferior (13 - 20 puntos) 32 71,1 71,1 82,2
Bajo superior (21 - 26 puntos) 8 17,8 17,8 100,0
Total 45 100,0 100,0

Conclusiones
Las principales conclusiones del presente trabajo son:

1. En cuanto al objetivo principal que es diseñar un modelo econométrico que permita

determinar el NSE de los estudiantes de matemáticas aplicadas en la universidad Nacional

JFSC, se concluye que se elaboró soportado teóricamente en en el marco conceptual descrito por

la asociación peruana de empresas de investigación de mercados APEIM 2003 – 2010 quienes

consideran el NSE como una variable teóricamente controvertida por lo que es importante

aproximar el estatus socioeconómico de las familias a través de un indicador práctico. Por otra

parte, se consideró el modelo econométrico que se desprende del concepto de econometría

planteado por Goldberger (1964), quien la define como una Ciencia social en la cual las

herramientas de la Teoría Económica, las Matemáticas y la Inferencia Estadística son aplicadas al

análisis de los fenómenos económicos.

2. El modelo econométrico se diseñó por etapas, que fueron desde la revisión teórica,

presentación de variables, supuestos considerados, prueba de los supuestos, selección de

variables de acuerdo a los supuestos, presentación del modelo y otras inferencias del modelo.
3. Se ha dado una coherencia entre los sustentos teóricos y prácticos para determinar el NSE

puesto que todas las variables explicativas teóricas, se tuvieron en cuenta en el diseño del modelo

econométrico.

4. De las variables consideradas en el modelo, la que aporta mayor información significativa es

ingresos familiares (IF), seguido del lugar al que acuden para casos de salud(AS), características

de la vivienda(CV), grado de estudios de los padres (GEP) y comodidad familiar (CF).

5. El modelo que se obtuvo bajo la prueba de supuestos es lineal de varias variables explicativas,

en el que no se tuvo en cuenta la constante.

6. En cuanto a la información general, se concluye que el 71% de los encuestados son de NSE

bajo inferior, el 17.2% de NSE bajo superior y el 11.1% de NSE marginal. Es muy interesante

tener en cuenta esta clasificación puesto que de alguna forma puede afectar el rendimiento y

permanencia de los estudiantes en el programa de matemáticas aplicadas.

Por otra parte, es motivo de preocupación que se siga la tendencia a que el programa de

matemáticas aplicadas sea casi exclusivamente para hombres, tal como se puede observar en la

población en estudio en la que el 95% son hombres y solamente el 5% son mujeres.

En cuanto a las demás variables descriptivas, las edades de los encuestados oscilan entre 17 y

25 años, son en su mayoría provenientes de Huaura, Santa María, Huacho, Huaral, Barranca y

zonas aledañas a la provincia de Huaura.