Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estudiantes:
Profesora:
2014
OBJETIVO GENERAL
Para realizar esta regresión, realizamos una nueva base de datos en la cual
eliminamos los datos de Bucaramanga para así poder realiza un modelo de regresión
lineal simple de las demás ciudades.
Se puede observar que el mayor R cuadrado encontrado fue de 0,317 entre las
variables puntaje en matemáticas y puntaje en ciencias sociales, aunque no sea
cercana a 1 fue la mejor que encontramos, por lo cual continuaremos con nuestro
análisis con este modelo. (Ver tablas 7, 8 y 9)
Tabla 10. Modelo de regresión lineal simple tomando como variable independiente el
puntaje en ciencias sociales.
Estadístico de prueba:
b1
t=
sb 1
0,641
t=
0,002
t=269,552
El valor bilateral de t que corresponde a α =0.05 y con 156497 grados de libertad es
t 0.025=1 , 96
Como 269,552 > 1,96 se rechaza H 0 y podemos concluir que a un nivel de significancia
de 0.05; β 1 ≠ 0. La evidencia obtenida es suficiente para decir que existe una relación
entre las variables puntaje en matemáticos y puntaje en ciencias sociales.
H 0 : β 1=0
H a : β1≠ 0
ANOVAa
Tabla 11. Tabla ANOVA para el modelo de regresión lineal simple tomando como
variable independiente el puntaje en ciencias sociales.
significancia de 0.05, β 1 ≠ 0
Figura 9. Diagrama de dispersión para el modelo lineal simple escogido
Ecuación estimada:
^y =18,325+ 0,641 x
ANOVAa
ANOVAa
De acuerdo a las tablas ANOVA obtenidas en los modelos anteriores, para el primer
modelo la suma de cuadrados residual es de 13484260,900 mientras que para el
segundo modelo esta es de 12587906,349 y la suma de cuadrados total es igual para
los dos modelos, por lo cual procedemos a escoger el modelo 2 ya que la suma de
cuadrados residual es menor en este (ver Tablas 12 y 13)
Resumen del modelo
Comparando los dos modelos (modelo lineal simple y modelo lineal múltiple) podemos
ver que la suma de cuadrados total es igual para los dos pero la suma de cuadrados
residual es menor para el modelo de regresión lineal múltiple, con un coeficiente de
determinación ajustado de 0,426 esto significa que este modelo de regresión tiene un
mejor ajuste para los datos obtenidos y nos va a ayudar a predecir mejor el puntaje en
matemáticas. (ver Tablas 11 y 13)
CONCLUSIONES