Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Integrantes del grupo: Kevin García, María Emilia Guzmán, Emmy Guillén, Javier
Mejía, Tahís Muñoz
El comportamiento creciente que representa la relación entre la altura y el peso del género
masculino y femenino es moderadamente lineal, por lo que, se procede a realizar un
modelo de regresión lineal simple para verificar si se puede explicar la relación lineal
entre estas variables con la misma.
Mínimos cuadrados
̂0 = −132,9910
𝐵
̂1 = 3,8181
𝐵
Coeficiente de determinación
𝑅2 = 0,6004
Este coeficiente de determinación es más cercano a 1 en comparación al 0, esto puede
indicar, que no se captó en su totalidad la variabilidad de Y (variable respuesta) a través
de las variables de explicación.
Correlación
𝑟𝑥𝑦 = 0,7748761
Los datos del peso y la altura de la muestra del género masculino y femenino tienen una
correlación positiva, lo que implica, que, en cierta medida, los datos están relacionados
linealmente.
Relación entre el coeficiente de determinación y el coeficiente de
correlación
𝑟𝑥𝑦 = √𝑅2
𝑟𝑥𝑦 = √0,6004
𝑟𝑥𝑦 ≈ 0,7748548
→ 0,7748761 ≈ 0,7748548
Se cumple la relación entre el coeficiente de determinación y el coeficiente de correlación
en un modelo de regresión lineal simple.
A través del histograma se observa que existe un sesgo hacia la derecha, se puede concluir
que los residuos no tienen un comportamiento normal.
Se observa que en su mayoría los residuos tienen una distribución normal, sin embargo,
en los extremos se presenta un sesgo positivo.
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 = 0,005841
𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1 , 𝑝𝑜𝑟𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 𝑒𝑠 𝑚𝑒𝑛𝑜𝑟 𝑞𝑢𝑒 0,05.
𝐸𝑠𝑡𝑜 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎 𝑞𝑢𝑒 𝑛𝑜 ℎ𝑎𝑦 𝑠𝑢𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎 𝑝𝑎𝑟𝑎 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠
𝑠𝑖𝑔𝑢𝑒𝑛 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙.
II. Homocedasticidad
𝑷𝒓𝒖𝒆𝒃𝒂 𝒅𝒆 𝒉𝒊𝒑ó𝒕𝒆𝒔𝒊𝒔
𝐻0 : 𝐿𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑒𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒 (𝐻𝑜𝑚𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑)
𝑣𝑠.
𝐻1 : 𝐿𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑛𝑜 𝑒𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒 (𝐻𝑒𝑡𝑒𝑟𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑)
𝑆𝑖 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 < 0,05, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 = 0,005114
𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1 , 𝑝𝑜𝑟𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 𝑒𝑠 𝑚𝑒𝑛𝑜𝑟 𝑞𝑢𝑒 0,05.
𝐸𝑠𝑡𝑜 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎 𝑞𝑢𝑒 𝑛𝑜 ℎ𝑎𝑦 𝑠𝑢𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎 𝑝𝑎𝑟𝑎 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠
𝑠𝑒 𝑐𝑜𝑚𝑝𝑜𝑟𝑡𝑎𝑛 𝑐𝑜𝑛 ℎ𝑜𝑚𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑, 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟, 𝑞𝑢𝑒 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛 𝑐𝑜𝑚𝑝𝑜𝑟𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒
ℎ𝑒𝑡𝑒𝑟𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑.
III. Homogeneidad
𝐸(𝑒) = 0.000155446
𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠 𝑐𝑒𝑟𝑐𝑎𝑛𝑜 𝑎 0, 𝑝𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜, 𝑠𝑒 𝑐𝑢𝑚𝑝𝑙𝑒 𝑒𝑙 𝑠𝑢𝑝𝑢𝑒𝑠𝑡𝑜 𝑑𝑒 𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑑𝑒
𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 𝑒𝑠 0.
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 = 0,333
𝑁𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1 , 𝑝𝑜𝑟𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 𝑒𝑠 𝑚𝑎𝑦𝑜𝑟 𝑞𝑢𝑒 0,05.
𝐸𝑠𝑡𝑜 𝑖𝑚𝑝𝑙𝑖𝑐𝑎 𝑞𝑢𝑒 𝑛𝑜 ℎ𝑎𝑦 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠
MODELO 2: Datos género femenino
Diagrama de dispersión
Mínimos cuadrados
̂0 = −153,1289
𝐵
̂1 = 4,1636
𝐵
Coeficiente de determinación
𝑅2 = 0,5642
Este coeficiente de determinación es más cercano a 1 en comparación al 0, esto puede
indicar, que no se captó en su totalidad la variabilidad de Y (variable respuesta) a través
de las variables de explicación. Mientras más cercano a 1, mayor será el ajuste del modelo
a la variable que se pretende aplicar, por lo que, resultará dicho modelo más fiable.
Correlación
𝑟𝑥𝑦 = 0,7511079
Los datos del peso y la altura de la muestra del género femenino tienen una correlación
positiva, por lo tanto, los datos están relacionados linealmente en cierta medida.
Relación entre el coeficiente de determinación y el coeficiente de
correlación
𝑟𝑥𝑦 = √𝑅2
𝑟𝑥𝑦 = √0,5642
𝑟𝑥𝑦 ≈ 0,7511324
→ 0,7511079 ≈ 0,7511324
Se cumple la relación entre el coeficiente de determinación y el coeficiente de correlación
en un modelo de regresión lineal simple.
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 = 2 ∙ 10−16
𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜, 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1 , 𝑝𝑜𝑟𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 𝑒𝑠 𝑚𝑒𝑛𝑜𝑟 𝑞𝑢𝑒 0,05.
𝐵1 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜 𝑒𝑛 𝑒𝑙 𝑚𝑜𝑑𝑒𝑙𝑜.
Prueba global del modelo de regresión
𝑷𝒓𝒖𝒆𝒃𝒂 𝒅𝒆 𝒉𝒊𝒑ó𝒕𝒆𝒔𝒊𝒔 𝒑𝒂𝒓𝒂 𝑩𝟏
𝐻0 : 𝐵1 = 0
𝑣𝑠.
𝐻1 : 𝐵1 ≠ 0
𝑆𝑖 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 < 0,05, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1
Se puede observar un pequeño sesgo hacia la derecha, pero en general se puede asociar
la gráfica a la de una normal.
ii. Metodología de Tendencia a la Simetría
Residuos entre ±1
Un 69,37% de los residuos cae en este intervalo. Este valor se aproxima a 68,27%, lo que
conlleva a decir que se cumple con este supuesto, al ser el porcentaje mayor al establecido.
Residuos entre ±2
Un 95,50% de los residuos conforma parte de este intervalo. El valor es similar a 98,45%,
pero no cumple el criterio, porque el porcentaje obtenido es menor al valor establecido en
la metodología.
Residuos entre ±3
Un 98,20% constituye este intervalo, pero este porcentaje a pesar de ser similar a 99,73%,
no se cumple el criterio porque es menor al establecido por la metodología.
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 = 0,2662
𝑁𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1 , 𝑝𝑜𝑟𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 𝑒𝑠 𝑚𝑎𝑦𝑜𝑟 𝑞𝑢𝑒 0,05.
𝐻𝑎𝑦 𝑠𝑢𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎 𝑝𝑎𝑟𝑎 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 𝑠𝑖𝑔𝑢𝑒𝑛 𝑢𝑛𝑎
𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙.
II. Homocedasticidad
𝑷𝒓𝒖𝒆𝒃𝒂 𝒅𝒆 𝒉𝒊𝒑ó𝒕𝒆𝒔𝒊𝒔
𝐻0 : 𝐿𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑒𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒 (𝐻𝑜𝑚𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑)
𝑣𝑠.
𝐻1 : 𝐿𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑛𝑜 𝑒𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒 (𝐻𝑒𝑡𝑒𝑟𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑)
𝑆𝑖 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 < 0,05, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 = 0,01284
III. Homogeneidad
𝐸(𝑒) = −9.239254 ∙ 10−5
𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠 𝑐𝑒𝑟𝑐𝑎𝑛𝑜 𝑎 0, 𝑝𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜, 𝑠𝑒 𝑐𝑢𝑚𝑝𝑙𝑒 𝑒𝑙 𝑠𝑢𝑝𝑢𝑒𝑠𝑡𝑜 𝑑𝑒 𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑑𝑒
𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 𝑒𝑠 0.
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 = 0,5316
𝑁𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1 , 𝑝𝑜𝑟𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 𝑒𝑠 𝑚𝑎𝑦𝑜𝑟 𝑞𝑢𝑒 0,05.
𝐿𝑜 𝑐𝑢𝑎𝑙 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎 𝑞𝑢𝑒 𝑛𝑜 ℎ𝑎𝑦 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠.
MODELO 3: Datos género masculino
Diagrama de dispersión
El comportamiento creciente que representa la relación entre la altura y el peso del género
masculino es moderadamente lineal. Se procede a realizar un modelo de regresión lineal
simple para verificar si se puede explicar la relación lineal entre estas variables con la
misma.
Mínimos cuadrados
̂0 = −125,6981
𝐵
̂1 = 3,6898
𝐵
Coeficiente de determinación
𝑅2 = 0,6245
Este coeficiente de determinación es más cercano a 1 en comparación al 0, esto puede
indicar, que no se capta en su totalidad la variabilidad de Y (variable respuesta) a través
de las variables de explicación.
Correlación
𝑟𝑥𝑦 = 0,7902623
Los datos del peso y la altura de la muestra del género masculino tienen una correlación
positiva, que los datos están relacionados linealmente.
Relación entre el coeficiente de determinación y el coeficiente de
correlación
𝑟𝑥𝑦 = √𝑅2
𝑟𝑥𝑦 = √0,6245
𝑟𝑥𝑦 ≈ 0,7902531
→ 0,7902623 ≈ 0,7902531
Se cumple la relación entre el coeficiente de determinación y el coeficiente de correlación
en un modelo de regresión lineal simple.
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 = 2 ∙ 10−16
𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜, 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1 , 𝑝𝑜𝑟𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 𝑒𝑠 𝑚𝑒𝑛𝑜𝑟 𝑞𝑢𝑒 0,05.
𝐵1 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜 𝑒𝑛 𝑒𝑙 𝑚𝑜𝑑𝑒𝑙𝑜.
Prueba global del modelo de regresión
𝑷𝒓𝒖𝒆𝒃𝒂 𝒅𝒆 𝒉𝒊𝒑ó𝒕𝒆𝒔𝒊𝒔 𝒑𝒂𝒓𝒂 𝑩𝟏
𝐻0 : 𝐵1 = 0
𝑣𝑠.
𝐻1 : 𝐵1 ≠ 0
𝑆𝑖 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 < 0,05, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1
Se puede observar un sesgo hacia la derecha por lo que podría decirse que los datos no
poseen una distribución normal.
Se observa que en su mayoría los residuos tienen una distribución normal, sin embargo,
en los extremos se presentan sesgos.
II. Homocedasticidad
𝑷𝒓𝒖𝒆𝒃𝒂 𝒅𝒆 𝒉𝒊𝒑ó𝒕𝒆𝒔𝒊𝒔
𝐻0 : 𝐿𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑒𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒 (𝐻𝑜𝑚𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑)
𝑣𝑠.
𝐻1 : 𝐿𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑛𝑜 𝑒𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒 (𝐻𝑒𝑡𝑒𝑟𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑)
𝑆𝑖 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 < 0,05, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 = 0,06684
𝑁𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1 , 𝑝𝑜𝑟𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 𝑒𝑠 𝑚𝑎𝑦𝑜𝑟 𝑞𝑢𝑒 0,05.
𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜, ℎ𝑎𝑦 𝑠𝑢𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎 𝑝𝑎𝑟𝑎 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑡𝑖𝑒𝑛𝑒𝑛 𝑢𝑛 𝑐𝑜𝑚𝑝𝑜𝑟𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 ℎ𝑜𝑚𝑜𝑐𝑒𝑑á𝑠𝑡𝑖𝑠𝑐𝑜.
III. Homogeneidad
𝐸(𝑒) = 0,0008743427
𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠 𝑐𝑒𝑟𝑐𝑎𝑛𝑜 𝑎 0, 𝑝𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜, 𝑠𝑒 𝑐𝑢𝑚𝑝𝑙𝑒 𝑒𝑙 𝑠𝑢𝑝𝑢𝑒𝑠𝑡𝑜 𝑑𝑒 𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑑𝑒
𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 𝑒𝑠 0.
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 = 0,6112
𝑁𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1 , 𝑝𝑜𝑟𝑞𝑢𝑒 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑝 𝑒𝑠 𝑚𝑎𝑦𝑜𝑟 𝑞𝑢𝑒 0,05.
𝐿𝑜 𝑐𝑢𝑎𝑙 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎 𝑞𝑢𝑒 𝑛𝑜 ℎ𝑎𝑦 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠.
Compare los 3 Modelos, ¿Existe una mejora en los modelos al
estratificar los datos por el Genero?
MODELO 1: Datos totales
El coeficiente de determinación no es un valor tan cercano a uno, por lo que desde un
principio se visualiza que el modelo de regresión lineal para estos datos no es tan fiable
para explicar su relación lineal. Es verdad, que dentro del modelo establecido con estos
datos, sus mínimos cuadrados son significativos. Sin embargo, al momento de verificar
los supuestos del modelo, se manifiestan anomalías.
Con respecto a la normalidad se obtuvieron los siguientes resultados, que negaron su
normalidad:
1. A través del histograma de residuos se observa un sesgo, que limita concluir que los
residuos no se comportan normalmente.
2. La metodología de la simetría en base a la desviación estándar con respecto a la media
no cae en los rangos establecidos por la misma, es decir, no hay normalidad.
3. El gráfico Q-Q muestra que los residuos no son completamente normales.
4. En la prueba de Kolmogórov-Smirnov, se observa que no se puede confirmar la
existencia de la normalidad.
Asimismo, a través de una prueba de hipótesis se concluyó que los residuos no se
comportaban con homocedasticidad. No obstante, se afirmó su homogeneidad y su
independencia. Es por esto, que al no cumplirse dos de sus los cuatro criterios evaluados,
y tener un coeficiente de determinación relativamente bajo, que este modelo es poco
fiable para explicar los datos de ambos géneros.
Conclusión
Los modelos cumplen con la mayoría de los supuestos al ser estratificados por géneros,
pero, se podría cuestionar el uso del modelo de regresión lineal simple para explicar la
relación entre el peso y estatura de dichas muestras, porque sus coeficientes de
determinación no son significativos. Es decir, que se debería hacer uso de otro modelo
que pueda explicar mejor esta relación.
Anexos
Estratificación de datos
Datos totales
Femenino
Masculino