Está en la página 1de 3

ÁREA DE ESTADÍSTICA

Inga. María Eugenia Aguilar

REGRESIÓN Y CORRELACION LINEAL

1. Al estudiar los efectos de la herencia y el entorno sobre la inteligencia, ha resultado útil analizar los
puntajes de cociente intelectual (IQ) de gemelos idénticos que fueron separados poco después de nacer. Los
gemelos idénticos comparten los mismos genes heredados del mismo óvulo fertilizado. Al estudiar gemelos
idénticos que se criaron separados, podemos eliminar la variable de la herencia y aislar mejor los efectos del
entorno. En la tabla adjunta se muestran los puntajes de IQ de gemelos idénticos (los gemelos mayores son x)
que se criaron separados. Use los datos de muestra para determinar si existe una relación entre los puntajes de
IQ de los gemelos.

X 107 96 103 90 96 113 86 99 109 105 96 89


Y 111 97 116 107 99 111 85 108 102 105 103 93
Basado en datos de “IQs of Identical Twins Reares Apart”, por Arthur Jensen Behavioral Genetics.

Por medio de la opción Análisis de Datos de Excel se obtiene el siguiente despliegue:


Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.694118972
Coeficiente de determinación R^2 0.481801147
R^2 ajustado 0.429981262
Error típico 6.514304855
Observaciones 12

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 394.5549893 394.5549893 9.297611219 0.01226848
Residuos 10 424.3616774 42.43616774
Total 11 818.9166667

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 33.01225309 23.05697898 1.431768364 0.182714755 -18.36189738 84.38640355
X 0.707193409 0.231927642 3.049198455 0.01226848 0.19042642 1.223960397

En estadística de la regresión se muestran los valores de la correlación:


Correlación lineal = R = 0.6941
Determinación = R2 = 0.4818
Estos valores se interpretan de la siguiente manera:
El modelo es lineal en un 69.41% lo que significa que la variable Y se relaciona con la X en un 69.41%.
El modelo tiene un grado de ajuste de 0.4818, es decir que es útil en un 48.18%, o dicho de otra forma, el
48.18% de los valores de Y pueden predecirse correctamente a través de la equis.

En la tabla de abajo se muestran los coeficientes para el modelo: Y = 33.0122 + 0.7071X

Dando respuesta al problema, puede decirse que existe poca relación entre los puntajes de IQ de los gemelos.
2. Se cree que la energía eléctrica consumida cada mes en cientos de Kw-hora por una planta química está
relacionada con la temperatura ambiental promedio X1, el número de días del mes X2, la pureza promedio del
producto X3 y las toneladas fabricadas del producto X4. Se dispone de datos históricos que se presentan en
tabla 1.
a. Calcule el modelo de regresión lineal.
b. Prediga el consumo de energía para un mes en que X1 = 75°F, X2 = 24 días, X3 = 90% y X4 = 98
toneladas
c. Estime S del modelo
d. Calcule e interprete los coeficientes R y R2.
TABLA 1
Y X1 X2 X3 X4
240 25 24 91 100
236 31 21 90 95
290 45 24 88 110
274 60 25 87 88
301 65 25 91 94
316 72 26 94 99
300 80 25 87 97
296 84 25 86 96
267 75 24 88 110
276 60 25 91 105
288 50 25 90 100
261 38 23 89 98

Por medio de la opción Análisis de Datos de Excel se obtiene el siguiente despliegue:


Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.862988866
Coeficiente de determinación R^2 0.744749783
R^2 ajustado 0.598892516
Error típico 15.57933272
Observaciones 12

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 4 4957.240744 1239.310186 5.10601768 0.030302769
Residuos 7 1699.009256 242.7156081
Total 11 6656.25

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción -102.7132364 207.8588509 -0.494148967 0.636328637 -594.221316 388.7948432
X1 0.605370537 0.368896954 1.641028833 0.144796622 -0.266932145 1.47767322
X2 8.923644198 5.300522238 1.683540564 0.136145668 -3.61009923 21.45738763
X3 1.437456733 2.391620508 0.601038806 0.566759239 -4.217827118 7.092740585
X4 0.013609308 0.733821444 0.018545803 0.985720985 -1.721602674 1.748821289

a. El modelo está dado por: Y = -1025.7132 + 0.6053X1 +8.9836X2 + 1.1374X3 + 0.0136X4.


b. Y cuando X1 = 75°F, X2 = 24 días, X3 = 90% y X4 = 98 toneladas. Y = 287.5618 cientos de Kw-hora.
c. S = 15.57
d. Correlación lineal = R = 0.8629
Determinación = R2 = 0.7447

El modelo es lineal en un 86.29% lo que significa que la variable Y se relaciona con las equis en un 86.69%.
El modelo tiene un grado de ajuste de 0.7447, es decir que es útil en un 74.47%, o dicho de otra forma, el
74.47% de los valores de Y (consumo) pueden predecirse correctamente a través de la equis.
3. Una corporación ha estado buscando los factores que influyen en la cantidad de acero (en millones de
toneladas) que puede vender cada año. La administración sospecha que los siguientes son los factores
principales: la tasa anual de inflación del país, el precio promedio por tonelada del acero importado que acota
los precios (en dólares) y el número de automóviles (en millones) que los fabricantes de autos de Estados
Unidos planean producir ese año. Se recolectaron los datos de los últimos siete años:

Millones de Tasa de Cota de Número


Toneladas inflación importaciones de
Año Vendidas Automóviles
2002 4.2 3.1 3.10 6.2
2003 3.1 3.9 5.00 5.1
2004 4.0 7.5 2.20 5.7
2005 4.7 10.7 4.50 7.1
2006 4.3 15.5 4.35 6.5
2008 3.7 13.0 2.60 6.1
2009 3.5 11.0 3.05 5.9

En base a la información de los años 2002 a 2009:

a. Calcule el modelo de regresión lineal que representa el comportamiento de las toneladas vendidas
anualmente en función de las demás variables.
b. Estime el valor de .
c. Estime e interprete los coeficientes de correlación y determinación.

Por medio de la opción Análisis de Datos de Excel se obtiene el siguiente despliegue:

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.931128159
Coeficiente de determinación R^2 0.866999649
R^2 ajustado 0.733999298
Error típico 0.277284817
Observaciones 7

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 3 1.503625106 0.501208369 6.518777157 0.078975386
Residuos 3 0.230660609 0.07688687
Total 6 1.734285714

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción -1.049030449 1.194367423 -0.878314687 0.444435936 -4.850040641 2.751979742
inflación -0.028228867 0.028818842 -0.979528141 0.399554203 -0.119943284 0.063485551
cota -0.05084386 0.107167915 -0.474431738 0.667587754 -0.391899995 0.290212275
Automóviles 0.890388464 0.212762351 4.184896707 0.024868082 0.213283705 1.567493223

a. El modelo está dado por: Y = -1.049 - 0.0282X1 – 0.0505X2 + 0.8903X3


b. La estimación de σ es S. S = 0.2772
c. Correlación lineal = R = 0.9311
Determinación = R2 = 0.8669

El modelo es lineal en un 93.11% lo que significa que la variable Y se relaciona con las equis en un 93.11%.
El modelo tiene un grado de ajuste de 0.8669, es decir que es útil en un 86.69%, o dicho de otra forma, el
86.69% de los valores de Y (toneladas vendidas) pueden predecirse correctamente a través de la equis.

También podría gustarte