Está en la página 1de 71

Instituto Tecnolgico de Toluca. Ing. En Gestin Empresarial. Estadstica Inferencial II. Unidad 2. Regresin Lineal mltiple y correlacin. Ejercicios.

Alumnos: Alarcn Villegas Pamela Alejandra. Sandoval Rendn Javier Antonio.

Profa. Ing. Laura Marmolejo. Toluca, Edo de Mx, a 12de Octubre de 2012.

EJERCICIO EXAMEN 2 UNIDAD.


En un experimento de ingeniera qumica que se refiere a la transferencia de calor en una cmara fluidizada superficial, se recolectan los datos de la siguiente cuatros variables de regresin: tasa de flujo de gas fluidizante lb / hora (x1), tasa de flujo de gas flotante lb/hrs (x2), abertura de la entrada de gas flotante en mm (x3); temperatura de entada de gas flotante F (x4). La respuesta es la eficiencia trmica (y1).

INTERPRETACIN DEL COEFICIENTE DE REGRESIN ESTIMADO

El aumento promedio de la eficiencia trmica es de 0.0355 por cada punto adicional en la tasa de flujo de gas fluidizante asumiendo que las otras tres variables permanecen constantes, as mismo el aumento promedio de la eficiencia trmica es de 0.482 por cada punto adicional en la tasa de flujo de gas flotante asumiendo que las otras tres variables permanecen constantes, asimismo aumento promedio de la eficiencia trmica es de 0.0418 por cada punto adicional en la abertura de la entrada de gas fluidizante asumiendo que las otras tres variables permanecen constantes, as mismo el aumento promedio de la eficiencia trmica es de 0.606 por cada punto adicional en la temperatura de entrada de gas asumiendo que las otras tres variables permanecen constantes,

COEFICIENTE DE DETERMINACIN. 2

El coeficiente de determinacin es de 31.1%, indica una baja asociacin lineal entre las variables, por lo cual no se puede usar la tasa de flujo de gas fluidizante la tasa de flujo de gas flotante la abertura de la entrada de gas fluidizante la y la temperatura de entrada de gas para predecir la eficiencia trmica.

INTERVALO DE CONFIANZA PARA 0

Con una confianza del 95% se asume que el valor medio de la eficiencia trmica caer en el intervalo de (58.65, 81.20)

INTERVALO DE CONFIANZA PARA 0

Con una confianza del 95% se asume que el valor futuro de la eficiencia trmica caer en el intervalo de (51.02, 88.84)

PRUEBA DE HIPOTESIS DE CADA COEFICIENTE DE REGRESION ES CERO:

1.

Datos anteriores

2. Ho: B1= 0 La variable Xj no es importante


3. H1 : B1 0 La variable si es importante 4. Nivel de significancia= 0.05

CONCLUSIONES
X1: tasa de flujo de gas fluidizante lb / hora (x1), La variable de tasa de flujo de gas fluidizante lb / hora (x1), tiene un p-values de 0.344 por lo tanto se acepta la hiptesis nula y sugiere que la variable no es importante en el modelo. X2: tasa de flujo de gas flotante lb/hrs (x2), La variable tasa de flujo de gas flotante lb/hrs (x2), tiene un pvalues de 0.007 por lo tanto se rechaza la hiptesis nula y sugiere que la variable si es importante en el modelo. X3 Abertura de la entrada de gas flotante en mm (x3); La variable del Abertura de la entrada de gas flotante en mm tiene un p-values de 0.655 por lo tanto se acepta la hiptesis nula y sugiere que la variable no es importante en el modelo. X4 Temperatura de entada de gas flotante F (x4). La variable Temperatura de entada de gas flotante F tiene un pvalues de 0.005 por lo tanto se rechaza la hiptesis nula y sugiere que la variable si es importante en el modelo.

PRUEBA DE HIPTESIS DE QUE TODOS LOS COEFICIENTES DE REGRESIN SON CERO:


1. 2. 3. Datos anteriores Ho: B1=b2=b3=b4= 0 el modelo no sirve H1 : al menos uno de los coeficientes es diferente de cero, al menos una de las variables sirve Nivel de significancia= 0.05 Regin critica: si fp < f(tabla) no se rechaza la hiptesis nula

4. 5.

6.

Clculos

ANALISIS DE VARIANZA MODELO COMPLETO (C)

= =
F=3.14

. .

7. Conclusin:
Como 3.14< 5.86 con un nivel de significancia del 95% se rechaza la hiptesis nula y se concluye que al menos una de las variables predictoras en el modelo es importante para predecir la eficiencia trmica. Como p es menor que 0.05 se acepta la hiptesis alternativa.

PRUEBA DE HIPTESIS PARA UN SUBCONJUNTO DE COEFICIENTES DE REGRESIN


1. 2. Datos anteriores Ho: B1=b2=0 no se rechaza la hiptesis nula el modelo reducido no sirve

3. H1 : al menos uno de los coeficientes es diferente de cero, al menos una de las variables sirve 4. Nivel de significancia= 0.05

5. Regin critica: si fp < f(tabla) no se rechaza la hiptesis nula

6. Clculos
Anlisis de varianza modelo completo

Anlisis de varianza modelo reducido x1, x2

FORMULA:

/ (n (K) 1

( )

Fp = ((637.40- 78.93)/2) / (761.05/15) = 5.5 F(tabla)= 5.86 7. Conclusiones: Como el valor de fp es igual a 5.5 y este valor es menor que el de las tablas 5.86 no se rechaza la hiptesis nula y se concluye que el modelo reducido no sirve.

PRUEBA DE HIPTESIS PARA UN SUBCONJUNTO DE COEFICIENTES DE REGRESIN


1. 2. Datos anteriores Ho: B3=b4=0 no se rechaza la hiptesis nula el modelo reducido no sirve

3. H1 : al menos uno de los coeficientes es diferente de cero, al menos una de las variables sirve 4. Nivel de significancia= 0.05

5. Regin critica: si fp < f(tabla) no se rechaza la hiptesis nula

6. Clculos
Anlisis de varianza modelo completo

Anlisis de varianza modelo reducido x3, x4

FORMULA:

/ (n (K) 1

( )

Fp = ((637.40- 78.97)/2) / (761.05/15) = 5.5 F(tabla)= 5.86 7. Conclusiones: Como el valor de fp es igual a 5.5 y este valor es menor que el de las tablas 5.86 no se rechaza la hiptesis nula y se concluye que el modelo reducido no sirve.

INTERPRETACIN DE LAS GRFICAS ANLISIS DE GRFICO RESIDUAL

La dispersin de los puntos en la grafica de residuos vs temperatura de entrada del gas respecto a la media residual presenta normalidad, sin embargo el dato 7 presenta un error residual muy grande que lo aleja de la media residual

INTERPRETACIN DE LAS GRFICAS ANLISIS DE GRFICO RESIDUAL

La dispersin de los puntos en la grafica de residuos vs la ta sa de flujo de gas fluidizante respecto a la media residual presenta normalidad, sin embargo el dato 7 presenta un error residual muy grande que lo aleja de la media residual

INTERPRETACIN DE LAS GRFICAS ANLISIS DE GRFICO RESIDUAL

La dispersin de los puntos en la grafica de residuos vs abertura de la entrada de gas respecto a la media residual presenta normalidad, sin embargo el dato 7 presenta un error residual muy grande que lo aleja de la media residual

INTERPRETACIN DE LAS GRFICAS ANLISIS DE GRFICO RESIDUAL

La dispersin de los puntos en la grafica de residuos vs la ta da de flujo de gas flotante respecto a la media residual presenta normalidad, sin embargo el dato 7 presenta un error residual muy grande que lo aleja de la media residual

INTERPRETACIN DE LAS GRFICAS ANLISIS DE GRFICO RESIDUAL

GRFICA DE NORMALIDAD: Presenta normalidad ya que todos los puntos estn cerca de la lnea recta. HISTOGRAMA DE RESIDUALES: La forma de la grafica es anormal debido a que la distribucin de el histograma no es simtrico.

RESIDUALES VS VALORES PREDICHOS:


La distribucin de los datos presenta una pequea anormalidad ya que en el sentido vertical se encuentras varios puntos alejados de la media residual y en el sentido horizontal se encuentra la misma dispersin. GRFICA DE RESIDUALES VS NDICE DE LA OBSERVACIN: A pesar a que existen dos datos muy alejados de la media residual estos solo se considera un dato anormal el de la fila numero 7 los dems datos se encuentran dentro de la zona de validez.

SELECCIN DE VARIABLES EN REGRESIN MLTIPLE. MTODOS STEPWISE.

MTODO DE ELIMINACIN HACIA ATRS BACKWARD


El mtodo termina en tres pasos. Se ha economizado dos variables: la variable eliminada es x3 que corresponde a la abertura de la entrada de gas cuya t=0.46 (es la menor) y P= 0.655>0.05. la variable eliminada es x1 que corresponde a la tasa de flujo de gas fluidizante cuya t=0.98 (es la menor) y P= 0.344>0.05.

Por lo tanto el mejor modelo de regresin mltiple queda:


La ecuacin de regresin es Eficiencia trmica (y) = - 172 + 0.490 Tasa de flujo de gas flotante ( + 0.620 Temperatura de entrada del gas Con el cual el consumo de gasolina queda con una 2 de 34.49% explicada por las variables x2 y x4

MTODO DE ELIMINACIN HACIA ADELANTE FORWARD.

No se puede realizar este mtodo a pesar de buscar la forma de realizar el mtodo con la variacin de l alfa; por lo que no se toma en cuenta este modelo

MTODO DE PASO A PASO STEPWISE.


No se puede realizar este mtodo, por lo tanto no se toma en cuenta.

MTODO DE LOS MEJORES SUBCONJUNTOS

Segn el modelo la mejor decisin es aquella que contiene dos variables ( las cuales son X2 y X4 ) tasa de flujo de gas flotante lb/hrs (x2), y temperatura de entada de gas flotante F (x4). A pesar de esto, el coeficiente de correlacin es mnimo y explica en 34.5% a eficiencia trmico respecto a las variables, por lo que no se puede realizar prediccin.

EJERCICIO PROPUESTO:

INTERPRETEACION DEL COEFICIENTE DE REGRESION:

INTERPRETACION:

El aumento promedio en el consumo diario de petrleo es de 10.3 por cada punto adicional en la parte de numero de horas- maquina, asumiendo que las otras dos variables permanecen constantes, asimismo el aumento promedio en el consumo de petrleo es de 0.284 por cada punto adicional en la parte de distancia de transportes asumiendo que las otras variables permanezcan constantes y hay un aumento promedio de 17.5 en el consumo diario de petrleo por cada punto adicional en la parte del rendimiento promedio de motores asumiendo que las otras variables permanecen constantes.

COEFICIENTE DE DETERMINACIN. 2

INTERPRETACIN: El coeficiente de determinacin es de 99.9%, indica una buena asociacin lineal entre las variables, por lo cual se pude usar el numero de horas-maquina el rendimiento de los motores y la distancia de los transportes para predecir el consumo diario de gasolina.

INTERVALO DE CONFIANZA PARA 0

Con una confianza del 95% se asume que el valor medio del consumo promedio de petrleo es caer en el intervalo de (4355.9, 4985)

INTERVALO DE CONFIANZA PARA 0

Con una confianza del 95% se asume que el valor futuro del consumo promedio de petrleo caer en el intervalo de (4311.9, 5029.7), sin embargo se denota un punto que es un valor atpico en extremo de los predictores

PRUEBA DE HIPOTESIS DE CADA COEFICIENTE DE REGRESION ES CERO:

1.

Datos anteriores

2. Ho: B1= 0 La variable Xj no es importante


3. H1 : B1 0 La variable si es importante 4. Nivel de significancia= 0.05

CONCLUSIONES
X1: La variable de numero de horas-maquina tiene un p-values de 0.014 por lo tanto se rechaza la hiptesis nula y sugiere que la variable si es importante en el modelo. X2: La variable distancia de los transportes tiene un p-values de 0.014 por lo tanto se rechaza la hiptesis nula y sugiere que la variable si es importante en el modelo. X3 La variable del rendimiento promedio del motor tiene un p-values de 0.415 por lo tanto se acepta la hiptesis nula y sugiere que la variable no es importante en el modelo.

PRUEBA DE HIPTESIS DE QUE TODOS LOS COEFICIENTES DE REGRESIN SON CERO:


1. 2. 3. Datos anteriores Ho: B1=b2=b3=0 el modelo no sirve H1 : al menos uno de los coeficientes es diferente de cero, al menos una de las variables sirve Nivel de significancia= 0.05 Regin critica: si fp < f(tabla) no se rechaza la hiptesis nula

4. 5.

6.

Clculos

ANALISIS DE VARIANZA MODELO COMPLETO (C)


= =
1 3

47613072 22776 5

F=3484.23 7. Conclusin: Como 3484.23> 4.28 con un nivel de significancia del 95% se rechaza la hiptesis nula y se concluye que al menos una de las variables productoras en el modelo es importante para predecir el consumo diario de petrleo.

PRUEBA DE HIPTESIS PARA UN SUBCONJUNTO DE COEFICIENTES DE REGRESIN


1. 2. Datos anteriores Ho: B1=b2=b3=0 no se rechaza la hiptesis nula el modelo reducido no sirve

3. H1 : al menos uno de los coeficientes es diferente de cero, al menos una de las variables sirve 4. Nivel de significancia= 0.05

5. Regin critica: si fp < f(tabla) no se rechaza la hiptesis nula

6. Clculos
ANALISIS DE VARIANZA MODELO COMPLETO (C)

Anlisis de varianza del modelo completo Fuente GL Regresin 3 Error residual 5 Total 8 SC MC F P 47613072 15871024 3484.23 0.000 22776 4555 47635848

Anlisis de varianza reducido x2,x3 Distancia de transportes X2 Rendimiento de motores X3 Fuente GL SC Regresin 2 47550086 Error residual 6 85762 Total 8 47635848 MC F P 23775043 1663.32 0.000 14294

FORMULA:

/ (n (K) 1

( )

Fp = ((47613072- 47550086)/2) / (22776/5) = 6.91 F(tabla)= 9.01

7. Conclusiones:
Como el valor de fp es igual a 6.91 y este valor es menor que el de las tablas 9.01 no se rechaza la hiptesis nula y se concluye que el modelo reducido no sirve.

INTERPRETACIN DE LAS GRFICAS ANLISIS DE GRFICO RESIDUAL


Los puntos de dispersin de los residuos de nmero de horas maquina respecto a la media residual presenta una normalidad en todos los datos, a pesar de la distancia de los datos de la fila 6 y 7 del modelo

Anlisis de grfico residual


Los puntos de dispersin de los residuos de la distancia de transporte respecto a la media residual presenta una normalidad en todos los datos, a pesar de la distancia de los datos de la fila 6 y 7 del modelo

Anlisis de grfico residual


Los puntos de dispersin de los residuos del rendimiento promedio de motores respecto a la media residual presenta una normalidad en todos los datos, a pesar de la distancia de los datos de la fila 6 y 7 del modelo

ANLISIS DE GRFICO RESIDUAL

GRFICA DE NORMALIDAD: Presenta normalidad ya que todos los puntos estn cerca de la lnea recta. HISTOGRAMA DE RESIDUALES: La forma de la grafica es anormal debido a que la distribucin de el histograma no es simtrico. RESIDUALES VS VALORES PREDICHOS: La distribucin de los datos presenta una pequea anormalidad ya que en el sentido vertical se encuentras dos puntos alejados de la media residual y en el sentido horizontal se encuentra un punto alejado de los dems datos.

GRFICA DE RESIDUALES VS NDICE DE LA OBSERVACIN:


A pesar a que existen dos datos muy alejados de la media residual estos no se consideran datos anormales, esto coloca los datos dentro de la zona de validez.

SELECCIN DE VARIABLES EN REGRESIN MLTIPLE. MTODOS STEPWISE.

MTODO DE ELIMINACIN HACIA ATRS BACKWARD


El mtodo termina en dos pasos.

Se ha economizado una variable: la variable eliminada es x3 que corresponde al RENDIMIENTO PROMEDIO DE MOTORES, cuya t=0.80 (es la menor) y P= 0.45>0.05.
Por lo tanto el mejor modelo de regresin mltiple queda: Con el cual el consumo de gasolina queda con una 2 de 99.93% explicada por las variables x1 y x2

MTODO DE ELIMINACIN HACIA ADELANTE FORWARD.


La variables elegidas por este mtodo son: en primer lugar x2 que corresponde a la distancia de Transportes cuyo valor t=4.96 y P=0.003<0.05, y en segundo lugar x1 que corresponde al nmero de horas-mquina cuyo valor t= 3.68 y P=0.1< 0.05 Por lo tanto el mejor modelo de regresin mltiple es:

MTODO DE PASO A PASO STEPWISE.


El modelo arrojo en orden las variables que participan en el mejor modelo: La x2 distancia de transportes y la x1 nmero de horasmquinas. El coeficiente de determinacin deja explicado el consumo de petrleo en 99.93%.

MTODO DE LOS MEJORES SUBCONJUNTOS

Se puede observar que el mejor modelo queda explicado con dos variables las cuales son x1 nmero de horas hombre-mquina y x2 distancia de transportes, cuyo coeficiente de determinacin queda en 99.9% y con esto queda explicada la variabilidad de l modelo y si se puede realizar prediccin.

EJERCICIO 3. PGINA 483.


Para ejercitar el cuerpo, una medicin objetiva del ajuste aerbico es el consumo de oxgeno en volumen por peso unitario del cuerpo por unidad de tiempo. Se utilizaron 31 individuos en un experimento con objeto de poder modelar el consumo de oxgeno contra: la edad en aos (x1); el peso en kilogramos (x2), el tiempo para correr 1 1/2 millas (x3); el ritmo del pulso en descanso (x4); el ritmo del pulso al final de la carrera (x5), el ritmo mximo del pulso durante la carrera (x6).

Individuo y consumo de oxgeno x1 (edad en aos) carrera) x6 (ritmo max del pulso durante 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 44.609 45.313 54.297 59.571 49.874 44.811 45.681 49.091 39.442 60.055 50.541 37.388 44.754 47.273 51.855 49.156 40.836 46.672 46.774 50.388 39.407 46.800 45.441 54.635 45.118 39.203 45.790 50.545 48.673 47.920 47.647 44 40 44 42 38 47 40 43 44 38 44 45 45 47 54 49 51 51 48 49 57 54 52 50 51 54 51 57 49 48 52 89.47 75.07 85.84 68.15 89.02 77.45 75.98 81.19 81.42 81.87 73.03 87.66 66.45 79.15 83.12 81.42 69.63 77.91 91.63 73.37 73.37 79.38 76.32 70.87 67.25 91.63 73.71 59.08 76.32 61.24 82.78

x2 (peso kg) 11.37 10.07 8.65 8.17 9.22 11.63 11.95 10.85 13.08 8.63 10.13 14.03 11.12 10.60 10.33 8.95 10.95 10.00 10.25 10.08 12.63 11.17 9.63 8.92 11.08 12.88 10.47 9.93 9.40 11.50 10.50

x3 (tiempo correr 1 y 1/2 milla 62 62 45 40 55 58 70 64 63 48 45 56 51 47 50 44 57 48 48 76 58 62 48 48 48 44 59 49 56 52 53 178 185 156 166 178 176 176 162 174 170 168 186 176 162 166 180 168 162 162 168 174 156 164 146 172 168 186 148 186 170 170

x4 (ritmo pulso en descanso) 182 185 168 172 180 176 180 170 176 186 168 192 176 164 170 185 172 168 164 168 176 165 166 155 172 172 188 155 188 176 172

x5 (pulso durante la

ECUACIN DE REGRESIN MLTIPLE.

Interpretaciones: A= 102, significa que El coeficiente de una variable predictora indica el cambio promedio en el consumo de oxgeno (y), cuando se incrementa en una unidad la variable predictora x, asumiendo que las dems permanecen constantes. Por lo tanto; la disminucin del consumo de oxgeno es de -0.21166 por cada ao de edad; la disminucin del consumo de oxgeno es de -0.07014 por cada unidad de peso en kg ,la disminucin del consumo de oxgeno es de -2.6829 por cada segundo adicional del tiempo para correr 1 y 1/2 milla; el consumo de oxgeno aumenta en 0.00445 por cada unidad adicional en el pulso de descanso; el consumo de oxgeno disminuye -0.3835 por cada unidad que aumenta el pulso al final de la carrera; el consumo de oxgeno aumenta en 0.3132 por cada unidad aumentada en el ritmo mximo del pulso durante la carrera. Asumiendo que las otras variables permanecen constantes.

COEFICIENTE DE DETERMINACIN.

Solo el 80.9% de la variacin del consumo de oxgeno, est explicada por su relacin con las variables predictoras.

PRUEBA DE HIPTESIS DE QUE CADA COEFICIENTE DE REGRESIN ES CERO.

0 : 2 = 0

La Variable x2 (peso kg) no es importante en el modelo.

0 : 2 0 La Variable x2 (peso kg) no es importante en el modelo. = 0.05

Ya que la variable x2 contiene un p-value de 0.212 > 0.05 se acepta la Hiptesis nula, y se concluye que el peso en kg no contribuye al modelo, ni a su prediccin.

PRUEBA DE HIPTESIS DE QUE TODOS LOS COEFICIENTES DE REGRESIN SON CEROS.

0 : 1 = 2 = 3 = 4 = 5 = 6 = 0 El modelo no sirve. 1 : . , . = 0.05

Ya que el p-value de la prueba F es 0.000, se concluye que al menos una de las variables predictoras del modelo es importante para predecir el consumo de oxgeno.

PRUEBA DE HIPTESIS PARA UN SUBCONJUNTO DE COEFICIENTES DE REGRESIN.

0 : 1 = 2 = 3 = 0 Las variables edad (x1), peso kg (x2) y


el tiempo para correr 1 y millas no influyen simultneamente en el modelo.

1 : 1 2 3 0
variables influye en el consumo de oxgeno.

Al menos una de las tres

= 0.05 Como > , 4.25 > 3.01; se rechaza la hiptesis nula y se concluye con un nivel de significancia de 0.05 que al menos una de las tres variables influye en el consumo de oxgeno.

ANLISIS RESIDUAL.

La grfica muestra que la dispersin de los datos en de edad en aos, respecto a la media de residuo es casi normal, sin embargo se puede mostrar un dato anormal que es el siguiente:

Grfica de normalidad: La dispersin de los puntos es normal, sin embargo los datos que se encuentran al principio y al final son outliers.

Histograma de Residuos: Hay algo de normalidad en los errores, sin embargo su distribucin no es del todo normal.
Grfica de residuales vs ndice de la observacin: Sugiere que el punto 15 y 17, son outliers en el sentido vertical. Grfica residuales vs valores predichos: La distribucin de los puntos no s igue un orden especfico, sin embargo muestra normalidad

ANLISIS RESIDUAL DE MODELO REDUCIDO.

ANLISIS RESIDUAL PARA EL MODELO REDUCIDO 1 , 2 , 3

La grfica muestra una dispersin casi normal, a no ser de ciertos puntos que muestran una lejana de la media de residuos.

Ambas grficas una dispersin casi normal de los puntos, realmente son algunos puntos que se encuentran anormales. A continuacin se muestra la tabal indicando los datos anormales:

Grfica de normalidad: La dispersin de los puntos es normal, sin embargo los datos que se encuentran al principio y al final son outliers. Histograma de Residuos: Hay algo de normalidad en los errores, sin embargo su distribucin no es del todo normal. Grfica de residuales vs ndice de la observacin: Sugiere que los puntos 2 y 17, son outliers en el sentido vertical. Grfica residuales vs valores predichos: La distribucin de los puntos no s igue un orden especfico, sin embargo muestra normalidad

MTODO PASO A PASO BACKWARD.


El mtodo termina en 3 pasos. La primera variable eliminadafue x4 (ritmo del pulso en descanso), seguido por x2 (peso kg), y por ltimo x1 (edad en aos) Por lo tanto se economizaron 3 variables. Y el coeficiente de correlacin explica el modelo de consumo de oxgeno en 83.69% por l as variables seleccionadas, las cuales son x3 el tiempo que tarda en correr una milla y media; seguido por x5 el pulso durante la carrera, y la x6 el ritmo mximo del pulso durante la carrera.

MTODO FORWARD.
Estas son las variables seleccionadas por el mtodo, las cuales influyen en la variacin de el conusmo de oxgeno. En primer lugar la x3 tiempo en que tarda en correr una y media millas; seguida por x5 pulso durante la carrera; y x6 ritmo mximo del pulso durante la carrera, y por ltimo por x1 que corresponde en la edad en aos.

MTODO STEPWISE.
Este mtodo muestra en orden consecutivo las variables que deben tomarse en cuenta en el modelo comenzando con la x3 tiempo en que tarda en correr una y media millas; seguida por x5 pulso durante la carrera; y x6 ritmo mximo del pulso durante la carrera. Cuyo Coeficiente de determinacin queda de 83.69%, no dice que el consumo queda explicado en este porcentaje con las variables anteriores.

MTODO DE MEJORES SUBCONJUNTOS.


Las mejores opciones son la de 4 variables con 83.7% el cual contiene las variables x1 edad en aos, x3 tiempo en que tarda en correr una y media millas; x5 pulso durante la carrera; y x6 ritmo mximo del pulso durante la carrer Tambin el modelo puede quedar explicado con 3 variables con 81.2% el cual contiene las variables la x3 tiempo en que tarda en correr una y media millas; seguida por x5 pulso durante la carrera; y x6 ritmo mximo del pulso durante la carrera.