P. 1
ESTADÍSTICA INFERENCIAL II (LIBRO)

ESTADÍSTICA INFERENCIAL II (LIBRO)

4.83

|Views: 88.043|Likes:
Publicado porRaul Jimenez

More info:

Published by: Raul Jimenez on Sep 13, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

01/31/2016

pdf

text

original

Las hipótesis sobre los parámetros del modelo son equivalentes a las realizadas para
regresión lineal simple, pero ahora son más necesarias porque en regresión múltiple
tenemos más parámetros en el modelo; sin embargo, por lo general es necesario evaluar
su verdadera contribución a la explicación de la respuesta. También requerimos de la
suposición de que los errores se distribuyen en forma normal, independientes, con
media cero y varianza

. Una consecuencia de esta suposición es que

las observaciones son:


.

La hipótesis global más importante sobre un modelo de regresión múltiple
consiste en ver si la regresión es significativa. Esto se logra probando la siguiente
hipótesis:


Aceptar significa que ningún término o variable en el modelo tiene una
contribución significativa al explicar la variable de respuesta . Mientras que rechazar
implica que por lo menos un término en el modelo contribuye de manera
significativa a explicar . El procedimiento para probar esta hipótesis es una
generalización del procedimiento utilizado para probar la hipótesis equivalente en
regresión lineal simple.

Resumen

Estadísticas de la regresión

Coeficiente de correlación múltiple

0,841756673

Coeficiente de determinación R^2

0,708554296

R^2 ajustado

0,643788584

Error típico

5,363214691

Observaciones

12

ANÁLISIS DE VARIANZA

Grados de libertad

Suma de cuadrados

Promedio de los cuadrados

F

Valor crítico de F

Regresión

2

629,3733536

314,6866768

10,9402688

0,003895018

Residuos

9

258,8766464

28,76407182

Total

11

888,25

Coeficientes

Error típico

Estadístico t

Probabilidad

Inferior 95%

Intercepción

3,651215805

16,16780562

0,22583249

0,82637676

-32,9229014

Estatura

0,854609929

0,451664156

1,892135824

0,0910251

-0,167125373

Edad

1,50633232

1,414265835

1,06509843

0,31457045

-1,692959262

Análisis de los residuales

Observación

Pronóstico Peso

Residuos

1

64,41464032

-0,414640324

2

69,13652482

1,863475177

3

54,56509625

-1,565096251

4

73,20668693

-6,20668693

5

59,28698075

-4,28698075

6

56,9260385

1,073961499

7

65,71808511

11,28191489

8

58,22948328

-1,229483283

9

63,15425532

-7,154255319

10

48,58282675

2,417173252

11

73,85840932

2,141590679

12

65,92097264

2,079027356

Pruebas de hipótesis en regresión lineal múltiple 35

Instituto Tecnológico de Ensenada Biol. Raúl Jiménez González

El estadístico de prueba para la significancia del modelo de regresión lineal

múltiple esta dado por:



(1.24)

que bajo tiene una distribución . Así, se rechaza si
o también si

Ejemplo
Se probará la significación de la regresión (con utilizando los datos de los
pesos , estaturas y edades de la tabla 1.5


El valor de calculado por formula nos da un valor de = 10,9402 ,por
comodidad observamos el resumen arrojado por Excel y/o Minitab


10,94

En tanto que el valor de encontrado en tablas cuando tenemos un nivel de
significancia de 0,05 y 2 grados de libertad en el numerador y 9 en el denominador el
cual es igual a 4,26

= =

Se rechaza la Hipótesis nula

Dado que el valor encontrado en formula es mayor al punto crítico en base al
nivel de significancia por lo que rechazamos la hipótesis nula y aceptamos la alterna lo
cual implica que por lo menos un término en el modelo contribuye de manera
significativa a explicar

Tabla 1.7 ANOVA para la significancia del modelo de regresión lineal múltiple

Fuente de
variación

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

Regresión

Error o residuo

Total



K

n-1

36 CAPÍTULO 1 Regresión lineal simple y múltiple

Instituto Tecnológico de Ensenada Biol. Raúl Jiménez González

Análisis de varianza en Minitab

Fuente GL SC MC F P
Regresión 2 629,37 314,69 10,94 0,004
Error residual 9 258,88 28,76
Total 11 888,25

Coeficiente de determinación

El que un modelo sea significativo no necesariamente implica que sea bueno en
términos de que explique la variación de los datos. Por ello es importante tener
mediciones adicionales de la calidad del ajuste del modelo, como las gráficas de
residuales y el coeficiente de determinación. Con la información del análisis de varianza
de la tabla 1.7 es muy sencillo calcular el coeficiente de determinación

, y el

coeficiente de determinación ajustado

:


(1.25)



(1.26)

Ambos coeficientes se interpretan de forma similar al caso de regresión lineal
simple, es decir, como el porcentaje de variabilidad de los datos que son explicados por
el modelo. Se cumple que

; en general, para hablar de un modelo que
tiene un ajuste satisfactorio es necesario que ambos coeficientes tengan valores
superiores a 0,7. Cuando en el modelo hay términos que no contribuyen de manera
significativa a éste, el

tiende a ser menor que el

. Por lo tanto, es deseable
depurar el modelo y para ello las siguientes pruebas de hipótesis son de mucha utilidad.

Para los datos de la tabla 1.5 tenemos que

Resumen

Estadísticas de la regresión

Coeficiente de correlación múltiple

0,841756673

Coeficiente de determinación R^2

0,708554296

R^2 ajustado

0,643788584

Error típico

5,363214691

Observaciones

12

ANÁLISIS DE VARIANZA

Grados de libertad

Suma de cuadrados

Promedio de los cuadrados

F

Valor crítico de F

Regresión

2

629,3733536

314,6866768

10,9402688

0,003895018

Residuos

9

258,8766464

28,76407182

Total

11

888,25

Coeficientes

Error típico

Estadístico t

Probabilidad

Inferior 95%

Intercepción

3,651215805

16,16780562

0,22583249

0,82637676

-32,9229014

Estatura

0,854609929

0,451664156

1,892135824

0,0910251

-0,167125373

Edad

1,50633232

1,414265835

1,06509843

0,31457045

-1,692959262

Análisis de los residuales

Observación

Pronóstico Peso

Residuos

1

64,41464032

-0,414640324

2

69,13652482

1,863475177

3

54,56509625

-1,565096251

4

73,20668693

-6,20668693

5

59,28698075

-4,28698075

6

56,9260385

1,073961499

7

65,71808511

11,28191489

8

58,22948328

-1,229483283

9

63,15425532

-7,154255319

10

48,58282675

2,417173252

11

73,85840932

2,141590679

12

65,92097264

2,079027356

Pruebas de hipótesis en regresión lineal múltiple 37

Instituto Tecnológico de Ensenada Biol. Raúl Jiménez González

Coeficiente de correlación múltiple

Es la raíz cuadrada del coeficiente de determinación

(1.27)

y es una medida de la intensidad de la relación entre la variable dependiente, , y el
conjunto de variables o términos en el modelo

Error estándar de estimación

Al igual que en regresión lineal simple, el error estándar de estimación proporciona la
medida del error de ajuste de un modelo, éstas tienen una interpretación similar a la que
se dio para el caso de regresión lineal simple. En cuanto al cálculo en el caso múltiple,
el error estándar de estimación,

(1.28)

En el caso del ejemplo de los pesos, estatura y edades tenemos

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->