P. 1
ESTADÍSTICA INFERENCIAL II (LIBRO)

ESTADÍSTICA INFERENCIAL II (LIBRO)

4.83

|Views: 87.934|Likes:
Publicado porRaul Jimenez

More info:

Published by: Raul Jimenez on Sep 13, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

01/31/2016

pdf

text

original

En la sección anterior estudiamos pruebas de hipótesis para verificar que hay una
relación significativa entre y ; sin embargo, no hemos visto si tal relación permite
hacer estimaciones con una precisión aceptable. Por ejemplo, es de interés saber qué
tanta de la variabilidad presente en fue explicada por el modelo, además si se cumplen
los supuestos de los residuos.

Coeficiente de determinación

. Un primer criterio para evaluar la calidad del
ajuste es observar la forma en que el modelo se ajustó a los datos. En el caso de la
regresión lineal simple esto se distingue al observar si los puntos tienden a ajustarse
razonablemente bien a la línea recta (véase la figura 1.3). Pero otro criterio más
cuantitativo es el que proporciona el coeficiente de determinación, el cual está definido por:



(1.17)

Es claro que

. En general

se interpreta como la proporción de la
variabilidad en los datos ( ) que es explicada por el modelo. En el caso de los datos de
la resistencia de la pulpa (tabla 1.1) tenemos

20 CAPÍTULO 1 Regresión lineal simple y múltiple

Instituto Tecnológico de Ensenada Biol. Raúl Jiménez González



=

= 2580,86

=

Por lo tanto, podemos decir que 93% de la variación observada en la resistencia
es explicada por el modelo (línea recta), lo cual nos dice que la calidad del ajuste es
satisfactorio, y que por ello, la relación entre es descrita adecuadamente por una
línea recta.

Nota. El resultado arrojado por Excel o Minitab, incluye el análisis de varianza
para el modelo de regresión simple cuyo cuadro sintético es el siguiente:

Fuente de variación Suma de cuadrados Grados de libertad Cuadrado medio

Valor-p

Regresión

Error o residual

Total

1


Análisis de varianza en Minitab

Fuente GL SC MC F P
Regresión 1 2400,5 2400,5 159,75 0,000
Error residual 12 180,3 15,0
Total 13 2580,9

S = 3,87648 R-cuad. = 93,0% R-cuad.(ajustado) = 92,4%

Coeficiente de determinación ajustado

. Este coeficiente se calcula de la

siguiente manera:


(1.18)

Resumen de Excel

Estadísticas de la regresión

Coeficiente de correlación múltiple

0,964432318

Coeficiente de determinación R^2

0,930129695

R^2 ajustado

0,92430717

Error típico

3,876481166

Observaciones

14

ANÁLISIS DE VARIANZA

Grados de libertad

Suma de cuadrados

Promedio de los cuadrados

F

Valor crítico de F

Regresión

1

2400,531868

2400,531868

159,7467824

2,70702E-08

Residuos

12

180,3252747

15,02710623

Total

13

2580,857143

Coeficientes

Error típico

Estadístico t

Probabilidad

Inferior 95%

Intercepción

130,6747253

2,417790201

54,047173

1,05975E-15

125,406813

Porcentaje de fibra

1,624175824

0,128504099

12,63909737

2,70702E-08

1,344189444

Análisis de los residuales

Observación

Pronóstico Resistencia

Residuos

1

137,1714286

-3,171428571

2

140,4197802

4,58021978

3

143,6681319

-1,668131868

4

146,9164835

2,083516484

5

150,1648352

-6,164835165

6

153,4131868

6,586813187

7

156,6615385

-0,661538462

8

159,9098901

-2,90989011

9

163,1582418

4,841758242

10

166,4065934

-0,406593407

11

169,6549451

-2,654945055

12

172,9032967

-1,903296703

13

176,1516484

-2,151648352

14

179,4

3,6

Resumen de Excel

Estadísticas de la regresión

Coeficiente de correlación múltiple

0,964432318

Coeficiente de determinación R^2

0,930129695

R^2 ajustado

0,92430717

Error típico

3,876481166

Observaciones

14

ANÁLISIS DE VARIANZA

Grados de libertad

Suma de cuadrados

Promedio de los cuadrados

F

Valor crítico de F

Regresión

1

2400,531868

2400,531868

159,7467824

2,70702E-08

Residuos

12

180,3252747

15,02710623

Total

13

2580,857143

Coeficientes

Error típico

Estadístico t

Probabilidad

Inferior 95%

Intercepción

130,6747253

2,417790201

54,047173

1,05975E-15

125,406813

Porcentaje de fibra

1,624175824

0,128504099

12,63909737

2,70702E-08

1,344189444

Análisis de los residuales

Observación

Pronóstico Resistencia

Residuos

1

137,1714286

-3,171428571

2

140,4197802

4,58021978

3

143,6681319

-1,668131868

4

146,9164835

2,083516484

5

150,1648352

-6,164835165

6

153,4131868

6,586813187

7

156,6615385

-0,661538462

8

159,9098901

-2,90989011

9

163,1582418

4,841758242

10

166,4065934

-0,406593407

11

169,6549451

-2,654945055

12

172,9032967

-1,903296703

13

176,1516484

-2,151648352

14

179,4

3,6

Calidad de ajuste en regresión lineal simple 21

Instituto Tecnológico de Ensenada Biol. Raúl Jiménez González

donde el cuadrado medio total, , se obtiene al dividir la suma de cuadrados total,
, entre sus grados d libertad. Cuando hay muchos términos en un modelo, el
estadístico

se prefiere en lugar de

, puesto que este último es engañoso al
incrementarse en forma artificial con cada término que se agrega al modelo, aunque sea
un término que no contribuya en nada a la explicación de la respuesta. En cambio, el

incluso baja de valor cuando el término que se agrega no aporta nada.
Se cumple que

. En general, para fines de predicción se

recomienda un coeficiente de determinación ajustado de al menos 0,7.
En el caso de los datos de la resistencia de la pulpa (tabla 1.1), el coeficiente de
determinación ajustado está dado por:



Observe que estos coeficientes son arrojados automáticamente en Excel y

Minitab.

Coeficiente de correlación . Es bien conocido que el coeficiente de correlación,
, mide la intensidad de la relación lineal entre dos variables Si se tiene pares
de datos de la forma ( , entonces este coeficiente se obtiene de la siguiente manera:


(1.19)

Se puede ver que ; si es próximo a , entonces tendremos
una relación lineal negativa fuerte, y si es próximo a cero, entonces diremos que no
hay correlación lineal, y finalmente se es próximo a , entonces tendremos una
relación lineal positiva fuerte. Por ejemplo, para los datos de la resistencia de la
pulpa (tabla 1.1), el coeficiente de correlación es;







lo cual habla de una correlación lineal positiva fuerte.

22 CAPÍTULO 1 Regresión lineal simple y múltiple

Instituto Tecnológico de Ensenada Biol. Raúl Jiménez González

Error estándar de estimación . Una medición sobre la calidad del ajuste de un
modelo lo da el error estándar de estimación, que es una estimación de la desviación
estándar del error . En el caso de la regresión lineal simple, está dado por:

=

(1.20)

Es claro que a medida que el modelo ajuste mejor, la será menor y en
consecuencia el error estándar de estimación también será menor.

Análisis gráfico de residuos.

Como complemento a lo que se ha discutido hasta aquí, un análisis adecuado de los
residuos proporciona información adicional sobre la calidad del ajuste del modelo de
regresión y de esa manera es posible verificar si el modelo es adecuado. Las gráficas
que suelen hacerse para completar el diagnóstico del modelo consisten en:

a) graficar los residuos en papel de probabilidad normal,
b) graficar los residuos contra los predichos.

Por ejemplo, para los datos de la resistencia de la pulpa (tabla 1.2), se construye
la gráfica de probabilidad normal que se muestra en la figura 1.4. En ésta se aprecia
que el supuesto de normalidad sobre los errores se cumple razonablemente bien, ya
que los puntos en esta gráfica tienden a ajustarse a la línea recta.

10

5

0

-5

-10

99

95
90
80
70
60
50
40
30
20
10
5

1

Residuo

Porcentaje

Gráfica de probabilidad normal

(la respuesta es Resistencia)

Figura 1.4 Gráfica de probabilidad normal para los residuos de la resistencia de la pulpa

A partir de la tabla 1.2 es fácil obtener la gráfica de residuos contra predichos
que se muestra en la figura 1.5. Si el modelo es adecuado se espera que en esta gráfica
los puntos no sigan ningún patrón y que, por lo tanto, estén distribuidos más o menos
aleatoriamente a lo largo y ancho de la gráfica. Cuando esto ocurre significa que el
modelo se ajusta de igual manera a lo largo de los valores de . Por el contrario, si se
aprecia algún patrón habrá que ver cuál es el tipo de patrón que se observa en la gráfica
y diagnosticar cuál es

la falla que registra el modelo

Estimación y predicción por intervalos en regresión lineal simple 23

Instituto Tecnológico de Ensenada Biol. Raúl Jiménez González

180

170

160

150

140

7,5

5,0

2,5

0,0

-2,5

-5,0

Valor ajustado

Residuo

vs. ajustes

(la respuesta es Resistencia)

Figura 1.5 Gráfica de residuos contra estimados o predichos para la resistencia de la pulpa

En particular la figura 1.5 no muestra ninguna anomalía, lo cual es una evidencia
más a favor del modelo de regresión simple para este ejemplo.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->