Está en la página 1de 40

Six Sigma

Entrenamiento Green Belt

Correlacin/Regresin
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Reconocer

Definir

Medir

Analizar

Mejorar

Controlar

Sobre este mdulo . . .


El anlisis de correlacin es usado para cuantificar
el grado de asociacin entre variables
El anlisis de regresin es usado para cuantificar
la relacin funcional entre variables

Six Sigma, Una bsqueda para la perfeccin del proceso


Ataca la variacin y logra objetivos

\DataFile\Correl.mtw
\DataFile\RegressAnova.mtw
\DataFile\Correg Your Turn.mtw
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Que aprenderemos . . .
Correlacin
Como medir una relacin lineal entre dos variables
Como interpretar el coeficiente de correlacin r de
Pearson
Regresin
Y = f(X): como encontrar la funcin que relacione una
variable dependiente , Y, con una variable independiente,
X (regresin lineal simple)
Como interpretar el coeficiente de determinacin, R-Sq
Como interpretar la tabla ANOVA para regresin lineal
simple
Como analizar residuales

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Ejemplos del Mundo Real


ADMINISTRACIN
Una compaa de software desea conocer la relacin entre la
llamadas en cola de espera y el tiempo de servicio.
FABRICACIN
Un encargado de calidad quiere predecir la resistencia de un
moldeado plstico realizando un ensayo destructivo de un
cupn
DISEO
Un ingeniero qumico, diseando un nuevo proceso, desea
investigar la relacin entre las variables clave de entrada y la
prdida de amonio en pilas
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Trminos
Correlacin

Usada cuando ambas Y y X son continuas

Mide la fuerza de la relacin lineal entre Y y X

Mtrica: r, coeficiente correlacin Pearson (r varia entre -1 y +1)


Relacin positiva perfecta, r = 1

No existe relacin, r = 0
Relacin negativa perfecta, r = -1

Regresin

Regresin linear simple usada cuando ambas Y y X son continuas

Cuantifica la relacin entre Y y X (Y = b0 + b1X)

Mtrica: Coeficiente de Determinacin, R-Sq (varia desde 0.0 a 1.0 o 0%


a 100%)

Si ninguna variacin de Y es explicada por X, R-Sq = 0.0 %


Si toda variacin en Y es explicada por X, R-Sq = 100 %
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Coeficientes de correlacin:
Ilustracin
SCATTERPLOT OF Y VERSUS X

SCATTERPLOT OF Y VERSUS X

-98

r = 102
+1.0

-99

101

-100

r = -1.0

-Y

103

100

-101

99

-102

98

-103

98

99

100

101

102

98

103

99

100

101

102

103

SCATTERPLOT OF Y VERSUS X
210

200

190

r = 0.0

180

200

210

220

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Correlacin: Ejemplo Minitab


Station 1 Station 2
8.6
8.7
8.8
9.0
9.0
9.1
9.1
9.3
9.0
9.1
9.1
9.2
9.1
9.2
9.2
9.4
9.1
9.2
9.1
9.2
9.0
9.2
8.8
9.0
9.0
9.2
9.1
9.2
9.4
9.6
9.3
9.5
8.8
9.0
9.2
9.4
9.0
9.0
8.8
8.9

El voltaje, correspondiente a una misma


fuente de suministro, es medido por la
Estacin 1 y Estacin 2
Determinar la correlacin existente, en la
medicin del voltaje, entre las dos
estaciones
Desarrollo:
Abrir Datafile\CORREL.mtw (los datos se
muestran en la Data Window)
Ir a Stat > Basic Statistics > Correlation

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Correlacin : Ejemplo Minitab


(Continuacin)

4
2

1. Seleccione C1 Station 1
and C2 Station 2
2. Presione Select
3. Observe Station 1 y
Station 2 como
Variables:
4. Seleccione Display pvalues
5. Seleccione OK

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Correlacin : Ejemplo Minitab (Continuacin)


Correlaciones: Estacin 1, Estacin 2

Correlacin de Pearson de Estacin 1 y Estacin 2 = 0.959


P-Value = 0.000
Desde la Ventana
de Sesin de
Minitab

Scatterplot of Station 1 vs Station 2


9.4
9.3
9.2
9.1

Station 1

Hiptesis Nula (H0):


NO existe correlacin
entre Estacin 1 y
Estacin 2
(H0 es falso porque p
es menor que 0.05)

9.0
8.9
8.8
8.7

Graph > Scatterplot

8.6
8.5
8.6

8.8

9.0

9.2
Station 2

9.4

9.6

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Anlisis de regresin lineal simple

Usada para ajustar lneas y curvas a los datos cuando los


parmetros (bs) son lineales

Las lneas ajustadas


Cuantifica la relacin entre la variable predictora (X) (ingreso)
y variable respuesta (Y) (salida)
Ayuda a identificar las pocas Xs vitales (filtrado)
Permite predicciones de la respuesta Y a partir del
conocimiento de la predictora X

Identifica el impacto de controlar una variable de proceso de


entrada (X) en una variable de proceso de salida (Y)

Produce una ecuacin de la forma:

= b +b X
Y
0
1
es un estimado (" valor ajustado' )
donde Y
del valor correspondiente a la poblacin, Y

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Regresin: Ejemplo Minitab


Station 1 Station 2
8.6
8.7
8.8
9.0
9.0
9.1
9.1
9.3
9.0
9.1
9.1
9.2
9.1
9.2
9.2
9.4
9.1
9.2
9.1
9.2
9.0
9.2
8.8
9.0
9.0
9.2
9.1
9.2
9.4
9.6
9.3
9.5
8.8
9.0
9.2
9.4
9.0
9.0
8.8
8.9

El voltaje en la Estacin 1 se correlaciona con


el voltaje en la Estacin 2.
A un Green Belt le dan la tarea de predecir el
voltaje en la Estacin 2 a partir del voltaje en
la Estacin 1

Desarrollo:
Abrir Datafile\CORREL.mtw (los datos se
muestran en la Data Window)
Ir a Stat > Regression > Fitted Line Plot

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Regresin: Ejemplo Minitab (Continuacin)


3
1
2

4
5

1. Seleccione C1 Station 1
and C2 Station 2
2. Presione Select
3. Observe Station 1 como
Response (Y): y Station 2
como Predictor (X):

4. Seleccione Linear como


Type of Regression Model
5. Seleccione OK

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Regresin: Ejemplo Minitab (Continuacin)


Ecuacin de
la prediccin

Fitted Line Plot

Station 1 = 1.020 + 0.8729 Station 2


9.5

S
R-Sq

9.4

R-Sq(adj)

Station 1

Lnea
9.3

ajustada:
obedece la
9.2
ecuacin de la
9.1
prediccin

0.0557288
92.0%
91.5%

Coeficiente de
Determinacin: use
R-Sq para la
regresin lineal
simple (una X)

9.0
8.9
8.8
8.7
8.6

8.6

8.8

9.0

9.2
Station 2

9.4

9.6

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Regresin lineal de la Estacin 1 en Estacin 2

Como se relaciona la Estacin 1 dependiente a la Estacin 2


independiente o cual es la regresin de la Estacin 1 en Estacin 2?

Desde la Ventana de Sesin, la ecuacin de la regresin es:


Estacin 1 = 1.020 + 0.8729 Estacin 2

Interseccin, b0

Pendiente, b1

La interseccin, b0, es donde la lnea ajustada (Lnea de


regresin) cruza el eje Y , donde X = 0
La pendiente, b1, es ascenso sobre incremento DY/DX

Los coeficientes b0 y b1 son estimadores de los parmetros de la


poblacin b0 y b1 ; son coeficientes lineales.
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Origen de la ecuacin de la regresin


Tiempo para Facturar (Y)

Diagrama de Dispersin
100
90
80

???

70
60

La mejor lnea de ajuste


pasa por las medias de
Y y X (mostrada por la
cruz)

50
40
40

50

60

70

80

90

100

tems Solicitados (X)

Cual es la mejor lnea de ajuste entre el


Tiempo para facturar y los tems solicitados?
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Mtodo de cuadrados mnimos

Residual, r = Valor Observado Valor predicho

Tiempo para facturar (Y)

Lneas de ajuste y residuales

El mtodo de
cuadrados mnimos
minimiza la suma de
los cuadrados de los
residuales

Las ecuaciones
resultantes para la
interseccin y
pendiente se
denominan
ecuaciones normales

100
90
80
70

60
50
40
40

50

60

70

80

tems Solicitados (X)

90

100

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Mtodo de cuadrados mnimos


(Continuacin)
Lneas de ajuste y Residuales
Tiempo de facturar (Y)

100
90
80

Residual
Positivo
Residual
Cero

70
60

Residual
Negativo

50
40
40

50

60

70

80

tems solicitados (X)

90

100

Un residual puede ser


positivo, negativo o cero

Positivo: punto por


encima de la lnea
de ajuste

Cero: punto en la
lnea de ajuste

Negativo: punto
bajo la lnea de
ajuste

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Significancia Estadstica
Una tabla de anlisis de varianza (ANOVA) nos informa sobre la
significancia estadstica del anlisis de regresin
La hiptesis nula, H0 indica: la regresin es el resultado de variacin
por causas comunes.
Si H0 es verdadera, entonces no hay regresin estadstica significativa
y la mejor prediccin de Y es el valor medio de Y
Como antes, el valor p es usado para evaluar la hiptesis nula: si p es
menor que 0.05, la hiptesis nula es falsa, y la regresin es
estadsticamente significativa
Desarrollo:
Use Datafile\REGRESSANOVA.mtw
Ir a Stat > Regression >Regression

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

ANOVA para regresin lineal simple


1. Seleccione Options
2. Seleccione Pure Error
en Lack of Fit Tests
3. Seleccione OK
1

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

ANOVA para regresin lineal simple


Observe la ANOVA (Ventana de Sesin Minitab)
Analysis of Variance
Source
DF SS
MS
F
P
Regression
1
32.123 32.123 722.31 0.000
Residual Error 12
0.534
0.044
Lack of Fit
3
0.212
0.071
1.98 0.188
Pure Error
9
0.322
0.036
Total
13
32.657

Regresin es
significativa:
p < 0.05

Ninguna carencia
del ajuste:
p >=valor
0.05
La suma de los cuadrados (SS) para la regresin implica cada

predicho de Y menos la media de Y


La SS para Error Residual implica cada valor observado de Y menos el
valor predicho de Y, esto es, el residual
SS para error residual puede ser luego descompuesto en SS carencia de
ajuste y SS error puro
SS error puro es la variacin interna del subgrupo y SS carencia de ajuste
es el Residual menos el SS error puro
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Regresin lineal simple


La regresin lineal simple es una tcnica
analtica que permite deducir
la lnea recta a travs de un conjunto de
datos que minimizan la suma de distancias
al cuadrado entre cada punto de datos y la
lnea

(X4,Y4)

Yi Y

residuo

Y
(X3,Y3)

Los valores Y de esta lnea se conocen


como Y(se pronuncia Ysombrero)

(X2,Y2)

Y - Y , la diferencia entre el valor


i

real y el valor de lnea ajustada,


se denomina residuo o error

(X1,Y1)

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Regresin lineal simple


La parte analtica del desarrollo de un modelo
de regresin consta de tres elementos:
Determinacin del modelo de regresin
Y

= b0 + b1x

Anlisis de varianza del modelo (ANOVA)


Evaluacin de lo bueno que es el modelo

Trabajaremos en cada uno de ellos en las


siguientes diapositivas
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Determinacin del modelo de


regresin
(X4,Y4)

(X3,Y3)

(X2,Y2)

Minitab calcula la ecuacin del


modelo de regresin como:
(X1,Y1)

Y = b0 b1X

Donde:
SS xy

b1 = SS
xx
X

b0 = Y b1 X

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Anlisis de la varianza del


modelo
El anlisis de la varianza permite comparar la variacin explicada
por el modelo de regresin con la variacin no explicada
El anlisis de la varianza es un proceso de 5 pasos:
Paso 1: Determinar las sumas de cuadrados (SS)
Paso 2: Determinar los grados de libertad (DF)
Paso 3: Determinar los cuadrados medios (MS)
Paso 4: Calcular la estadstica f (f) Ejemplo de tabla de anlisis de varianza:
Paso 5: Evaluar el valor p (p)

Fuente
DF
SS
MS
f
p
Regresin 1 14.458,9 14.458,9 293,08 0,000
Error
21 1.036,0
49,3
Total
22 15.494,9

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Paso 1: Total de las sumas


de cuadrados

La distancia entre cada punto


de datos (Yi) e Ybarra se determina, se
eleva al cuadrado y se suma.

Y
(X4,Y4)

Este valor corresponde al total


de las sumas de cuadrados (SST)
y representa toda la variacin
en los datos de respuesta.
Matemticamente, esto es:

Y4 Y
Y2 Y

(X3,Y3)

(X2,Y2)

Y1 Y

SST = (Yi Y)2


i =1

Y3 Y

Ejemplo de tabla de anlisis de varianza:

(X1,Y1)
X

Fuente
DF
SS
MS
f
p
Regresin 1 14.458,9 14.458,9 293,08 0,000
Error
21 1.036,0
49,3
Total
22 15.494,9

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Paso 1: Regresin de las sumas


de cuadrados

A cada valor X, la distancia


entre Ysombrero e Ybarra se determina,
se eleva al cuadrado y se suma.
Este valor corresponde a la Suma de
cuadrados (SSR) de la Regresin y
representa la
variacin en los datos explicados
por el modelo de regresin.
Matemticamente, esto es:

Y
(X4,Y4)

Y 4 Y
Y 3 Y
Y 2 Y

(X3,Y3)

Y 1 Y

Y)2
SSR = (Y

(X2,Y2)

i =1

Ejemplo de tabla de anlisis de varianza:

(X1,Y1)

Fuente
DF
SS
MS
f
p
Regresin 1 14.458,9 14.458,9 293,08 0,000
Error
21 1.036,0
49,3
Total
22 15.494,9

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Paso 1: Error de las sumas


de cuadrados
Y

Y3 Y

La distancia entre cada punto de datos


(Yi) e Ysombrero se determina,
se eleva al cuadrado y se suma.

(X4,Y4)

Y4 Y 4

Este valor corresponde a la suma de


cuadrados del error (SSE)
y representa la variacin en los datos no
explicados por el modelo de regresin.

Y3 Y 3
(X3,Y3)

Matemticamente, esto es:


n

Y2 Y 2

SSE

(X2,Y2)

= ( Yi Y i ) 2
i =1

Ejemplo de tabla de anlisis de varianza:

Y Y
1

(X1,Y1)

Fuente
DF
SS
MS
f
p
Regresin 1 14.458,9 14.458,9 293,08 0,000
Error
21 1.036,0
49,3
Total
22 15.494,9

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Paso 2: Grados de libertad


Los grados de libertad se determinan como:
dfTot = nmero de observaciones - 1
dfReg = nmero de trminos estimados a
travs del modelo - 1 (por ejemplo, bo, b1,
Ejemplo de tabla de anlisis de varianza:
etc.)
Fuente
DF
SS
MS
f
p
dfError = dfTot- dfReg
Regresin 1 14.458,9 14.458,9 293,08 0,000
Error
Total

21 1.036,0
22 15.494,9

49,3

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Paso 3: Cuadrados Medios


Los Cuadradados Medios se determinan como:
Cuadrado Medio de la Regresin

MSR =

SSR
dfReg

Cuadrado Medio del error

MSE =

SSE
dfError

Ejemplo de tabla de anlisis de varianza:


Fuente
DF
SS
MS
f
p
Regresin 1 14.458,9 14.458,9 293,08 0,000
Error
21 1.036,0
49,3
Total
22 15.494,9
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Paso 4: Calcular la estadstica f


Calcular la estadstica f como
la relacin de MSR con respecto a
MSE

f =

MSR
MSE

Ejemplo de tabla de anlisis de varianza:


Fuente
DF
SS
MS
f
p
Regresin 1 14.458,9 14.458,9 293,08 0,000
Error
21 1.036,0
49,3
Total
22 15.494,9

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Paso 5: Evaluar el valor p


Determine el valor p basado en la estadstica f, dfReg
y dfError (Minitab lo har por nosotros), para
determinar si el modelo es estadsticamente
significativo
La hiptesis nula (h0) consiste en que b1 = 0
Ejemplo de tabla de anlisis de varianza:
Fuente
DF
SS
MS
f
p
Regresin 1 14.458,9 14.458,9 293,08 0,000
Error
21 1.036,0
49,3
Total
22 15.494,9
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Anlisis de residuales

Los residuales son usados para comprobar si la ecuacin


de prediccin (modelo) es adecuada
En los diagramas de residuales, tres formas de diagrama
indican un modelo inadecuado
Las formas de los diagramas sern dramticas no
sutiles!

1. Abanico

2. Bandas que se inclinan


hacia arriba o abajo

3. Bandas curvas

Nota: Fitted Line Plot. no tiene Lack of Fit Test.

Desarrollo
Abrir Datafile\Residuals
Ir a Stat > Regression > Fitted Line Plot
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Anlisis de residuales
(Continuacin)

1. En el cuadro de dilogo
Fitted Line Plot ,
Seleccione Graphs
2. Seleccione grfico Four
in One
3. Seleccione OK
4. Seleccione OK

2
3

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Anlisis de residuales (Continuacin)


Fitted Line Plot

Units = - 2.343 + 0.08993 Minutes


S
R-Sq
R-Sq(adj)

20

R-Sq es 89.7%
15
La regresin
es significativa
Podemos hacerlo mejor?
Como se 10ven los residuales?
Units

1.78117
89.7%
89.2%

0
0

50

100
Minutes

150

200

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Anlisis de residuales (Continuacin)


Residual Plots for Units
Normal Probability Plot of the Residuals

Residuals Versus the Fitted Values

99

Residual

Percent

90
50
10

2
0
-2

1
-5.0

-2.5

0.0
Residual

2.5

5.0

Histogram of the Residuals

12

16

Residual

Frequency

8
Fitted Value

Residuals Versus the Order of the Data

4
2
0

2
0
-2

-3

-2

-1

0
1
Residual

8 10 12 14 16 18 20 22 24
Observation Order

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Anlisis de residuales (Continuacin)


Normal Probability Plot of the Residuals
(response is Units)

p > 0.05
Se puede asumir que
los residuales son
normales

99

95
90

70
60
50
40
30
20
10
5

Probability Plot of RESI1


1

-4

-3

-2

-1

0
1
Residual

Normal

99

Mean
StDev
N
AD
P-Value

95

Los residuales deben tener


una distribucin normal.
Es as?
Primero, guarde los
residuales, luego
Stat > Basic Statistics >
Normality Test

90

-9.69595E-15
1.742
24
0.336
0.479

80

Percent

Percent

80

70
60
50
40
30
20
10
5

-4

-3

-2

-1

0
1
RESI1

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Anlisis de residuales
(Continuacin)
Residuals Versus the Fitted Values

El grfico de Residuales vs.


Ajustes muestra una forma
curva.

4
3
2

Residual

Pruebe Stat > Regression >


Fitted Line Plot y
seleccione Quadratic.

(response is Units)

1
0
-1
-2
-3

Select Graphs > Four in One


Plot.

8
10
Fitted Value

12

14

16

18

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Anlisis de residuales
(Continuacin)
Mejorando la
adecuacin del modelo,
increment R-Sq de
89.7% a 95.0%

Fitted Line Plot

Units = 2.672 - 0.02075 Minutes


+ 0.000466 Minutes**2
S
R-Sq
R-Sq(adj)

20

1.26903
95.0%
94.5%

10

Residual Plots for Units


Normal Probability Plot of the Residuals

Residuals Versus the Fitted Values

99

50

100
Minutes

150

Residual

Percent

90
50
200
10
1

1
0
-1
-2

-3.0

-1.5

0.0
Residual

1.5

3.0

Histogram of the Residuals


6.0

4.5

3.0
1.5
0.0

10
Fitted Value

15

20

Residuals Versus the Order of the Data

Residual

Como se ven los


residuales?

Frequency

Units

15

0
-1
-2

-2

-1

0
Residual

8 10 12 14 16 18 20 22 24
Observation Order

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

Su turno
Abra Datefile\CORREG YOUR TURN
Analice los conjuntos de datos:
1.
2.
3.
4.

Existe correlacin entre las variables?


Cul es la ecuacin de prediccin?
Es la regresin estadsticamente significativa?
Muestra el anlisis de residuales algo inusual ?

Otro desarrollo:

Stat > Regression > Regression > Options > Lack of Fit Tests
Seleccione Pure Error cuando sus datos estn replicados
Seleccione Data Sub setting cuando sus datos no estn
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
replicados
Universidad Catlica del Per.

Hemos aprendido . . .
Correlacin
Como medir una relacin lineal entre dos variables
Como interpretar el coeficiente de correlacin r de
Pearson
Regresin
Y = f(X): como regresionar una variable dependiente , Y,
en una variable independiente, X (regresin lineal simple)
Como interpretar el coeficiente de determinacin, R-Sq
Como interpretar la tabla ANOVA para regresin lineal
simple
Como analizar residuales

INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.

También podría gustarte