Está en la página 1de 24

1-1

Regresión lineal
y correlación
OBJETIVOS
Al terminar este capítulo podrá:
UNO
Dibujar un diagrama de dispersión.
DOS
Entender e interpretar los términos variable dependiente y variable
independiente.
TRES
Calcular e interpretar el coeficiente de correlación, el coeficiente de
determinación y el error estándar de la estimación.
CUATRO
Realizar una prueba de hipótesis para determinar si existe una diferencia
entre las medias de bloques.
1-1

Regresión lineal
y correlación
OBJETIVOS
Al terminar este capítulo podrá:
CINCO
Calcular la recta de regresión de mínimo cuadrados e interpretar la pendiente
y las intercepciones.
SEIS
Construir e interpretar intervalos de confianza e intervalos de predicción para
la variable independiente.
SIETE
Establecer e interpretar una tabla de ANOVA.
12-3

Análisis de correlación

• Análisis de correlación: se usa un gupo de


técnicas estadísticas para medir la fuerza de la
relación (correlación) entre dos variables.
• Diagrama de dispersión: gráfica que describe la
relación entre las dos variables de interés.
• Variable dependiente: la variable que se
pronostica o estima.
• Variable independiente: la variable que
proporciona la base para la estimación. Es la
variable predictora.
12-4

Coeficiente de correlación, r

• El coeficiente de correlación (r) es una medida


de la intensidad de la relación entre dos
variables.
· Requiere datos con escala de intervalo o de razón
(variables).
· Puede tomar valores entre -1.00 y 1.00.
· Valores de -1.00 o 1.00 indican correlación fuerte y
perfecta.
· Valores cercanos a 0.0 indican correlación débil.
· Valores negativos indican una relación inversa y
valores positivos indican una relación directa.
12-5

Correlación negativa perfecta

10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
12-6

Correlación positiva perfecta

10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
12-7

Correlación cero

10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
12-8

Correlación positiva fuerte

10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
12-9

Fórmula para r

n( XY )  ( X )(Y )
n( X  n(Y 
r= 2
)  (X ) 2 2
)  (Y ) 2
12-10

Coeficiente de determinación

• El coeficiente de determinación, r2 - la
proporción de la variación total en la
variable dependiente Y que está explicada
por o se debe a la variación en la variable
independiente X.
· El coeficiente de determinación es el cuadrado
del coeficiente de correlación, y toma valores de
0 a 1.
12-11

EJEMPLO 1

• Dan Ireland, presidente de la sociedad de


alumnos de la Universidad de Toledo, está
preocupado por el costo de los libros. Para
tener un panorama del problema elige una
muestra de 8 libros de venta en la librería.
Decide estudiar la relación entre el número
de páginas del libro y el costo. Calcule el
coeficiente de correlación.
12-12

EJEMPLO 1 continuación

Libro Páginas Costo ($)


1 500 28
2 700 25
3 800 33
4 600 24
5 400 23

6 500 27

7 600 21

8 800 31
12-13

EJEMPLO 1 continuación

• r =.614 (verifique)
• Pruebe la hipótesis de que no existe
correlación en la población. Use .02 de nivel
de significancia.
• Paso 1: H0 la correlación en la población es
cero. H1 la correlación en la población es
distinta de cero.
• Paso 2: H0 se rachza si t>3.143 o si
t<-3.143, gl = 6,  = .02
12-14

EJEMPLO 1 continuación

• El estadístico de prueba es t = 1.9055,


calculado por
r n2
t 
1 r2

con (n - 2) grados de libertad


• Paso 4: H0 no se rechaza
12-15

Análisis de regresión

• Propósito: determinar la ecuación de


regresión; se usa para predecir el valor de la
variable dependiente (Y) basado en la
variable independiente (X).
• Procedimiento: seleccionar una muestra de la
población y enumerar los datos por pares para
cada observación; dibujar un diagrama de
dispersión para visualizar la relación;
determinar la ecuación de regresión.
12-16

Análisis de regresión

• La ecuación de regresión: Y’= a + bX, donde:


• Y’ es el valor promedio pronosticado de Y para cualquier
valor de X.
• a es la intercepción en Y, o el valor estimado de Y
cuando X = 0
• b es la pendiente de la recta, o cambio promedio en Y’
por cada cambio de una unidad en X
• se usa el principio de mínimos cuadrados para obtener
a y b:
n (  XY )  (  X )(  Y )
b 
n(  X 2 )  (  X ) 2
Y X
a  b
n n
12-17

EJEMPLO 2

• Desarrollar una ecuación de regresión para la


información dada en el EJEMPLO 1 que
puede usarse para estimar el precio de venta
basado en el número de páginas.
• Por el principio de mínimos cuadrados,
b = .01714 y a = 16.00175
Y’ = 16.00175 + .01714X
12-18

Error estándar de la estimación

• El error estándar de la estimación mide la


dispersión de los valores observados alrededor
de la recta de regresión.
• Fórmulas usadas para calcular el error
estándar:
 (Y  Y ' ) 2
SY  X 
n2
 Y 2  a (  Y )  b(  XY )

n2
12-19

Suposiciones fudamentales de regresión lineal

• Para cada valor de X, existe un grupo de valores de


Y que tienen una distribución normal.
• Las medias de estas distribuciones normales de
valores de Y deben estar sobre la recta de
regresión.
• Las desviaciones estándar de estas distribuciones
normales son iguales.
• Los valores de Y son estadísticamente
independientes. Es decir, que en la selección de una
muestra, los valores elegidos de Y para un valor
particular de X no depende de los valores de Y para
otro valor de X.
12-20

Intervalo de confianza

• El intervalo de confianza para el valor medio


de Y para un valor dado de X está definido
por:
1 (X  X) 2

Y 't  ( SY  X ) 
n ( X ) 2
X 
2
n
12-21

Intervalo de predicción

• El intervalo de predicción para un valor


individual de Y para un valor dado de X se
define por:
1 (X  X) 2

Y 't  ( SY  X ) 1  
n ( X ) 2
X 
2
n
12-22

EJEMPLO 3

• Use la información del EJEMPLO 1:


· calcule el error estándar de la estimación:
SY  X = 3.471
· desarrolle un intervalo de confianza de 95% para los
libros de 650 páginas: [24.03, 30.25]. Verifique
· desarrolle un intervalo de predicción de 95% para un
libro de 650 páginas: [18.09, 36.19] Verifique
12-23

Más sobre el coeficiente de determinación

2 variación total - variación no explicada


r =
variación total
(Y - Y )2 - (Y - Y ' )2
= 2
(Y - Y )
Regresión = SSR =  (Y’ - Y )2
Variación del error = SSE =  (Y’ - Y )2
Variación total = SS total =  (Y - Y )2
12-24

Más sobre el coeficiente de determinación

SSR SSE
r 
2
 1
SS total SS total
SSE
SY  X 
n2

También podría gustarte