Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TEMA 5
REGRESIÓN Y CORRELACIÓN LINEAL BIVARIANTE
Hay dos aspectos relacionados, pero diferentes, del estudio de la asociación entre
variables:
A. ANÁLISIS DE REGRESIÓN: Trata de establecer la naturaleza de la relación entre
variables, es decir, estudiar la relación funcional entre las variables y proporcionar un
mecanismo de predicción ó pronóstico.
B. ANÁLISIS DE CORRELACIÓN: Trata de determinar el grado y el sentido de la relación
lineal entre variables.
SP/MTS 1
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES
DEPARTAMENTO DE ESTADÍSTICA Y PROBABILIDAD
CÁTEDRA DE MÉTODOS ESTADÍSTICOS
ASIGNATURA: ESTADÍSTICA II
PROFESORAS: SANDRA V. PINTO R. Y MARÍA T. SALOMÓN V.
SP/MTS 2
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES
DEPARTAMENTO DE ESTADÍSTICA Y PROBABILIDAD
CÁTEDRA DE MÉTODOS ESTADÍSTICOS
ASIGNATURA: ESTADÍSTICA II
PROFESORAS: SANDRA V. PINTO R. Y MARÍA T. SALOMÓN V.
yi a bxi ei (3)
y la Ecuación de Regresión de la Muestra
yˆ ci a bX i (4)
El estimador lineal ideal que buscamos es el MELI (Mejor Estimador Lineal Insesgado) y
el método para obtenerlo es el de los Mínimos Cuadrados, que consiste en minimizar la
suma de los cuadrados de los errores (ei).
Tenemos que: yi a bxi ei y yˆci a bxi , luego yi yˆ c i ei =>
ei yi yˆ c i
Estimadores de A y B.
yi a bxi ei (3) , sumando (3) hasta n
yi na b xi ei
tenemos:
yi na b xi Ecuaciones
2
xi yi a xi b x i Normales
SP/MTS 3
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES
DEPARTAMENTO DE ESTADÍSTICA Y PROBABILIDAD
CÁTEDRA DE MÉTODOS ESTADÍSTICOS
ASIGNATURA: ESTADÍSTICA II
PROFESORAS: SANDRA V. PINTO R. Y MARÍA T. SALOMÓN V.
yˆ ci a bxi
Una medida de las desviaciones de la línea de ajuste con respecto a la nube de puntos a la
cual es ajustada, es el estimador Insesgado de la varianza de la regresión de población que
se define como:
( yi yˆ ci ) 2 ( yi (a bxi )) 2 yi a yi b xi yi
2
ˆ 2
n2 n2 n2
yx
SP/MTS 4
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES
DEPARTAMENTO DE ESTADÍSTICA Y PROBABILIDAD
CÁTEDRA DE MÉTODOS ESTADÍSTICOS
ASIGNATURA: ESTADÍSTICA II
PROFESORAS: SANDRA V. PINTO R. Y MARÍA T. SALOMÓN V.
ˆ 2 x2
σ σˆ2
2 yx i yx
ˆ
σ ˆ2
σ
a n (x x )2 b (x x )2
i i
a) Sí n<=30 y yx es desconocida:
2
b) Sí n>30 y 2
yx
conocida ó no::
Estadísticos de Contraste:
a) Sí n<=30 y yx es desconocida:
2
aA bB
t o
t o
̂ a
y
̂ b
b) Si n>30 y
2
yx
conocida ó no:
aA bB
z o
z o
a
y
b
SP/MTS 5
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES
DEPARTAMENTO DE ESTADÍSTICA Y PROBABILIDAD
CÁTEDRA DE MÉTODOS ESTADÍSTICOS
ASIGNATURA: ESTADÍSTICA II
PROFESORAS: SANDRA V. PINTO R. Y MARÍA T. SALOMÓN V.
yˆ ̂ a bx
ci yx i
ˆ t
y c n 2 ; 1 / 2
ˆ yc
y ˆ c z1 / 2
y ˆ yc
Cálculo de 2
yˆc :
yˆ ci a bxi , además
a y bx yˆ y bx bx y b( x x )
ci i i
y
ˆ y b( x x ) , Así que
ci i
V ( y ) V ( y b( x x )) V ( y ) V (b( x x ))
ˆc
y
2
c i i
V ( y ) V ( y) / n yx
2
/n, y
2
V (b( xi x )) ( x x ) V (b) ( x x ) 2 2 yx
, Luego
( xi x ) 2
SP/MTS 6
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES
DEPARTAMENTO DE ESTADÍSTICA Y PROBABILIDAD
CÁTEDRA DE MÉTODOS ESTADÍSTICOS
ASIGNATURA: ESTADÍSTICA II
PROFESORAS: SANDRA V. PINTO R. Y MARÍA T. SALOMÓN V.
2
2
1 ( xi x ) 2
yc V ( y ) V (b( x x ))
2 yx
( x x )2 yx
yx
2
2
( xi x ) ( xi x )
i
n
2
n
1 ( xi x ) 2
Y finalmente la Varianza estimada de yc , será: ˆ yc ˆ
2 2
n (x x)
yx 2
i
Así que el Intervalo de Confianza para la Recta de regresión Poblacional µ yx, construido sobre
la base de la recta de regresión estimada, viene expresado como:
Pr( yˆ t c n2 ; / 2
ˆ yˆ t
yc yx c
ˆ ) 1
n2 ;1 / 2 yc
Para obtener una estimación por intervalos para Ya, se debe obtener a V(Ya)= 2
Ya
2
Ya
V (a bxi ei ) y2c yx2 ˆ Y2a ˆ y2c ˆ yx2
1 ( x x )2 1 ( x x )2
ˆ 2
ˆ yx2 2
ˆ 2
ˆ yx
2
1 2
( xi x ) ( xi x )
Ya yx
n n
Luego:
ˆ c z / 2ˆ Ya Ya y
Para n>30, Pr( y ˆ c z1 / 2ˆ Ya ) 1
SP/MTS 7
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES
DEPARTAMENTO DE ESTADÍSTICA Y PROBABILIDAD
CÁTEDRA DE MÉTODOS ESTADÍSTICOS
ASIGNATURA: ESTADÍSTICA II
PROFESORAS: SANDRA V. PINTO R. Y MARÍA T. SALOMÓN V.
Cov( x, y ) E ( x x )( y y )
xy
x y ( x x )2 E ( y y )2
Observaciones:
a) xy es simétrico con respecto a X y Y, es decir, si se intercambian X y Y no cambia.
b) es un número puro, porque se define como la razón de la covarianza en X y Y al
xy
Cuando se extrae una muestra aleatoria de tamaño n, de pares ordenados (xi, yi), i=1,2,…,n, de
una población bivariante normal. El estimador de probabilidad máxima de , representado por
r, se obtiene así:
( xi x )( yi y ) xi yi nx y
r
ˆ xy
( ( xi x ) 2 )( ( yi y ) 2 ) ( xi nx 2 )( yi2 ny 2 )
2
SP/MTS 8
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES
DEPARTAMENTO DE ESTADÍSTICA Y PROBABILIDAD
CÁTEDRA DE MÉTODOS ESTADÍSTICOS
ASIGNATURA: ESTADÍSTICA II
PROFESORAS: SANDRA V. PINTO R. Y MARÍA T. SALOMÓN V.
infinito. Cuando =0, hay una transformación por la cual los valores transformados de r se
distribuyen según una t-student con n-2 grados de libertad, esta es:
r n2
tn2
1 r2
Esta transformación no puede usarse para estimación por intervalos, pero sí como el
estadístico de prueba para la hipótesis nula de que =0 contra una alternativa adecuada.
Nota: Las hipótesis nula Ho: =0 y Ho: B=0, son equivalentes, porque B ( y / x ) .
( yi y ) ( y
ˆ ci y ) ( yi y
ˆ ci )
ERROR TOTAL ERROR EXPLICADO ERROR RESIDUAL
Elevando al cuadrado ambos miembros de esta identidad y sumando todas las observaciones
de la muestra:
y )2 i1 ( yˆ ci y ) ( yi yˆ ci ) i1 ( yˆ ci y ) ei
n n 2 n 2
( yi
i 1
Veamos,
SP/MTS 9
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES
DEPARTAMENTO DE ESTADÍSTICA Y PROBABILIDAD
CÁTEDRA DE MÉTODOS ESTADÍSTICOS
ASIGNATURA: ESTADÍSTICA II
PROFESORAS: SANDRA V. PINTO R. Y MARÍA T. SALOMÓN V.
Luego:
y ) 2 i ˆ ei
n n 2 2 n
( yi ( y ci
y )
i 1 1 i 1
y ) 2 i ˆ ( yi y
ˆ
n n2 2 n
( yi ( y ci
y ) ci
)
i 1 1 i 1
Donde:
SCR SCE
SCT=SCR+SCE 1 , luego definimos el coeficiente de determinación de la
SCT SCT
muestra r2, como
( xi x )
2
SCE SCR
r 2 1 b2 , 0<r2<1
( yi y )
2
SCT SCT
SP/MTS 10
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES
DEPARTAMENTO DE ESTADÍSTICA Y PROBABILIDAD
CÁTEDRA DE MÉTODOS ESTADÍSTICOS
ASIGNATURA: ESTADÍSTICA II
PROFESORAS: SANDRA V. PINTO R. Y MARÍA T. SALOMÓN V.
ANOVA
SC GRADOS CM RAZON
FUENTE DE
SUMA DE DE CUADRADOS F
VARIACIÓN
CUADRADOS LIBERTAD(gl) MEDIOS
CMR/CME
Regresión SCR ( yˆ ci y ) 2 CMR SCR / k 1
k-1
En la tabla ANOVA se puede apreciar que CME= Cuadrado Medio del Error es igual a la
ˆ yx 2
varianza estimada de la regresión , es decir,
SCE yi2 a yi b xi yi
ˆ yx 2
CME
n2 n2
SP/MTS 11