Documentos de Académico
Documentos de Profesional
Documentos de Cultura
X
VARIABLE
Y
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Estimacin por asociacin
Predecir valores de una variable como
funcin de otra u otras variables
Y = f (X)
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Asociacin entre variables cuantitativas
Variable X
independiente?
Variable Y
dependiente?
SE ASOCIAN
Tienen
relacin?
Qu clase de
relacin tienen?
Diagrama de
dispersin
Qu grado de
relacin tienen?
ANALISIS DE CORRELACIN
ANLISIS DE
REGRESIN
Prediccin: cunto
vale Y si X vale....?
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
DOS ASPECTOS:
ANLISIS DE CORRELACIN
Grado de relacin
ANLISIS DE REGRESIN
Naturaleza de la relacin
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
CLASES DE ASOCIACIN
Simple
(2 variables)
Mltiple
(Ms de 2 variables)
SEGN CANTIDAD
DE VARIABLES
LINEAL NO LINEAL
SEGN NATURALEZA
DE LA RELACIN
ASOCIACIN
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
ANLISIS DE CORRELACIN
BIVARIABLE LINEAL
MUESTRA DE n INDIVIDUOS
Individuo x
i
y
i
Pares ordenados
1 x
1
y
1
(x
1
, y
1
)
2 x
2
y
2
(x
2
, y
2
)
3 x
3
y
3
(x
3
, y
3
)
... ... ... ......
n x
n
y
n
(x
n
, y
n
)
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
1
er.
Paso: ver si existe correlacin
lineal entre X e Y
DIAGRAMA DE DISPERSIN
( Nube de puntos )
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Ejemplo de aplicacin
Datos
Alumno: 1 2 3 4 5 6 7 8 9 10
Matemt. 8 4 7 8 10 3 9 2 6 5
Fsica 7 2 6 6 9 2 7 1 5 4
Variables: X Calificaciones en Matemtica
Y Calificaciones en Fsica
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Diagrama de Dispersin
0 2 4 6 8 10 M
F
10
8
6
4
2
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Supuestos bsicos del anlisis de correlacin
bivariable lineal
X e Y son variables aleatorias
La poblacin bivariable es normal
X ~ normal con E(X) =
x
y V(X) =
o
2
x
Y ~ normal con E(Y) =
y
y V(Y) =
o
2
y
La relacin entre X e Y es lineal
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
2do. Paso: Clculo del
Coeficiente de correlacin lineal
El coeficiente de correlacin lineal mide el grado de
intensidad de la posible relacin entre las variables.
X Y
X Y Cov
o o
) , (
=
| |
2 2
) ( . ) (
) ).( (
X Y
X Y
X E Y E
X Y E
=
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Frmula de trabajo del
Coeficiente de correlacin lineal
(
=
= = =
= = =
n
i
i i
n
i
n
i
i i
n
i
n
i
i i
n
i
i i
n x x n y y
n x y x y
r
1
2 2
1 1
2 2
1 1 1
/ ) ( . / ) (
/ ) ).( ( .
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
- no mide la magnitud de la pendiente
("fuerza de la asociacin")
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
- tampoco mide lo apropiado del modelo lineal
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
3
er.
Paso: Interpretacin de r
r 1 Correlacin lineal positiva alta
r 0 No existe correlacin lineal
r 0,5 Correlacin lineal positiva
moderada
r -1 Correlacin lineal negativa
alta
r -0,5 Correlacin lineal negativa
moderada
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Ejemplo de aplicacin
Datos
Alumno: 1 2 3 4 5 6 7 8 9 10
Matemt. 8 4 7 8 10 3 9 2 6 5
Fsica 7 2 6 6 9 2 7 1 5 4
Variables: X Calificaciones en Matemtica
Y Calificaciones en Fsica
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Diagrama de Dispersin
0 2 4 6 8 10 M
F
10
8
6
4
2
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Tabla de resultados
Variable X
E
i
y
i
x
i
= 365
E
i
x
i
= 62
E
i
x
i
2
=448
Media = 6,2
o = 2,658
Variable Y
E
i
y
i
= 49
E
i
y
i
2
= 301
Media = 4,9
o = 2,601
n = 10
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Calculo de r y r
2
r =
365 [(62) . (49)] / 10
\ [468 (62)
2
/10].[301 (49)
2
/10 ]
r = 0.98 Correlacin lineal positiva alta
r
2
= 0.96 Alto grado de linealidad en
los puntos del diagrama
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Prueba de la existencia de correlacin lineal
bivariable estadsticamente significativa
Hiptesis: H
0
: = 0 (No existe correlacin lineal
estadsticamente significativa entre las
variables)
H
1
: 0 (Existe correlacin lineal
estadsticamente significativa entre las
variables)
Nivel de significacin: P(e
I
) = o
Estadstica de prueba:
t
c
= r (n-2) / 1 - r
2
~ t de Student con o=n-2
bajo el supuesto de que H
0
es verdadera.
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Criterio de decisin: rechazar H
0
si, solo si,
t
c
< -t
o,o
t
c
> t
o,o
(prueba bilateral)
Clculos: se realizan todos los clculos
necesarios para determinar
t
c
Decisin: si
t
c
a la regin crtica, se
rechaza la hiptesis nula.
si
t
c
no a la regin crtica, se dice que no
existen evidencias suficientes para
rechazar la hiptesis nula.
Conclusin: se interpreta la decisin.
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
ANLISIS DE REGRESIN
BIVARIABLE LINEAL
FUNCIN MATEMTICA
PREDICCIN
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Diagrama de Dispersin
0 2 4 6 8 10 M
F
10
8
6
4
2
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Modelo de regresin bivariable lineal
= o + |x
i
+ c
i
Y : variable dependiente o explicada
X : variable independiente o explicativa
Parmetros de regresin
llamados coeficientes de
regresin de poblacin
Residual
i
y
i
y
(
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Para demostrar que la expresin anterior
es un mnimo, se debe aplicar derivacin
parcial con respecto a a y a b; y mediante
el criterio de la derivada segunda
(derivada primera igual a cero y derivada
segunda positiva), se obtiene un sistema
de ecuaciones normales.
= =
=
n
i
i i
n
i
i i
bx a y y y
1
2
1
2
) ( )
(
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
= =
= =
n
i
i i
n
i
i i
bx a y y y
1
2
1
2
) ( )
(
0
'
=
a o
o
0
' '
)
a o
o
0
'
=
b o
o
0
' '
)
b o
o
Sistema de
ecuaciones
normales
= =
+ =
n
i
i
n
i
i
x b na y
1 1
= = =
+ =
n
i
i
n
i
i
n
i
i i
x b x a y x
1
2
1 1
ECUACIN DE LA RECTA DE
REGRESIN DE Y SOBRE X
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
i i
bx a y + =
x b y a =
= =
= = =
=
n
i
n
i
i i
n
i
n
i
n
i
i i i i
n x x
n x y x y
b
1 1
2 2
1 1 1
/ ) (
/ ) ).( ( .
i = 1, 2, 3, , n
Si X se transforma tal que
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
0
1
=
=
n
i
i
x
y a =
=
=
=
n
i
i
n
i
i i
x
x y
b
1
2
1
Tres interpretaciones de a y b
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Para a:
Interpretacin geomtrica a es la ordenada al origen
Interpretacin general a es el valor de la variable
dependiente cuando la variable independiente vale cero.
Interpretacin especfica del problema particular que se
resuelve.
Para b:
Interpretacin geomtrica b es la pendiente de la lnea
Interpretacin general b es el cambio en la variable
dependiente por unidad de cambio de la variable
independiente.
Interpretacin especfica del problema particular que se
resuelve.
Ejemplo de aplicacin
Datos
Das 1 2 3 4 5 6 7 8 9 10
Anuncios 4 2 5 6 3 1 7 8 9 10
Ventas 15 8 21 24 17 4 25 23 30 32
Variables: X N de anuncios publicitarios
Y Ventas
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Anuncios
12 10 8 6 4 2 0
V
e
n
t
a
s
40
30
20
10
0
Diagrama de Dispersin
r = 0.956 Correlacin lineal positiva alta
r
2
= 0.914 Alto grado de linealidad
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Anlisis de regresin bivariable lineal
Tabla de resultados
Variable X
E
i
y
i
x
i
= 1329
E
i
x
i
= 55
E
i
x
i
2
= 385
Media = 5,5
o = 3,027
Variable Y
E
i
y
i
= 199
E
i
y
i
2
= 4689
Media = 19,9
o = 8,999
n = 10
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
= a + b x
i
, i = 1, 2, 3, . . . n
Ecuacin de la recta de regresin de Y sobre X
b = 1329 - (55).(199) / 10 = 2,842
385 (55)
2
/10
a = 19,9 2,842 (5,5) = 4,267
Los das que no se hagan anuncios se haran,
en promedio, entre cuatro y cinco ventas.
Por cada anuncio que se aumenta, las ventas
aumentan en 2,842.
i
y
(
1
2
1
2 2
= =
= =
n bx a y n y y S
n
i
i i
n
i
i i
2
1 1 1
2
2
=
= = =
n
x y b y a y
S
n
i
n
i
n
i
i i i i
Prueba de la existencia de regresin lineal de Y
sobre X estadsticamente significativa
Hiptesis: H
0
: | = 0 (No existe regresin lineal,
estadsticamente significativa, de Y sobre X)
H
1
: | 0 (Existe regresin lineal,
estadsticamente significativa, de Y sobre X)
Nivel de significacin: P(e
I
) = o
Estadstica de prueba:
t
c
= b / S
b
~ t de Student con o=n-2 bajo el
supuesto de que H
0
es verdadera.
Siendo S
b
= S / \ E
i
(x
i
x )
2
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Criterio de decisin: rechazar H
0
si, solo si,
t
c
< -t
o,o
t
c
> t
o,o
(prueba bilateral)
Clculos: se realizan todos los clculos
necesarios para determinar
t
c
Decisin: si
t
c
a la regin crtica, se rechaza la
hiptesis nula. La regresin de Y sobre X es
estadsticamente significativa, por lo tanto la ecuacin
de regresin es confiable como ecuacin predictiva.
si
t
c
no a la regin crtica, se dice que no existen
evidencias suficientes para rechazar la hiptesis nula.
Conclusin: se interpreta la decisin.
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Para realizar predicciones
En = a + b x
i
, i = 1, 2, 3, . . . n
Se reemplaza x
i
por un valor de X para el
cual se desea estimar
Se realizan los clculos.
Por ejemplo: cuando se hagan 3 anuncios
= 4,267 + 2,842 (3) = 12,793
Se realizarn, en promedio, entre 12 y 13
ventas.
i
y
i
y
i
y