Está en la página 1de 41

VARIABLE

X

VARIABLE
Y

Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Estimacin por asociacin
Predecir valores de una variable como
funcin de otra u otras variables
Y = f (X)
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Asociacin entre variables cuantitativas
Variable X
independiente?
Variable Y
dependiente?
SE ASOCIAN
Tienen
relacin?
Qu clase de
relacin tienen?
Diagrama de
dispersin
Qu grado de
relacin tienen?
ANALISIS DE CORRELACIN
ANLISIS DE
REGRESIN
Prediccin: cunto
vale Y si X vale....?
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
DOS ASPECTOS:
ANLISIS DE CORRELACIN
Grado de relacin
ANLISIS DE REGRESIN
Naturaleza de la relacin
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
CLASES DE ASOCIACIN
Simple
(2 variables)
Mltiple
(Ms de 2 variables)
SEGN CANTIDAD
DE VARIABLES
LINEAL NO LINEAL
SEGN NATURALEZA
DE LA RELACIN
ASOCIACIN
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
ANLISIS DE CORRELACIN
BIVARIABLE LINEAL
MUESTRA DE n INDIVIDUOS
Individuo x
i
y
i
Pares ordenados
1 x
1
y
1
(x
1
, y
1
)


2 x
2
y
2
(x
2
, y
2
)


3 x
3
y
3
(x
3
, y
3
)


... ... ... ......
n x
n
y
n
(x
n
, y
n
)


Mara Elena Marcoleri
Mg. en Estadstica Aplicada
1
er.
Paso: ver si existe correlacin
lineal entre X e Y
DIAGRAMA DE DISPERSIN
( Nube de puntos )
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Ejemplo de aplicacin
Datos

Alumno: 1 2 3 4 5 6 7 8 9 10
Matemt. 8 4 7 8 10 3 9 2 6 5
Fsica 7 2 6 6 9 2 7 1 5 4
Variables: X Calificaciones en Matemtica
Y Calificaciones en Fsica
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Diagrama de Dispersin
0 2 4 6 8 10 M
F
10
8
6
4
2

Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Supuestos bsicos del anlisis de correlacin
bivariable lineal
X e Y son variables aleatorias
La poblacin bivariable es normal
X ~ normal con E(X) =
x
y V(X) =
o
2
x
Y ~ normal con E(Y) =
y
y V(Y) =
o
2
y
La relacin entre X e Y es lineal
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
2do. Paso: Clculo del
Coeficiente de correlacin lineal
El coeficiente de correlacin lineal mide el grado de
intensidad de la posible relacin entre las variables.
X Y
X Y Cov
o o

) , (
=
| |
2 2
) ( . ) (
) ).( (
X Y
X Y
X E Y E
X Y E



=
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Frmula de trabajo del
Coeficiente de correlacin lineal
(

=


= = =
= = =
n
i
i i
n
i
n
i
i i
n
i
n
i
i i
n
i
i i
n x x n y y
n x y x y
r
1
2 2
1 1
2 2
1 1 1
/ ) ( . / ) (
/ ) ).( ( .
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
- no mide la magnitud de la pendiente
("fuerza de la asociacin")
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
- tampoco mide lo apropiado del modelo lineal
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
3
er.
Paso: Interpretacin de r
r 1 Correlacin lineal positiva alta
r 0 No existe correlacin lineal
r 0,5 Correlacin lineal positiva
moderada
r -1 Correlacin lineal negativa
alta
r -0,5 Correlacin lineal negativa
moderada


Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Ejemplo de aplicacin
Datos

Alumno: 1 2 3 4 5 6 7 8 9 10
Matemt. 8 4 7 8 10 3 9 2 6 5
Fsica 7 2 6 6 9 2 7 1 5 4
Variables: X Calificaciones en Matemtica
Y Calificaciones en Fsica
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Diagrama de Dispersin
0 2 4 6 8 10 M
F
10
8
6
4
2

Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Tabla de resultados
Variable X
E
i
y
i
x
i
= 365
E
i
x
i
= 62
E
i
x
i
2
=448
Media = 6,2
o = 2,658
Variable Y
E
i
y
i
= 49
E
i
y
i
2
= 301
Media = 4,9
o = 2,601
n = 10

Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Calculo de r y r
2

r =
365 [(62) . (49)] / 10
\ [468 (62)
2
/10].[301 (49)
2
/10 ]
r = 0.98 Correlacin lineal positiva alta
r
2
= 0.96 Alto grado de linealidad en
los puntos del diagrama
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Prueba de la existencia de correlacin lineal
bivariable estadsticamente significativa
Hiptesis: H
0
: = 0 (No existe correlacin lineal
estadsticamente significativa entre las
variables)
H
1
: 0 (Existe correlacin lineal
estadsticamente significativa entre las
variables)
Nivel de significacin: P(e
I
) = o
Estadstica de prueba:
t
c
= r (n-2) / 1 - r
2
~ t de Student con o=n-2
bajo el supuesto de que H
0
es verdadera.
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Criterio de decisin: rechazar H
0
si, solo si,
t
c
< -t
o,o


t
c
> t
o,o
(prueba bilateral)
Clculos: se realizan todos los clculos
necesarios para determinar

t
c

Decisin: si

t
c
a la regin crtica, se
rechaza la hiptesis nula.

si

t
c
no a la regin crtica, se dice que no
existen evidencias suficientes para
rechazar la hiptesis nula.
Conclusin: se interpreta la decisin.

Mara Elena Marcoleri
Mg. en Estadstica Aplicada
ANLISIS DE REGRESIN
BIVARIABLE LINEAL
FUNCIN MATEMTICA


PREDICCIN
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Diagrama de Dispersin
0 2 4 6 8 10 M
F
10
8
6
4
2

Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Modelo de regresin bivariable lineal
= o + |x
i
+ c
i

Y : variable dependiente o explicada
X : variable independiente o explicativa
Parmetros de regresin
llamados coeficientes de
regresin de poblacin
Residual
i
y
i
y

Mara Elena Marcoleri


Mg. en Estadstica Aplicada
La relacin de dependencia lineal
consta de dos partes
Parte sistemtica:
o + |x
i
Parte estocstica:
c
i
Modelo probabilista
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Supuestos bsicos del A.R.B.L.
La variable independiente X toma valores
fijados o predeterminados por el investigador,
y existe una subpoblacin de Y para cada X.
El residuo, c
i
, asociado con cada x
i
, es una
variable aleatoria con distribucin normal,
con E(c
i
) = 0 y E(y / x ) = o + | x
i
se llama
ecuacin de regresin de poblacin.
La variancia de la regresin es constante.
V(y
i
) = = o
2
.
. c
i
es estadsticamente independiente de x
i
.
o
c
2
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Estimacin de los parmetros de regresin
Ecuacin de regresin lineal de Y sobre X
Poblacional
Muestral
y
i
= o + |x
i

= a + b x
i
a: estimador puntual de o
b: estimador puntual de |
i
y

Mara Elena Marcoleri


Mg. en Estadstica Aplicada
Estimacin de los parmetros
Mtodo de Mnimos Cuadrados
ES UN MNIMO

= =
=
n
i
i i
n
i
i i
bx a y y y
1
2
1
2
) ( )

(
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Para demostrar que la expresin anterior
es un mnimo, se debe aplicar derivacin
parcial con respecto a a y a b; y mediante
el criterio de la derivada segunda
(derivada primera igual a cero y derivada
segunda positiva), se obtiene un sistema
de ecuaciones normales.

= =
=
n
i
i i
n
i
i i
bx a y y y
1
2
1
2
) ( )

(
Mara Elena Marcoleri
Mg. en Estadstica Aplicada

= =
= =
n
i
i i
n
i
i i
bx a y y y
1
2
1
2
) ( )

(
0
'
=
a o
o
0
' '
)
a o
o
0
'
=
b o
o
0
' '
)
b o
o
Sistema de
ecuaciones
normales

= =
+ =
n
i
i
n
i
i
x b na y
1 1

= = =
+ =
n
i
i
n
i
i
n
i
i i
x b x a y x
1
2
1 1
ECUACIN DE LA RECTA DE
REGRESIN DE Y SOBRE X
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
i i
bx a y + =

x b y a =


= =
= = =

=
n
i
n
i
i i
n
i
n
i
n
i
i i i i
n x x
n x y x y
b
1 1
2 2
1 1 1
/ ) (
/ ) ).( ( .
i = 1, 2, 3, , n
Si X se transforma tal que
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
0
1
=

=
n
i
i
x
y a =

=
=
=
n
i
i
n
i
i i
x
x y
b
1
2
1
Tres interpretaciones de a y b
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Para a:
Interpretacin geomtrica a es la ordenada al origen
Interpretacin general a es el valor de la variable
dependiente cuando la variable independiente vale cero.
Interpretacin especfica del problema particular que se
resuelve.
Para b:
Interpretacin geomtrica b es la pendiente de la lnea
Interpretacin general b es el cambio en la variable
dependiente por unidad de cambio de la variable
independiente.
Interpretacin especfica del problema particular que se
resuelve.
Ejemplo de aplicacin
Datos

Das 1 2 3 4 5 6 7 8 9 10
Anuncios 4 2 5 6 3 1 7 8 9 10
Ventas 15 8 21 24 17 4 25 23 30 32
Variables: X N de anuncios publicitarios
Y Ventas
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Anuncios
12 10 8 6 4 2 0
V
e
n
t
a
s
40
30
20
10
0
Diagrama de Dispersin
r = 0.956 Correlacin lineal positiva alta
r
2
= 0.914 Alto grado de linealidad
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Anlisis de regresin bivariable lineal
Tabla de resultados
Variable X
E
i
y
i
x
i
= 1329
E
i
x
i
= 55
E
i
x
i
2
= 385
Media = 5,5
o = 3,027
Variable Y
E
i
y
i
= 199
E
i
y
i
2
= 4689
Media = 19,9
o = 8,999
n = 10

Mara Elena Marcoleri
Mg. en Estadstica Aplicada
= a + b x
i
, i = 1, 2, 3, . . . n

Ecuacin de la recta de regresin de Y sobre X
b = 1329 - (55).(199) / 10 = 2,842
385 (55)
2
/10
a = 19,9 2,842 (5,5) = 4,267
Los das que no se hagan anuncios se haran,
en promedio, entre cuatro y cinco ventas.
Por cada anuncio que se aumenta, las ventas
aumentan en 2,842.
i
y

Mara Elena Marcoleri


Mg. en Estadstica Aplicada
Variancia de la regresin en la muestra
Mara Elena Marcoleri
Mg. en Estadstica Aplicada
La ecuacin de regresin es tanto mejor
como ecuacin predictiva cuanto menor sea
la variancia de la regresin en la muestra
Frmula de clculo:
) 2 /( ) ( ) 2 /( )

(
1
2
1
2 2
= =

= =
n bx a y n y y S
n
i
i i
n
i
i i
2
1 1 1
2
2


=

= = =
n
x y b y a y
S
n
i
n
i
n
i
i i i i
Prueba de la existencia de regresin lineal de Y
sobre X estadsticamente significativa
Hiptesis: H
0
: | = 0 (No existe regresin lineal,
estadsticamente significativa, de Y sobre X)
H
1
: | 0 (Existe regresin lineal,
estadsticamente significativa, de Y sobre X)
Nivel de significacin: P(e
I
) = o
Estadstica de prueba:
t
c
= b / S
b
~ t de Student con o=n-2 bajo el
supuesto de que H
0
es verdadera.
Siendo S
b
= S / \ E
i
(x
i
x )
2

Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Criterio de decisin: rechazar H
0
si, solo si,
t
c
< -t
o,o


t
c
> t
o,o
(prueba bilateral)
Clculos: se realizan todos los clculos
necesarios para determinar

t
c

Decisin: si

t
c
a la regin crtica, se rechaza la
hiptesis nula. La regresin de Y sobre X es
estadsticamente significativa, por lo tanto la ecuacin
de regresin es confiable como ecuacin predictiva.

si

t
c
no a la regin crtica, se dice que no existen
evidencias suficientes para rechazar la hiptesis nula.
Conclusin: se interpreta la decisin.

Mara Elena Marcoleri
Mg. en Estadstica Aplicada
Para realizar predicciones
En = a + b x
i
, i = 1, 2, 3, . . . n
Se reemplaza x
i
por un valor de X para el
cual se desea estimar


Se realizan los clculos.
Por ejemplo: cuando se hagan 3 anuncios

= 4,267 + 2,842 (3) = 12,793

Se realizarn, en promedio, entre 12 y 13
ventas.

i
y

i
y

i
y

Mara Elena Marcoleri


Mg. en Estadstica Aplicada

También podría gustarte