Está en la página 1de 27

UNIDAD 5

SESIN: 14
Covarianza

Regresin lineal, Correlacin de Pearson y Coeficiente de


determinacin.
Indicadores de Logro:
- Describe, calcula e interpreta los valores de la ecuacin de la regresin
y correlacin lineal.

Recuperado de: http://personales.upv.es/jcanizar/modulo_3/cluster_5.html

REGRESIN

CORRELACIN
Es la medicin de la intensidad de la relacin entre variables.
Presentan una
distribucin
normal bivariada ( X e
conjuntamente)

varan

Recuperado de: http://uce.uniovi.es/cursolineal/Informese4.html

Permite averiguar la forma probable de las relaciones entre las variables.


Permite predecir o estimar el valor de una variable que corresponde al valor dado
de otra variable.

Y = + X

Regresin Lineal

y son los parmetros


a y b son estimadores de y

Se puede establecer cmo estn


relacionadas
las
variables
(fenmeno de causa-efecto).

Valor estimado de Y para un determinado valor


de X:
a= Valor que toma Y cuando X es igual a cero.
b= Coeficiente de regresin (indica el incremento de la
variable Y al incrementarse X en una unidad.

Objetivo:
- Predecir o estimar el valor de la variable Y
en funcin de otra u otras variables
independientes o predictoras.

Los valores que toma la variable


independiente son seleccionadas por el
investigador (no aleatorias) y los valores
de la variable dependiente se determinan
por la relacin entre las variables.

Pretende establecer si hay


relacin funcional entre dos
variables cuantitativas

Supuestos:
a) La variable dependiente es una variable aleatoria.

b) Variables independientes y dependientes estn relacionadas en forma


lineal.
c) Establece que aunque se puedan controlar los valores de la variable
independiente, los valores de la variable dependiente deben obtenerse a
travs del proceso de muestreo aleatorio.
d) Que las varianzas de las distribuciones condicionales de la variable
dependiente, dados diferentes valores de la variable independiente sean
todas iguales.
e) Que las distribuciones condicionales de la variable dependiente, dados
diferentes valores de la variable independiente estn distribuidas
normalmente.
f) Los valores observados de la variable dependiente sean independientes
entre si.

ECUACIN DE REGRESIN LINEAL SIMPLE

= + iXi + ei
Considerando la muestra

Error estimado
Son desviaciones de los valores observados
de la variable respuesta, respecto a la Lnea
de regresin.

= 0

Mtodo
de
los
Mnimos
Cuadrados.- ajusta la recta que
cumple la siguiente condicin: la
suma de los cuadrados de las
desviaciones
de
cada
valor
observado
respecto
a
su
correspondiente valor de prediccin,
sea mnima.


=1

Al utilizar el mtodo de mnimos cuadrados


obtenemos las siguientes dos ecuaciones
conocidas como ecuaciones normales:
n

Y
i 1
n

i 1

an b Xi
i 1

i 1

i 1

X i Yi a X i b X i2

Resolviendo el sistema de ecuaciones normales se obtiene que:

X Y X X
n X X
2
i

2
i

n X i Yi
n

2
i

X Y
X

O tambin:

=
=

Yi


2 2

ERROR ESTNDAR DE ESTIMACIN

( )2
2
2
2

2
2

COVARIANZA

sxy
Medida que nos permite determinar
la
variabilidad conjunta de dos variables
numricas (cuantitativas).

X
i 1

X Yi Y
n

Enunciados:
a) Si las dos variables crecen o decrecen a la vez (nube de puntos creciente).
b) Si una variable crece, la otra tiene tendencia a decrecer (nube de puntos
decreciente).
c) Si los puntos se reparten con igual intensidad, (no hay relacin
lineal).

La covarianza mide la fuerza de la


relacin lineal entre dos variables

Hallar la covarianza del siguiente conjunto de datos:

Solucin:
=
=

= 5

= .

Sxy = 894/5 30.4 x 5


Sxy = 26.8

COEFICIENTE DE CORRELACIN DE PEARSON

Es un nmero que mide la intensidad de la asociacin lineal entre dos variables.


El coeficiente de correlacin se representa simblicamente por "r". Este
coeficiente se aplica cuando la relacin que puede existir entre las variables es
lineal (es decir, si representramos en un grfico los pares de valores de las dos
variables, la nube de puntos se aproximara a una recta).

n XY X Y

n X

2
i

X n Yi Y
2

Recuperado de: http://psicologiadelabolsa.com/coeficientes3-el-coeficiente-de-correlacion-de-pearson-por-que-alprimo-de-darwin-le-gustaba-el-anis/

Los valores que puede tomar el coeficiente de correlacin "r" son:


-1 < r < 1

Si "r" > 0 La correlacin lineal es positiva (si sube el valor de una variable
sube el de la otra). La correlacin es tanto ms fuerte cuanto ms se
aproxime a 1.
Si "r" < 0 La correlacin lineal es negativa (si sube el valor de una variable
disminuye el de la otra). La correlacin negativa es tanto ms fuerte cuanto
ms se aproxime a -1.
Si "r" = 0 No existe correlacin lineal entre las variables, aunque podra
existir otro tipo de correlacin (parablica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera prximo a 1 -1, tampoco esto
quiere decir obligatoriamente que existe una relacin de causa-efecto entre
las dos variables, ya que este resultado podra haberse debido al puro azar

rendimiento

rendimiento

rendimiento

Representacin grfica de una relacin

inteligencia
Relacin lineal perfecta
(casi perfecta)

inteligencia
Relacin lineal
fuerte/moderada

inteligencia
Relacin lineal dbil

Ahora necesitamos un ndice que nos informe tanto del grado en que X e
Y estn relacionadas, y si la relacin es positiva o negativa

Coeficiente de correlacin:

Estadstico de Prueba:

COEFICIENTE DE DETERMINACIN (r2)


Indicador de la Bondad de Ajuste
Una manera de evaluar la eficiencia de la ecuacin lineal es comparar la
dispersin de los puntos en torno a la recta de regresin de dispersin en
torno a , de la muestra de Y.
=

La proporcin de la variacin total de la variable respuesta que es explicada


Para variables independientes

El coeficiente de determinacin determina:


1.- Si r2 est prximo a 1, se dice que el ajuste es bueno.
2.- Un r2 est prximo a cero indica un ajuste deficiente puesto que una mayor
proporcin de la variacin total en la respuesta no estara explicada por el modelo

Ejemplo:
El dueo de una tienda de artefactos est interesado en medir el efecto
del precio de un televisor, sobre la cantidad vendida. Los resultados de la
tabla adjunta se obtuvieron de una muestra aleatoria de las ventas de 8
semanas. El precio est dado en soles y las ventas unidades.

Precio
(soles)

1920

Ventas
(unidades)

25.4

2050
14.7

1970
18.6

2130
12.4

2080

1990

11.1

15.7

1780
29.2

1720
35.2

Clculos

X.Y

X2

Y2

1920
2050
1970
2130
2080
1990
1780
1720

25.4
14.7
18.6
12.4
11.1
15.7
29.2
35.2

48768
30135
36642
26412
23088
31243
51976
60544

3686400
4202500
3880900
4536900
4326400
3960100
3168400
2958400

645.16
216.09
345.96
153.76
123.21
246.49
852.64
1239.04

15640

162.3

308808

30720000

3822.35

X
i 1

15640

X Y
i 1
8

Y
i 1

Y
i 1

308808

3822 .35

162 .3

X
i 1

2
i

30720000

a) Construya el Diagrama de Dispersin

b) Calcule el Coeficiente de Correlacin Lineal


X

X.Y

X2

Y2

1920
2050
1970
2130
2080
1990
1780
1720

25.4
14.7
18.6
12.4
11.1
15.7
29.2
35.2

48768
30135
36642
26412
23088
31243
51976
60544

3686400
4202500
3880900
4536900
4326400
3960100
3168400
2958400

645.16
216.09
345.96
153.76
123.21
246.49
852.64
1239.04

15640

162.3

308808

30720000

3822.35

Reemplazando en la frmula obtenemos un r = - 0.9726


Interpretacin: Existe una alta correlacin lineal negativa, lo cual
significa que cuando el precio de los televisores suben; las ventas bajan.

c ) Obtencin de la ecuacin de regresin lineal:


Reemplazando en las frmulas tenemos:
a = 30720000 (162.3) 15640 (308808)
8(30720000) (15640)2

b = 8(308808) 15640 (162.3)


8(30720000) (15640)2

= 135.7

= - 0.059

La ecuacin de regresin ser:


= 135.7 - 0.059 X
Interpretacin: Al aumentar el precio
de un artefacto en un sol, entonces las
ventas
se
reducen
en
aproximadamente 0.06 unidades; esto
significara que si el precio aumentara
en
100
soles
se
venderan
aproximadamente 6 unidades menos.

Se desea pronosticar las ventas, para una determinada semana si el


precio de un televisor se estableciera en 2000 soles.
= 135.7 - 0.059 (2000) = 17.63
televisores

es decir aproximadamente 18

Ejemplo:
Un analista extrae una muestra de 10 embarques en camin que ha realizado
una empresa y registra la distancia en millas as como el tiempo de entrega
con una aproximacin de medio da desde el momento en que el embarque
estuvo disponible para recogerlo. Construya el diagrama de dispersin y
realice los clculos correspondientes.

Flete
muestreado

Distancia X
(millas)

825

215

1070

550

480

Tiempo de
entrega Y
(das)

3.5

1.0

4.0

2.0

1.0

10

920 1350

325

670

1215

3.0

1.5

3.0

5.0

4.5

Solucin:
Resultados
a = 2.85
b = 0.00358
Y = 2.85 -0.00358X
r = 0.9489

r2 = 0.9004
Sxy=

Ejemplo:
Analizar si las variables estn relacionadas linealmente y aplicar el estadstico
de prueba.
Tabla: Nivel de inteligencia (X vs. Rendimiento acadmico (Y)

IMPORTANTE:
a)
b)
c)
d)
e)

Identificar el modelo.
Revisar las suposiciones.
Obtener la ecuacin de regresin.
Evaluacin de la ecuacin.
Utilizar la ecuacin

Recuperado de: http://pixabay.com/p-145013/?no_redirect

También podría gustarte