Está en la página 1de 28

Estadstica y

Probabilidad II
El Coeficiente de Correlacin Lineal
y
la Recta de Mnimos Cuadrados
Ciclo escolar 2013-2014

Relacin entre variables.


En la prctica es frecuente encontrar una relacin
entre dos o ms variables. Por ejemplo, el peso
de los hombres adultos depende en cierto grado
de su estatura, las circunferencias de los crculos
depende en cierto grado de su radio, y la presin
de una masa de gas depende de su temperatura y
volumen.
Entonces, es mejor expresar esta relacin en
forma matemtica, lo cual sucede determinando
una ecuacin que enlaza las variables.

Ajuste de curvas.
Para hallar una ecuacin que relacione variables, un primer
paso es recolectar datos que muestran los valores
correspondientes de las variables en consideracin. Por
ejemplo, supngase que X y Y denotan la estatura y peso
de hombres adultos, respectivamente; entonces, una
muestra de individuos revelara las estaturas X 1, X 2, ... ,X N,
asi como los pesos correspondientes Y1 , Y2 , ... , YN .
El prximo paso es marcar los puntos X 1 ,Y1 , X 2 ,Y2 , ...
, X N , YN sobre un sistema de coordenadas rectangulares.
El conjunto resultante se llama a veces diagrama de
dispersin. A partir del diagrama de dispersin es posible,
con frecuencia visualizar una curva suave que aproxima los
datos.

Distintos tipos de diagramas.

Teora de correlacin.
Si todos los valores de las variables satisfacen
una ecuacin exactamente, decimos que las
variables estn perfectamente correlacionadas
o que hay correlacin perfecta entre ellas.

Correlacin Lineal.
Si X e Y son las dos variables de cuestin, un diagrama de
dispersin muestra la localizacin de los puntos ( X , Y ) sobre
un sistema rectangular de coordenadas. Si todos los puntos
del diagrama de dispersin parecen estar en una recta, como
en la figura (a) y (b), la correlacin se llama lineal. En tales
casos, una ecuacin lineal es adecuada a efectos de regresin.

a) Correlacin Lineal
Directa (positiva).

a) Correlacin Lineal
Inversa (negativa).

a) Correlacin Nula.

Correlacin Lineal.
Si Y tiende a crecer cuando X crece, como en la figura
(a), la correlacin se dice positiva, o directa.
Si Y tiende a decrecer cuando X crece, como en la
figura (b), la correlacin se dice negativa o inversa.
Si no hay relacin entre las variables, como en la figura
(c), decimos que no hay correlacin entre ellas.

Un Ejemplo.
Un centro comercial sabe en funcin de la distancia, en
kilmetros, a la que se site de un ncleo de poblacin,
acuden los clientes que figuran en la tabla.
No de clientes (X)

Distancia (Y)

15

19

25

23

34

40

a) Trazar el diagrama de dispersin


b) Calcular el coeficiente de correlacin lineal
c) Calcular la recta de mnimos Cuadrados

45

40

D
i
s
t
a
n
c
i
a

35

30

25

20

15

10

0
0

No de Clientes

45

40

D
i
s
t
a
n
c
i
a

35

30

25

20

15

10

0
0

No de Clientes

45

40

D
i
s
t
a
n
c
i
a

35

30

25

20

15

10

0
0

No de Clientes

Covarianza.
La definicin formal de covarianza es la siguiente:
N

s XY

X
i 1

X Yi Y
N

Al igual que con la desviacin estndar podemos


obtener este resultado mediantes formulas cortas.
s XY XY X Y

Covarianza.
X
8
7
6
4
2
1

Y
15
19
25
23
34
40

Covarianza.

Promedios

XY

15

120

19

133

25

150

23

92

34

68

40

40

4.6667

26

100.5

s XY XY X Y
s XY 100.5 4.6667 26
s XY 20.8342

Desviacin Estndar.
La definicin formal de la desviacin estndar para la
variable X es la siguiente:
N

sX

X
i
i 1

Y aqu tenemos su forma corta

sX X 2 X

De manera anloga podemos obtener el de la variable Y


sY Y Y
2

Desviacin Estndar.

Promedios

X2

Y2

XY

15

64

225

120

19

49

361

133

25

36

625

150

23

16

529

92

34

1156

68

40

1600

40

4.6667

26

28.3333

749.3333

100.5

sX X

s X 28.3333 4.6667

s X 2.5604
sY 8.5635

Coeficiente de correlacin lineal.


La forma breve del coeficiente de correlacin
lineal es :
s XY
r
s X sY

20.8342
r
2.56048.5635
r 0.9502

Propiedades del coeficiente de


correlacin.
El coeficiente de correlacin no vara al hacerlo la escala de
medicin. Es decir, si expresamos la altura en metros o en
centmetros el coeficiente de correlacin no vara.
El signo del coeficiente de correlacin es el mismo que el
de la covarianza.
a)
b)
c)

Si la covarianza es positiva, la correlacin es directa.


Si la covarianza es negativa, la correlacin es inversa.
Si la covarianza es nula, no existe correlacin.

El coeficiente de correlacin lineal es un nmero real


comprendido entre -1 y 1.

1 r 1

Propiedades del coeficiente de


correlacin.
Si el coeficiente de correlacin lineal toma valores
cercanos a -1 la correlacin es fuerte e inversa, y ser
tanto ms fuerte cuanto ms se aproxime a -1.
Si el coeficiente de correlacin lineal toma valores
cercanos a 1 la correlacin es fuerte y directa, y ser
tanto ms fuerte cuanto ms se aproxime a 1.
Si el coeficiente de correlacin lineal toma valores
cercanos a 0, la correlacin es dbil.
Si r 1 1 , los puntos de la nube estn sobre la
recta creciente o decreciente. Entre ambas variables
hay dependencia funcional.

La recta de Mnimos Cuadrados.


La recta de mnimos cuadrados que aproxima el
conjunto de puntos X 1 ,Y1 , X 2 ,Y2 ,, X N , YN tiene
por ecuacin:
y mx b

donde las constantes quedan fijadas al resolver


simultneamente las ecuaciones

Y m X bN
XY m X b X
2

que se llaman ecuaciones normales para la recta de


mnimos cuadrados.

La recta de Mnimos Cuadrados.


Las constantes m y b de las ecuaciones
anteriores se pueden hallar de las formulas
m

N XY X Y
N X X

2
Y
X
X XY

N X X
2

La recta de Mnimos Cuadrados.


Tambin pueden obtenerse de su forma corta:
s XY
m
s X 2
20.8342
2.56042
3.2283

b Y mX
b 26 3.22834.6667
41.0655

45

40

D
i
s
t
a
n
c
i
a

35

30

25

20

15

10

0
0

No de Clientes

45

40

D
i
s
t
a
n
c
i
a

35

30

25

20

15

10

0
0

No de Clientes

45

40

D
i
s
t
a
n
c
i
a

35

30

25

20

15

10

0
0

No de Clientes

45

40

D
i
s
t
a
n
c
i
a

35

y 3.2283x 41.0655
30

25

20

15

10

0
0

No de Clientes

Actividad
En un Centro de Salud hacen el seguimiento de la
tensin arterial de sus pacientes, y los resultados
constatan que aquellos que tienen sobrepeso,
tienen una tensin arterial superior a la media.
Calcule el coeficiente de correlacin de Pearson y
la recta de mnimos cuadrados para corroborar
estos resultados en una muestra de 10 pacientes.
X=Peso (Kg)
Y=Tensin
Sistlica(mm Hg)

72

76

78

81

89

95 108 115 120 130

115 121 125 130 141 150 165 170 177 178

Actividad
La tabla nos muestra las
puntuaciones en Literatura (X), y
las puntuaciones en Matemtica
(Y) de un grupo de alumnos de
un determinado centro
educativo.

Trace el diagrama de dispersin,


calcule el coeficiente de
correlacin, y la recta de
mnimos cuadrados.

N
Estudiante
1
2
3
4
5
6
7
8

10
30
38
40
60
65
80
90

30
15
37
25
35
5
20
10

También podría gustarte