Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Minimos Cuadrados
Minimos Cuadrados
Probabilidad II
El Coeficiente de Correlacin Lineal
y
la Recta de Mnimos Cuadrados
Ciclo escolar 2013-2014
Ajuste de curvas.
Para hallar una ecuacin que relacione variables, un primer
paso es recolectar datos que muestran los valores
correspondientes de las variables en consideracin. Por
ejemplo, supngase que X y Y denotan la estatura y peso
de hombres adultos, respectivamente; entonces, una
muestra de individuos revelara las estaturas X 1, X 2, ... ,X N,
asi como los pesos correspondientes Y1 , Y2 , ... , YN .
El prximo paso es marcar los puntos X 1 ,Y1 , X 2 ,Y2 , ...
, X N , YN sobre un sistema de coordenadas rectangulares.
El conjunto resultante se llama a veces diagrama de
dispersin. A partir del diagrama de dispersin es posible,
con frecuencia visualizar una curva suave que aproxima los
datos.
Teora de correlacin.
Si todos los valores de las variables satisfacen
una ecuacin exactamente, decimos que las
variables estn perfectamente correlacionadas
o que hay correlacin perfecta entre ellas.
Correlacin Lineal.
Si X e Y son las dos variables de cuestin, un diagrama de
dispersin muestra la localizacin de los puntos ( X , Y ) sobre
un sistema rectangular de coordenadas. Si todos los puntos
del diagrama de dispersin parecen estar en una recta, como
en la figura (a) y (b), la correlacin se llama lineal. En tales
casos, una ecuacin lineal es adecuada a efectos de regresin.
a) Correlacin Lineal
Directa (positiva).
a) Correlacin Lineal
Inversa (negativa).
a) Correlacin Nula.
Correlacin Lineal.
Si Y tiende a crecer cuando X crece, como en la figura
(a), la correlacin se dice positiva, o directa.
Si Y tiende a decrecer cuando X crece, como en la
figura (b), la correlacin se dice negativa o inversa.
Si no hay relacin entre las variables, como en la figura
(c), decimos que no hay correlacin entre ellas.
Un Ejemplo.
Un centro comercial sabe en funcin de la distancia, en
kilmetros, a la que se site de un ncleo de poblacin,
acuden los clientes que figuran en la tabla.
No de clientes (X)
Distancia (Y)
15
19
25
23
34
40
45
40
D
i
s
t
a
n
c
i
a
35
30
25
20
15
10
0
0
No de Clientes
45
40
D
i
s
t
a
n
c
i
a
35
30
25
20
15
10
0
0
No de Clientes
45
40
D
i
s
t
a
n
c
i
a
35
30
25
20
15
10
0
0
No de Clientes
Covarianza.
La definicin formal de covarianza es la siguiente:
N
s XY
X
i 1
X Yi Y
N
Covarianza.
X
8
7
6
4
2
1
Y
15
19
25
23
34
40
Covarianza.
Promedios
XY
15
120
19
133
25
150
23
92
34
68
40
40
4.6667
26
100.5
s XY XY X Y
s XY 100.5 4.6667 26
s XY 20.8342
Desviacin Estndar.
La definicin formal de la desviacin estndar para la
variable X es la siguiente:
N
sX
X
i
i 1
sX X 2 X
Desviacin Estndar.
Promedios
X2
Y2
XY
15
64
225
120
19
49
361
133
25
36
625
150
23
16
529
92
34
1156
68
40
1600
40
4.6667
26
28.3333
749.3333
100.5
sX X
s X 28.3333 4.6667
s X 2.5604
sY 8.5635
20.8342
r
2.56048.5635
r 0.9502
1 r 1
Y m X bN
XY m X b X
2
N XY X Y
N X X
2
Y
X
X XY
N X X
2
b Y mX
b 26 3.22834.6667
41.0655
45
40
D
i
s
t
a
n
c
i
a
35
30
25
20
15
10
0
0
No de Clientes
45
40
D
i
s
t
a
n
c
i
a
35
30
25
20
15
10
0
0
No de Clientes
45
40
D
i
s
t
a
n
c
i
a
35
30
25
20
15
10
0
0
No de Clientes
45
40
D
i
s
t
a
n
c
i
a
35
y 3.2283x 41.0655
30
25
20
15
10
0
0
No de Clientes
Actividad
En un Centro de Salud hacen el seguimiento de la
tensin arterial de sus pacientes, y los resultados
constatan que aquellos que tienen sobrepeso,
tienen una tensin arterial superior a la media.
Calcule el coeficiente de correlacin de Pearson y
la recta de mnimos cuadrados para corroborar
estos resultados en una muestra de 10 pacientes.
X=Peso (Kg)
Y=Tensin
Sistlica(mm Hg)
72
76
78
81
89
115 121 125 130 141 150 165 170 177 178
Actividad
La tabla nos muestra las
puntuaciones en Literatura (X), y
las puntuaciones en Matemtica
(Y) de un grupo de alumnos de
un determinado centro
educativo.
N
Estudiante
1
2
3
4
5
6
7
8
10
30
38
40
60
65
80
90
30
15
37
25
35
5
20
10