Documentos de Académico
Documentos de Profesional
Documentos de Cultura
RELACIONES
ENTRE
VARIABLES
Cuando hemos hablados de los distintos gráficos para
mostrar los datos, hemos hecho referencia al diagrama
de dispersión como grafico para mostrar las relaciones
entre variables.- Ahora introduciremos la covariancia y
la correlación, que permiten describir numéricamente
una relación lineal y que después en la Unidad de
Regresión lineal simple y Correlación nos dedicaremos
en detalle.-
│r│ = 2
SOLUCION
Scatterplot of nº de mesas vs nº de trabajadores
60
50
nº de mesas
40
30
20
10 15 20 25 30
nº de trabajadores
La planilla de calculo para calcula la Covarianza y el
Coeficiente de correlación será:
x y Xi - x (xi - x)² (yi - y) (yi - y)² (xi - X) (yi- Y)
12 20 - 9,3 86,49 - 21,2 449,44 197,16
30 60 8,7 75,69 18,8 353,44 163,56
15 27 - 6,3 39,69 - 14,2 201,64 89,46
24 50 2,7 7,29 8,8 77,44 23,76
14 21 - 7,3 53,29 - 20,2 408,04 147,46
18 30 - 3,3 10,89 - 11,2 125,44 36,96
28 61 6,7 44,89 19,8 392,04 132,66
26 54 4,7 22,09 12,8 163,84 60,16
19 32 - 2,3 5,29 - 9,2 84,64 21,16
27 57 5,7 32,49 15,8 249,64 90,06
213 412 -------- 378,1 -------- 2505,6 962,4
Aplicando la ecuación de la covarianza tenemos:
(xi – x) (yi - y)
Cov (x,y) = Sxy = =
n-1
962,4
= 9
= 106,93
Luego tenemos
Cov (x;que
y) el Coeficiente
106,93 de correlación es:
r = Sx Sy = 108,14758 = 0,989
20
18
16
14
y
12
10
}
8
6
5,0 7,5 10,0 12,5 15,0 17,5
x
εi Ŷ = b0 + b1 X
Consideremos el ejemplo de la placa anterior, donde
tenemos pares de puntos de un proceso que tiene una
relación lineal.-
La ecuación lineal representada por la recta es la ecuación
lineal que mejor se ajusta.- Vemos que los puntos de datos
individuales se encuentran por encima y por debajo de la
recta y que esta tiene puntos con desviaciones positiva
como negativas.- Se han usado también otros métodos
para determinar la recta pero se llego a la conclusión que
el método de mínimos cuadrado es la mejor que ajusta los
puntos a la recta, haciendo mínima las distancias de los
puntos a la recta.-
Más adelante veremos que los coeficientes desarrollados
utilizando este método tienen propiedades estadísticas
muy importantes.-
Una importante cautela que se debe tener es que el caso
de método de mínimo cuadrado, es que los puntos
atípicos extremos pueden tener tal influencia en la recta de
regresión que toda la recta se dirija hacia esos puntos.-
Por lo tanto, siempre debemos examinar los diagrama de
dispersión para asegurarnos de que la relación de
regresión no se basa solamente en unos cuantos puntos
extremos.-
En la Unidad de regresión y correlación, desarrollaremos
con mayor precisión este tema.-
La regresión por mínimos cuadrados elige los valores de
b0 y b1 con los que se minimiza la suma de los cuadrados
de los residuos.-
Entonces:
Ŷ = b0 + b1 X
b1 es la pendiente de la recta o sea la variación de Y por
cada variación unitaria de X y se calcula mediante la
siguiente formula:
Cov. (x;y)
b1 =
S²x
Veamos un ejemplo
Supongamos que tenemos el numero de trabajadores X y
el numero de mesas producidas por hora Y, para una
muestra de 10 trabajadores.- Si la dirección decide
emplear 25 trabajadores, estime el número de mesas que
es probable que se produzcan.-
60
50
y
40
30
20
10 15 20 25 30
x