Está en la página 1de 23

MEDIDAS DE LAS

RELACIONES
ENTRE
VARIABLES
Cuando hemos hablados de los distintos gráficos para
mostrar los datos, hemos hecho referencia al diagrama
de dispersión como grafico para mostrar las relaciones
entre variables.- Ahora introduciremos la covariancia y
la correlación, que permiten describir numéricamente
una relación lineal y que después en la Unidad de
Regresión lineal simple y Correlación nos dedicaremos
en detalle.-

La covariancia es una media del sentido de una


relación lineal entre dos variables.- Un valor
positivo indica una relación lineal directa o creciente y
un valor negativo indica una relación lineal
decreciente.- Una covariancia poblacional será:
 (xi – μx) (yi - μy)
Cov (x; y) = σx,y =
N
Donde X e Y son los valores observados, μx y μy son
las medias poblacionales y N es el tamaño de la
población.-

Una covariancia muestral es:

 (xi – x) (yi - y)


Cov (X;Y) = Sxy = n-1

El coeficiente de correlación muestral nos da una medida


estandarizada de la relación lineal entre dos variables.-
Generalmente es una medida mas útil, ya que indica
tanto el sentido como el grado de la relación.- La
covariancia y el coeficiente de correlación
correspondiente tienen el mismo signo (ambos son
negativos o ambos son positivo).-
El coeficiente de correlación se calcula dividiendo la
covariancia por el producto de las desviaciones
estándares de las dos variables.-
El Coeficiente de Correlación poblacional será:
Cov (x; y)
ρ =
σx σy

Donde σx σy son las desviaciones estándar poblacionales


de las dos variables.-
El coeficiente de correlación muestral será:
Cov (x; y)
r =
sx s y
Donde Sx y Sy son las desviaciones estándar
muéstrales de las dos variables.-
Una regla útil y practica que se suele usar es que existe
una relación entre las variables numéricas si:

│r│ = 2

El coeficiente de correlación señala la relación o


asociación lineal entre dos variables numéricas.-
Cuando el coeficiente de correlación se acerca a +1 o a
-1, es mas fuerte la relación o asociación entre las dos
variables.- Cuando el coeficiente de correlación se
acerca a cero, existe poca o ninguna relación lineal
entre las dos variables numéricas
El signo del coeficiente de correlación lineal nos indica
de que tipo es la asociación.- Si el diagrama de
dispersión nos muestra una nube de puntos creciente,
es decir que a medida que crece una variable crece la
otra el coeficiente de correlación lineal será positivo,
caso inverso será negativo.- Será cero cuando no se
evidencia ningún tipo de relación entre ambas
variables.-
Royal Manufacturas SRL, desea estudiar la relación entre
el numero de trabajadores, X y el numero de mesas, Y,
producidas en su planta de Córdoba.- Ha tomado una
muestra aleatoria de 10 horas de producción.- Se han
obtenido los siguientes pares de datos:

(12;20) (30:60) (15;27) (24;50) (14;21)


(18;30) (28;61) (26;54) (19;32) (27;57)

Calcule la covarianza y el coeficiente de correlación.-


Analizar brevemente la relación entre el numero de
trabajadores y el numero de mesas producidas por
hora.-

SOLUCION
Scatterplot of nº de mesas vs nº de trabajadores

60

50
nº de mesas

40

30

20

10 15 20 25 30
nº de trabajadores
La planilla de calculo para calcula la Covarianza y el
Coeficiente de correlación será:

x y Xi - x (xi - x)² (yi - y) (yi - y)² (xi - X) (yi- Y)
12 20 - 9,3 86,49 - 21,2 449,44 197,16
30 60 8,7 75,69 18,8 353,44 163,56
15 27 - 6,3 39,69 - 14,2 201,64 89,46
24 50 2,7 7,29 8,8 77,44 23,76
14 21 - 7,3 53,29 - 20,2 408,04 147,46
18 30 - 3,3 10,89 - 11,2 125,44 36,96
28 61 6,7 44,89 19,8 392,04 132,66
26 54 4,7 22,09 12,8 163,84 60,16
19 32 - 2,3 5,29 - 9,2 84,64 21,16
27 57 5,7 32,49 15,8 249,64 90,06
213 412 -------- 378,1 -------- 2505,6 962,4
Aplicando la ecuación de la covarianza tenemos:
 (xi – x) (yi - y)
Cov (x,y) = Sxy = =
n-1

962,4
= 9
= 106,93

Luego tenemos
Cov (x;que
y) el Coeficiente
106,93 de correlación es:

r = Sx Sy = 108,14758 = 0,989

Luego aplicando la relación 0,989 ≥ 0,64

Llegamos a la conclusión de que existe una estrecha


relación positiva entre el número de trabajadores y el
número de mesas producidas por hora.-
OBTENCION
DE
RELACIONES
LINEALES
Hemos visto como puede describirse la relación entre dos
variables utilizando datos muestrales.- Los diagramas de
dispersión representan la relación y los coeficientes de
correlación son una medida numérica.-
En muchos problemas económicos y empresariales se
desea una relación específica.- Por ejemplo:
•¿Qué nivel medio de ventas cabe esperar si el precio se
fija en 10$ por unidad?.-
• Si un país en vía de desarrollo aumenta su producción
de fertilizantes en un millón de toneladas, ¿Cuánto cabe
esperar que aumente la producción de cereal?.-
• Si aumento el gasto de publicidad, ¿en cuanto espero
que se incremente las ventas del comercio?.........etc.-
Los modelos económicos utilizan relaciones funcionales
específicas para indicar el efecto que producen en una
variable dependiente Y, algunas variaciones de la variable
independiente X.-
En muchos casos, podemos calcular aproximadamente las
relaciones funcionales deseadas mediante una ecuación
lineal;
Y = β0 + β1 X + εi
Donde Y es la variable dependiente; X es la variable
independiente, β0 es la ordenada en el origen y β1 es la
pendiente de la recta, o sea, la variación que experimenta
Y por cada variación unitaria de X.-
En nuestras aplicaciones, partimos de supuesto nominal
de que podemos fijar X en diferentes valores y a cada uno
le corresponderá un valor medio de Y debido a la relación
lineal subyacente en el proceso estudiado.-
El modelo de la ecuación lineal calcula la media de Y para
cada valor de X.- Esta idea es la base para obtener muchas
relaciones económicas y empresariales, entre las que se
encuentran las funciones de demanda, las funciones de
producción, las funciones de consumo y las predicciones
sobre las ventas.-
Utilizamos regresiones para averiguar cual es la mejor
relación entre X e Y para una aplicación específica.- Para
esto es necesario hallar los mejores valores de los
coeficientes β0 y β1.- Generalmente utilizamos los datos de
una muestra para calcular estimaciones de estos dos
coeficientes, generalmente se calculan utilizando el
método de ajustamiento de mínimos cuadrados, técnica
que se aplica mucho en paquetes estadísticos como Excel
y Minitab.-
El método de mínimo cuadrado selecciona la recta que
mejor se ajusta, dado un conjunto de pares de puntos.-
Veamos por ejemplo:

Gráfica de dispersión de y vs. x

20

18

16

14
y

12

10
}
8

6
5,0 7,5 10,0 12,5 15,0 17,5
x

εi Ŷ = b0 + b1 X
Consideremos el ejemplo de la placa anterior, donde
tenemos pares de puntos de un proceso que tiene una
relación lineal.-
La ecuación lineal representada por la recta es la ecuación
lineal que mejor se ajusta.- Vemos que los puntos de datos
individuales se encuentran por encima y por debajo de la
recta y que esta tiene puntos con desviaciones positiva
como negativas.- Se han usado también otros métodos
para determinar la recta pero se llego a la conclusión que
el método de mínimos cuadrado es la mejor que ajusta los
puntos a la recta, haciendo mínima las distancias de los
puntos a la recta.-
Más adelante veremos que los coeficientes desarrollados
utilizando este método tienen propiedades estadísticas
muy importantes.-
Una importante cautela que se debe tener es que el caso
de método de mínimo cuadrado, es que los puntos
atípicos extremos pueden tener tal influencia en la recta de
regresión que toda la recta se dirija hacia esos puntos.-
Por lo tanto, siempre debemos examinar los diagrama de
dispersión para asegurarnos de que la relación de
regresión no se basa solamente en unos cuantos puntos
extremos.-
En la Unidad de regresión y correlación, desarrollaremos
con mayor precisión este tema.-
La regresión por mínimos cuadrados elige los valores de
b0 y b1 con los que se minimiza la suma de los cuadrados
de los residuos.-
Entonces:
Ŷ = b0 + b1 X
b1 es la pendiente de la recta o sea la variación de Y por
cada variación unitaria de X y se calcula mediante la
siguiente formula:
Cov. (x;y)
b1 =
S²x

Donde b0 es la ordenada en el origen cuando X = 0 y se


calcula mediante la siguiente formula:
b 0 = x - b 1 y

Veamos un ejemplo
Supongamos que tenemos el numero de trabajadores X y
el numero de mesas producidas por hora Y, para una
muestra de 10 trabajadores.- Si la dirección decide
emplear 25 trabajadores, estime el número de mesas que
es probable que se produzcan.-

En un ejemplo anterior hemos calculado la covarianza y el


coeficiente de correlación, y nos daba;
Cov (x; y) = 106,93 r = 0,989

La covarianza muestra que el sentido de la relación es


positiva, la elevada correlación de 0,989 también indica
que los pares de datos muestrales están muy cerca de una
recta ascendente, y los podemos ver en el diagrama de
dispersión siguiente:
Gráfica de dispersión de y vs. x
70

60

50

y
40

30

20

10 15 20 25 30
x

Calculamos los coeficientes de regresión muestrales:

Cov. (x;y) 106.93


b1 = = = 2.545
S²x 42.01
b0 = x - b1 y = 41.21 - 2.545 * (21.3) = - 13.02

Entonces ahora podemos decir que la recta de regresión


muestral es:
Ŷ = b0 + b1 X = - 13.02 + 2.545 X

Con 25 trabajadores es de esperar que se produzcan,

Ŷ = - 13.02 + 2,545 * (25) = 50.62 = 51 mesas


O sea que se espera que se produzcan alrededor de 51
mesas.-
2.- Un hospital tiene interés en averiguar la eficacia de
un nuevo medicamento para reducir el tiempo necesario
para recuperarse totalmente de una operación de
rodilla.- La recuperación total se mide por medio de una
serie de test de fuerza que comparan la rodilla operada
de la no operada.- El medicamento se administró en
dosis diferentes a 18 pacientes durante un período de
seis meses.- Los datos (X;Y) siguientes indican el
número de unidades de medicamento X y los días
necesarios para la recuperación total Y de cada
pacientes:
(5; 53) (21; 65) (14; 48) (11; 66) (9; 46) (4; 56)
(7; 53) (21; 57) (17; 49) (14; 66) (9; 54) (7; 56)
(9; 53) (21; 52) (13; 49) (14; 56) (4; 56) (9; 59)
a) Calcular la covarianza.-
b) Calcule el coeficiente de correlación.-
c) Analice brevemente la relación entre el número de
unidades de medicamento y el tiempo de recuperación.-
¿Qué dosis deberíamos recomendar basándonos en
este análisis inicial?.-

También podría gustarte