Está en la página 1de 6

5 El Análisis de Correlación

El análisis de correlación es la técnica estadística que permite describir el
grado hasta el cual una variable está linealmente relacionada con otra.
 Hay dos medidas que se usan para describir la correlación
El coeficiente de correlación
El coeficiente de determinación

A) El coeficiente de determinación
Al construir un modelo de regresión, se define que “el valor Y depende de X”
Y = f (X)
Si la relación es lineal:
Y=a+bX
Pero en la práctica Y depende también de “otros factores” diferentes a X:
Y = a+ b X + 
Parte de los cambios en Y pueden explicarse por X, a esto se llama
variación explicada.
Pero hay cambios en Y que no pueden explicarse por X, a lo que se llama
variación no explicada.

Yi Y Variación Total Yi .Ŷ Variación Explicada Ŷ.Ÿ Variación no explicada Yi .Ÿ Ÿ X Variación Total = Variación Explicada + Variación No Explicada .

9 Perfecta Negativa -0.9 1 Perfecta Positiva . r= r2 Sus valores oscilan entre -1 y 1 Interpretación del coeficiente de correlación de Pearson Fuerte Moderada Negativa Negativa -1 -0.B) El coeficiente de correlación 1. El coeficiente r tiene el mismo signo que el coeficiente b en la ecuación de regresión Es la raíz cuadrada del coeficiente de determinación. Cuando r es negativo. indica que X e Y están inversamente relacionados. Cuando r es positivo.5 Débil Negativa Débil Positiva 0 No existe correlación Moderada Positiva 0. 3. 2. indica que X e Y están directamente relacionados.5 Fuerte Positiva 0.

5) 2 sc x  126.25  10 sc x  20.51 ERROR ESTANDAR DE ESTIMACIÓN S yx = S yx  Syx = 1.625 Sx = 1.84 CUADRADO DE LA DESVIACIÓN ESTANDAR DE X sc x   x 2   x 2 n (32.98 8 2 .5) 10(1660)  (126)  2 r = 0.40 Sy = 2.5(126)  10(1263)  (32.Y n2 20.84 2 sc y   y 2  y   2 n (126) 2 sc y  1660  10 sc y  72.619 ˆ)  (Y .MÉTODO PRACTICO CUADRADO DE LA DESVIACIÓN ESTANDAR DE Y HALLAR ( r ) r = r= n  xy    x   y  n  x 2   x 2 n y 2   y 2 10( 442)  32.

0.25 .35 1.6 cov( x.64 9 x Y (x.y) 1.0 .3.4 .También se puede calcular r r  c ( x.55 2.5  1.0 0.80 4.84) La ecuación de regresión de Y sobre X. Sy son las desviaciones de la variable x e y de la variable y respectivamente.1.2.25 1.10 4. y) es la covarianza y Sx.84 (1.5 13.4 5.5 14.0 .4.6 4.45 y  12.51   5.10 5.0 1.75 1.2.80 r  3.6  1.45 3.25) 1.x) (y.84  y  12. y ) sx s y en la siguiente ecuación: Donde c (x.0 2.80  3.25 y cov( x.5 17.0.0 .4 2.0 14.75 2. Verificar el valor de r es = 0.50 2. y )  32.64  0.6 0.51)( 2.4 1.75 .0 1.0 0.5 12.57 x . también se puede calcular mediante la ecuación:  sx  s  y y  y  r   ( x  x)   y  7.84  ( x  3.35 3. y )  ( x  x)( y  y ) n 1 y = 12.4 3.0 .0 .25 0.6  0.0 15.50  2.0 ∑ 32.0 8.25 4.0.84 donde la x = 3.75 .45 9.6 10.x) (y.0 14.57 x  5.25 .5 10.6 4.0.1.4 0.y) (x.25 1.

Caso 1 Caso 2 Para probar la utilidad de este nuevo instrumento para medir el nivel de respuesta del paciente. los datos registrados se presentan a continuación: VENDEDOR EXPERIENCIA (años):X VENTAS (unidades) : Y CARLOS PEDRO JOSE JUAN MANUEL 3 1 2 5 4 9 5 7 14 10 Un equipo de profesionales en salud mental de un hospital psiquiátrico donde el tiempo de permanencia es largo. Se seleccionan 5 vendedores. quiere medir el nivel de respuesta de pacientes retraídos mediante un programa de terapia de remotivación. Para salvar este obstáculo. Paciente 1 2 3 4 5 6 7 8 9 10 11 50 55 60 65 70 75 80 85 90 95 100 Prueba estandar 61 61 59 71 80 76 90 106 98 100 114 Prueba nueva . el equipo decidió examinar la relación entre las calificaciones obtenidas con la nueva prueba y las calificaciones obtenidas con la prueba estandarizada. el equipo creó una prueba más fácil de aplicar. Para este propósito se contaba con una prueba estandarizada. se desea determinar la relación lineal simple entre la experiencia del vendedor y las ventas durante un mes.Ejemplo: En la Farmacia Santa Rita. que era costosa y su aplicación tomaba mucho tiempo.