Está en la página 1de 13

Coeficiente de

Correlación

Objetivo: Calcular e interpretar el coeficiente de


correlación y obtener la ecuación de regresión simple
¿Qué es el análisis de correlación?
• Técnicas para medir la asociación entre dos variables.
• Cuando se estudia la relación entre dos variables es
usual comenzar con un diagrama de dispersión como
representación visual de la relación entre las variables.
• Primero se calcula el coeficiente de correlación, medida
cuantitativa de la fuerza de la relación entre dos
variables.
Análisis de correlación
EJEMPLO: Copiadoras
• El gerente de ventas de Copier Sales of America desea determinar si existe alguna
relación entre el número de llamadas telefónicas de ventas y el número de copiadoras
que se vendieron para un mes dado.
• Selecciona una muestra aleatoria de 15 representantes, determina el número de
llamadas de ventas de cada uno hizo y el número de copiadoras que vendió.
• Revisando los datos parece haber una relación, los vendedores que hicieron más
llamadas de venta vendieron más unidades.
• No obstante, la relación no es “perfecta” o exacta.
Coeficiente de correlación
COEFICIENTE DE CORRELACION
• Describe la fuerza de la relación entre dos variables en escala de intervalo o de razón.
• Un coeficiente de correlación de -1.00 o +1.00 indica una correlación perfecta.
• Un coeficiente de correlación próximo a 0.00 indica que la relación lineal es muy débil.

EJEMPLO: Copiadoras
El primer paso es realizar un diagrama de
dispersión.
La variable independiente es la variable
predictora.
La variable dependiente es aleatoria, hay
muchos posibles resultados para la variable
dependiente.
Existe una relación positiva entre ambas
variables, pero no todos los puntos caen en
una recta.
Coeficiente de correlación
COEFICIENTE DE CORRELACION
• Describe la fuerza de la relación entre dos
variables.
• Un coeficiente de correlación de
-1.00 o +1.00 indica una correlación perfecta.
• Un coeficiente de correlación de
0.00 indica que la relación lineal es muy débil.
• ¿Cómo se determina?

• Donde
• diferencia de cada versus su promedio.
• diferencia de cada versus su promedio.
• numero de elementos de .
• desviación estándar de .
• desviación estándar de .
Coeficiente de correlación
VENDEDOR LLAMADAS x COPIADORAS y x - xm (x-xm)2 y-ym (y-ym)2 (x-xm)(y-ym)
Brian Virost 96 41 0 0 -4 16 0
Carlos Ramirez 40 41 -56 3,136 -4 16 224
Carol Saia 104 51 8 64 6 36 48
Greg Fish 128 60 32 1,024 15 225 480
Jeff Hall 164 61 68 4,624 16 256 1,088
Mark Reynolds 76 29 -20 400 -16 256 320
Meryl Rumsey 72 39 -24 576 -6 36 144
Mike Kiel 80 50 -16 256 5 25 -80
Ray Snarsky 36 28 -60 3,600 -17 289 1,020
Rich Niles 84 43 -12 144 -2 4 24
Ron Broderick 180 70 84 7,056 25 625 2,100
Sal Spina 132 56 36 1,296 11 121 396
Soni Jones 120 45 24 576 0 0 0
Susan Welch 44 31 -52 2,704 -14 196 728
Tom Keller 84 30 -12 144 -15 225 180
Totales 1,440 675 0 25,600 0 2,326 6,672
Elementos 15 15
Promedios 96 45
Desviación 42.76 12.89
Coeficiente de correlación
EJEMPLO: Copiadoras

• La correlación es positiva,
es una relación directa.
• El valor de 0.856 es cercano a 1.00,
se concluye que la asociación es fuerte.
• Se debe tener mucho cuidado con la interpretación.
• ¿Más llamadas de ventas ocasionan más ventas? No.
• Sólo que hay una relación entre ambas variables.
• Si existe una relación fuerte (r ≥ ±0.95) es factible suponer que un aumento o una
disminución en una variable causa un cambio en la otra.
• También hay tener cuidado con las
correlaciones espurias:
• Aquellos casos en los que parece ser que existe una relación entre dos variables,
pero una no afecta a la otra.
Prueba t del Coeficiente de correlación
EJEMPLO: Copiadoras PASO 2: α = 0.05
• La muestra sólo incluía 15 vendedores. PASO 3: Estadístico t
• ¿Puede ser que la correlación de la población PASO 4: Valor crítico con α = 0.05
sea 0?, • Grados de libertad gl = n - 2 = 15 - 2 = 13
y que la correlación de 0.865 se debió a la
casualidad. • No se rechaza H0 si -2.160 ≤ test ≤ 2.160

• Para resolver este dilema se requiere de una PASO 5: Calcular testadístico


prueba de hipótesis. • con grados de libertad

PRUEBA t DEL COEFICIENTE DE CORRELACIÓN • El valor t calculado se encuentra en la región de


• El coeficiente de correlación de la población se rechazo. Se rechaza la H0 con α = 0.05.
representa con la letra griega (rho).
PASO 6: Conclusión
PASO 1: Hipótesis nula y alterna
• Significa que la correlación entre la población
• H0: ρ = 0 La correlación entre la población es no es cero, es decir, hay una correlación entre
cero. las llamadas y el número de copiadoras
• H1: ρ ≠ 0 La correlación es diferente de cero. vendidas en la población de vendedores.
• La prueba es de dos colas.
Coeficiente de correlación
POSIBLES CASOS DE PRUEBA DE HIPOTESIS EN COEFICIENTES DE CORRELACIÓN

MENOR DIFERENTE MAYOR


TIPO DE PRUEBA CORRELACIÓN (-) CORRELACIÓN = 0 CORRELACIÓN (+)

Hipótesis nula
H0: ρ≥0 ρ=0 ρ≤0

Prueba de … cola inferior 2 colas cola superior


No se rechaza H0 -t crít < t est -t crít ≤ t est ≤ t crít t est < t crít
si…
Coeficiente de correlación
EJEMPLO: Edad vs ganancia PASO 3: Estadístico t
• En el ejemplo de Applewood Auto Group se
determinó un coeficiente de correlación de r =
0.262. PASO 4: Valor crítico del estadístico t con α =
0.05
• También se concluyó que existía una relación • Grados de libertad gl = n - 2 = 180 -2 = 178
directa entre ambas variables, pero por ser una
baja se determino que no había garantías en • No se rechaza H0 si… test < 1.653
una campaña. PASO 5: Calcular test
• ¿El coeficiente de correlación poblacional • con grados de libertad
presenta una asociación positiva entre sus
variables?
• Asumamos un α = 0.05 y n = 180 vehículos. • El valor t estimado > t crítica, se rechaza la H0.
PASO 1: Hipótesis nula y alterna PASO 6: Conclusión
• H0: ρ ≤ 0 la correlación entre la población es • Se concluye que el coeficiente de correlación
(-) o cero. de la muestra de 0.262 es demasiado grande
• H1: ρ > 0 La correlación es (+). como para provenir de una población sin
correlación.
• Ésta es una prueba de una cola, porque el
interés es confirmar una asociación positiva • CUIDADO: El resultado de la prueba de la
entre las variables. hipótesis muestra que existe una relación, no
revela nada con respecto a la fuerza de la
PASO 2: α = 0.05
relación.
Coeficiente de correlación
EJEMPLO: Votos vs publicidad PASO 3: Estadístico t.
• Una muestra de 25 campañas para la alcaldía
de ciudades de tamaño medio con
poblaciones entre 500 y 250 k habitantes PASO 4: Valor crítico t con α = 0.05
demostró que la correlación entre el • Grados de libertad gl = n - 2 = 25 -2 = 23
porcentaje de los votos recibidos y la cantidad • No se rechaza H0 si test < tcrítico 1.714
gastada en la campaña por cada candidato fue
r = 0.43. PASO 5: Calcular test
• A un nivel de significancia de 0.05, • con grados de libertad
¿existe una correlación positiva entre las
variables?
• El valor t estimado 2.284 > t crítica 1.714.
PASO 1: Hipótesis nula y alterna.
• H0: ρ ≤ 0 La correlación entre la población es • H0 se rechaza.
(-) o cero. PASO 6: Conclusión
• H1: ρ > 0 La correlación es (+).
• Hay una correlación positiva entre el
• Ésta es una prueba de una cola, porque el porcentaje de los votos recibidos y la
interés es confirmar una asociación positiva cantidad que se gastó en la campaña.
entre las variables.
PASO 2: α = 0.05
VENDEDOR LLAMADAS x COPIADORAS y x - xm (x-xm)2 y-ym (y-ym)2 (x-xm)(y-ym)
Brian Virost 96 41 0 0 -4 16 0
Ecuación de regresión lineal Carlos Ramirez
Carol Saia
40
104
41
51
-56
8
3,136
64
-4
6
16
36
224
48
Greg Fish 128 60 32 1,024 15 225 480
Jeff Hall 164 61 68 4,624 16 256 1,088
EJEMPLO: Copiadoras Mark Reynolds 76 29 -20 400 -16 256 320
Meryl Rumsey 72 39 -24 576 -6 36 144
• Aplicando el método de los mínimos cuadrados, Mike Kiel 80 50 -16 256 5 25 -80
Ray Snarsky 36 28 -60 3,600 -17 289 1,020
determinar una ecuación lineal que exprese la Rich Niles 84 43 -12 144 -2 4 24
relación entre ambas variables. Ron Broderick 180 70 84 7,056 25 625 2,100
Sal Spina 132 56 36 1,296 11 121 396
Soni Jones 120 45 24 576 0 0 0
Susan Welch 44 31 -52 2,704 -14 196 728
Tom Keller 84 30 -12 144 -15 225 180
Totales 1,440 675 0 25,600 0 2,326 6,672
Elementos 15 15
Promedios 96 45
Desviación 42.76 12.89

• ¿Cuál es el número esperado de copiadoras


vendidas de un representante de ventas que
hizo 100 llamadas?

Problema 19
Lind, D., Marchal, W. y Wathen, S. (2018).
ística aplicada a los negocios y la economía.
17ma edición. Editorial McGraw Hill. México.

CAPÍTULO 13
Regresión lineal
y correlación
OA13-1 ¿Qué es el análisis de correlación? 381
OA13-2 Coeficiente de correlación 383
OA13-3 Análisis de regresión lineal 392
OA13-4 Probar la significancia de la pendiente 399
OA13-5 Error estándar de estimación 401
OA13-6 Estimaciones de intervalo de predicción
405

También podría gustarte