Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis de Correlación Lineal
Análisis de Correlación Lineal
¿Cómo interpretamos
este resultado?
(0 – 4) x (3 – 7) + (4 – 4) x (3 – 7) + (8 – 4) x (9 – 7)
𝑪𝒐𝒗 𝐗, 𝐘 = = −𝟐. 𝟔𝟕
𝟑
Significa que la variable X y la variable Y guardan una
En este relación negativa, de manera que X e Y son
inversamente proporcionales la una respecto de la
supuesto, el otra, de manera que, en palabras más sencillas,
valor que cuando una variable aumenta, la otra variable
disminuye. No obstante, para poder conocer la
adquiere relación ajustada entre la variable X y la variable Y es
la covarianza es necesario llevar a cabo el cálculo de la correlación
lineal.
menor de 0. En cualquier caso, es necesario decir que dos
¿Qué quiere covarianzas de variables diferentes no son
comparables, ya que la unidad de medida de la
decir este covarianza será la unidad de medida de las variables.
resultado? De acuerdo con esto, no se puede comparar la
covarianza del peso y de la altura, por ejemplo.
Diagrama de dispersión
El diagrama de dispersión permite estudiar las
relaciones entre dos conjuntos asociados de datos
que aparecen en pares (por ejemplo, (x,y), uno de
cada conjunto). El diagrama muestra estos pares
como una nube de puntos. Las relaciones entre los
conjuntos asociados de datos se infieren a partir
de la forma de las nubes
ANÁLISIS DE
CORRELACIÓN LINEAL
Un signo positivo indica que existe una relación positiva
entre las dos variables; es decir, cuando la magnitud de
Coeficiente de una incrementa, la otra también.
Un signo negativo indica que existe una relación negativa
correlación entre las dos variables. Mientras los valores de una
incrementan, los de la segunda variable disminuyen.
Describe la fuerza de la Si dos variables son independientes, el coeficiente de
relación entre dos correlación es de magnitud cero.
conjuntos de variables en La fuerza de la relación lineal incrementa a medida que el
escala de intervalo o de coeficiente de correlación se aproxima a -1 o a +1.
razón. Se designa con la
letra r, y con frecuencia se
le conoce como r de
Pearson. σ 𝑥 − 𝑥ҧ 𝑦 − 𝑦ത
𝑟=
𝑛 − 1 𝑆𝑥 𝑆𝑦
¿Qué observaciones cabe hacer respecto de la
relación entre el número de llamadas de ventas
y el número de copiadoras vendidas?
CASO
ESTUDIO
RESUELTO
Es práctica común situar la variable dependiente
(copiadoras vendidas) en el eje vertical o Y y la variable
independiente (número de llamadas de ventas) en el eje
horizontal o X.
Diagrama de
dispersión que
representa las
llamadas de
ventas y las
copiadoras
vendidas
σ 𝑥 − 𝑥ҧ 𝑦 − 𝑦ത
𝑟=
𝑛 − 1 𝑆𝑥 𝑆𝑦
Si no hay ninguna relación entre los dos conjuntos de
variables, la r de Pearson es cero.
Un coeficiente de correlación r cercano a 0 (sea 0.08) indica que la relación lineal es
muy débil. Se llega a la misma conclusión si r =- 0.08. Los coeficientes de -0.91 y
+0.91 tienen una fuerza igual; los dos indican una correlación muy fuerte entre las
dos variables. Por lo tanto, la fuerza de la correlación no depende de la dirección (ya
sea - o bien + ).
¿Qué significan los términos fuerza y dirección?
Fuerza: La fuerza significa la correlación de relación entre dos variables. Significa cuán
consistentemente una variable cambiará debido al cambio en la otra.
Los valores cercanos a +1 o -1 indican una relación fuerte. Estos valores se alcanzan si los
puntos de datos caen sobre la línea o muy cerca de ella. Cuanto más se alejan los puntos de
datos, más débil es la fuerza de la relación lineal. Cuando no hay una forma práctica de trazar
una línea recta porque los puntos de datos están dispersos, la fuerza de la relación lineal es la
más débil.
Dirección: La dirección de la línea indica una relación lineal positiva o negativa entre las
variables. Si la línea tiene una pendiente ascendente, las variables tienen una relación
positiva. Esto significa que un aumento en el valor de una variable llevará a un aumento en el
valor de la otra variable. Una correlación negativa representa una pendiente descendente.
Esto significa que un aumento en la cantidad de una variable lleva a una disminución en el
valor de otra variable.
Inicie con un diagrama de dispersión. Se traza una
recta vertical con los valores de datos en la media de
¿Cómo se los valores X y una recta horizontal en la media de los
valores Y
determina el
coeficiente de
correlación?
Desviaciones de la media y sus productos 𝑥 − 𝑥ҧ 𝑦 − 𝑦ത
Coeficiente de
correlación
El análisis de correlación consiste en un
procedimiento estadístico para determinar si dos
Análisis de variables están relacionadas o no.
El resultado del análisis es un coeficiente de
correlación correlación que puede tomar valores entre -1 y +1.
Caso practico
Caso práctico
Un ejemplo de una correlación positiva media sería:
A medida que el número de automóviles aumenta, también aumenta la demanda en la variable combustible.
Un ejemplo de una correlación débil/ninguna sería:
Un aumento en el precio del combustible lleva a que menos personas adopten mascotas.
σ 𝑥 − 𝑥ҧ 𝑦 − 𝑦ത
𝑟= X y
𝑛 − 1 𝑆𝑥 𝑆𝑦
4 4
5 6
3 5
6 7
10 7
CARACTERÍSTICAS DEL
COEFICIENTE DE CORRELACIÓN
1. El coeficiente de correlación de la muestra se
identifica con la letra minúscula r.
2. Muestra la dirección y fuerza de la relación lineal
(recta) entre dos variables en escala de intervalo o en
escala de razón.
3. Varía de -1 hasta +1, inclusive.
CARACTARÍSTICAS
4. Un valor cercano a 0 indica que hay poca asociación
entre las variables.
5. Un valor cercano a 1 indica una asociación directa o
positiva entre las variables.
6. Un valor cercano a -1 indica una asociación inversa o
negativa entre las variables.
CASO PRÁCTICO 1. Caso A: resultados de las ventas de un producto (variable Y), según los
precios de oferta (variable X).
σ 𝑥 − 𝑥ҧ 𝑦 − 𝑦ത
𝑟=
𝑛 − 1 𝑆𝑥 𝑆𝑦
A B
X Y X Y
21 53 21 70
22 59 10 25
31 80 15 44
17 69 16 57
27 45 16 61
22 74 31 74
15 89 6 41
14 92 14 49
9 95 17 25
22 39 24 81
σ 𝑥 − 𝑥ҧ 𝑦 − 𝑦ҧ
𝑟=
𝑛 − 1 𝑆𝑥𝑆𝑦
X Y
21 53
22 59
31 80
17 69
27 45
22 74
15 89
14 92
9 95
22 39
CASO PRÁCTICO 1. Caso A: resultados de las ventas de un producto (variable Y), según los precios de oferta
(variable X).
2. Caso B: resultados obtenidos en las ventas de los productos de una empresa (variable Y),
según la inversión en promoción (variable X).
3. En el caso C, una empresa desea saber si existe una relación entre los días que algunos
A B C productos permanecen en exhibidos en una valla publicitaria y sus ventas.
El valor t calculado se encuentra en la región de rechazo. Por ello, H0 se rechaza con un nivel de significancia de 0.05. Esto
significa que la correlación entre la población no es cero. Desde un punto de vista práctico, esto indica a la gerente de
ventas que hay una correlación entre el número de llamadas de ventas y el número de copiadoras vendidas en la
población de vendedores.
Una prueba de hipótesis es una regla que especifica
cuando se puede aceptar o rechazar una afirmación
sobre una población dependiendo de la evidencia
proporcionada por una muestra de datos.
Una prueba de hipótesis examina
dos hipótesis opuestas sobre una población:
la hipótesis nula y a hipótesis alternativa.