Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CORRELACION
El coeficiente de correlación lineal r que es una medida numérica de la fuerza de la
relación entre dos variables que representan datos cuantitativos. Utilizando datos
muéstrales apareados (que en ocasiones se llaman datos bivariados), calculamos el valor
de r (generalmente con la ayuda de recursos tecnológicos) y luego utilizamos este valor
para concluir que existe (o no) una relación entre las dos variables. En esta sección sólo
consideramos las relaciones lineales, lo que quiere decir que cuando se grafican, los
puntos se aproximan al patrón de una línea recta.
Conceptos básicos de correlación: Iniciamos con la definición básica de correlación, un
término que se utiliza comúnmente en el contexto de una relación entre dos variables.
Definición: Una correlación existe entre dos variables cuando una de ellas está
relacionada con la otra de alguna manera.
El coeficiente de correlación lineal r mide la fuerza de la relación lineal entre los valores
cuantitativos apareados x y y en una muestra. [El coeficiente de correlación lineal también
se conoce como coeficiente de correlación producto momento de Pearson, en honor de
Karl Pearson (1857-1936), quien lo desarrolló originalmente]. Puesto que el coeficiente de
correlación lineal r se calcula utilizando datos muéstrales, se trata de un estadístico
muestral empleado para medir la fuerza de la correlación lineal entre x y y.
Requisitos
Dado cualquier conjunto de datos muéstrales apareados, siempre se puede calcular el
coeficiente de correlación lineal r, pero se deben satisfacer los siguientes requisitos
cuando se prueban hipótesis o cuando se hacen inferencias acerca de r.
1. La muestra de datos apareados (x, y) es una muestra aleatoria de datos cuantitativos.
(Es importante que los datos muéstrales no se hayan reunido por medio de algún método
inapropiado, como una muestra de respuesta voluntaria).
2. El examen visual del diagrama de dispersión debe confirmar que los puntos se acercan
al patrón de una línea recta.
3. Es necesario eliminar cualquier valor extremo, si se sabe que se trata de un error. Los
efectos de cualquier otro valor extremo deben tomarse en cuenta calculando r con y sin el
valor extremo incluido.
Nota: Los requisitos 2 y 3 se simplifican al verificar el siguiente requisito formal:
Los pares de datos (x, y) tienen una distribución normal bivariada. (Las distribuciones
normales, pero este supuesto requiere que, para cualquier valor fijo de x, los valores
correspondientes de y tengan una distribución con forma de campana, y que para
cualquier valor fijo de y, los valores de x tengan también una distribución con forma de
campana). Suele ser difícil verificar este supuesto, así que, por ahora, usaremos los
requisitos 2 y 3 descritos arriba.
Notación para el coeficiente de correlación lineal:
n Representa el número de pares de datos presentes.
∑ Denota la suma de los elementos indicados.
∑ 𝑥 Denota la suma de todos los valores de x.
∑ 𝑥 2 Indica que cada valor de x debe elevarse al cuadrado y después deben sumarse
esos cuadrados.
(∑ 𝑥)2 Indica que los valores de x deben sumarse y el total elevarse al cuadrado. Es
sumamente importante evitar confundirse entre.
∑ 𝑥𝑦 Indica que cada valor de x debe multiplicarse primero por su valor y correspondiente.
Después de obtener todos estos productos, se calcula su suma.
r Representa el coeficiente de correlación lineal de una muestra.
p La letra griega rho se usa para representar el coeficiente de correlación lineal de una
población.
𝒏(∑ 𝒙𝒚)−(∑ 𝒙)(∑ 𝒚)
FORMULA: 𝒓=
√𝒏(∑ 𝒙𝟐 )−(∑ 𝑥)2 √𝒏(∑ 𝒚𝟐 )−(∑ 𝑦)2
Esta fórmula abreviada simplifica los cálculos manuales. Su formato la hace fácil de usar
en una hoja de cálculo o en un programa de cómputo.
Errores comunes en las correlaciones
Ahora identificamos tres de las fuentes más comunes de errores que se cometen al
interpretar los resultados de correlaciones:
1. Un error común es concluir que la correlación implica causalidad
2. Otro error proviene de los datos basados en promedios. Los promedios eliminan la
variación individual y pueden inflar el coeficiente de correlación.
3. Un tercer error implica la propiedad de linealidad. Puede existir una relación entre x y y,
aun cuando no haya una correlación lineal
Prueba de hipótesis de correlación
𝐻0 : 𝑝 = 0 (No existe una correlación lineal).
𝐻1 : 𝑝 ≠ 0 (Existe una correlación lineal).
Método 1: El estadístico de prueba es t
𝒓
Estadístico de prueba: 𝒕 = 𝟐
√𝟏−𝒓
𝒏−𝟐