Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción
Si sobre una población de niños entre 0 y 6 años,
estudiamos las variables peso y estatura, esperamos que en
general ocurra que a mayor estatura también encontremos
mayor peso, aunque es posible que en algunos pocos casos
no ocurra así
Si un grupo de obreros manufactureros de una fábrica
reciben mensualmente cursos de seguridad industrial, se
puede esperar que los accidentes industriales de esa fábrica
disminuya a lo largo del año.
Se podría esperar que los estudiantes con mayores
calificaciones en la prueba interna de la Facultad de
Humanidades y Educación, obtenga altas calificaciones en
sus estudios en esa Facultad.
Introducción
Es frecuente que estudiemos sobre un mismo
grupo de sujetos u objetos los valores de dos
variables estadísticas distintas, con el fin de
examinar si existe alguna relación entre ellas, es
decir, si los cambios en una de ellas influyen en los
valores de la otra. Si ocurre esto decimos que las
variables están correlacionadas o bien que hay
correlación entre ellas.
Situación en el Marco Educativo
Un docente desea conocer si el tiempo dedicado al
estudio tiene alguna relación con los resultados de las
evaluaciones en química. Si existe alguna relación
entre estas dos variables podrá establecer los
mecanismos necesarios para ayudar a sus alumnos a
elevar globalmente su nivel de rendimiento en química.
Por ello le pide a sus alumnos que registren el tiempo
dedicado para la preparación del examen (en horas),
mientras que él registrará las calificaciones obtenidas
ellos en el examen de lapso, de manera de
correlacionarlo.
Distribución Bidimensional
Cuando sobre una población estudiamos simultáneamente
los valores de dos variables estadísticas, el conjunto de los
pares de valores correspondientes a cada individuo se
denomina distribución bidimensional o bivariante.
Tiempo
8 12 4 5 7 2 10 14 8 3 2 4 12 4 10
Preparación (x)
Calificaciones
9 14 5 7 10 10 12 18 8 2 8 6 17 5 13
Química (y)
Representación gráfica
¿Cómo sabemos si las Variables están relacionadas?
–+ xi x
++ yi y
y
yi y ––
xi x +–
x
+ – Zona IV
– – Zona III + – Zona IV – – Zona III
–1<r<0 0<r<+1
r=–1
r=+1
Coeficiente de Correlación Lineal de Pearson
1
Desplace la
barra para
0
cambiar la
-3 -2 -1 0 1 2 3
correlación
-1
-2
-3
Visualización Coeficiente de Correlación Lineal de Pearson
Interpretación de r
En la interpretación del resultado del coeficiente de
correlación Pearson hay que considerar tanto el signo como
la magnitud.
El signo se indica el tipo de tipo de relación. Un r positivo
indica la tendencia a aumentar los valores de Y cuando
aumentan los de X, y a disminuir los valores de Y cuando
disminuyen los de X .
Un r negativo señala la tendencia a disminuir los valores de
Y cuando aumentamos los de X y a aumentar los de Y
cuando disminuimos los de X.
Un coeficiente de correlación en torno a cero indica que el
modelo de relación lineal entre esas variables no es válido.
Interpretación de r
Para la interpertación de la magnitud del coeficiente usualmente se
encuentran tablas que orientan sobre ese tema.
Tablas para la interpretación de r
Guilford (1956)
<0.20 correlación muy baja; relación casi insignificante
0.20 - 0.40 correlación baja; relación definida pero pequeña
0.40 - 0.70 correlación moderada; relación considerable
0.70 - 0.90 correlación elevada; relación notable
>0.90 correlación sumamente elevada; relación muy fiable
Fox (1981)
± 0.50 o menos: correlación baja => apenas 25% de varianza común
± 0.50 a ± 0.70: correlación moderada => 25% a 50% de varianza común
± 0.70 a ± 0.86: correlación alta => 50% a 75% de varianza común
± 0.86 o más: correlación muy alta => más del 75% de varianza común
Interpretación de r
Para juzgar la magnitud de r es necesario considerar
la situación donde se calcula el coeficiente.
Una relación que se considera como alto en una
situación puede parecer relativamente normal en
otra. Ej. Test de inteligencia – validez predictiva
La interpretación de la magnitud de una correlación
con frecuencia es subjetiva Una posibilidad es
comparar con los resultados habitualmente
obtenidos en investigaciones similares.
Interpretación de r
Otra opción para interpretar r es utilizar r2 ayuda a tener
una idea más clara de lo que implica un valor de r
r2 es la proporción de varianza que tienen en común las
dos medidas respecto a la varianza total de ambas
variables. r2 se conoce como Coeficiente de
Determinación
El porcentaje de varianza compartida es una estimación
de la eficacia predictiva de los datos en estudio .
La diferencia 1 – r2 se denomina Coeficiente de
Alienación, implica la presencia de otras variables no
contempladas en este estudio
Interpretación de r
Relación entre r y r2
Análisis de Correlación Lineal
n xy x y
r xy
n x 2
x n y y
2 2 2
r = +1 – 1 < r <+1
r=0
Error Estándar de Estimación
Una medición del Error
Salvo en el caso de que el módulo de r sea 1 (si r = 1
o r = -1), cuando se estiman valores de la variable
dependiente utilizando la recta de regresión siempre
se incurre en errores.
Una medida del error en el que puede incurrir se
puede calcular con:
' 2
s xy
( yi yi )
Error de Estimación
n
Este índice es una medida del error promedio
cometido cuando se estima una variable a partir de
otra, no indican que siempre se cometerá ese error,
en algunos casos será mayor y en otros menor.
Error Estándar de Estimación
y
y – y´
y´- y
y
y y ( y y) ( y y )
x
xi
VEx ( y y ) 2
VnoEx ( y y ) 2
r2 k2
VT ( y y)2 VT ( y y)2
Ejemplo de Regresión
n xy x y
B yx
n x x
2 2
A yx y B yx x
A yx 20,3 ( 0,4154) * 11,32 27,38
y A yx B yx x y 27,38 0,4154x
Otros Coeficientes de Correlación
Casos Especiales de r de Pearson
Spearman
El coeficiente de correlación por rangos Spearman, rs
o , mide la fuerza de la relación lineal entre dos
variables cuando ambas se ubican en un escala de
medición ordinal. Ej. Nivel satisfacción con la carrera
que cursó y Orden en la promoción de graduación.
6 d i2
1
n(n 2 1)
más que la relación entre las variables X e Y, lo que
mide es la relación entre los ordenes de las dos
variables
Su valor se encuentra acotado, - 1 < < +1.
Su calculo es sencillo.
Cuando no hay empates es igual a r
Otros Coeficientes de Correlación
Casos Especiales de r de Pearson
Coeficiente phi
El coeficiente mide la fuerza de la relación lineal
entre dos variables nominales cuando ambas son
dicotómicas. Puede utilizarse con variables continua
dicotomizadas, p.e.cuando las puntuaciones de una
prueba se dividen por la mediana.
ad bc
n1 n 2 n3 n 4