Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Introducción.
2. Tablas y gráficas bivariadas.
3. Variables cuantitativas.
3.1. Covarianza.
3.2. Coeficiente de correlación de Pearson.
3.3. Matriz de varianzas/covarianzas y matriz de correlaciones.
4. Variables semicuantitativas: Coeficiente de Spearman.
5. Variables cualitativas: Indices Ji Cuadrado y V de Cramer.
6. Asociación entre variables de escalas diferentes.
7. Concepto de relaciones no lineales.
5.1 Introducción
rendimiento
rendimiento
inteligencia inteligencia inteligencia
rendimiento
rendimiento
rendimiento
inteligencia inteligencia inteligencia
Ahora necesitamos un índice que nos informe tanto del grado en que X e Y están
relacionadas, y si la relación es positiva o negativa
5.3 Covarianza e índice de correlación de Pearson
inteligencia
inteligencia
Covarianza
X i X Yi Y
sxy i 1
Interpretación (2)
(Esa es una de las razones empleadas por las tabaqueras en el tema de la correlación
entre cáncer de pulmón y el hecho de fumar.)
COEFICIENTE DE CORRELACIÓN (LINEAL) DE
PEARSON
Interpretación (3)
Es importante indicar que el coeficiente de correlación de Pearson puede verse afectado por
la influencia de terceras variables.
Por ejemplo, si fuéramos a un colegio y medimos la estatura y pasamos una prueba de
habilidad verbal, saldrá que los más altos también tienen más habilidad verbal...claro, que eso
puede ser debido simplemente a que en el colegio los niños más altos serán mayores en edad
que los más bajos.
Si se parcializa esta “tercera” variable
(mediante “correlación parcial”, que ya
veremos más adelante), difícilmente habrá
una relación de importancia entre
Habilidad numérica
14 a
estatura y habilidad numérica.
12 a
10 a
Hay muchos casos en que es la tercera
8a
variable la causante de una alta relación
6 años entre X e Y (y ello muchas veces es difícil
de identificar)
Estatura
COEFICIENTE DE CORRELACIÓN (LINEAL) DE
PEARSON
Interpretación (3)
Por otra parte, el valor del coeficiente de Pearson depende
en parte de la variabilidad del grupo.
Si efectuamos el coeficiente de Pearson entre
inteligencia y rendimiento con todos los sujetos,
el valor del coeficiente de Pearson será bastante
elevado.
Sin embargo, si empleamos únicamente los
individuos con CI bajo (o CI alto) y calculamos la
correlación con Rendimiendo, el valor del
coeficiente de Pearson será claramente menor.
Rendimiento
CI bajo CI alto
Un grupo heterogéneo daría pues un mayor
grado de relación entre variables que un grupo
inteligencia homogéneo.
5.4 Otros coeficientes: variables semi-cuantitativas
n
6 di2
rs 1 i 1
n n 1
2
Las frecuencias empíricas son las que tenemos en la tabla de contingencia. Ahora
bien, ¿cómo computar las frecuencias teóricas? Tal proceso es simple:
Si ambas variables son independientes, la frecuencia teórica de cada celdilla será el
resultado de multiplicar la suma de frecuencias de la fila x la suma de frecuencia de
las columnas, y ese resultado se divide por N
Este índice se interpreta
2 de manera análoga al
coeficiente de Pearson
(pero observa que phi no
n
puede ser negativo...sólo
de 0 a 1)
Prueba 2 como medida de asociación: Coeficientes derivados e
interpretación
m es el número menor entre el número
2 de filas-1 y columnas-1
Vˆ
nm
Este índice se interpreta análogamente al índice de Pearson (excepto por el tema
del signo).
Observa que si la tabla es 2x2 este índice coincide con el índice phi