Está en la página 1de 8

Esmeralda4

www.wuolah.com/student/Esmeralda4

18875

TEMA 5.pdf
Bloque II: Estadística Descriptiva Bivariada

1º Análisis de Datos I

Grado en Psicología

Facultad de Psicología
UAM - Universidad Autónoma de Madrid

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647

BLOQUE II: ESTADÍSTICA DESCRIPTIVA BIVARIADA

Describir 2 variables conjuntamente. Sobre todo, variables cuantitativas.


Estudiaremos 3 cosas:
1) Relación lineal. Si existe, aprovechamos la relación para hacer predicciones, lo que da lugar a una
regresión simple. De la relación lineal y la regresión se ocupan los temas 5 y 7.
2) Puntuaciones combinadas: para aplicar las fórmulas, hace falta la covarianza.
3) Organizar la información: tema 8. Tabla de contingencia, representación gráfica, índices de
asociación.

TEMA 5: Correlación lineal

1. RELACIÓN LINEAL

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
§ Objetivo de la ciencia: utilizar el método científico para descubrir relaciones entre variables.
Ejemplo: velocidad de un objeto.

§ Papel de las matemáticas y la estadística: modelizar dichas relaciones, mediante modelos


matemáticos. Dan rigor a las afirmaciones.
!"#$%&'
Función matemática: 𝑉𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑 = !"#$%&

Son funciones teóricas que reflejan relaciones de tipo determinista (relaciones causa–efecto), es decir, se
puede predecir de forma exacta un resultado en función de los valores de otras variables.

En Psicología
Algunas preguntas que nos hacemos:
– ¿La satisfacción en el trabajo guarda relación con la personalidad del trabajador?
– ¿El fracaso escolar tiene que ver con la motivación del alumno?

Papel de la estadística: modelos teóricos. No hay relaciones de tipo determinista (causa–efecto). El


modelo que fabriquemos no va a ser “perfecto”: puede ser que diga poco, o que solo lo explique para un
colectivo. Dará una aproximación.
El modelo estadístico me ayudará a responder a la pregunta: ¿en qué grado se parecen mis datos al modelo?

v Tipos de relación
La relación entre dos variables puede ser de diversos tipos:
a) Relación lineal: Y = A + B · X
Línea recta. Dos razones para usar la relación lineal:
– Sencilla de entender.
– En la práctica muchas de las variables de Psicología se pueden modelizar mediante el modelo
lineal.
Sin embargo, puede ser que no sirva para explicar una relación.

b) Relación cuadrática: Y = X2
Forma de campana (U o U invertida).

c) Relación inversa: Y = 1 / X

En este tema hablaremos exclusivamente sobre relación lineal.

40
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647

v Tipos de relación lineal


Hablamos de 2 variables cuantitativas (X e Y). Si se elabora un gráfico de dispersión, tenemos pares de
puntuaciones de las mismas personas.

a) Relación lineal directa o positiva: Y = A + B · X


El patrón me dice que las puntuaciones altas en X se corresponden con valores altos en Y, y viceversa.
Ejemplo: peso y estatura; relación entre población en miles y número de farmacias; inteligencia y
rendimiento.

b) Relación lineal inversa o negativa: Y = A – B · X


A valores altos en X se corresponden valores bajos en Y. Pero, al igual que en la relación directa, a valores
medios se corresponden valores medios.
Ejemplo: relación entre autoestima y depresión; ansiedad y aciertos.

c) Relación lineal Nula / Independencia lineal:


No hay un emparejamiento sistemático entre X e Y en función de sus valores numéricos. No significa que no
haya relación entre las variables, sino que el modelo lineal no sirve para explicarlo.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejemplo: relación entre edad y colesterol total; extroversión y absentismo.

v Representación gráfica
Diagrama de dispersión
Solo para variables cuantitativas. Se dispone de N pares de puntuaciones en dos variables cuantitativas.
Importante: tienen que referirse a los mismos sujetos.
La variable X está en abscisas, la variable Y en ordenadas.
Al patrón visual se le denomina “nube de puntos”. No hay relación lineal perfecta, sino que se intuye.

Para interpretarlo, es útil definir los cuadrantes definidos por cada media: la media de X y la de Y.

Si los puntos caen en el b) y c), la relación es directa; si caen en a) y d), es inversa; si están repartidos por
todos, es nula.

2. CUANTIFICACIÓN DE LA RELACIÓN LINEAL (ÍNDICES DESCRIPTIVOS)


Calcular un estadístico que proporcione información acerca de si existe relación lineal, sin necesidad de
gráficos. Son procedimientos precisos que distinguen entre los 3 tipos de relación lineal y cuantifican su
intensidad.
Hay dos estadísticos: Covarianza y Correlación de Pearson.

Relación lineal perfecta: si la relación es de tipo determinista, el gráfico es una recta perfecta. Es casi
imposible.
En la práctica, se evalúan tendencias, es decir, hasta qué punto el modelo teórico se aproxima a lo que
encuentro empíricamente.

41

2x1 universitario - Foster’s Hollywood - fostershollywood2x1universitario.com

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647

v La Covarianza
Se evalúa cómo cambian las puntuaciones de una variable en función de los valores de la otra. Medida de
variación conjunta.
La fórmula es la misma que la de la varianza, solo que tiene en cuenta dos variables en lugar de una.

Promedio de los productos cruzados de las puntuaciones diferenciales.


*Producto cruzado: resultado de multiplicar, para cada individuo o caso, sus valores en las dos variables. N
es el número de pares de valores observados.
Al tratar con puntuaciones diferenciales, estas serán positivas si superan la media y negativas si no la
superan. Por tanto, sabiendo el cuadrante en que nos encontramos, podemos deducir el signo del producto
cruzado.

∑ !! ·!!
Fórmula: 𝑆!" =
!

Mientras que la varianza solo puede ser positiva, la covarianza: –∞ ≤ Sxy ≤ +∞

Dificultad de la covarianza como índice de la asociación lineal: no se puede interpretar. Solo dice si hay

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
relación positiva (directa) o negativa (inversa). Si fuera relación nula, daría 0.
Esto es porque, como no hay valores máximo y mínimo fijos, no tiene límites comunes a todos los casos que
permitan la interpretación inmediata. Tan solo medir en diferentes unidades la misma magnitud alteraría la
covarianza.

Otras fórmulas:
!! ·!!
– Fórmula más sencilla: 𝑆!" = !
– (𝑋 · 𝑌)

– Sxy = rxy · Sx · Sy

Trabajaremos con 3 ejemplos:


a) Relación entre inteligencia y rendimiento: la relación es lineal y directa, por lo que la covarianza
debería dar positiva.
b) Relación entre ansiedad y aciertos: relación lineal inversa. La covarianza debería dar negativa.
c) Relación entre extroversión y absentismo: relación lineal nula. Al cuantificar la covarianza, sale un
valor muy próximo al 0, aunque sea negativo (–0,08).

v Matriz de Varianzas-Covarianzas, S
Forma de colocar la información. Es una tabla cuadrada donde hay tantas filas como columnas (matriz
cuadrada); cada fila y cada columna corresponden a una variable. Lo que hay dentro de la tabla son las
fuentes de variación.
En la diagonal principal está la coincidencia entre variables (Sxx = S2x): covarianza de una variable consigo
misma o varianza. El resto de términos son las covarianzas, por arriba y por abajo.

42

2x1 universitario - Foster’s Hollywood - fostershollywood2x1universitario.com

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Resume todas las fuentes de variación: varianza y covarianza.

Es una matriz simétrica: la información está “repetida” arriba y abajo, es decir, Sxy = Syx. Por eso, basta con
hacer la tabla incompleta: con la diagonal principal y lo que hay por arriba.

Para completar la información, se suele escribir debajo de la matriz el vector de medias.

Es útil para hacer cuentas de otras cosas, pero no para interpretar:


a) Realizar los cálculos dirigidos a calcular la varianza de una combinación lineal de varianzas.
b) Ofrecer los estadísticos más importantes de un conjunto de variables en un formato compacto y
sencillo de entender.

v La Correlación de Pearson
Representa el grado en que los mismos individuos o casos ocupan la misma posición relativa en dos
variables.
∑ !! · !!
Fórmula: 𝑟!" = !

!! – !
Se hace con las puntuaciones típicas: 𝑧! = . Se tipifica, se convierten las puntuaciones en universales,
!!
con la misma media (0) y la misma varianza (1).

Da un valor entre –1 y +1, y eso sí se puede interpretar. –1 ≤ rxy ≤ +1


Da solución al problema de interpretación de la covarianza.

La correlación es una covarianza hallada sobre puntuaciones típicas, por lo que a veces se dice que es una
‘covarianza estandarizada’ o ‘covarianza adimensional’.

Otras fórmulas:

(!· !! · !! ) –( !! · !! )
– Desarrollo de la otra (más sencilla): 𝑟!" =
! !
!· !!! –( !! ) · !· !! ! –( !! )

!!"
– Fórmula que usaremos mucho: 𝑟!" = !! · !!

!! · !!
– 𝑟!" = !· !! · !!

43
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647

Si da positivo y grande, la relación es alta.

v Propiedades de la covarianza y la correlación


1) –∞ ≤ Sxy ≤ +∞
–1 ≤ rxy ≤ +1

Sxy y rxy tienen el mismo signo.


La máxima correlación entre dos variables (1) se obtiene cuando las puntuaciones en ambas variables son
equivalentes, es decir, zx = zy. Cuando el signo de las puntuaciones es opuesto, se obtiene la mínima
correlación (–1).

2) Sxy = Syx // rxy = ryx

3) En las transformaciones lineales, la covarianza se altera pero la correlación de Pearson no.


Si: U = a · X + b; V = c · Y + d

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
– La correlación queda igual: ruv = rxy en caso de que las constantes multiplicadoras sean positivas
o negativas (ambas).
– La covarianza sí varía: Suv = a · c · Sxy
Si las constantes tienen signo opuesto, daría una covarianza negativa, por lo que la correlación inicial
también sería negativa: ruv = –rxy.

4) Si la desviación típica de alguna de las variables es 0, la correlación es indeterminada. En términos


gráficos, esto ocurre cuando los puntos están en perfecta línea recta y esta es paralela a alguno de los ejes.
Esta característica recibe el nombre de colinealidad.

v Matriz de Correlaciones, R
Se miden conjuntos de variables y se cuantifican sus relaciones lineales, dos a dos, mediante sendos
coeficientes de correlación de Pearson.

Expresa lo mismo que la matriz de Varianzas-Covarianzas pero en puntuaciones típicas. Interesa elaborarla
para interpretar, hacer valoraciones de la relación lineal.
También es una matriz cuadrada. Se tienen correlaciones.
La correlación de una variable consigo misma (en la diagonal principal) es una correlación perfecta. Si,
además, sabemos que esta matriz es lo mismo que la otra matriz pero en típicas, en la diagonal principal
estará formada por 1.
La matriz es simétrica con respecto a la diagonal principal: al igual que antes, solo se pone lo que hay por
encima o por debajo de la diagonal (incluso podríamos obviar la diagonal principal, sabiendo que es 1). Es
lo que se denomina ‘matriz triangular superior’ o ‘matriz triangular inferior’.

44

2x1 universitario - Foster’s Hollywood - fostershollywood2x1universitario.com

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647

Ejemplos:
– Correlación positiva entre inteligencia y rendimiento: relación lineal.
– Correlación negativa entre ansiedad y aciertos: relación inversa.
– Correlación prácticamente 0 para extroversión y absentismo: relación nula.
– Extroversión correlaciona de manera positiva con ansiedad: a mayor extroversión, mayor ansiedad.
– Datos que llaman la atención: correlación 0,00 entre inteligencia y aciertos entre ansiedad y
absentismo.
– Correlación negativa y alta entre aciertos y extroversión.

v Relación entre las matrices S y R


1) Pasar de S a R (volcado de la matriz). Aplicar la fórmula siguiente para cada par de covarianzas:
𝑆!"
𝑟!" =
𝑆! · 𝑆!

Cociente entre las covarianzas y el producto de las desviaciones típicas.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
No olvidar sacar la raíz de la diagonal principal para el denominador.

2) Pasar de R a S (volcado inverso). Aplicar la siguiente fórmula:


𝑆!" = 𝑟!" · 𝑆! · 𝑆!

Se necesita la varianza.

v Interpretación de rxy
La correlación de Pearson indica el grado de relación lineal (positiva, negativa o nula) que existe entre dos
variables cuantitativas (X e Y).
Como da valores entre –1 y +1, se puede interpretar en términos relativos.

Pasos:
1) Examinar la magnitud absoluta: CUANTÍA
– |rxy| = 0 à Relación lineal nula.
– |rxy| à 1 à Relación lineal.

2) Examinar su signo: SENTIDO


– rxy > 0 à Relación lineal directa.
– rxy < 0 à Relación lineal inversa.
El signo no se interpreta en términos numéricos, únicamente indica si la relación es directa o inversa. Así,
una correlación de –0,70 es mayor que una de 0,5 porque se interpreta el valor absoluto.

0 significa que no hay correlación: correlación nula.


Hasta 0,3, interpretamos que la correlación es baja. A partir de 0,31 hasta 0,6 es media. Por encima de 0,6
hasta 1 es alta.
Sin embargo, esto depende del contexto. En cada área de estudio se va desarrollando un conocimiento que
permite valorar los coeficientes de correlación en términos relativos.
45

2x1 universitario - Foster’s Hollywood - fostershollywood2x1universitario.com

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647

Cuanto más cercano quede un coeficiente del valor cero, menos apto es el modelo lineal como descripción
de la relación entre las variables. Cuanto más se acerque a los extremos, mejor describe esa relación.

Propiedades de rxy:
1) En la práctica, se eleva al cuadrado la correlación de Pearson, pues así evito el problema del signo.
2
r xy · 100 à Indicador del porcentaje de variabilidad común entre X e Y.

Es como se debe interpretar.


Por ejemplo, una correlación de 0,7 supone que las variables comparten un 49% de variabilidad común (lo
que tienen en común las variables de 0 a 100).

2) rxy = 0 no implica que no hay relación entre X e Y. Solo significa que no hay relación de tipo lineal.
Puede haber relación de otro tipo (por ejemplo, cuadrática).

3) Factores que afectan a la correlación de Pearson:


!!"
– Dada la fórmula 𝑟!" = ! · ! , será la variabilidad de X, Y y XY lo que le afecte.
! !

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
– Terceras variables (efectos moderadores).
– Que X e Y estén bien medidas (fiabilidad).
– La muestra en que se evalúen X e Y. Cuantos más sujetos mejor, porque la población estará
mejor representada.

4) Para decidir si X e Y están linealmente relacionadas, la información descriptiva no es suficiente: se


realiza una prueba de significación estadística (contraste de hipótesis sobre ρxy).

5) La correlación nunca implica causalidad, solo grado de relación lineal.

*Relación “espuria”: no aporta datos con rigor.

Ejemplos de situaciones engañosas:


Variables con un rango restringido: población ρ = 0,80; muestra r = 0,25. La conclusión es que no hay
correlación o que es muy baja, cuando realmente es muy alta. Es una muestra poco representativa.
Variables en las que se mezclan grupos no homogéneos: en la población, hay relación nula entre colesterol
y edad. Sin embargo, el sexo modula esa relación: en las mujeres hay relación lineal.

v Ejemplos de correlación en variables psicológicas

Variables rxy
Depresión –0,58
Autoestima (niños)
Deterioro de actividades cotidianas –0,50
Calidad de la red social
Deterioro de actividades cotidianas –0,02
Número de diagnósticos médicos (ancianos)
Fluidez verbal –0,28
Edad (ancianos)

46

2x1 universitario - Foster’s Hollywood - fostershollywood2x1universitario.com

También podría gustarte