Documentos de Académico
Documentos de Profesional
Documentos de Cultura
www.wuolah.com/student/Esmeralda4
18875
TEMA 5.pdf
Bloque II: Estadística Descriptiva Bivariada
1º Análisis de Datos I
Grado en Psicología
Facultad de Psicología
UAM - Universidad Autónoma de Madrid
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647
1. RELACIÓN LINEAL
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
§ Objetivo de la ciencia: utilizar el método científico para descubrir relaciones entre variables.
Ejemplo: velocidad de un objeto.
Son funciones teóricas que reflejan relaciones de tipo determinista (relaciones causa–efecto), es decir, se
puede predecir de forma exacta un resultado en función de los valores de otras variables.
En Psicología
Algunas preguntas que nos hacemos:
– ¿La satisfacción en el trabajo guarda relación con la personalidad del trabajador?
– ¿El fracaso escolar tiene que ver con la motivación del alumno?
v Tipos de relación
La relación entre dos variables puede ser de diversos tipos:
a) Relación lineal: Y = A + B · X
Línea recta. Dos razones para usar la relación lineal:
– Sencilla de entender.
– En la práctica muchas de las variables de Psicología se pueden modelizar mediante el modelo
lineal.
Sin embargo, puede ser que no sirva para explicar una relación.
b) Relación cuadrática: Y = X2
Forma de campana (U o U invertida).
c) Relación inversa: Y = 1 / X
40
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejemplo: relación entre edad y colesterol total; extroversión y absentismo.
v Representación gráfica
Diagrama de dispersión
Solo para variables cuantitativas. Se dispone de N pares de puntuaciones en dos variables cuantitativas.
Importante: tienen que referirse a los mismos sujetos.
La variable X está en abscisas, la variable Y en ordenadas.
Al patrón visual se le denomina “nube de puntos”. No hay relación lineal perfecta, sino que se intuye.
Para interpretarlo, es útil definir los cuadrantes definidos por cada media: la media de X y la de Y.
Si los puntos caen en el b) y c), la relación es directa; si caen en a) y d), es inversa; si están repartidos por
todos, es nula.
Relación lineal perfecta: si la relación es de tipo determinista, el gráfico es una recta perfecta. Es casi
imposible.
En la práctica, se evalúan tendencias, es decir, hasta qué punto el modelo teórico se aproxima a lo que
encuentro empíricamente.
41
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647
v La Covarianza
Se evalúa cómo cambian las puntuaciones de una variable en función de los valores de la otra. Medida de
variación conjunta.
La fórmula es la misma que la de la varianza, solo que tiene en cuenta dos variables en lugar de una.
∑ !! ·!!
Fórmula: 𝑆!" =
!
Dificultad de la covarianza como índice de la asociación lineal: no se puede interpretar. Solo dice si hay
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
relación positiva (directa) o negativa (inversa). Si fuera relación nula, daría 0.
Esto es porque, como no hay valores máximo y mínimo fijos, no tiene límites comunes a todos los casos que
permitan la interpretación inmediata. Tan solo medir en diferentes unidades la misma magnitud alteraría la
covarianza.
Otras fórmulas:
!! ·!!
– Fórmula más sencilla: 𝑆!" = !
– (𝑋 · 𝑌)
– Sxy = rxy · Sx · Sy
v Matriz de Varianzas-Covarianzas, S
Forma de colocar la información. Es una tabla cuadrada donde hay tantas filas como columnas (matriz
cuadrada); cada fila y cada columna corresponden a una variable. Lo que hay dentro de la tabla son las
fuentes de variación.
En la diagonal principal está la coincidencia entre variables (Sxx = S2x): covarianza de una variable consigo
misma o varianza. El resto de términos son las covarianzas, por arriba y por abajo.
42
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Resume todas las fuentes de variación: varianza y covarianza.
Es una matriz simétrica: la información está “repetida” arriba y abajo, es decir, Sxy = Syx. Por eso, basta con
hacer la tabla incompleta: con la diagonal principal y lo que hay por arriba.
v La Correlación de Pearson
Representa el grado en que los mismos individuos o casos ocupan la misma posición relativa en dos
variables.
∑ !! · !!
Fórmula: 𝑟!" = !
!! – !
Se hace con las puntuaciones típicas: 𝑧! = . Se tipifica, se convierten las puntuaciones en universales,
!!
con la misma media (0) y la misma varianza (1).
La correlación es una covarianza hallada sobre puntuaciones típicas, por lo que a veces se dice que es una
‘covarianza estandarizada’ o ‘covarianza adimensional’.
Otras fórmulas:
(!· !! · !! ) –( !! · !! )
– Desarrollo de la otra (más sencilla): 𝑟!" =
! !
!· !!! –( !! ) · !· !! ! –( !! )
!!"
– Fórmula que usaremos mucho: 𝑟!" = !! · !!
!! · !!
– 𝑟!" = !· !! · !!
43
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
– La correlación queda igual: ruv = rxy en caso de que las constantes multiplicadoras sean positivas
o negativas (ambas).
– La covarianza sí varía: Suv = a · c · Sxy
Si las constantes tienen signo opuesto, daría una covarianza negativa, por lo que la correlación inicial
también sería negativa: ruv = –rxy.
v Matriz de Correlaciones, R
Se miden conjuntos de variables y se cuantifican sus relaciones lineales, dos a dos, mediante sendos
coeficientes de correlación de Pearson.
Expresa lo mismo que la matriz de Varianzas-Covarianzas pero en puntuaciones típicas. Interesa elaborarla
para interpretar, hacer valoraciones de la relación lineal.
También es una matriz cuadrada. Se tienen correlaciones.
La correlación de una variable consigo misma (en la diagonal principal) es una correlación perfecta. Si,
además, sabemos que esta matriz es lo mismo que la otra matriz pero en típicas, en la diagonal principal
estará formada por 1.
La matriz es simétrica con respecto a la diagonal principal: al igual que antes, solo se pone lo que hay por
encima o por debajo de la diagonal (incluso podríamos obviar la diagonal principal, sabiendo que es 1). Es
lo que se denomina ‘matriz triangular superior’ o ‘matriz triangular inferior’.
44
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647
Ejemplos:
– Correlación positiva entre inteligencia y rendimiento: relación lineal.
– Correlación negativa entre ansiedad y aciertos: relación inversa.
– Correlación prácticamente 0 para extroversión y absentismo: relación nula.
– Extroversión correlaciona de manera positiva con ansiedad: a mayor extroversión, mayor ansiedad.
– Datos que llaman la atención: correlación 0,00 entre inteligencia y aciertos entre ansiedad y
absentismo.
– Correlación negativa y alta entre aciertos y extroversión.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
No olvidar sacar la raíz de la diagonal principal para el denominador.
Se necesita la varianza.
v Interpretación de rxy
La correlación de Pearson indica el grado de relación lineal (positiva, negativa o nula) que existe entre dos
variables cuantitativas (X e Y).
Como da valores entre –1 y +1, se puede interpretar en términos relativos.
Pasos:
1) Examinar la magnitud absoluta: CUANTÍA
– |rxy| = 0 à Relación lineal nula.
– |rxy| à 1 à Relación lineal.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-996647
Cuanto más cercano quede un coeficiente del valor cero, menos apto es el modelo lineal como descripción
de la relación entre las variables. Cuanto más se acerque a los extremos, mejor describe esa relación.
Propiedades de rxy:
1) En la práctica, se eleva al cuadrado la correlación de Pearson, pues así evito el problema del signo.
2
r xy · 100 à Indicador del porcentaje de variabilidad común entre X e Y.
2) rxy = 0 no implica que no hay relación entre X e Y. Solo significa que no hay relación de tipo lineal.
Puede haber relación de otro tipo (por ejemplo, cuadrática).
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
– Terceras variables (efectos moderadores).
– Que X e Y estén bien medidas (fiabilidad).
– La muestra en que se evalúen X e Y. Cuantos más sujetos mejor, porque la población estará
mejor representada.
Variables rxy
Depresión –0,58
Autoestima (niños)
Deterioro de actividades cotidianas –0,50
Calidad de la red social
Deterioro de actividades cotidianas –0,02
Número de diagnósticos médicos (ancianos)
Fluidez verbal –0,28
Edad (ancianos)
46