Está en la página 1de 11

09/03/2021

Grado en Psicología

ESTADÍSTICA Y ANÁLISIS DE DATOS


APLICADOS A LA PSICOLOGÍA

TEMA 3
Análisis de la asociación entre variables y
su predicción

CONTENIDOS

1. Distribución conjunta, marginal y condicionada

2. Representaciones gráficas de distribuciones


conjuntas

3. Correlación entre variables cuantitativas

4. Correlación entre variables cualitativas

5. Regresión lineal

1
09/03/2021

1. Distribución conjunta, marginal y condicionada

En el tema anterior veíamos cómo organizar las puntuaciones de


una variable en una distribución de frecuencias (distribución
univariada). En esta ocasión veremos cómo organizar
conjuntamente los datos provenientes de dos variables
(bivariada).

En este caso contamos con n pares de observaciones que


provienen de dos variables X e Y. La variable X tiene f categorías
y la variable Y tiene c categorías, por lo que si consideramos
conjuntamente ambas variables, tendremos un total de f ꞏ c
categorías conjuntas.

1.1. Distribución conjunta de dos variables

Y
X Y1 Y2 … Yj … Yc
X1 n11 n12 … n1j n1c n1.
X2 n21 n22 … n2j … n2c n2.
… … … … … … … …
Xi ni1 ni2 … nij … nic ni.
… … … … … … … …
Xf nf1 nf2 … nfj … nfc nf.
n.1 n.2 … n.j … n.c n
f c

 n
i 1 j 1
ij n
Esta sería la distribución conjunta de frecuencias absolutas de X e Y. Podemos
hacer la distribución conjunta de frecuencias relativas dividiendo cada valor de nij
f c
entre n. En ese caso:
 p
i 1 j 1
ij 1

2
09/03/2021

Veamos un ejemplo:

Variable X: Opinión sobre el uso de la energía nuclear


Variable Y: Ideología política
Y
X (1) Izquierda (2) Centro (3) Derecha
(1) A favor 5 8 20 33
(2) En contra 25 15 8 48
(3) Sin opinión 7 5 7 19
37 28 35 100

¿Cuál es el valor de n? ¿Cuál es el valor de n1.?

¿Cuál es el valor de n11? ¿Cuál sería el valor de p21?

¿Cuál es el valor de n23? ¿Total de encuestados de centro?

¿Cuál es el valor de n.2? ¿Total de encuestados a favor de la energía nuclear?

1.2. Distribuciones marginales

Una distribución marginal es la distribución de frecuencias de cada una de


las variables que se representan en una distribución conjunta.
Y
X Izquierda Centro Derecha
A favor 5 8 20 33 Distribución
En contra 25 15 8 48 conjunta
Sin opinión 7 5 7 19 de X e Y
37 28 35 100

Distribución marginal de X: Distribución marginal de Y:


X ni Y nj
A favor 33 Izquierda 37
En contra 48 Centro 28
Sin opinión 19 Derecha 35
100 100

n = ni.=33+48+19=100 n = n.j=37+28+35=100

La distribución marginal de X es independiente de la de Y, y viceversa.

3
09/03/2021

1.3. Distribuciones condicionadas

Las distribuciones condicionadas indican la asociación entre los valores de


una variable con uno de los valores de la otra variable.
Y
X Izquierda Centro Derecha
A favor 5 8 20 33
En contra 25 15 8 48
Sin opinión 7 5 7 19
37 28 35 100

Distribución condicionada de Ideología política a la categoría “En contra”


(distribución condicionada de Y cuando i=2).
Y
X Izquierda Centro Derecha
En contra 25 15 8

Distribución condicionada de X cuando j=3:


Y
X Derecha
A favor 20
En contra 8
Sin opinión 7

Para las distribuciones condicionadas también podemos considerar las


frecuencias relativas. Por ejemplo, para calcular las proporciones de la
distribución de X condicionada a la categoría j de Y:
nij
pxi / Yi 
n. j
donde nij serían las frecuencias conjuntas y n.j sería la frecuencia marginal.
Ejemplo: distribución de X condicionada a Y cuando j=2
Y
X Izquierda Centro Derecha
A favor 5 8 20 33
En contra 25 15 8 48 Distribución conjunta
Sin opinión 7 5 7 19
37 28 35 100

Y
X Centro Distribución de X
A favor 0,28 8/28=0,28 condicionada a Y
En contra 0,54 15/28=0,54 cuando j=2 (Centro)
Sin opinión 0,18 5/28=0,18
n.2=28

De las personas que son de centro, una proporción de 0,28 está a favor de la energía nuclear, un
0,54 en contra y el 0,18 restante no tiene una opinión al respecto.

4
09/03/2021

2. Representaciones gráficas de distribuciones conjuntas


2.1. Variables cualitativas

25
Frecuencias absolutas

20

15

10

5 Derecha

Centro
0 Ideología política
Izquierda
A favor
En contra
Sin opinión
Energía nuclear

2.2. Variables cuantitativas

Representación gráfica tridimensional

20
18
16
14
12
Frecuencias
10
absolutas
8
6
4 4
2
3
0 Horas de estudio
10 2
15
20
25
Nº respuestas correctas

5
09/03/2021

Diagrama de dispersión
Velocidad (Km/h) TR (mseg)
77 300
79 321
80 321
80 352 600
85 390
89 281 550
89 320
90 370 500
Tiempo de reacción (mseg)
90 416
93 360 450
94 350
96 340
400
98 360
101 310
103 430 350
104 390
104 420 300
106 430
107 334 250
107 436
110 390 200
110 423 70 80 90 100 110 120
110 422
113 500 Velocidad de desplazamiento
114 560
114 421
115 453
118 453
119 529
120 418

3. Correlación entre variables cuantitativas


Con la distribución conjunta de dos variables y su representación gráfica
podemos hacernos una idea de la relación que hay entre ambas. Sin embargo,
necesitamos una serie de índices que cuantifiquen esa relación.

3.1. La covarianza

La covarianza indica la variabilidad conjunta de dos variables y es una


medida de la relación que hay entre ambas.

Cálculo con datos no agrupados en intervalos:

S xy 
 (X i  X )(Y j  Y )

XY i j
 XY
n n
Cálculo con datos agrupados en intervalos:

S xy 
 n ij ( X i  X )( Y j  Y )

 n ij X i Y j
 XY
n n

6
09/03/2021

El valor de la covarianza puede ser positivo o negativo. Si es la


covarianza es positiva indica que hay una relación directa entre las
variables. Si es negativa indica que hay una relación inversa entre las
dos variables.

Si la covarianza es cero, indica que no hay relación entre las variables


X e Y.

Los diagramas de dispersión siguientes muestran esto gráficamente.

RELACIÓN POSITIVA

25

20

15
Y

10

0
0 5 10 15 20 25
X

7
09/03/2021

RELACIÓN NEGATIVA

25

20

15
y

10

0
0 5 10 15 20 25
x

SIN RELACIÓN

25

20

15
Y

10

0
0 5 10 15 20 25
X

8
09/03/2021

¿Cuán relacionadas están dos variables cuya covarianza es de 98,56?

El valor de la covarianza es difícil de interpretar porque no sólo


depende de la intensidad de la relación, sino también de las unidades
en que se han medido las variables.

Una solución sería calcular la covarianza con puntuaciones típicas,


que no tienen unidad de medida, en lugar de con puntuaciones
directas.

Pues bien, este nuevo índice es el coeficiente de correlación de


Pearson.

3.2. Coeficiente de correlación de Pearson

El coeficiente de correlación de Pearson cuantifica la relación lineal


que hay entre dos variables, y sería la covarianza entre las
puntuaciones típicas de las variables X e Y:

 ( Xi  X )  (Yj Y ) 
 
 S 

rxy 
Z Z x y

i j  S X  Y 
n n
Desarrollando la ecuación anterior llegamos a la siguiente expresión:

S XY
rxy 
S X SY

9
09/03/2021

O a estas otras que son las que emplearemos con puntuaciones directas,
en función de que tengamos datos sin agrupar:

nXYXY
rxy 
nX2 (X)2 nY2(Y)2

O datos agrupados en intervalos:

n nijXY   niX  njY


rxy 
n niX 2  ( niX ) 2 n njY 2  ( njY ) 2

Ejemplo:
Vamos a hallar el coeficiente de correlación de Pearson de las variables X e
Y a partir de puntuaciones directas.

X Y XY X2 Y2 También podemos calcular las desviaciones


8 17 136 64 289 típicas y la covarianza para hallar el
24 18 432 576 324 coeficiente:
27 18 486 729 324
25 18 450 625 324 S XY 2 , 22
23 19 437 529 361 rxy    0 , 2345
16 19 304 256 361 S X SY 6 , 99 ꞏ1, 41
19 20 380 361 400
33 20 660 1089 400
20 22 440 400 484
195 171 3725 4629 3267

n XY   X Y (9ꞏ3725)  (195ꞏ171)
rxy    0,2345
n X  ( X )
2 2
nY (Y )
2 2
9ꞏ4629 (195)2 9ꞏ3267 (171)2

10
09/03/2021

Propiedades del coeficiente de correlación de Pearson:

1. rxy será siempre un valor comprendido entre –1 y +1.

2. Cuando la relación es exacta rxy es igual a 1 en valor absoluto.

3. Cuando las variables no están relacionadas rxy es igual a 0.

4. rxy no depende del orden en que se consideran las variables: rxy = ryx

5. rxy no se altera por transformaciones lineales de la variable. Es decir,


r(aX+b, cY+d)= r(X,Y), si a y c son del mismo signo.

11

También podría gustarte