Está en la página 1de 21

Estudio de la dependencia o asociación entre

dos variables cuantitativas

Consiste en analizar la dependencia o asociación existente


entre dos variables cuantitativas, utilizando, en una primera
etapa, la Estadística Descriptiva.

Elemento X Y
De
muestra ¿Están asociadas?
1 X1 Y1
2 X2 Y2
3 X3 Y3
Use los gráficos de dispersión y
… … … las medidas de
n Xn Yn asociación

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 1
Diagrama de dispersión de datos
cuantitativos
Consiste en ubicar en un sistema de ejes cartesianos, las parejas de
valores poblacionales o muestrales (x , y) correspondientes a las
variables cuantitativas X e Y, respectivamente, que permitirá
determinar, de manera preliminar, si existe o no dependencia o
asociación entre las variables.

Y
. . .
. .. .
(X2,Y2)

. . .
(Xn,Yn)
(X1,Y1)

. . .
. . X
.
UNIVERSIDAD DEL PACÍFICO
ESTADÍSTICA I 2
Medidas de asociación o dependencia para
variables cuantitativas

Tienen como objetivo medir la intensidad de la dependencia


o grado de asociación que existe entre el comportamiento
de dos variables cuantitativas

Medidas de
dependencia COVARIANCIA
absoluta

COEFICIENTE DE
Medidas de
CORRELACIÓN DE
dependencia relativa
PEARSON

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 3
Covariancia

Medida estadística que puede tomar cualquier valor real y


que sirve para determinar el tipo de dependencia o de
asociación (directa o inversa) que existe entre dos variables
cuantitativas.
P O B L A C IO N A L
N

∑ (x − µ
i =1
X )( y − µ Y )
C ov ( x , y ) = σ X ,Y =
N

M UESTRAL
n

∑ ( x − x )( y − y )
Cˆ o v ( x , y ) = S X , Y = i =1

n −1
UNIVERSIDAD DEL PACÍFICO
ESTADÍSTICA I 4
Coeficiente de Correlación de Pearson
Medida estadística que puede tomar un valor entre -1 y +1,
y que permite determinar, además del tipo de dependencia,
el grado de dependencia o de asociación, en términos
relativos, que existe entre dos variables cuantitativas.
P O B L A C IO N A L
N

C o v ( X ,Y )

i =1
( x − µ X )( y − µ Y )
ρ X ,Y = =
σ σ N N

∑ ∑
X Y 2
(x − µ X ) ( y − µY )2
i =1 i =1

M UESTRAL
n

S X ,Y ∑ ( x − x )( y −
i =1
y)
ρˆ X ,Y = rX ,Y = =
SX SY n n

∑ (x − x ) ∑ ( y −
i =1
2

i =1
y )2

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 5
Covariancia, Coeficiente de correlación de Pearson,
Suma de productos corregida y Sumas de cuadrados
corregidas con datos muestrales

SP ( X ,Y )
Cˆ o v ( X , Y ) = S X ,Y =
n −1
S X ,Y SP ( X ,Y )
ρˆ X ,Y = rX ,Y = =
S X SY S C ( X ) i S C (Y )
siendo:
n n
( ∑ x )( ∑ y )
SP ( X ,Y ) = ∑
i =1
( x − x )( y − y ) = ∑
i =1
xy −
n
(∑
2
n n x)
SC ( X ) = ∑i =1
( x − x )2 = ∑i =1
x2 −
n
(∑
2
n n y)
S C (Y ) = ∑
i =1
( y − y )2 = ∑
i =1
y2 −
n

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 6
Diagrama de dispersión para datos de variables
cuantitativas, covariancia y correlación

Asociación o Relación Lineal directa y perfecta

Cov( x, y ) > 0, ρ X ,Y = 1

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 7
Diagrama de dispersión para datos de variables
cuantitativas, covariancia y correlación

Asociación o Relación lineal directa e imperfecta

Cov( x, y ) > 0, 0 < ρ X ,Y < 1

UNIVERSIDAD DEL PACÍFICO


8
ESTADÍSTICA I
Diagrama de dispersión para datos de variables
cuantitativas, covariancia y correlación

Asociación o Relación lineal inversa y perfecta

Cov( x, y ) < 0, ρ X ,Y = -1

UNIVERSIDAD DEL PACÍFICO


9
ESTADÍSTICA I
Diagrama de dispersión para datos de variables
cuantitativas, covariancia y correlación

Asociación o Relación inversa e imperfecta

Cov( x, y ) < 0, − 1 < ρ X ,Y < 0

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 10
Diagrama de dispersión para datos de variables
cuantitativas, covariancia y correlación

Poca o ninguna asociación

Cov( x, y ) ≅ 0, ρ X ,Y ≅ 0

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 11
Cálculo de la covariancia y del coeficiente de
correlación de Pearson : Ejemplo

En un estudio sobre la relación entre el sueldo promedio de los


integrantes del equipo de trabajo (en miles de soles) y la
productividad (puntaje),se obtuvo la siguiente información

Equipo Productividad Sueldo Prom.


(i) (Y) (X)
1 42 2 ¿Qué se puede afirmar
sobre la asociación
2 39 2
entre las variables
3 48 3 Productividad y Sueldo
4 51 3 promedio ?
5 49 2.5
6 53 2.5
7 51 3.5
8 60 3.5

UNIVERSIDAD DEL PACÍFICO


12
ESTADÍSTICA I
Diagrama de dispersión: Ejemplo

MedAsoc-Prod-Sueldo.txt

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 13
Cálculo de la covariancia y del coeficiente de
correlación de Pearson: Ejemplo

∑ X = 22, ∑ = 63,
X 2
∑ Y = 393, ∑ = 19601
Y 2

∑ X Y = 1102.5, SP( X , Y ) = 21.75, SC(X) = 2.5,


SC(Y) =294.875

ˆ SP( X , Y ) 21.75
Cov( X , Y ) = = = 3.107143
n −1 8 −1

SP( X , Y ) 21.75
ρˆ X ,Y = rX ,Y = = = 0.80107
SC ( X ) SC (Y ) (2.5)(294.875)

UNIVERSIDAD DEL PACÍFICO


14
ESTADÍSTICA I
Coeficiente de Correlación de Spearman

Se aplica para medir la asociación entre variables, una de


cuales o ambas son ordinales.

POBLACION AL MUESTRAL
n n
6∑ D 2
i 6 ∑ d i2
i =1
ρS = 1 − 2 rS = 1 − i =1
2
N ( N − 1) n ( n − 1)

Di=diferencia de rangos poblacionales di=diferencia de rangos muestrales


corregidos por empates. corregidos por empates.
Di = RX,i – RY,i Di = rX,i – rY,i
N = tamaño poblacional n = tamaño muestral

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 15
Coeficiente de Correlación de Spearman - Ejemplo
Se realiza un estudio, que comprende a bodegas. El estudio comprende entre otros
objetivos, la calificación de los propietarios de la bodegas en relación al apoyo
publicitario que reciben de la empresa fabricante dos productos complementarios: el
detergente de marca A y el suavizante de marca B. A los encuestados se les indica
que la calificación debe realizarse considerando los valores 0 (lo peor), 1, 2, 3, 4, 5 (lo
mejor). La muestra de 7 propietarios de bodegas proporciona la siguiente información:

Bodega Calificación A Calificación B


1 14.8 15.1
2 14.3 15.1
3 14.9 14.1
4 14.1 13.8
5 15.2 14.6
6 14.1 14.3
7 13.6 15.1

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 16
Coeficiente de Correlación de Spearman - Ejemplo
Rangos de Calificaciones (Número de orden de menor a mayor
Calificación para cada producto)

Producto A Producto B
Establecimiento Calific. Rango A Calific. Rango B
1 3 5 5 5
2 2 4 5 6
3 4 6 2 2
4 1 2 1 1
5 5 7 4 4
6 1 3 3 3
7 0 1 5 7

UNIVERSIDAD DEL PACÍFICO


17
ESTADÍSTICA I
Coeficiente de Correlación de Spearman - Ejemplo

Rangos de precios corregidos por empates, y diferencias di

Producto A Producto B Diferencia


Rango Rango
Bodega Calific. corregido Calific. corregido di
1 3 5 5 6 -1
2 2 4 5 6 -2
3 4 6 2 2 4
4 1 2.5 1 1 1.5
5 5 7 4 4 3
6 1 2.5 3 3 -0.5
7 0 1 5 6 -5

UNIVERSIDAD DEL PACÍFICO


18
ESTADÍSTICA I
Diagrama de dispersión de rangos corregidos: Ejemplo

Diagrama de dispersión de Rango corregido de A y Rango corregido de B


6

5
Rango Corr B

1 2 3 4 5 6 7
Rango Corr A

¿Qué se puede deducir del gráfico?

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 19
Coeficiente de Correlación de Spearman - Ejemplo

Considerando que n=7

∑i
d
i=1
2
= (−1)2
+ (−2)2
+ (4)2
+ (1.5)2
+ (3)2
+ (−0.5)2
+ (−5)2
= 57.5

rS = 1 −
(6) ( ∑d ) = 1 −
2
i (6)(57.5)
= −0.0267857
(n) n 2 − 1 (7) 7 − 1
2

UNIVERSIDAD DEL PACÍFICO


ESTADÍSTICA I 20
Correlación espuria

X: Consumo mensual de mantequilla (en Kgs)


r=0.90
Y: Gasto mensual en lapiceros (soles)

Correlación o asociación alta entre el


Consumo mensual de mantequilla y el
Gasto mensual en lapiceros

¿Es lógico que a mayor consumo de mantequilla


Se presente mayor gasto en lapiceros?

La correlación es espuria
UNIVERSIDAD DEL PACÍFICO
ESTADÍSTICA I 21

También podría gustarte