Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ventajas y Desventajas de Medidas de Correlacion Lineal
Ventajas y Desventajas de Medidas de Correlacion Lineal
Ventajas y Desventajas de Medidas de Correlacion Lineal
Contenidos de la clase:
|
Medidas de dispersin:
z
z
Medidas:
z
z
z
z
z
qu son?
en qu
Ejercicios de aplicacin
Frmulas
Frmulas para
datos originales y
agrupados
Ventajas y
desventajas
Medidas de dispersin
|
Indican si las p
puntuaciones
nt aciones son m
muy parecidas o m
muy distintas entre
s.
Las siguientes distribuciones tienen todas una media de 4. Qu las
diferencia?
7, 6, 3, 3, 1
3, 4, 4, 5, 4
4, 4, 4, 4, 4
Existen dos procedimientos:
z
z
Considerar
C
id
ell recorrido
id o amplitud
lit d d
de lla escala
l en lla que se
distribuyen las puntuaciones;
Describir la variacin por medio de las diferencias que se
producen entre todas las puntuaciones y un ndice de
tendencia central.
Medidas de dispersin
|
qu
En
q se diferencian con las medidas de tendencia
central?
|
Son complementarias
Para calcular algunas medidas de dispersin es necesario
conocer los valores de otras medidas
Ambos tipos de medidas son necesarias para una
descripcin acabada de una distribucin
Rango o recorrido
Se calcula
S
l l restndole
t d l all valor
l ms
alto
lt d
de
una distribucin, el valor ms bajo
| Se aplica tanto a distribuciones de datos
originales, como a distribuciones de datos
agrupados.
d
|
Distribucindepasessegnporcentajedelapoblacinde15yms
Distribucin
de pases segn porcentaje de la poblacin de 15 y ms
aosdeedadanalfabeta,AmricaLatinayelCaribe.Ao2010
L.Inf. L.Sup
0a5
5a10
10a20
20a42
n (total)
n(total)
Xc
2,5
7,5
15
31
fi
14
8
3
3
28
fr (%)
50
28
11
11
100
Fi
14
22
25
28
Fr(%)
50
78
89
100
Ai
5
5
10
22
Fuente: Elaboracin propia en base a datos de CEPAL: Anuario estadstico de Amrica Latina y el Caribe, 2009
MEDIDA
Rango o
recorrido
VENTAJAS
DESVENTAJAS
Es muy general, tan slo nos
da una idea de cun amplia
p es
la variacin entre puntajes
extremos.
No toma en cuenta los valores
intermedios de la distribucin
distribucin.
Es la diferencia entre el Q1 y el Q3
Nos indica la dispersin en el 50% central de la distribucin
Es ms sensible a la concentracin de los datos que el
recorrido ordinario
Su clculo es indistinto para datos originales como para datos
agrupados.
RI = Q3 Q1
Rango intercuartlico
Rangointercuartlico
Q1
25%
Q2
25%
P25
Q3
25%
P50
25%
P75
RI = Q3 Q1
|
|
Datos originales
g
20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
Q1 = 1/ 4n = 0,25 * 12 = 3
Q3 = 3 / 4n = 0,75* 12 = 9
18, 20, 20, 24, 32, 32, 32, 48, 49, 53, 59, 63
Q1
=(20+24)/2
=22
RI = 51 22 = 29.aos
Q3
=(49+53)/2
=51
RI = Q3 Q1
|
Datos
agrupados
Distribucindepasessegnporcentajedelapoblacinde15yms
aaosdeedadanalfabeta,AmricaLatinayelCaribe.Ao2010
os de edad a a abeta,
ca at a y e Ca be. o 0 0
L.Inf. L.Sup
Xc
fi
fr (%)
Fi
Fr(%) Ai
0a5
2,5
14
50
14
50
5
Lmite inferior del
5a10
7,5
8
28
22
78
5
que contiene
intervalo q
10 20
10a20
15
3
11
25
89
10
al primer cuartil (Fr%
20a42
31
3
11
28
100
22
supera al 25%)
n(total)
28
100
Total de casos
Frecuencia acumulada absoluta de la clase
anterior a la que contiene al primer cuartil
(1/ 4N Fi 1)
Q1 = L.Inf . +
* Ai
fi
(1/ 4 * 28 0)
Q1 = 0 +
* 5 = 2,5
14
Q3 = 5 +
(3 / 4 * 28 14)
* 5 = 9,4
8
MEDIDA
Rango o
recorrido
Rango
g
intercuartlico
VENTAJAS
DESVENTAJAS
Fcil de calcular
No sufre la influencia de los
valores extremos
Varianza
|
Datos originales:
S2 =
2
(
X
X
)
i
i =1
n 1
2
X
n
X
i
2
i =1
n 1
Varianza
|
( X i X ) * fi
Tabla de frecuencia
de datos:
S2 =
i =1
n 1
2
X
fi
n
X
i
2
i =1
n 1
Varianza
|
Tabla de frecuencia
de clases:
( Xci X ) * fi
S2 =
i =1
n 1
2
Xc
fi
n
X
i
2
i =1
n 1
( X i X ) * fi
S2 =
|
|
x=
i =1
n 1
2
X
fi
n
X
i
2
i =1
n 1
Datos originales
20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
20 + 49 + 59 + 18 + 32 + 32 + 63 + 24 + 20 + 32 + 53 + 48 450
=
= 37,5.aos
12
12
Edad
18
20
24
32
48
49
53
59
63
n(Total)
fi
1
2
1
3
1
1
1
1
1
12
Xi2
Xi2*fi
324
324
400
800
576
576
1024
3072
2304
2304
2401
2401
2809
2809
3481
3481
3969
3969
(Xi2 *fi)=
19736
X 2 = 1406,25
S2 =
19736 12 * 1406,25
= 260,1
11
S2 =
2
(
Xc
X
)
* fi
i
i =1
Xc
2,5
7,5
15
31
x=
2
Xc
fi
n
X
i
2
i =1
233
= 8,32.puntos.porcentuales
28
fi (Xc*fi) Xc2
Xc2*fi
14
35
6
87,5
8
60
56
450
3
45
225
675
3
93
961
2883
(Xc*fi)
(Xc2*fi)
28 =233
= 233
= 4095 5
=4095,5
2
4095
,
5
28
*
(
8
,
32
)
4095,5 28 * (69,2)
2
S =
=
= 77,1
28
28
MEDIDA
VENTAJAS
DESVENTAJAS
Es
Es fcil de calcular, y tiene
una interpretacin intuitiva
Rango
intercuartlico
Fcil de calcular
No sufre la influencia de los
valores extremos
Varianza
Al expresarse en el cuadrado
de las unidades de los datos, es
de difcil interpretacin.
Rango o
recorrido
S=
2
(
X
X
)
i
i =1
= S2
S= S
|
|
Datos originales
20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
S 2 = 77,1
S = 77,1 = 8,8.puntos.porcentual es
MEDIDA
VENTAJAS
DESVENTAJAS
Rango
intercuartlico
Fcil de calcular
No
N sufre
f lla iinfluencia
fl
i d
de llos
valores extremos
Varianza
Al expresarse en el cuadrado
de las unidades de los datos, es
de difcil interpretacin.
Desvo
estndar o
tpico
Rango o
recorrido
Coeficiente de variacin
|
S
CV = * 100
X
S
CV = * 100
X
|
Datos originales
g
16,1
CV =
* 100 = 43%
37,5
Tabla de frecuencia de clases:
8,8
CV =
* 100 = 106%
8,32
MEDIDA
VENTAJAS
DESVENTAJAS
Rango
intercuartlico
Fcil de calcular
No
N sufre
f lla iinfluencia
fl
i d
de llos
valores extremos
Varianza
Al expresarse en el cuadrado
de las unidades de los datos, es
de difcil interpretacin.
Desvo
estndar o
tpico
Se
S expresa en las
l unidades
id d
originales de la variable
Es
E sensible
ibl a llas unidades
id d d
de
medida
Rango o
recorrido
Bibliografa
z
Garca Ferrando,
Ferrando, M. Socioestadstica
Socioestadstica..
Introduccin a la estadstica en sociologa
Lind, Marchal,
Lind,
Marchal, Mason:
Mason: Estadstica para
Administracin y Economa