Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Xi = {0, 2, 4, 6, 8, 10} X =5
Yi = { 5, 5, 5, 5, 5, 5} Y =5
Vi = {0, 0, 0,10,10,10} V =5
Wi = {4, 4, 4, 6, 6, 6 } W =5
1
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
AT = R = Xmáx – Xmín.
AT = 8 – 3 = 5
Actividad 2. ¿Cuál de las dos distribuciones le parece más variable? Calcule en ambos
casos la amplitud total y comente los resultados.
Xi = {0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 10}
Yi = {0, 0, 2, 2, 4, 6, 6, 8, 8, 9, 10}
Q 3 − Q1 P75 − P25 C 75 − C 25
Q= = = .
2 2 2
2
Se trata de un índice que no toma en consideración ni las puntuaciones por encima del
cuartil 3 (Q3) ni las puntuaciones por debajo del cuartil 1 (Q1), con lo que tan sólo toma
en consideración el 50% central de las puntuaciones. En consecuencia tiene la ventaja
de no dejarse afectar por la presencia de puntuaciones muy extremas, y el inconveniente
de no utilizar toda la información.
3
Finalmente presentamos la fórmula de la varianza de una variable X, s X2 , que
conceptualmente ha de entenderse como el promedio de las diferencias (distancias) al
cuadrado de cada puntuación respecto a la media:
∑ (X − X)
2
=
i
s X2
n
∑ (X − X) ∑ (X ) = ∑ X − ∑ 2X X + ∑ X
2 2
− 2X i X + X 2 2 2
= = =
i i i i
s X2
n n n
=
∑ X i − 2X
2
∑X i + nX 2
=
∑X i
2
−
2X ∑X i
+
nX 2
=
∑X i
2
− 2XX + X 2 =
∑X i
2
−X2
n n n n n n
s X2 =
∑X i
2
−X2
n
∑ (X − X)
2
i
s X2 = =
n
4
s X2 =
∑X i
2
−X2 =
n
Cuando los datos de una variable están agrupados por frecuencias, las fórmulas
que se aplican para calcular la varianza son las siguientes:
∑ n (X − X) ∑n X
2 2
i i
= = −X2
i i
s X2 s X2
n n
Xi ni
3 2
6 4
n=6
X=
∑n X i i
=
2(3) + 4(6) 6 + 24 30
= = =5
n 6 6 6
∑ n (X − X)
2
2(3 − 5) 2 + 4(6 − 5) 2 2(4) + 4(1) 12
= = = = =2
i i
s X2
n 6 6 6
s X2 =
∑n X i i
2
−X2 =
2(3 2 ) + 4(6 2 )
− 52 =
2(9) + 4(36)
− 25 =
162
− 25 = 2
n 6 6 6
Cuando los datos de una variable están agrupados por intervalos, al igual que
ocurría con el cálculo de la media, se asume que las puntuaciones en un mismo intervalo
se concentran en el punto medio, con lo que los datos pasarían a estar únicamente
agrupados por frecuencias, aplicándose las mismas fórmulas que en el ejemplo previo.
5
X ni Xi
8-10 4
11-13 10
14-16 6
n = 20
∑ n (X − X)
2
i i
s X2 = =
n
s X2 =
∑n X
i i
2
−X2 =
n
6
∑ (X − X)
2
i
s X2 = → unidades cuadráticas
n
Para conseguir índice de variabilidad en las mismas unidades con que fue
medida la variable se propuso la desviación típica, s X , que se define como la raíz
cuadrada positiva de la varianza:
∑ (X − X)
2
sX = =
i
s X2 → unidades lineales
n
Segunda consideración: Tanto la varianza como la desviación típica sólo pueden tomar
valores positivos. El valor mínimo de ambos índices es 0, cuando todas las puntuaciones
son iguales o se da la situación de máxima homogeneidad. De ahí que conceptualmente
no tenga sentido hablar de variabilidad negativa o de distancias negativas entre las
puntuaciones y la media.
Si Yi = Xi + a
entonces sY2 = s X2 y sY = s X
Veamos un ejemplo. Siendo Xi = {18, 18, 18, 18} la edad en años de cuatro
sujetos hoy, Yi la edad de los mismos sujetos dentro de tres años (Yi = Xi + 3) y a = 3 la
constante que representa que han pasado 3 años para todos ellos:
7
• Si Yi = Xi +3 (pasan tres años), entonces sY2 = s 2X = 0 y sY = s X = 0
Propiedad 2. Si a las puntuaciones de una variable se las multiplica por una constante,
la varianza de las nuevas puntuaciones es igual a la varianza de las puntuaciones
originales multiplicada por el cuadrado de la constante. Y la desviación típica de las
nuevas puntuaciones es igual a la desviación típica de las puntuaciones originales
multiplicada por el valor absoluto de la constante. Matemáticamente:
Si Yi = bXi
entonces sY2 = b 2 s X2 y sY = b s X
X=
∑X i
=
2 + 5 + 8 15
= =5
n 3 3
s X2 =
∑X i
2
−X2 =
4 + 25 + 64
− 25 = 31 − 25 = 6
n 3
s X = 6 = 2,449
8
• Comprobación: Yi ={4,10,16} → Y = 10 , sY2 = 24 , sY = 4,899
Y =
∑Y i
=
4 + 10 + 16 30
= = 10
n 3 3
sY2 =
∑Y i
2
−Y 2 =
16 + 100 + 256
− 100 = 124 − 100 = 24
n 3
sY = 24 = 4,899
Si Yi = a + bXi
entonces sY2 = y sY =
9
4.5 Índices de asimetría
X
Md
Mo
Mo Md X X Md Mo
10
4.5.1 Índice de asimetría intercuartílico
Este índice se basa en la relación entre los tres cuartiles de una distribución,
calculándose a partir de la fórmula:
(Q 3 − Q 2 ) − (Q 2 − Q1 )
As interc. =
Q 3 − Q1
La razón por la que este índice mide el grado de asimetría se debe a que cuando
una distribución es simétrica, la distancia entre los cuatiles 3 y 2 (Q3 – Q2) es la misma
que entre los cuartiles 2 y 1 (Q2 – Q1). Si la distancia entre los cuartiles 3 y 2 es mayor
que entre los cuartiles 2 y 1 (Q3 – Q2 > Q2 – Q1), es porque predominan las
puntuaciones bajas, siendo la distribución asimétrica positiva. Y cuando la distancia
entre los cuartiles 3 y 2 es menor que entre los cuartiles 2 y 1, es porque predominan las
puntuaciones altas, siendo la distribución asimétrica negativa.
Actividad 8. Dibuje dos distribuciones, una simétrica y otra con una marcada asimetría
positiva, e indique la posición aproximada de los cuartiles 1, 2 y 3 en cada una de ellas.
X − Mo
As Pearson = ,
sx
11
donde X y Mo son la media y la moda de la distribución, respectivamente. Un valor de
0 nos indicará que la distribución es simétrica, un valor negativo que la distribución es
asimétrica negativa y un valor positivo, que es asimétrica positiva.
Una limitación del índice de asimetría de Pearson es que sólo se puede calcular
en distribuciones unimodales o con una sola moda.
Este índice se basa en las distancias entre las puntuaciones y la media elevadas
al cubo. Se calcula a partir de la fórmula:
As Fisher =
∑ (X i − X) 3
,
n s 3x
As Fisher =
∑ n (X
i i − X) 3
,
n s 3x
12
13
14