Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Son aquellas que indican la dispersión de las distintas puntuaciones con respecto a su
tendencia central, por lo tanto, permiten determinar cuan alejados o cerca de la medida que
se tome como referencia se encuentran los datos, de allí que indiquen homogeneidad y esa
medida será representativa de la serie de datos, si ocurre lo contrario señalarán que los
datos se alejan de la medida y por lo tanto será un grupo heterogéneo y la medida será poco
representativa.
Entre las medidas de variabilidad o dispersión más comunes tenemos, la amplitud total o
Rango la cual se simboliza generalmente como At, la desviación típica o estándar (s),
la varianza (s2) y el coeficiente de variación (Cv).
Indica la distancia que existe entre el dato menor (d) y el dato mayor (D), inclusive de una
serie de datos, es la más sencilla y directa de las medidas de dispersión, es muy poco
utilizada por su marcada inestabilidad ante la existencia de valores extremos, ya que la
información mostrada por ella nos dará una impresión errada de heterogeneidad.
Fórmula
A (D d ) 1
Donde:
D= Dato mayor
D= Dato menor
Al respecto, para Martínez Bunicon y March (2010) el estudio del recorrido de los datos
desde el menor valor hasta el mayor valor real observado es la amplitud total, que describe
que tan distantes están los datos de toda la serie de donde provienen. La forma de
determinar el recorrido es considerando el desplazamiento entre los valores extremos y ello
es la primera inclusión de la dispersión.
At = (Xs - Xi) + 1 donde consideran Xs como dato mayor y Xi como dato menor
Por ejemplo, se tienen tres series de datos tal cual como se presentan a continuación:
¿Qué información se tiene con la amplitud total en las tres series de datos?
Varianza (s2)
Pinto y Pernalete (2002) consideraron que esta medida expresa la variación promedio
cuadrática entre cada valor de la serie respecto a la media aritmética de la serie de datos o
distribución (cuadrado de la desviación típica). Como la varianza es una medida cuadrática
es muy útil determinar la varianza para poder determinar la variabilidad de la serie de datos
o distribuciones cuando se relaciona con la media.
f • X
n
2
i X
s2 i 1
n 1
Consiste en el promedio de todas las desviaciones de los datos con respecto a la media
aritmética de la serie de datos o distribución.
Datos no agrupados
X
n 2
X n _ n
s i 1
i
X i2 X ( X i )
n 1 s i 1 i 1
n 1
f • X
n 2
i X
i 1
s
n 1
Ejemplo.
Solución.
X
n 2
X
Se desea calcular la desviación típica para datos directos, mediante la fórmula: s i 1
i
n 1
n
X
x 14,7 Puntos
i
donde: x i 1
n
n
xi x 14 14,7 12 14,7 15 14,7 8 14,7 17 14,7 20 14,7 18 14,7 17 14,7 17 14,7 9 14,7
i 1
2
2 2 2 2 2 2
2 2 2 2
x x
n
0,7 2,7 0,3 6,7 2,3 5,3 3,3 2,3 2,3 5,7
2 2
2 2 2 2 2 2 2 2 2
i 1
i
x x
n 2
140,1
i 1
i
Aplicando ahora la fórmula de desviación típica, nos queda lo siguiente:
140,1
s s 15,566667 s 3,9454 Puntos.
10 1
Interpretación:
3,95 puntos, representa a la dispersión promedio de las calificaciones con respecto al
promedio general del grupo.
f • X
n
2
n=50 ∑(f*X)=568 i X 713
i 1
f • X
n n
( f * Xi )
2
X
f • X
n 2
X i
X i 1
s2 i 1
i
s i 1
n n 1 n 1
568 713
713
X s s2
50 50 1 50 1
X 11,36 Puntos s 3,81 Puntos(Desv. Típica) s 2 14,55 Puntos (Varianza)
Figura 76. Esquema de trabajo para determinar las medidas de dispersión en Excel
Interpretación:
Para el cálculo de la desviación típica o estándar se procede del mismo modo como se hizo
en el procedimiento anterior. (Ver Figura 80 y 81)
Fórmula: S
Cv
*100
X
GRUPO 1: X 10,2 puntos S = 1,84 puntos
GRUPO 2: X 14,2 puntos S = 2,11 puntos
GRUPO 3: X 9,44 puntos S = 1,68 puntos
El estudio del Coeficiente de Variación permitirá determinar cuál media resultó más
representativa de su distribución al realizar comparaciones entre los diferentes valores de la
Media y la Desviación, anulando el efecto de las magnitudes; al tomar en cuenta que puede
trabajar con escalas de intervalo y de razón y para las ordinales el Coeficiente de Variación
es con la Mediana en lugar de la Media Aritmética.
Tomando los datos se puede estudiar la homogeneidad de la siguiente manera:
GRUPO 1
S
Cv
*100 Cv
1,84
*100 Cv 18,04%
X 10,2
GRUPO 2
S 2,11
Cv
*100 Cv *100 Cv 14,86%
X 14,2
Grupo 3
S
Cv
*100 Cv
1,68
*100 Cv 17,80%
X 9,44
En los resultados se puede precisar que el Grupo 2 tienen menor variabilidad, por lo tanto el
grupo es más homogéneo en torno a la Media Aritmética y la representatividad del promedio
es mayor para este Grupo, mientras que en el Grupo 1 la representatividad de la Media
Aritmética es la menor porque hay mayor variabilidad.
Otro aspecto a resaltar es que se puede evidenciar que la Desviación Típica es menor en el
Grupo 3, pero el Promedio también es el Menor, por tanto la medida relativa de dispersión
expresada en el Coeficiente de Variación fue mayor que la del Grupo 2 que tiene mayor
Desviación Típica pero también la mayor Media Aritmética, lo que confirma que la
homogeneidad o heterogeneidad depende de los niveles de medición relativa y no del
resultado absoluto de la Desviación Típica tomada aisladamente.
( f * Xi )
Paso 1. Se calculan las medias aritméticas mediante la fórmula: X i 1
n
1• 6 2 • 3 3 • 0 4 • 3 5 • 3 39
X1 X1 X 1 2,6
15 15
1• 0 2 • 7 3 • 7 4 •1 5 • 0 39
X2 X2 X 2 2,6
15 15
X
n 2
i X
Paso 2. Se calculas las desviaciones típicas a través de: s i 1
n 1
S1
Cv1 *100 1,6818 Cv1 64,69%
X Cv1 *100
2,6
S2
Cv 2 *100 Cv 2
0,6325
X *100 Cv2 24,33%
2,6
Par calcular el coeficiente de variación (CV) s, se debe calcular primero la media aritmética y
la desviación típica. Por ejemplo, calcule el coeficiente de variación para los siguientes datos
: 14 – 12 – 15 – 8 – 17 – 20 – 18 – 17 – 17 – 9.
Promedio (C4:C13)
=(C18/C16) *100
Puntaje Típico Estándar “Z” es un puntaje derivado que se obtiene a partir del alejamiento
que tienen por encima o por debajo de la Media Aritmética en cantidad de Desviaciones
Típicas, es un puntaje que describe la relación de los desvíos respecto a la Media con la
Desviación Típica, le es propio a cada observación o valor de la variable a estudiar.
Se representa por:
Xi X Xi
Z Z
S
Un ejemplo sobre la explicación del puntaje “Z”, es que si un estudiante tiene 8 puntos en un
examen cuya Media Aritmética fue de 12 puntos y dispersión de 2 puntos; implica que el
sujeto está a 4 puntos por debajo de la Media y eso es a 2 Desviaciones Típicas por debajo
de la media (Z = - 2 ) porque cada Desviación son 2 puntos. Se emplea el símbolo sigma
( ) por ser la dispersión poblacional o de todos los posibles valores reflejados en la curva
normal, que es un modelo a nivel de población.
Media = 12 puntos
Puntaje Bruto = 8 Puntos
Desviación Típica = 2 puntos
Xi X 8 12 Z 2
Z Z
S 2
La puntuación derivada “T” de Thordike y Termer parte del puntaje típico estándar “Z” y
se emplea mayormente en aplicación de Test Psicológicos con media de 50 y desviación
típica de 10, así hay otros puntajes derivados, por ejemplo, los de Wechshler con media 100
y desviación 15.
Ejemplo: Considerando los tres primeros semestres de la base de datos que se ha venido
trabajando a lo largo del texto, considerar algunos ejercicios sobre puntuaciones observadas
“X”, típicas “Z” y derivadas “T”. Una vez tratados los tres semestres de referencia se observa
que:
1.- Se desea conocer en cuál de los semestres obtuvo mejor rendimiento un estudiante
respecto a su grupo, si la calificación promedio que obtuvo fue uniforme en los tres
semestres y es de 12 puntos.
Solución:
Se requiere tipificar para normalizar las distribuciones en cuanto al promedio y
Desviación Típica:
Xi X
Z
S
12 13,95 Z1 1,25
Z1
1,55
12 13,80 Z 2 0,93
Z2
1,94
12 14,25
Z3 Z 3 1,67
1,35
Se observa que el estudiante en todos los semestres se encuentra por debajo del promedio
de su grupo, pero si se grafican los tres resultados simultáneamente se tiene:
Se observa que el estudiante se aleja en los tres casos por debajo de la Media, pero el
mejor rendimiento lo obtuvo en el segundo semestre, ya que es donde se aproxima más a la
Media y es el puntaje “Z” que se encuentra más tendente hacia la derecha de la distribución.
También se confirma que el rendimiento más bajo es en el tercer semestre porque es el
puntaje que se aleja mayormente por debajo de la Media. Una nota de interés es que el
estudiante obtiene el mismo puntaje neto, esto es en la evaluación criterial, pero al
compararlo con el grupo con la evaluación normativa, existe diferencia en el rendimiento en
los tres semestres. Si se consideran estas calificaciones “Z” ¿cuáles serán las calificaciones
derivadas “T” del estudiante.
SOLUCIÓN:
T1 = 50 + 10*(-1,25 s) T1 = 50 –12,5 T1 = 37,5 pts.
T2 = 50 + 10 (-0,93 s) T2= 50 – 9,3 T2 = 40,7 pts.
T3 = 50 + 10*(- 1,67s) T3 = 50 – 16,7 T3 = 33,3 pts.
Los puntajes “T” al igual que en los puntajes típicos “Z” se puede observar que el mayor
rendimiento fue en el segundo semestre y el peor rendimiento fue en el tercer semestre,
esto se confirma de forma directa con el valor en puntos arrojados por la escala “T”, pero
siempre hay que considerar que la Media es de 50 y la Desviación Típica de 10 puntos.
2.- Si se elige un estudiante y en el primer semestre tiene un puntaje que se aleja en 1,25
Desviaciones Típicas por encima de la Media Aritmética, en el segundo semestre obtuvo un
puntaje derivado de 65 puntos y en el tercer semestre obtuvo un puntaje neto de 14 puntos,
¿En cuál semestre el alumno que obtuvo un mejor rendimiento con respecto a su grupo y
cuáles son los puntajes reales que obtuvo en cada semestre?
Solución:
Hay que establecer el criterio bajo el cual se harán las comparaciones, ya sea en puntajes
“Z” o “T”. Suponiendo que se tipifique con “Z” en todos los semestres.
Primer Semestre
Dato suministrado Z = 1,25
En este caso no hay que realizar ninguna operación porque ya está en valor “Z”
Segundo Semestre
Dato suministrado T = 65 pts.
Hay que transformar de puntaje “T” a “Z” empleando el despeje de la ecuación
T = 50 + 10 (Z)
T 50 65 50 Z 1,5
Z Z
10 10
Tercer Semestre
Dato suministrado X = 14 pts.
Hay que transformar de puntaje “X” a “Z” empleando la ecuación
Xi X 14 14,25
Z Z Z 0,19
S 1,35
Primer Semestre
Dato suministrado Z = 1,25
En este caso no hay que transformar de puntaje “Z” a puntaje “X” despejando.
“X” se tiene
Xi X
Z Xi Z • S X
S
La calificación obtenida por el estudiante en su promedio del primer semestre fue de 15,89
puntos aproximadamente.
Segundo Semestre:
Dato suministrado T = 65 pts.
Hay que transformar de puntaje “T” a “Z” empleando el despeje de la ecuación
T 50 10 • Z
T 50 65 50 Z 1,5
Z Z
10 10
El puntaje típico “Z” para el segundo semestre es de Z =1,5 . Luego hay que transformarlo
a puntaje “X”, despejando “X” se tiene
Xi X
Z Xi Z • S X
S
X i 1,50 •1,94 13,80 X i 2,91 13,80 X i 16,71 puntos
La calificación obtenida por el estudiante en su promedio del segundo semestre fue de 16,71
puntos aproximadamente.
Tercer Semestre
Dato suministrado X = 14 pts.
No hay que transformar, el puntaje real obtenido por el estudiante en el tercer semestre fue
de 14 puntos
Se observó que el estudiante tiene una calificación real superior en el segundo semestre y la
menor en el tercer semestre, ello tomando en cuenta el criterio de la escala de calificaciones
del 1 – 20 puntos.
MEDIDAS DE FORMA
Son las medidas que permiten el estudio de una serie o distribución de datos, y de acuerdo
a ellas se puede describir el grado de deformación de la información, destacando que la
asimetría y la curtosis, son las de mayor importancia.
ASIMETRÍA
La variación del coeficiente de asimetría debe estar ubicada en el rango desde -1 hasta +1 y
en la medida en que se aleja de cero (0) la distribución será más asimétrica, con sesgo a la
izquierda o positivamente o a la derecha negativamente; en la medida en que se aproxime a
cero (0) la distribución tiende a ser menos asimétrica; se aproximará a un modelo en forma
de campana y si hay evidencias suficientes para confirmar que el coeficiente de asimetría
sea cero (0), la distribución será perfectamente simétrica y no existirá sesgo ni a la derecha
ni a la izquierda. Si se comparan las medidas de tendencia central (media mediana y Moda)
solamente se puede saber si la serie de datos o distribución de frecuencias es simétrica o
asimétrica, más no su grado de inclinación o sesgo.
As
( Xi X ) 3
/n
3
s
Distribución Simétrica
Cuando el coeficiente de Asimetría de cero (0): As = 0 la distribución de los datos será de
forma simétrica respecto a la Media Aritmética y se puede afirmar que la mayoría de los
casos se concentran alrededor de la Media y las Medidas de Tendencia Central tienden a
ser de igual valor; la media aritmética, la mediana y la moda tienden a ser iguales, la curva
descrita tiene forma de campana con igual comportamiento en ambos lados de la Media
Aritmética, que al coincidir con la Mediana, es evidente que hay un 50% de casos a la
derecha y otro a la izquierda, la mayor altura está en el centro de la curva que es donde se
ubican las Medidas de Tendencia Central.
En las distribuciones simétricas, a los extremos también tienden a ser iguales en cuanto a su
comportamiento, pero existen curvas simétricas que no describen una forma de campana,
por ejemplo unos datos con forma de “U”, son simétricos respecto a la Media Aritmética,
pero la distribución es Bimodal, por tanto no es simétrica respecto a la distribución Normal y
con ello se debe tener precaución al momento de interpretar los resultados de los
coeficientes, se debe acompañar el análisis con una revisión de los datos en general.
3( X Xd ) (Q3 2Q2 Q1 ) X 90 2 * X 50 X 10
As As As
s (Q3 Q1 ) X 90 X 10
Tabla referencial para la interpretación del Coeficiente de Asimetría cuando el cálculo
se realiza por percentiles.
As = 0 simétrica
- /+ 0,01 As - /+ 0,10 se dice que es ligeramente asimétrica.
- /+ 0,11 As - /+ 0,30 se dice que es moderadamente asimétrica
- /+ 0,31 As - /+ 1,00 se dice que es marcadamente asimétrica
3
n
X X X
N 3
n N
As • i As • i
n 1 • n 2 i1 S N 1 • N 2 i1
As = 0 simétrica
- /+ 0,01 As - /+ 1,00 se dice que es ligeramente asimétrica.
- /+ 1,01 As - /+ 2,00 se dice que es moderadamente asimétrica
- /+ 2,01 As - /+ 3,00 se dice que es marcadamente asimétrica
CURTOSIS
Cu
( Xi X ) 4
/n
4
s
X 75 X 25
Cu
2 • X 90 X 10
n • n 1 n
X X
4
3 • n 1
2
Cu • i
n 1 • n 2 • n 3 i 1 S n 2 • n 3
Tabla referencial para la interpretación del Coeficiente de Curtosis, cuando el cálculo
se realiza con Excel o con procesadores estadísticos.
Cabe destacar que estos estadísticos también se pueden observar en la Figura 92, donde
se muestran las medidas de tendencia central, la desviación típica y los percentiles
utilizados en el cálculo de la simetría y curtosis.
X 90 2 * X 50 X 10
As
X 90 X 10
19 2 * (11,50) 10 19 23 10 6
As1 As1 As1 As1 0,667
19 10 19 10 9
20 2 * (19) 10 20 38 10 8
As3 As3 As3 As3 0,80
20 10 20 10 10
Asimétrica negativa
Promedio obtenido
por el estudiante La mayoría de los
- 0,75
en el segundo estudiantes se encuentran
semestre por encima de 16,3
puntos.
Asimétrica negativa
Promedio obtenido
por el estudiante La mayoría de los
- 0,80
en el tercer estudiantes se encuentran
semestre por encima de 17,54
puntos
Interpretación.
Se observa en las calificaciones promedios del primer semestre muestran una distribución
marcadamente asimétrica positiva, significando esto que la mayoría de los estudiantes
poseen una calificación promedio en el primer semestre menor a 13,15 puntos, a diferencia
del segundo y tercer semestre donde se observó una distribución marcadamente
asimétrica negativa. En el primero de los casos, por ser una distribución marcadamente
asimétrica positiva la mayor concentración de datos está por debajo de la media del grupo
y como la media del grupo es de 13,15 puntos; se dice que la mayoría de las notas
promedios de los estudiantes se encuentran por debajo de 13,15 puntos (Ver Figura 51 en
medidas de tendencia central)
Cabe destacar, en el segundo y tercer semestre las calificaciones promedias tienden a estar
en mayor concentración por encima de sus medias por poseer distribuciones
marcadamente asimétricas negativas; pero entre estas dos últimas asimetrías, es en el
tercer semestre donde la mayoría de los estudiantes obtuvieron notas por encima del
promedio 17,54 puntos, ya que su coeficiente de asimetría se aleja más de cero (el sesgo
es más acentuado a la derecha de la curva) que en el segundo semestre. Esto lo puede
visualizar directamente, observando la figura 93 en las próximas páginas.
Con respecto al uso de la tecnología, se utilizó la herramienta EXCEL para el cálculo de los
diferentes coeficientes de asimetría en sus distintos momentos, acción que se logró
haciendo uso de la base de datos, luego se hizo Clic en el menú Formulas, Posteriormente
se seleccionó la opción más funciones y de allí se realizó un Clic en Asimetría, permitiendo
el cálculo de las mismas. (Ver Figura 92):
Figura 89. Asimetría de los tres primeros semestres universitarios, haciendo de ExCel
Asimétrica positiva
Promedio obtenido
por el estudiante
La mayoría de los
en el primer 0,907
estudiantes se encuentran
semestre
por debajo de 13,15
puntos.
Asimétrica negativa
Promedio obtenido
por el estudiante La mayoría de los
- 0,709
en el segundo estudiantes se encuentran
semestre por encima de 16,3
puntos.
Asimétrica negativa
Promedio obtenido
por el estudiante La mayoría de los
- 1,471
en el tercer estudiantes se encuentran
semestre por encima de 17,54
puntos
Fuente: Martínez Bunicon y March (2010), recreada por Martínez (2020)
Para efecto de su interpretación, se procede del mismo modo que el anterior procedimiento.
CURTOSIS
Para el cálculo de este coeficiente, vamos a utilizar la siguiente fórmula en las notas
promedios obtenidas en los tres primeros semestres de acuerdo a los datos suministrados
en la Figura 86:
X 75 X 25
Cu
2 • X 90 X 10
15 10 5
Cu1 Cu1 Cu1 0,2778
2 • 19 10 18
19,875 10 8,875
Cu 2 Cu 2 Cu2 0,4437
2 • 20 10 20
20 18 2
Cu3 Cu3 Cu3 0,100
2 • 20 10 20
Obtenidos los tres coeficientes de curtosis, se procedió a organizar la información tal cual
como se muestra en la Figura 90:
Figura 90. Coeficientes de curtosis de los tres primeros semestres universitarios, a través
del cálculo de percentiles
Promedio Platicúrtica.
obtenido por
el estudiante Cu1=0,277 > 0,263 La distribución es
0,2778 achatada en el centro
en el primer
semestre y la dispersión es alta
Promedio
obtenido por Platicúrtica.
el estudiante Cu2= 0,443 > 0,263 La distribución es
0,4437
en el achatada en el centro
segundo y la dispersión es alta
semestre
Promedio Leptocúrtica.
obtenido por
el estudiante 0,100 Cu3= 0,100 < 0,263 La distribución es
en el tercer apuntada en el centro
semestre y la dispersión es baja
Interpretación:
En el primer y segundo semestre se describen distribuciones platicúrticas ya que sus
resultados son mayores a 0,263; la dispersión de los datos es alta y el poder discriminativo
también es alto, sin embargo, al alejarse más en el segundo semestre del valor referencial
de 0,263, se puede confirmar que ese es el grupo con mayor dispersión porque la curva es
más achatada en el centro, respecto a la distribución normal. Mientras que en el tercer
semestre la curva es leptocúrtica y los datos tienden a concentrarse mayormente en el
centro de la distribución, por tanto, la discriminabilidad es baja.
Figura 91. Curtosis de las calificaciones promedios de los tres primeros semestres
universitarios, a través del uso de Excel.
Curtosis Resultado Relación Tipo de Distribución Gráfica
Promedio Platicúrtica.
obtenido por La distribución es
el estudiante Cu1= - 0,636 < 0,00 achatada en el centro
- 0,6363
en el primer y la dispersión es alta
semestre porque es un valor
negativo
Promedio Platicúrtica.
obtenido por
el estudiante Cu2= - 1,422 < 0,00 La distribución es
-1,4221 achatada en el centro
en el
segundo y la dispersión es alta
semestre porque es un valor
negativo
Promedio Leptocúrtica.
obtenido por La distribución es
el estudiante 0,3602 Cu3= 0,360 > 0,00 apuntada en el centro
en el tercer y la dispersión es baja
semestre porque es un valor
positivo
Hay que recordar que el coeficiente de curtosis mide el grado de concentración de datos en
el centro de la distribución de frecuencias o serie de datos. Si el cálculo se realiza por
EXCEL o un programa para procesar datos a nivel de estadística, se debe tomar en cuenta
como valor de referencia, el valor de Cu=0,00 para la interpretación. Los valores obtenidos
de curtosis, se pueden observar en la Figura 92
Sesgo
Asimetría Positiva
Asimetría Negativa
Sesgo
Asimetría Negativa
Sesgo