Está en la página 1de 28

CAPITULO V

MEDIDAS DE VARIABILIDAD Y DE FORMA

Son aquellas que indican la dispersión de las distintas puntuaciones con respecto a su
tendencia central, por lo tanto, permiten determinar cuan alejados o cerca de la medida que
se tome como referencia se encuentran los datos, de allí que indiquen homogeneidad y esa
medida será representativa de la serie de datos, si ocurre lo contrario señalarán que los
datos se alejan de la medida y por lo tanto será un grupo heterogéneo y la medida será poco
representativa.

Entre las medidas de variabilidad o dispersión más comunes tenemos, la amplitud total o
Rango la cual se simboliza generalmente como At, la desviación típica o estándar (s),
la varianza (s2) y el coeficiente de variación (Cv).

Rango o Amplitud Total (At)

Indica la distancia que existe entre el dato menor (d) y el dato mayor (D), inclusive de una
serie de datos, es la más sencilla y directa de las medidas de dispersión, es muy poco
utilizada por su marcada inestabilidad ante la existencia de valores extremos, ya que la
información mostrada por ella nos dará una impresión errada de heterogeneidad.

Fórmula
A  (D  d ) 1

Donde:

D= Dato mayor

D= Dato menor

Al respecto, para Martínez Bunicon y March (2010) el estudio del recorrido de los datos
desde el menor valor hasta el mayor valor real observado es la amplitud total, que describe
que tan distantes están los datos de toda la serie de donde provienen. La forma de
determinar el recorrido es considerando el desplazamiento entre los valores extremos y ello
es la primera inclusión de la dispersión.

At = (Xs - Xi) + 1 donde consideran Xs como dato mayor y Xi como dato menor

Por ejemplo, se tienen tres series de datos tal cual como se presentan a continuación:
¿Qué información se tiene con la amplitud total en las tres series de datos?

Se puede describir el comportamiento general de cada serie en conjunto, esto es que en la


Serie “C” solo hay un (1) valor numérico, es decir que la calificación para cada medida
realizada siempre fue el mismo valor; 10 puntos, pero en la Serie “B” hay una dispersión de
tres (3) puntos y los datos que mostraron las mediciones hacen un recorrido entre esas tres
calificaciones, en este caso desde 9 puntos hasta 11 puntos y en la Serie “A” hay un
recorrido de diecinueve (19) puntos y ello da clara evidencia que es la más dispersa y en
consecuencia la representación gráfica será la que mostrará una curva más alargada en el
eje de las abscisas si se presenta el par (X,Y) (Calificaciones, frecuencias); diferente al
gráfico de la Serie “C” que es una recta fija en el eje “X” y la Serie “B” una curva menos
extendida en el eje “X” que la de la Serie “A”. Como observación de interés, está que el
hecho de que la Amplitud Total describa un recorrido de 19 puntos en la Serie “A”, no quiere
decir que hay 19 datos, sino que los valores de la variable recorren 19 puntos (desde 1
hasta 19 puntos) y ello es independiente de la cantidad de los valores, que en la Serie “A”
son 3 valores (01, 10 y 19) en 7 sujetos.

Varianza (s2)

Pinto y Pernalete (2002) consideraron que esta medida expresa la variación promedio
cuadrática entre cada valor de la serie respecto a la media aritmética de la serie de datos o
distribución (cuadrado de la desviación típica). Como la varianza es una medida cuadrática
es muy útil determinar la varianza para poder determinar la variabilidad de la serie de datos
o distribuciones cuando se relaciona con la media.

En palabras de Martinez Bunicon y Marcha (2010), la varianza como estadístico descriptivo


es una medida de dispersión paramétrica, que representa la media de los cuadrados de los
desvíos respecto a la media aritmética y se concreta como la dispersión promedio
cuadrática entre cada valor de la serie de datos respecto a la media aritmética. La Varianza
muestral es dada por:

Se emplea en muestras de tamaño superior a 100

Se aplica la corrección de Bessel y se habla de cuasivarianza en muestras pequeñas o


inferiores o iguales a 100 casos

 f • X 
n
2
i X
s2  i 1

n 1

Desviación Típica o Estándar (s)

Consiste en el promedio de todas las desviaciones de los datos con respecto a la media
aritmética de la serie de datos o distribución.
Datos no agrupados

 X 
n 2

X n _ n

s i 1
i
 X i2  X ( X i )
n 1 s i 1 i 1

n 1

Es la dispersión promedio entre cada valor de la serie de datos respecto a la Media


Aritmética de la distribución. Se obtiene con la raíz cuadrada de la Varianza y es la medida
de dispersión que mayormente se emplea para obtener medidas de variabilidad secundarias
a partir de ella, con la desviación típica o desviación estándar, se desarrollan los estudios
sobre variabilidad general y particular de los datos, ya sea con el Coeficiente de Variación o
con los puntajes típicos.

La base de la desviación Típica son los desvíos respecto a la Media Aritmética


representados por (X – X); que se obtienen a partir de las diferencias observadas entre cada
valor de la serie y el valor promedio general y la raíz cuadrada del promedio de todos los
desvíos respecto a la Media Aritmética es la Desviación Típica. En este sentido observe la
siguiente fórmula:

 f • X 
n 2

i X
i 1
s
n 1

En general se utiliza (n – 1) en muestras pequeñas (n ≤ 100) y “n” en nuestras grandes (n >


100), pero los criterios se adecúan cuando se realiza inferencia estadística y la desviación
típica o la varianza son empleadas como estimadores.

Ejemplo.

Para datos directos o no agrupados.

Dadas las siguientes calificaciones obtenidas de la aplicación de una prueba de biología en


un tercer año de educación básica: 14 – 12 – 15 – 8 – 17 – 20 – 18 – 17 – 17 – 9. Determine
en qué grado se dispersan las calificaciones respecto al promedio del grupo.

Solución.
 X 
n 2

X
Se desea calcular la desviación típica para datos directos, mediante la fórmula: s  i 1
i

n 1
n

X
x  14,7 Puntos
i
donde: x i 1
n
n

 
 xi  x  14 14,7  12 14,7  15 14,7  8 14,7  17 14,7  20 14,7  18 14,7  17 14,7  17 14,7  9 14,7
i 1
2
2 2 2 2 2 2
2 2 2 2

 x  x
n
  0,7    2,7   0,3   6,7   2,3  5,3  3,3  2,3  2,3   5,7 
2 2
2 2 2 2 2 2 2 2 2

i 1
i

 x  x
n 2
 140,1
i 1
i
Aplicando ahora la fórmula de desviación típica, nos queda lo siguiente:

140,1
s s  15,566667 s  3,9454 Puntos.
10  1

Interpretación:
3,95 puntos, representa a la dispersión promedio de las calificaciones con respecto al
promedio general del grupo.

Ejemplo. Para datos agrupados

Figura 75. Distribución de Frecuencias para datos agrupados.


Clase Li X Ls f f.X 
f • Xi  X 
2

14 17,5 18 18,5 3 54 3*(18 – 11,36)2= 132,2688


13 16,5 17 17,5 2 34 2*(17 – 11,36)2= 63,6192
12 15,5 16 16,5 4 64 4*(16 – 11,36)2= 86,1184
11 14,5 15 15,5 5 75 5*(15 – 11,36)2= 66,2480
10 13,5 14 14,5 2 28 2*(14 – 11,36)2= 13,9392
9 12,5 13 13,5 3 39 3*(13 – 11,36)2= 8,0688
8 11,5 12 12,5 4 48 4*(12 – 11,36)2= 1,6384
7 10,5 11 11,5 4 44 4*(11 – 11,36)2= 0,5184
6 09,5 10 10,5 6 (6)*(10)=60 6*(10 – 11,36)2= 11,0976
5 08,5 09 09,5 4 (4)*(09)=36 4*(9 – 11,36)2= 22,2784
4 07,5 08 08,5 4 (4)*(08)=32 4*(8 – 11,36)2= 45,1584
3 06,5 07 07,5 2 (2)*(07)=14 2*(7 – 11,36)2= 38,0192
2 05,5 06 06,5 5 (5)*(06)=30 5*(6 – 11,36)2= 143,648
1 04,5 05 05,5 2 (2)*(05)=10 2*(5 – 11,36)2= 80,8992

 f • X 
n
2
n=50 ∑(f*X)=568 i X  713
i 1

 f • X 
n n

 ( f * Xi )
2
X
 f • X 
n 2
 X i
X i 1
s2  i 1
i
s i 1
n n 1 n 1

 568 713
713
X s s2 
50 50  1 50  1


X  11,36 Puntos s  3,81 Puntos(Desv. Típica) s 2  14,55 Puntos (Varianza)

Interpretación de la desviación típica


Como se observa, el valor de la desviación típica para en la distribución de frecuencias es
de 3,81 puntos; lo cual significa que los datos tienden en promedio a dispersarse en 3,81
puntos con respecto a la media aritmética.
Para procesar las medidas de dispersión se pudiera utilizar el siguiente esquema de trabajo
en EXCEL. Donde dice “insertar fórmula” mejor haga Clic en “Más funciones”, luego
seleccione Estadísticas y allí se abre el menú de opciones.

Figura 76. Esquema de trabajo para determinar las medidas de dispersión en Excel

Fuente: Martínez Bunicon y March (2021)


Para el cálculo de la varianza como medida de dispersión a través de la herramienta Excel,
primero se selecciona la opción de “Formula”, posteriormente se despliega un menú de
donde se debe activar la alternativa “Mas funciones”, luego usted se ubica en el menú
“Estadísticas” y de allí elige lo deseado. (Ver Figura 78)

Figura 77. Base de datos. Figura 78. Procedimiento para el cálculo de


la varianza

Fuente: Microsoft Exel

Una vez seleccionada la alternativa “VAR.S”, se


abre el cuadro de dialogo presente en la Figura
79.

Figura 79. Argumentos de función.

Fuente: Microsoft Exel


Fuente: Martínez (2020)
Donde, usted debe rellenar el rango que dice “Número 1”, sombreando solamente los
valores que se encuentran en la base de datos (Ver Figura 77), para poder observar
posteriormente el valor de la medida de dispersión seleccionada. Finalmente, se hace un
Clic en” Aceptar” para lograr el resultado final.

Interpretación:

14,56 puntos es el promedio cuadrático de los desvíos de las calificaciones obtenidas en la


aplicación del primer examen parcial de estadística Aplicada a la Educación.

Para el cálculo de la desviación típica o estándar se procede del mismo modo como se hizo
en el procedimiento anterior. (Ver Figura 80 y 81)

Figura 80. Procedimiento para el cálculo de


la desviación típica

Figura 81. Argumentos de función.

Fuente: Microsoft Excel

Fuente: Microsoft Excel


Interpretación:
3,81 puntos es la desviación promedio entre las calificaciones obtenidas en la aplicación del
primer parcial de estadística Aplicada a la Educación.

Coeficiente de Variación (Cv)

Martínez Bunicon y March consideraron, el coeficiente de variación es la dispersión relativa


de la Desviación Típica y la Media Aritmética, por lo que representa la variabilidad de los
datos respecto al promedio, con ello se afirma que en la medida en que el Coeficiente de
Variación aumenta, los datos se dispersan proporcionalmente de la Media Aritmética y su
representatividad disminuye. Cuando el Coeficiente de Variación es obtenido en una serie
de datos que no se persigue comparar con otras series de promedios distintos, se emplea
para analizar si la representatividad tiende a ser alta, es decir que cuando el resultado del
Coeficiente de Variación se aproxima a Cero (0) la representatividad de la Media Aritmética
tiende a ser alta porque los datos son poco variables, el grupo tiende a ser homogéneo. La
dispersión relativa representada en el Coeficiente de Variación es empleada mayormente
para comparar grupos de datos con medias diferentes y así normalizar los valores respecto
al promedio. En fin, el Coeficiente de Variación persigue normalizar la Desviación Típica en
distribuciones con promedios diferentes y lograr realizar comparaciones para estudiar la
variabilidad y establecer elementos concluyentes sobre la homogeneidad o heterogeneidad
y por ende en la representatividad de la Media Aritmética. Con ello se puede asumir
decisiones para diferentes actuaciones, como por ejemplo si se quiere estudiar una serie de
datos y hay la posibilidad de elegir entre varias, la información dada por el Coeficiente de
Variación puede orientar la selección.

Fórmula: S
Cv  
*100
X

En ideas de Pinto y Pernalete , el coeficiente de variación es una medida de variación la cual


no considera la medida en que se expresan las variables ni los valores o magnitudes que
asuman los datos de las variables. Es el cociente entre la desviación típica y la media
expresado en porcentaje, por lo tanto, indica que tan variado es la serie con respecto a su
media aritmética.

Un ejemplo práctico se puede desarrollar si se comparan los resultados obtenidos en los


siguientes grupos de resultados:


GRUPO 1: X  10,2 puntos S = 1,84 puntos

GRUPO 2: X  14,2 puntos S = 2,11 puntos

GRUPO 3: X  9,44 puntos S = 1,68 puntos

El estudio del Coeficiente de Variación permitirá determinar cuál media resultó más
representativa de su distribución al realizar comparaciones entre los diferentes valores de la
Media y la Desviación, anulando el efecto de las magnitudes; al tomar en cuenta que puede
trabajar con escalas de intervalo y de razón y para las ordinales el Coeficiente de Variación
es con la Mediana en lugar de la Media Aritmética.
Tomando los datos se puede estudiar la homogeneidad de la siguiente manera:

GRUPO 1

S
Cv  
*100 Cv 
1,84
*100 Cv  18,04%
X 10,2

GRUPO 2

S 2,11
Cv  
*100 Cv  *100 Cv  14,86%
X 14,2

Grupo 3

S
Cv  
*100 Cv 
1,68
*100 Cv  17,80%
X 9,44
En los resultados se puede precisar que el Grupo 2 tienen menor variabilidad, por lo tanto el
grupo es más homogéneo en torno a la Media Aritmética y la representatividad del promedio
es mayor para este Grupo, mientras que en el Grupo 1 la representatividad de la Media
Aritmética es la menor porque hay mayor variabilidad.

Otro aspecto a resaltar es que se puede evidenciar que la Desviación Típica es menor en el
Grupo 3, pero el Promedio también es el Menor, por tanto la medida relativa de dispersión
expresada en el Coeficiente de Variación fue mayor que la del Grupo 2 que tiene mayor
Desviación Típica pero también la mayor Media Aritmética, lo que confirma que la
homogeneidad o heterogeneidad depende de los niveles de medición relativa y no del
resultado absoluto de la Desviación Típica tomada aisladamente.

Otro ejemplo, tomado de Vergara J, y Quesada V. (2013) (p153). En un juego de tiro al


blanco con escopeta de perdigones por dos participantes a un tablero, obtienen el siguiente
registro después de 15 disparos cada uno (Ver Figura 82). Determinar el coeficiente de
variación para ambos casos.

Figura 82. Juego de tiro al blanco

Fuente: Vergara y Quesada (2013)


n

  ( f * Xi )
Paso 1. Se calculan las medias aritméticas mediante la fórmula: X i 1
n

1• 6  2 • 3  3 • 0  4 • 3  5 • 3 39
X1  X1  X 1  2,6
15 15

1• 0  2 • 7  3 • 7  4 •1  5 • 0 39
X2  X2  X 2  2,6
15 15

 X 
n 2

i X
Paso 2. Se calculas las desviaciones típicas a través de: s i 1
n 1

6 • 1  2,6  3 • 2  2,6  0 • 3  2,6  3 • 4  2,6  3 • 5  2,6


2 2 2 2 2
39,6 S1  1,6818
S1  S1  S1  2,8286
15  1 14

0 • 1  2,6  7 • 2  2,6  7 • 3  2,6  1 • 4  2,6  0 • 5  2,6


2 2 2 2 2
5,6 S 2  0,6325
S2  S2  S2  0,4
15  1 14

Paso 3. Se calcula el coeficiente de variación para ambos casos Cv  S * 100



utilizando la fórmula:
X

S1
Cv1  *100 1,6818 Cv1  64,69%
X Cv1  *100
2,6
S2
Cv 2  *100 Cv 2 
0,6325
X *100 Cv2  24,33%
2,6

El menor coeficiente de variación indica que el jugador 2, presenta una menor


dispersión, menor variabilidad de sus puntuaciones respecto a la media, su media es más
representativa, las puntuaciones son más homogéneas, hay menor heterogeneidad. El
jugador 1, presenta mayor dispersión, mayor variabilidad, su media es menos
representativa, hay menor homogeneidad, mayor heterogeneidad
Cálculo del Coeficiente de variación en Excel

Par calcular el coeficiente de variación (CV) s, se debe calcular primero la media aritmética y
la desviación típica. Por ejemplo, calcule el coeficiente de variación para los siguientes datos
: 14 – 12 – 15 – 8 – 17 – 20 – 18 – 17 – 17 – 9.

Figura 83. Forma de calcular el coeficiente de variación

Promedio (C4:C13)

Desviación Típica (C4:C13)

=(C18/C16) *100

Fuente Martínez (2020)


Interpretación
un coeficiente de variación igual a 26,839%, por sí solo no indica mayor cosa debería
interpretarse comparándolo con otro grupo.

PUNTAJE TIPICO (Z)

Puntaje Típico Estándar “Z” es un puntaje derivado que se obtiene a partir del alejamiento
que tienen por encima o por debajo de la Media Aritmética en cantidad de Desviaciones
Típicas, es un puntaje que describe la relación de los desvíos respecto a la Media con la
Desviación Típica, le es propio a cada observación o valor de la variable a estudiar.

Se representa por:

Xi  X Xi  
Z Z
S 

El puntaje “Z” se emplea para estandarizar y estudiar la normalización de la distribución de


datos y con ella se parte el estudio sobre la curva normal con media cero (0) y desviación
típica uno (1) y describe el número de Desviaciones Típicas en que se alejan los valores de
series de datos de la Media Aritmética, entonces el puntaje “Z” es la distancia, medida en
desviaciones típicas, que existe entre una calificación observada “X” y la Media Aritmética.
Como la media de la curva estandarizada es cero, los valores “Z” cuando se encuentran por
debajo de la Media son negativos y los que están por encima de la Media son positivos y
ambos expresan a cuántas desviaciones típicas se encuentra “X” por encima o por debajo
de la Media Aritmética.

Un ejemplo sobre la explicación del puntaje “Z”, es que si un estudiante tiene 8 puntos en un
examen cuya Media Aritmética fue de 12 puntos y dispersión de 2 puntos; implica que el
sujeto está a 4 puntos por debajo de la Media y eso es a 2 Desviaciones Típicas por debajo
de la media (Z = - 2  ) porque cada Desviación son 2 puntos. Se emplea el símbolo sigma
(  ) por ser la dispersión poblacional o de todos los posibles valores reflejados en la curva
normal, que es un modelo a nivel de población.

En esta curva se encuentran los alores


que puede asumir “Z” en el eje de las
abscisas y la función de “Z” en el eje de
las ordenadas, las áreas descritas son
Probabilidades.

Los puntajes “Z” necesariamente no se distribuyen en la curva normal como lo plantea el


modelo teórico, pero se grafican desde ese parámetro, por ejemplo, si se quiere representar
un puntaje que se aleja en dos (2) desviaciones típicas por debajo de la Media Aritmética,
según el ejemplo anterior se tiene que:

Media = 12 puntos
Puntaje Bruto = 8 Puntos
Desviación Típica = 2 puntos

Xi  X 8  12 Z  2
Z Z
S 2

El alumno se encuentra a 2 Desviaciones Típicas por debajo de la Media Aritmética y eso es


a 4 puntos por debajo, lo que arroja una calificación de 8 puntos. Si se tratara de un alumno
que estuviese a 2 Desviaciones Típicas (Z = 2  positivo) por encima de la Media (eso es 4
puntos brutos, porque cada conteo de la desviación son 2 puntos), le corresponde un
puntaje de 16 puntos.
PUNTAJE DERIVADO o PUNTAJE T

La puntuación derivada “T” de Thordike y Termer parte del puntaje típico estándar “Z” y
se emplea mayormente en aplicación de Test Psicológicos con media de 50 y desviación
típica de 10, así hay otros puntajes derivados, por ejemplo, los de Wechshler con media 100
y desviación 15.

La ecuación para calcular el puntaje “T” es: T = 50 + 10 (Z).

APLICACIONES DE PUNTAJES TÍPICOS EN EDUCACIÓN

Ejemplo: Considerando los tres primeros semestres de la base de datos que se ha venido
trabajando a lo largo del texto, considerar algunos ejercicios sobre puntuaciones observadas
“X”, típicas “Z” y derivadas “T”. Una vez tratados los tres semestres de referencia se observa
que:

Primer Semestre: X  13,95 Puntos S = 1,55 pts


Segundo Semestre: X  13,80 Puntos S = 1,94 pts
Tercer Semestre: X  14,25 Puntos S = 1,35 pts

1.- Se desea conocer en cuál de los semestres obtuvo mejor rendimiento un estudiante
respecto a su grupo, si la calificación promedio que obtuvo fue uniforme en los tres
semestres y es de 12 puntos.

Solución:
Se requiere tipificar para normalizar las distribuciones en cuanto al promedio y
Desviación Típica:

Xi  X
Z
S

12  13,95 Z1  1,25
Z1 
1,55

12  13,80 Z 2  0,93
Z2 
1,94

12  14,25
Z3  Z 3  1,67
1,35

Se observa que el estudiante en todos los semestres se encuentra por debajo del promedio
de su grupo, pero si se grafican los tres resultados simultáneamente se tiene:
Se observa que el estudiante se aleja en los tres casos por debajo de la Media, pero el
mejor rendimiento lo obtuvo en el segundo semestre, ya que es donde se aproxima más a la
Media y es el puntaje “Z” que se encuentra más tendente hacia la derecha de la distribución.
También se confirma que el rendimiento más bajo es en el tercer semestre porque es el
puntaje que se aleja mayormente por debajo de la Media. Una nota de interés es que el
estudiante obtiene el mismo puntaje neto, esto es en la evaluación criterial, pero al
compararlo con el grupo con la evaluación normativa, existe diferencia en el rendimiento en
los tres semestres. Si se consideran estas calificaciones “Z” ¿cuáles serán las calificaciones
derivadas “T” del estudiante.

Primer Semestre: X  13,95 pts S = 1,55 pts Z = - 1,25 


Segundo Semestre: X  13,80 pts S = 1,94 pts Z = - 0,93 
Tercer Semestre: X  14,25 pts S = 1,35 pts Z = - 1,67 

Los puntajes derivados “T” se determinan a partir de: T = 50 + 10 (Z).

SOLUCIÓN:
T1 = 50 + 10*(-1,25 s) T1 = 50 –12,5 T1 = 37,5 pts.
T2 = 50 + 10 (-0,93 s) T2= 50 – 9,3 T2 = 40,7 pts.
T3 = 50 + 10*(- 1,67s) T3 = 50 – 16,7 T3 = 33,3 pts.

Los puntajes “T” al igual que en los puntajes típicos “Z” se puede observar que el mayor
rendimiento fue en el segundo semestre y el peor rendimiento fue en el tercer semestre,
esto se confirma de forma directa con el valor en puntos arrojados por la escala “T”, pero
siempre hay que considerar que la Media es de 50 y la Desviación Típica de 10 puntos.

2.- Si se elige un estudiante y en el primer semestre tiene un puntaje que se aleja en 1,25
Desviaciones Típicas por encima de la Media Aritmética, en el segundo semestre obtuvo un
puntaje derivado de 65 puntos y en el tercer semestre obtuvo un puntaje neto de 14 puntos,
¿En cuál semestre el alumno que obtuvo un mejor rendimiento con respecto a su grupo y
cuáles son los puntajes reales que obtuvo en cada semestre?

Solución:

Primeramente, se presenta la solución para determinar el mejor rendimiento, para ello se


tipificarán las calificaciones después de reflejar la simbología de cada dato presentado.
Cuando se afirma “en el primer semestre tiene un puntaje que se aleja en 1,25 Desviaciones
Típicas por encima de la Media Aritmética”, esto es en lenguaje matemático: Z = 1,25 
Positivo porque es por encima y “Z” porque se refiere a la distancia en Desviaciones Típicas
Cuando se afirma “en el segundo semestre obtuvo un puntaje derivado de 65 puntos” esto
en lenguaje matemático es T = 65 pts.
Cuando se afirma “en el tercer semestre obtuvo un puntaje neto de 14 puntos” esto en
lenguaje matemático es X = 14 pts.

Hay que establecer el criterio bajo el cual se harán las comparaciones, ya sea en puntajes
“Z” o “T”. Suponiendo que se tipifique con “Z” en todos los semestres.

Primer Semestre
Dato suministrado Z = 1,25 
En este caso no hay que realizar ninguna operación porque ya está en valor “Z”

Segundo Semestre
Dato suministrado T = 65 pts.
Hay que transformar de puntaje “T” a “Z” empleando el despeje de la ecuación
T = 50 + 10 (Z)

Despejando “Z” se tiene

T  50 65  50 Z  1,5
Z Z
10 10

El puntaje típico “Z” para el segundo semestre es de Z  1,5

Tercer Semestre
Dato suministrado X = 14 pts.
Hay que transformar de puntaje “X” a “Z” empleando la ecuación

Xi  X 14  14,25
Z Z Z  0,19
S 1,35

El puntaje típico “Z” para el tercer semestre es de Z = - 0,19 

Primer Semestre: X  13,95 pts S = 1,55 pts Z = 1,25 


Segundo Semestre: X  13,80 pts. S = 1,94 pts. Z = 1,50 
Tercer Semestre: X  14,25 pts S = 1,35 pts Z = - 0,19 

Se observó que el estudiante tiene un mayor rendimiento en el segundo semestre, porque


es donde se aleja mayormente por encima de la Media Aritmética. Para determinar el
puntaje real que tiene el estudiante en cada semestre se tiene:

Primer Semestre
Dato suministrado Z = 1,25 

En este caso no hay que transformar de puntaje “Z” a puntaje “X” despejando.
“X” se tiene

Xi  X
Z Xi  Z • S  X
S

X i  1,25 • 1,55  13,95 X i  1,94  13,95 X i  15,89 puntos

La calificación obtenida por el estudiante en su promedio del primer semestre fue de 15,89
puntos aproximadamente.

Segundo Semestre:
Dato suministrado T = 65 pts.
Hay que transformar de puntaje “T” a “Z” empleando el despeje de la ecuación
T  50  10 • Z 

Despejando “Z” se tiene:

T  50 65  50 Z  1,5
Z Z
10 10

El puntaje típico “Z” para el segundo semestre es de Z =1,5  . Luego hay que transformarlo
a puntaje “X”, despejando “X” se tiene

Xi  X
Z Xi  Z • S  X
S
X i  1,50 •1,94  13,80 X i  2,91  13,80 X i  16,71 puntos

La calificación obtenida por el estudiante en su promedio del segundo semestre fue de 16,71
puntos aproximadamente.

Tercer Semestre
Dato suministrado X = 14 pts.
No hay que transformar, el puntaje real obtenido por el estudiante en el tercer semestre fue
de 14 puntos

Primer Semestre: X  13,95 pts S = 1,55 pts X = 15,89 PTS


Segundo Semestre: X  13,80 pts S = 1,94 pts X = 16,71 PTS
Tercer Semestre: X  14,25 pts S = 1,35 pts X = 14 PTS

Se observó que el estudiante tiene una calificación real superior en el segundo semestre y la
menor en el tercer semestre, ello tomando en cuenta el criterio de la escala de calificaciones
del 1 – 20 puntos.
MEDIDAS DE FORMA

Son las medidas que permiten el estudio de una serie o distribución de datos, y de acuerdo
a ellas se puede describir el grado de deformación de la información, destacando que la
asimetría y la curtosis, son las de mayor importancia.

ASIMETRÍA

El término asimetría, de acuerdo a Pinto y Pernalete (2002); indica el comportamiento de


los datos con respecto a la media aritmética, ya que describe el grado de sesgo general de
los datos, informando la concentración de valores por encima o por debajo de la media.

La variación del coeficiente de asimetría debe estar ubicada en el rango desde -1 hasta +1 y
en la medida en que se aleja de cero (0) la distribución será más asimétrica, con sesgo a la
izquierda o positivamente o a la derecha negativamente; en la medida en que se aproxime a
cero (0) la distribución tiende a ser menos asimétrica; se aproximará a un modelo en forma
de campana y si hay evidencias suficientes para confirmar que el coeficiente de asimetría
sea cero (0), la distribución será perfectamente simétrica y no existirá sesgo ni a la derecha
ni a la izquierda. Si se comparan las medidas de tendencia central (media mediana y Moda)
solamente se puede saber si la serie de datos o distribución de frecuencias es simétrica o
asimétrica, más no su grado de inclinación o sesgo.

Figura 84. Simetría y tipos de asimetría

Fuente. Pinto y Pernalete (2002)

Cabe acotar, que As es el coeficiente de asimetría, cuya formula de mayor precisión es


As 
 ( Xi  X ) 3
/n
3
s
Distribución Simétrica
Cuando el coeficiente de Asimetría de cero (0): As = 0 la distribución de los datos será de
forma simétrica respecto a la Media Aritmética y se puede afirmar que la mayoría de los
casos se concentran alrededor de la Media y las Medidas de Tendencia Central tienden a
ser de igual valor; la media aritmética, la mediana y la moda tienden a ser iguales, la curva
descrita tiene forma de campana con igual comportamiento en ambos lados de la Media
Aritmética, que al coincidir con la Mediana, es evidente que hay un 50% de casos a la
derecha y otro a la izquierda, la mayor altura está en el centro de la curva que es donde se
ubican las Medidas de Tendencia Central.
En las distribuciones simétricas, a los extremos también tienden a ser iguales en cuanto a su
comportamiento, pero existen curvas simétricas que no describen una forma de campana,
por ejemplo unos datos con forma de “U”, son simétricos respecto a la Media Aritmética,
pero la distribución es Bimodal, por tanto no es simétrica respecto a la distribución Normal y
con ello se debe tener precaución al momento de interpretar los resultados de los
coeficientes, se debe acompañar el análisis con una revisión de los datos en general.

Distribución Asimétrica Positiva (As)


Se detecta cuando el Coeficiente de Asimetría es mayor que cero (0): As > 0 Los datos se
comportan de manera irregular alrededor de la Media Aritmética, existe un sesgo a la
izquierda y la distribución es asimétricamente positiva. La mayoría de los casos se
concentran por debajo de la Media Aritmética, la Media tiende a ser mayor que la mediana y
la mediana mayor que la moda, describiendo una curva con una cola más larga a la
derecha.

Distribución Asimétrica Negativa (As)


Se detecta cuando el Coeficiente de Asimetría es menor que cero (0): As < 0 Los datos se
comportan de manera irregular alrededor de la Media Aritmética, existe un sesgo a la
derecha y la distribución es asimétricamente negativa. La mayoría de los casos se
concentran por encima de la Media Aritmética, la Media tiende a ser menor que la mediana y
la mediana menor que la moda, describiendo una curva con una cola más larga a la
izquierda

Fórmulas para el cálculo del Coeficiente de Asimetría basada en cuartiles y percentiles:


3( X  Xd ) (Q3  2Q2  Q1 ) X 90  2 * X 50  X 10
As  As  As 
s (Q3  Q1 ) X 90  X 10
Tabla referencial para la interpretación del Coeficiente de Asimetría cuando el cálculo
se realiza por percentiles.

As = 0 simétrica
- /+ 0,01  As  - /+ 0,10 se dice que es ligeramente asimétrica.
- /+ 0,11  As  - /+ 0,30 se dice que es moderadamente asimétrica
- /+ 0,31  As  - /+ 1,00 se dice que es marcadamente asimétrica

Fórmula utilizada en Exel para el cálculo de Asimetría:

A nivel de Muestra A nivel de Población

3
n 
X X   X  
N 3
n N
As  •   i  As  •  i 
n  1 • n  2 i1  S  N  1 • N  2 i1   

El paquete estadístico SPSS, determina el valor de la asimetría por la fórmula anterior, es


decir utiliza el momento tercero y para su interpretación se tiene

✓ Si As > 0, la asimetría es a la derecha o positiva; existe mayor concentración de


valores a la izquierda de la media que a su derecha.
✓ Si As = 0, existe simetría; existe la misma concentración de valores a la derecha y a
la izquierda de la media.
✓ Si As < 0, la asimetría es a la izquierda o negativa; existe mayor concentración de
valores a la derecha de la media que a su izquierda.

Tabla referencial para la interpretación del coeficiente de asimetría, cuando el cálculo


se realiza con Exel o con procesadores estadísticos.

As = 0 simétrica
- /+ 0,01  As  - /+ 1,00 se dice que es ligeramente asimétrica.
- /+ 1,01  As  - /+ 2,00 se dice que es moderadamente asimétrica
- /+ 2,01  As  - /+ 3,00 se dice que es marcadamente asimétrica

CURTOSIS

La Curtosis evalúa el grado de apuntamiento o achatamiento de la distribución de datos


empíricos respecto al modelo normal, ello para preservar el estudio de curvas, que aún
siendo simétricas, no cumplan con propiedades de que la altura sea más o menos apuntada
que la curva normal, pudiendo describir la altura que logra la curva normal en distribuciones
Mesocúrticas, que la distribución sea más apuntada en el centro que la normal llamada
Leptocúrtica o que sea más achatada que la normal conocida como Platicúrtica y de ellas
se puede inducir si los datos están más o menos dispersos en el centro que la referencia de
la curva normal. A diferencia de la Asimetría, antes de comenzar a estudiar la Curtosis, se
debe aclarar que existen diferentes interpretaciones sobre un valor referencial, esto es que
si se trabaja con varias ecuaciones y valores de normalidad diferentes, el resultado del
coeficiente debe considerar esa referencia. Por ejemplo, si se determina la Curtosis
empleando procesadores estadísticos, se tendrá un valor que tiene como referencia cero (0)
para la distribución Mesocúrtica Cuando la curtosis es mayor que cero (o) es decir que es
un valor positivo la distribución será Leptocúrtica (apuntada) y si la curtosis es menor que
cero (o) es decir que es un valor negativo la distribución será Platicúrtica (achatada) Pero
si se trabaja con la fórmula de percentiles se tiene como referencia a 0,263 para la
distribución Mesocúrtica Cuando la curtosis es mayor que 0,263 la distribución será
Platicúrtica (achatada) y si la curtosis es menor que 0,263 la distribución será
Leptocúrtica (Apuntada).

La relación se centra, en la medida que el resultado del coeficiente se aproxime a su valor


de referencia, en esa medida se aproximará a las condiciones de la curva normal. Si la
curva que representa a la serie de datos es más alta y estrecha que la curva normal diremos
que es apuntada y su se llama leptocúrtica, lo cual indica que el grupo es homogéneo en el
centro, si la curva es baja y ancha se llama platicúrtica, de allí que el grupo se heterogéneo
o disperso en el centro y si se asemeja a la normal diremos que es mesocúrtica. (Ver Figura
85)

Figura 85. Tipo de apuntamiento

Fuente: Vergara y Quesada 2013)

Fórmula de mayor precisión para el cálculo del Coeficiente de Curtosis:

Cu 
 ( Xi  X ) 4
/n
4
s

Fórmula para el cálculo del Coeficiente de Curtosis basado en percentiles:

X 75  X 25
Cu 
2 •  X 90  X 10 

Tabla referencial para la interpretación del Coeficiente de Curtosis, cuando el cálculo


se realiza con percentiles.

En este caso se toma como valor de referencia, el coeficiente 0,263

✓ Si Cu > 0,263 es platicúrtica


✓ Si Cu = 0,263 es mesocúrtica
✓ Si Cu < 0,623 es leptocúrtica

Fórmula utilizada en Exel para el cálculo de la Curtosis:

 n • n  1 n 
X X 
4
3 • n  1
2 
Cu   •   i  


 n  1 • n  2 • n  3 i 1  S  n  2 • n  3
Tabla referencial para la interpretación del Coeficiente de Curtosis, cuando el cálculo
se realiza con Excel o con procesadores estadísticos.

En este caso se toma como valor de referencia, el coeficiente 0,00

✓ Si Cu < 0,00 es platicúrtica


✓ Si Cu = 0,00 es mesocúrtica
✓ Si Cu > 0,00 es leptocúrtica

Ejemplo para el cálculo de asimetría y curtosis


Suponga que se desea investigar sobre el comportamiento de los datos en torno a la media
aritmética y el grado de apuntamiento central, en los tres primeros semestres de acuerdo a
la información suministrada en la siguiente tabla de datos:

Figura 86. Calificaciones promedios en los tres primeros semestres universitarios

Fuente: Martínez (2020)


Para efecto de la fluidez de la información, se utilizó el procesador SPSS 25, calculándose
los siguientes estadísticos:
Figura 87. Estadísticos de los tres primeros semestres universitarios
Promedio obtenido Promedio obtenido Promedio obtenido
por el estudiante por el estudiante por el estudiante
Estadísticos en el primer en el segundo en el tercer
semestre de semestre de semestre de
estudio estudio estudio
n 40 40 40
Media 13,15 16,30 17,5375
Mediana 11,50 18,75 19,00
Moda 10 20 20
Desv. Típica 3,46817 4,17686 3,68362
Percentil 10 10,00 10,00 10,00
Percentil 25 10,00 11,00 18,00
Percentil 50 11,50 18,75 19,00
Percentil 75 15,00 19,875 20
Percentil 90 19,00 20,00 20,00
Fuente: Martínez Bunicon y March (2010), recreada por Martínez (2020)

Cabe destacar que estos estadísticos también se pueden observar en la Figura 92, donde
se muestran las medidas de tendencia central, la desviación típica y los percentiles
utilizados en el cálculo de la simetría y curtosis.

Cálculo del Coeficiente de Asimetría por percentiles

X 90  2 * X 50  X 10
As 
X 90  X 10

19  2 * (11,50)  10 19  23  10 6
As1  As1  As1  As1  0,667
19  10 19  10 9

20  2 * (18,75)  10 20  37,5  10  7,5


As 2  As 2  As 2  As2  0,75
20  10 20  10 10

20  2 * (19)  10 20  38  10 8
As3  As3  As3  As3  0,80
20  10 20  10 10

Una vez calculados los tres coeficientes de asimetría, se procedió a organizarlos en la


Figura 88
Figura 88. Coeficientes de asimetría de los tres primeros semestres universitarios, haciendo
uso del cálculo de percentiles
Resultado Tipo de Distribución Grafica
Asimetría
Asimétrica positiva.
Promedio obtenido
por el estudiante La mayoría de los
en el primer + 0,667 estudiantes se encuentran
semestre por debajo de 13,15
puntos.

Asimétrica negativa
Promedio obtenido
por el estudiante La mayoría de los
- 0,75
en el segundo estudiantes se encuentran
semestre por encima de 16,3
puntos.

Asimétrica negativa
Promedio obtenido
por el estudiante La mayoría de los
- 0,80
en el tercer estudiantes se encuentran
semestre por encima de 17,54
puntos

Fuente: Martínez Bunicon y March (2010), recreada por Martínez (2020)

Interpretación.

Se observa en las calificaciones promedios del primer semestre muestran una distribución
marcadamente asimétrica positiva, significando esto que la mayoría de los estudiantes
poseen una calificación promedio en el primer semestre menor a 13,15 puntos, a diferencia
del segundo y tercer semestre donde se observó una distribución marcadamente
asimétrica negativa. En el primero de los casos, por ser una distribución marcadamente
asimétrica positiva la mayor concentración de datos está por debajo de la media del grupo
y como la media del grupo es de 13,15 puntos; se dice que la mayoría de las notas
promedios de los estudiantes se encuentran por debajo de 13,15 puntos (Ver Figura 51 en
medidas de tendencia central)

Cabe destacar, en el segundo y tercer semestre las calificaciones promedias tienden a estar
en mayor concentración por encima de sus medias por poseer distribuciones
marcadamente asimétricas negativas; pero entre estas dos últimas asimetrías, es en el
tercer semestre donde la mayoría de los estudiantes obtuvieron notas por encima del
promedio 17,54 puntos, ya que su coeficiente de asimetría se aleja más de cero (el sesgo
es más acentuado a la derecha de la curva) que en el segundo semestre. Esto lo puede
visualizar directamente, observando la figura 93 en las próximas páginas.

Con respecto al uso de la tecnología, se utilizó la herramienta EXCEL para el cálculo de los
diferentes coeficientes de asimetría en sus distintos momentos, acción que se logró
haciendo uso de la base de datos, luego se hizo Clic en el menú Formulas, Posteriormente
se seleccionó la opción más funciones y de allí se realizó un Clic en Asimetría, permitiendo
el cálculo de las mismas. (Ver Figura 92):
Figura 89. Asimetría de los tres primeros semestres universitarios, haciendo de ExCel

Resultado Tipo de Distribución Grafica


Asimetría

Asimétrica positiva
Promedio obtenido
por el estudiante
La mayoría de los
en el primer 0,907
estudiantes se encuentran
semestre
por debajo de 13,15
puntos.

Asimétrica negativa
Promedio obtenido
por el estudiante La mayoría de los
- 0,709
en el segundo estudiantes se encuentran
semestre por encima de 16,3
puntos.

Asimétrica negativa
Promedio obtenido
por el estudiante La mayoría de los
- 1,471
en el tercer estudiantes se encuentran
semestre por encima de 17,54
puntos
Fuente: Martínez Bunicon y March (2010), recreada por Martínez (2020)

Para efecto de su interpretación, se procede del mismo modo que el anterior procedimiento.
CURTOSIS
Para el cálculo de este coeficiente, vamos a utilizar la siguiente fórmula en las notas
promedios obtenidas en los tres primeros semestres de acuerdo a los datos suministrados
en la Figura 86:

X 75  X 25
Cu 
2 •  X 90  X 10 

Al respecto, se utilizaron los estadísticos establecidos en la Figura 11, de acuerdo al


semestre de interés:

15  10 5
Cu1  Cu1  Cu1  0,2778
2 • 19  10 18

19,875  10 8,875
Cu 2  Cu 2  Cu2  0,4437
2 • 20  10 20

20  18 2
Cu3  Cu3  Cu3  0,100
2 • 20  10 20
Obtenidos los tres coeficientes de curtosis, se procedió a organizar la información tal cual
como se muestra en la Figura 90:

Figura 90. Coeficientes de curtosis de los tres primeros semestres universitarios, a través
del cálculo de percentiles

Curtosis Resultado Relación Tipo de Distribución Gráfica

Promedio Platicúrtica.
obtenido por
el estudiante Cu1=0,277 > 0,263 La distribución es
0,2778 achatada en el centro
en el primer
semestre y la dispersión es alta

Promedio
obtenido por Platicúrtica.
el estudiante Cu2= 0,443 > 0,263 La distribución es
0,4437
en el achatada en el centro
segundo y la dispersión es alta
semestre

Promedio Leptocúrtica.
obtenido por
el estudiante 0,100 Cu3= 0,100 < 0,263 La distribución es
en el tercer apuntada en el centro
semestre y la dispersión es baja

Fuente: Martínez Bunicon y March (2010), y recreada por Martínez (2020)

Interpretación:
En el primer y segundo semestre se describen distribuciones platicúrticas ya que sus
resultados son mayores a 0,263; la dispersión de los datos es alta y el poder discriminativo
también es alto, sin embargo, al alejarse más en el segundo semestre del valor referencial
de 0,263, se puede confirmar que ese es el grupo con mayor dispersión porque la curva es
más achatada en el centro, respecto a la distribución normal. Mientras que en el tercer
semestre la curva es leptocúrtica y los datos tienden a concentrarse mayormente en el
centro de la distribución, por tanto, la discriminabilidad es baja.

Cuando se trabaja con los procesadores estadísticos los resultados de la Asimetría y de la


Curtosis varía de los observados al trabajar por percentiles, eso se evidencia por la
aplicación del proceso por los momentos ordinales, ya que actúa con un cálculo más agudo
y por ende considera el comportamiento de los datos en su totalidad. Si se procede a
recopilar los datos en EXCEL, SPSS o STATGRAPHICS se tiene como resultados lo
siguiente:

Figura 91. Curtosis de las calificaciones promedios de los tres primeros semestres
universitarios, a través del uso de Excel.
Curtosis Resultado Relación Tipo de Distribución Gráfica

Promedio Platicúrtica.
obtenido por La distribución es
el estudiante Cu1= - 0,636 < 0,00 achatada en el centro
- 0,6363
en el primer y la dispersión es alta
semestre porque es un valor
negativo

Promedio Platicúrtica.
obtenido por
el estudiante Cu2= - 1,422 < 0,00 La distribución es
-1,4221 achatada en el centro
en el
segundo y la dispersión es alta
semestre porque es un valor
negativo

Promedio Leptocúrtica.
obtenido por La distribución es
el estudiante 0,3602 Cu3= 0,360 > 0,00 apuntada en el centro
en el tercer y la dispersión es baja
semestre porque es un valor
positivo

Fuente: Martínez Bunicon y March (2010), recreada por Martínez (2020)

Hay que recordar que el coeficiente de curtosis mide el grado de concentración de datos en
el centro de la distribución de frecuencias o serie de datos. Si el cálculo se realiza por
EXCEL o un programa para procesar datos a nivel de estadística, se debe tomar en cuenta
como valor de referencia, el valor de Cu=0,00 para la interpretación. Los valores obtenidos
de curtosis, se pueden observar en la Figura 92

A manera de ir finalizando, se informa que el color verde por columna y semestre en la


Figura 92, representa a la calificación o estudiante que superó a su promedio, mientras que
el color rojo representa al estudiante o nota que está por debajo del promedio grupal.
Figura 92. Calculo de medidas de tendencia central, de orden Y dispersión de las
calificaciones promedios durante los tres primeros semestres universitarios

Fuente: Martinez (2020)


Figura 93. Representaciones gráficas de las distintas asimetrías de acuerdo
a las calificaciones promedios durante los tres primeros semestres universitarios

Sesgo
Asimetría Positiva

Asimetría Negativa
Sesgo

Asimetría Negativa

Sesgo

Fuente: Procesador estadístico SPSS 25.

También podría gustarte