Está en la página 1de 14

MEDIDAS DE VARIABILIDAD: RANGO, DESVIACION ESTANDAR

Y VARIANZA

Las medidas de variabilidad, también llamadas medidas de dispersión, indican ciertos


aspectos del conjunto de datos que no nos dicen las medidas de tendencia central; por lo
tanto, una descripción más completa de la naturaleza de un conjunto de datos se obtiene
cuando se utilizan tanto las medidas de tendencia central como las de variabilidad o
dispersión. De hecho, los cálculos para hallar algunas medidas de variabilidad involucran a
la media.
Una medida de tendencia central se emplea para ubicar el centro de un conjunto de datos;
no obstante, con frecuencia resulta igualmente importante describir la manera en que los
datos están diseminados o dispersos a cada lado del centro. A esta diseminación
comúnmente se le conoce como variación o dispersión.
Una variación o dispersión pequeña indica un alto grado de homogeneidad en los datos,
mientras que una grande indica poca homogeneidad. Por ejemplo, si en una fábrica que se
dedica a producir tornillos se encontrara una alta variación en los diámetros de los mismos,
habría un alto porcentaje de productos defectuosos. Por otro lado, si se tratara de elegir
entre varios aspirantes a ocupar el puesto de contador y el examen arrojara poca variación
en los puntajes, la elección se torna más difícil al tener una población relativamente
homogénea de aspirantes.

Considera las dos distribuciones de datos mostradas en la figura anterior. Se trata de


calificaciones obtenidas por 20 mujeres e igual número de hombres en una prueba. Ambas
centradas en X = 6, sin embargo, puedes observar que hay una gran diferencia en la forma
en que se dispersan o varían. Las calificaciones de las mujeres varían de 2 a 10, mientras
que en los hombres varían de 4 a 8.
Existen varias medidas de variabilidad, las que nosotros abordaremos son:
 Rango
 Desviación estándar
 Varianza
Cabe señalar que los conceptos a revisar sólo tienen sentido para variables cuantitativas
medidas en escalas de intervalo o de razón.
Cálculo de las medidas de variabilidad para datos no agrupados
Rango
Se calcula hallando la diferencia (resta) entre los valores máximo y mínimo. Rango = R =
Valor máximo – Valor mínimo

Como podrás darte cuenta, el valor del rango depende sólo de dos valores, el máximo y el
mínimo, por tal motivo se puede dar origen a una interpretación equivocada de la variación.
Por ejemplo, en el conjunto 4, 5, 5, 5, 6, 7, 7, 20, el rango es 16 (20-4), y en el conjunto 2,
4, 6, 7, 9, 12, 14, 15 el rango es 13 (15-2). El primer conjunto tiene un rango mayor que el
segundo; sin embargo, si observas detenidamente los valores en ambos, concluirás que hay
mayor variación en el segundo. La razón es porque en el primer conjunto hay un valor
extremo: el valor 20. Si se omite éste el rango sería R = 7 – 4 = 3, valor que refleja con
mayor fidelidad la dispersión o variación del primer conjunto.
Es necesario considerar el hecho anterior cuando se quiera utilizar esta medida de
variabilidad. Es innegable que una de sus ventajas es la facilidad con la que calcula; no
obstante, es poco utilizada debido a que es muy influenciable por la presencia de valores
extremos de poca frecuencia, lo que conduce a apreciaciones erróneas, ya que por lo
general se piensa que cuanto mayor es el rango, mayor es la dispersión de los datos.
Desviación estándar
Es la medida de variabilidad más adecuada por sus propiedades algebraicas, se le conoce
también como desviación típica.
Antes de abordar su definición, conviene aclarar el término desviación. Éste se utiliza para
valorar la diferencia entre un dato y el valor de la media del conjunto de datos. Por ejemplo,
si un dato es igual a 12 y la media del conjunto de datos donde él pertenece es X = 10,
entonces decimos que “la desviación de 12 respecto a su media es 2”, ya que 12-10 = 2.
Nota que, si el valor del dato es menor que la media, entonces la diferencia entre el dato y
su media, es decir, su desviación, resulta negativa. Para el concepto de desviación no
interesa su signo, sino su valor absoluto.4

La desviación estándar se simboliza por s y es una medida de la variación de los valores


respecto a la media. Es una especie de desviación promedio respecto a la media.
La desviación estándar se calcula con la siguiente fórmula:

Antes de explicar el procedimiento para la aplicación de la fórmula anterior, es importante


señalar que: El valor de la desviación estándar • s es positivo. Resulta cero cuando todos los
valores de los datos son el mismo número. Además, valores grandes de s indican mayores
cantidades de variación.

El valor de s puede incrementarse de manera importante cuando se incluye uno o más datos
distantes, es decir, que se encuentran muy lejos de los demás.
Las unidades de s son las mismas de los datos originales: minutos, kilogramos, etcétera.
Para valorar si el resultado de s es grande o pequeño, se compara con el de otro conjunto de
datos. Por ejemplo, supongamos que en una prueba de tiro al blanco de 10 anillos José y
Pedro obtuvieron los siguientes resultados:
Ambos competidores obtuvieron el mismo promedio en puntaje; sin embargo, el resultado
de José es más consistente ya que su desviación estándar s es menor. Recuerda que la
desviación estándar nos indica qué tan cerca de la media están los valores involucrados, así,
los tiros de José y Pedro estuvieron alrededor de 8, pero los de José estuvieron más cerca de
8 que los de Pedro.

Varianza
La varianza es una medida de variabilidad que se obtiene elevando al cuadrado la
desviación estándar y se simboliza por s2.
Retomando el ejemplo del conjunto de datos relativo a las estaturas de 5 alumnos, la
varianza sería:
Varianza = s2 = (0.0275)2 = 0.00076 metros cuadrados
La varianza es muy importante en algunos métodos estadísticos como el análisis de
varianza, que es motivo de tratamiento en cursos más avanzados. Para los propósitos de
éste, la varianza tiene la desventaja de que sus unidades son diferentes a las del conjunto
original de datos. Nota que, en el ejemplo visto, las unidades fueron en metros cuadrados
(unidad de superficie), aunque originalmente eran metros lineales (unidad de longitud), esto
hace que su interpretación sea algo compleja.
Ejemplo:
Hallar el rango, el rango, la desviación estándar y la varianza para la siguiente situación. Se
encuestó a 300 personas preguntándoles el número de hijos que tienen.
I. ¿Qué idea gráfica tienes cuando escuchas la frase “Un grupo de manifestantes se
dispersó”?
II. Resuelve lo siguiente.
1. Halla el rango de este conjunto de datos, 30, 28, 32, 31, 42, 29, 36, 40, 37 y 33, que
expresan el peso en kilogramos de 10 personas.
2. Calcula la desviación estándar y la varianza del siguiente conjunto de datos, los cuales
representan el número de teléfonos celulares que han tenido 9 estudiantes de bachillerato: 1,
5, 1, 3, 3, 2, 4, 5, 2. Interpreta la desviación estándar.
3. Encuentra el rango, la desviación estándar y la varianza de los siguientes datos
presentados en una tabla de frecuencias simple. Se trata de los salarios diarios de 50
estudiantes universitarios.

Cálculo de la desviación estándar y la varianza para datos agrupados


Para calcular la desviación estándar y la varianza en datos agrupados, se aplica la misma
fórmula utilizada cuando se tenían los datos en una tabla de frecuencias simple, esto es:

Sólo que ahora X es la marca de clase del intervalo. Recuerda que para este caso aplicamos
siete pasos, una vez ya calculadas las marcas de clase respectivas.
_

Σf (x-x)2

s=

Ejemplo:
Durante un mes se midió el tiempo que tardan en recorrer el zoológico a 1,000 visitantes de
cierta ciudad. Los resultados se muestran en la siguiente tabla.
Nota que se usó el símbolo de aproximación en lugar del de igual, puesto que dicha fórmula
permite sólo una idea preliminar del valor de s. Cabe aclarar que esta fórmula no siempre es
válida, depende de la forma en que se comporten los datos. En el ejemplo sobre la encuesta
aplicada a 300 personas para conocer su número de hijos, encontramos que el rango fue de
6 hijos. Por lo tanto:

Este valor es muy cercano al valor correcto de 1.74, el cual se halló mediante la fórmula.
Realiza lo que se te indica en los casos siguientes.
Sugerencias acerca de las medidas de tendencia central y de variabilidad
1. No hacer interpretaciones ni obtener conclusiones de primera aproximación basadas en
una sola medida descriptiva, con excepción de los datos de una variable cualitativa.
2. Utilizar al menos una gráfica para apoyar la interpretación de las medidas descriptivas
utilizadas.
3. Utilizar toda la información posible acerca de los datos para interpretar las medidas y
gráficas obtenidas de ellos.
4. Cualquier medida de tendencia central puede usarse en variables cuyo nivel de medición
sea de intervalo o de razón. Sin embargo, debe tomarse en cuenta lo siguiente:
a) La media es una medida sensible a la presencia de valores extremos y se recomienda
utilizarla cuando la forma de la distribución de los datos presente un alto grado de simetría.
b) La mediana es una medida menos sensible a los valores extremos, por tanto, se
recomienda utilizarla cuando la forma de la distribución de los datos presente un alto grado
de asimetría.
c) La moda es insensible a los valores extremos, por lo que deberá utilizarse sólo cuando la
forma de la distribución de los datos presente picos pronunciados. De igual forma, la moda
puede indicar la presencia de información no considerada para la organización y
clasificación de los datos en una variable cuantitativa. Por ejemplo, la presencia de dos
modas puede sugerir que un conjunto de datos debe dividirse en dos subgrupos para
analizarlos.
d) Si se tiene una variable ordinal en la cual se ha utilizado un valor numérico para las
categorías, la mediana es la medida más adecuada para analizar este tipo de variables.
5. Cualquier medida de variabilidad puede usarse para analizar datos de variable con nivel
de medición de intervalo y de razón.
6. La medida de variabilidad a utilizar generalmente depende de la medida de tendencia
central seleccionada, el siguiente cuadro permite orientarnos al respecto.

Ejemplo:
A 28 jóvenes aspirantes se les toma el pulso (frecuencia cardiaca) antes de presentar un
examen de admisión. Los datos arrojados fueron los siguientes:

Contesta los siguientes ejercicios.


1. Explica la diferencia entre las medidas de tendencia central y las de variabilidad.
2. En un laboratorio, se pesan 10 animales cuyos pesos en kilogramos son los siguientes:
12, 20, 28, 14, 26, 20, 19, 21, 23, 17. Calcula e interpreta la media, mediana y moda.
3. Calcula e interpreta las medidas de tendencia central de los resultados obtenidos al
realizar una encuesta a 30 estudiantes de bachillerato para conocer cuántos libros habían
leído durante los últimos tres años:
4. Calcula e interpreta la media, mediana y moda de los siguientes datos acerca del tiempo
que 188 estudiantes dedican al estudio fuera de clases.

5. En los datos 560, 610, 420, 600, 500, 580, 630, ¿qué valor se debe agregar para que la
media sea 560?
6. En los datos 3, 12, 24, 17, 9, 6, 13, 41, 36, ¿qué valor agregarías para que la mediana sea
15?
7. En la serie de datos azul, azul, azul, verde, verde, verde, rojo, rojo, negro, negro, negro,
negro, amarillo, amarillo, café, café, café, ¿qué datos se necesitan para que la moda sea
rojo y verde?
8. Encuentra el rango, la desviación estándar y la varianza de la siguiente serie de datos: 2,
15, 9, 16, 3, 4, 8, 4, 5, 5, 5, 8.
9. Calcula las medidas de variabilidad: desviación estándar y varianza de las calificaciones
de 40 alumnos en una prueba calificada de 1 a 50.

10. Calcula tanto las medidas de tendencia central como las de variabilidad de los datos
siguientes.

11. Los siguientes datos representan el número de enfermos que acuden al servicio de
urgencias de un hospital durante 100 días elegidos aleatoriamente a lo largo de un año.
Calcula las medidas de tendencia central y de variabilidad e interpreta los resultados,
apoyándote en algún gráfico.

También podría gustarte