Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Y VARIANZA
Como podrás darte cuenta, el valor del rango depende sólo de dos valores, el máximo y el
mínimo, por tal motivo se puede dar origen a una interpretación equivocada de la variación.
Por ejemplo, en el conjunto 4, 5, 5, 5, 6, 7, 7, 20, el rango es 16 (20-4), y en el conjunto 2,
4, 6, 7, 9, 12, 14, 15 el rango es 13 (15-2). El primer conjunto tiene un rango mayor que el
segundo; sin embargo, si observas detenidamente los valores en ambos, concluirás que hay
mayor variación en el segundo. La razón es porque en el primer conjunto hay un valor
extremo: el valor 20. Si se omite éste el rango sería R = 7 – 4 = 3, valor que refleja con
mayor fidelidad la dispersión o variación del primer conjunto.
Es necesario considerar el hecho anterior cuando se quiera utilizar esta medida de
variabilidad. Es innegable que una de sus ventajas es la facilidad con la que calcula; no
obstante, es poco utilizada debido a que es muy influenciable por la presencia de valores
extremos de poca frecuencia, lo que conduce a apreciaciones erróneas, ya que por lo
general se piensa que cuanto mayor es el rango, mayor es la dispersión de los datos.
Desviación estándar
Es la medida de variabilidad más adecuada por sus propiedades algebraicas, se le conoce
también como desviación típica.
Antes de abordar su definición, conviene aclarar el término desviación. Éste se utiliza para
valorar la diferencia entre un dato y el valor de la media del conjunto de datos. Por ejemplo,
si un dato es igual a 12 y la media del conjunto de datos donde él pertenece es X = 10,
entonces decimos que “la desviación de 12 respecto a su media es 2”, ya que 12-10 = 2.
Nota que, si el valor del dato es menor que la media, entonces la diferencia entre el dato y
su media, es decir, su desviación, resulta negativa. Para el concepto de desviación no
interesa su signo, sino su valor absoluto.4
El valor de s puede incrementarse de manera importante cuando se incluye uno o más datos
distantes, es decir, que se encuentran muy lejos de los demás.
Las unidades de s son las mismas de los datos originales: minutos, kilogramos, etcétera.
Para valorar si el resultado de s es grande o pequeño, se compara con el de otro conjunto de
datos. Por ejemplo, supongamos que en una prueba de tiro al blanco de 10 anillos José y
Pedro obtuvieron los siguientes resultados:
Ambos competidores obtuvieron el mismo promedio en puntaje; sin embargo, el resultado
de José es más consistente ya que su desviación estándar s es menor. Recuerda que la
desviación estándar nos indica qué tan cerca de la media están los valores involucrados, así,
los tiros de José y Pedro estuvieron alrededor de 8, pero los de José estuvieron más cerca de
8 que los de Pedro.
Varianza
La varianza es una medida de variabilidad que se obtiene elevando al cuadrado la
desviación estándar y se simboliza por s2.
Retomando el ejemplo del conjunto de datos relativo a las estaturas de 5 alumnos, la
varianza sería:
Varianza = s2 = (0.0275)2 = 0.00076 metros cuadrados
La varianza es muy importante en algunos métodos estadísticos como el análisis de
varianza, que es motivo de tratamiento en cursos más avanzados. Para los propósitos de
éste, la varianza tiene la desventaja de que sus unidades son diferentes a las del conjunto
original de datos. Nota que, en el ejemplo visto, las unidades fueron en metros cuadrados
(unidad de superficie), aunque originalmente eran metros lineales (unidad de longitud), esto
hace que su interpretación sea algo compleja.
Ejemplo:
Hallar el rango, el rango, la desviación estándar y la varianza para la siguiente situación. Se
encuestó a 300 personas preguntándoles el número de hijos que tienen.
I. ¿Qué idea gráfica tienes cuando escuchas la frase “Un grupo de manifestantes se
dispersó”?
II. Resuelve lo siguiente.
1. Halla el rango de este conjunto de datos, 30, 28, 32, 31, 42, 29, 36, 40, 37 y 33, que
expresan el peso en kilogramos de 10 personas.
2. Calcula la desviación estándar y la varianza del siguiente conjunto de datos, los cuales
representan el número de teléfonos celulares que han tenido 9 estudiantes de bachillerato: 1,
5, 1, 3, 3, 2, 4, 5, 2. Interpreta la desviación estándar.
3. Encuentra el rango, la desviación estándar y la varianza de los siguientes datos
presentados en una tabla de frecuencias simple. Se trata de los salarios diarios de 50
estudiantes universitarios.
Sólo que ahora X es la marca de clase del intervalo. Recuerda que para este caso aplicamos
siete pasos, una vez ya calculadas las marcas de clase respectivas.
_
Σf (x-x)2
s=
Ejemplo:
Durante un mes se midió el tiempo que tardan en recorrer el zoológico a 1,000 visitantes de
cierta ciudad. Los resultados se muestran en la siguiente tabla.
Nota que se usó el símbolo de aproximación en lugar del de igual, puesto que dicha fórmula
permite sólo una idea preliminar del valor de s. Cabe aclarar que esta fórmula no siempre es
válida, depende de la forma en que se comporten los datos. En el ejemplo sobre la encuesta
aplicada a 300 personas para conocer su número de hijos, encontramos que el rango fue de
6 hijos. Por lo tanto:
Este valor es muy cercano al valor correcto de 1.74, el cual se halló mediante la fórmula.
Realiza lo que se te indica en los casos siguientes.
Sugerencias acerca de las medidas de tendencia central y de variabilidad
1. No hacer interpretaciones ni obtener conclusiones de primera aproximación basadas en
una sola medida descriptiva, con excepción de los datos de una variable cualitativa.
2. Utilizar al menos una gráfica para apoyar la interpretación de las medidas descriptivas
utilizadas.
3. Utilizar toda la información posible acerca de los datos para interpretar las medidas y
gráficas obtenidas de ellos.
4. Cualquier medida de tendencia central puede usarse en variables cuyo nivel de medición
sea de intervalo o de razón. Sin embargo, debe tomarse en cuenta lo siguiente:
a) La media es una medida sensible a la presencia de valores extremos y se recomienda
utilizarla cuando la forma de la distribución de los datos presente un alto grado de simetría.
b) La mediana es una medida menos sensible a los valores extremos, por tanto, se
recomienda utilizarla cuando la forma de la distribución de los datos presente un alto grado
de asimetría.
c) La moda es insensible a los valores extremos, por lo que deberá utilizarse sólo cuando la
forma de la distribución de los datos presente picos pronunciados. De igual forma, la moda
puede indicar la presencia de información no considerada para la organización y
clasificación de los datos en una variable cuantitativa. Por ejemplo, la presencia de dos
modas puede sugerir que un conjunto de datos debe dividirse en dos subgrupos para
analizarlos.
d) Si se tiene una variable ordinal en la cual se ha utilizado un valor numérico para las
categorías, la mediana es la medida más adecuada para analizar este tipo de variables.
5. Cualquier medida de variabilidad puede usarse para analizar datos de variable con nivel
de medición de intervalo y de razón.
6. La medida de variabilidad a utilizar generalmente depende de la medida de tendencia
central seleccionada, el siguiente cuadro permite orientarnos al respecto.
Ejemplo:
A 28 jóvenes aspirantes se les toma el pulso (frecuencia cardiaca) antes de presentar un
examen de admisión. Los datos arrojados fueron los siguientes:
5. En los datos 560, 610, 420, 600, 500, 580, 630, ¿qué valor se debe agregar para que la
media sea 560?
6. En los datos 3, 12, 24, 17, 9, 6, 13, 41, 36, ¿qué valor agregarías para que la mediana sea
15?
7. En la serie de datos azul, azul, azul, verde, verde, verde, rojo, rojo, negro, negro, negro,
negro, amarillo, amarillo, café, café, café, ¿qué datos se necesitan para que la moda sea
rojo y verde?
8. Encuentra el rango, la desviación estándar y la varianza de la siguiente serie de datos: 2,
15, 9, 16, 3, 4, 8, 4, 5, 5, 5, 8.
9. Calcula las medidas de variabilidad: desviación estándar y varianza de las calificaciones
de 40 alumnos en una prueba calificada de 1 a 50.
10. Calcula tanto las medidas de tendencia central como las de variabilidad de los datos
siguientes.
11. Los siguientes datos representan el número de enfermos que acuden al servicio de
urgencias de un hospital durante 100 días elegidos aleatoriamente a lo largo de un año.
Calcula las medidas de tendencia central y de variabilidad e interpreta los resultados,
apoyándote en algún gráfico.