Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Por otro lado, la mediana de un conjunto de datos es la medida de tendencia central que
indica el valor intermedio, cuando los datos originales se presentan en orden de
magnitud creciente (o decreciente). La mediana no utiliza directamente todos los valores
de datos.
También está la moda, como medida de tendencia central utilizada en datos cualitativos
la moda de un conjunto de datos es el valor que ocurre con mayor frecuencia. La cual
tiene propiedades como:
Un conjunto de datos puede tener una moda, o múltiples modas, o no tener
ninguna.
Cuando ningún valor de datos se repite, se dice que no hay moda.
Cuando más de dos valores de datos ocurren con la misma mayor frecuencia,
cada uno es una moda y se dice que el conjunto de datos es multimodal.
Otra medida es la mitad del rango. La mitad del rango de un conjunto de datos es la
medida de tendencia central que consiste en el valor que está a la mitad entre los valores
máximo y mínimo del conjunto de datos original. Entre sus propiedades tiene:
Debido a que la mitad del rango utiliza sólo los valores máximo y mínimo, es
muy sensible a esos extremos y, por lo tanto, no es resistente.
En la práctica, la mitad del rango se utiliza con poca frecuencia, pero tiene tres
características redentoras.
Medidas de variación
En estas medidas hay varias reglas, como la regla del redondeo, esta se basa en que, al
redondear el valor de una medida de variación, conserve un decimal más que los
presentes en el conjunto original de datos. Las tres medidas importantes de variación: el
rango, la desviación estándar y la varianza.
Entre las medidas de variación se encuentra el rango, el rango de un conjunto de valores
de datos es la diferencia entre el valor máximo de datos y el valor mínimo de datos.
Utiliza sólo los valores máximo y mínimo de los datos, por lo que es muy sensible a los
valores extremos.
La desviación estándar es la medida de variación más comúnmente utilizada en
estadística. Es una medida de cuánto se desvían los valores de datos de la media. Se
calcula utilizando la fórmula 3-4 o 3-5. La fórmula 3-5 es solamente una versión
diferente de la fórmula 3-4; ambas son algebraicamente iguales. Esta tiene una amplia
gama de propiedades:
La desviación estándar es una medida de cuánto se desvían los valores de datos
de la media.
El valor de la desviación estándar s nunca es negativo. Es cero sólo cuando
todos los valores de datos son exactamente iguales.
Las unidades de la desviación estándar s (como minutos, pies, libras) son las
mismas que las unidades de los valores de datos originales
Por último nos encontramos con la varianza de una muestra y de una población La
varianza de un conjunto de valores es una medida de variación igual al cuadrado de la
desviación estándar.
• Varianza muestral: s2--- cuadrado de la desviación estándar s.
• Varianza poblacional: σ2-- cuadrado de la desviación estándar poblacional s
Al comparar la variación en muestras o poblaciones con medias muy diferentes, es
mejor utilizar el coeficiente de variación, el cual para un conjunto de datos muestrales o
poblacionales no negativos, expresado como porcentaje, describe la desviación estándar
en relación con la media, y está dado por:
Mediana = 7 horas
3. Moda de sueño ¿Cuál es la moda de los valores muestrales listados
en el ejercicio 1?
Moda = 7 y 8 (bimodal)
4. Varianza de sueño. La desviación estándar de los valores
muestrales en el ejercicio 1 es de 1.3 horas. ¿Cuál es la varianza
(incluyendo las unidades)?
Varianza = s2 = 1.32 = 1.69 horas2
respectivamente.
Ejercicios de repaso
1. Géiser Old Faithful. A continuación se listan los errores de
predicción (minutos) que son las diferencias entre los tiempos
reales de erupción y los tiempos de erupción previstos. Los números
positivos corresponden a erupciones que ocurrieron más tarde de lo
previsto, y los números negativos corresponden a erupciones que
ocurrieron antes del pronóstico. (Los datos provienen del conjunto
de datos 23 “Old Faithful” en el apéndice B). Encuentre (a) la media;
(b) la mediana; (c) la modo; (d) la mitad del rango; (e) el rango; (f) la
desviación estándar; (g) la varianza; (h) Q1; (i) Q3
4 -7 0 1 -1 1 -4 -7 22 7 -5 1
a) 1.0 min b) 0.5 min c) 1 min d) 7.5 min e) 29.0 min f) 7.9 min
g) 61.8 min2 h) -4.5 min i) 2.5 min
Resumen de 5 números: -7 min, -4.5 min, 0.5 min, 2.5 min, 22 min.
a. Media = 6.09 µg
b. Mediana =6.45 µg
c. Desviación estándar = 1.75 µg
d. Varianza = 3.06 µg2
e. Rango = 6.70 µg