Las medidas de varianza, son un conjunto de datos que establecen o permiten
conocer la dispersión de un rango de valores en la escala de medición con respecto a la
media aritmética de los valores; estos permiten crear una imagen mental de la dispersión de datos.
El rango es el diferencial del dato de mayor peso y el menor de los valores de un
conjunto de cifras.
La varianza es el promedio de los cuadrados de las desviaciones medidas
alrededor de la media aritmética. Este promedio diferirá cuando calculemos la dispersión de datos para una muestra o una población.
Varianza para una población
Varianza para una muestra
La desviación estándar es una medida que calcula el grado de dispersión de los
datos respecto al valor promedio, esto es igual a la raíz cuadrada positiva de la varianza.
Teorema de Chebyshev
Dado un numero K mayor o igual a 1 y un conjunto de n mediciones al menos
[1-(1/k^2)] de las mediciones estarán dentro de K desviaciones estándar de su media.
Este teorema permite describir la variabilidad de una muestra o población ,donde lo
primero que debemos hacer es construir un intervalo a partir de una distancia a cualquier lado de la media aritmética ,el rango de la distancia estará comprendido por un numero K que deberá ser mayor o igual a 1,por lo que al menos [1-(1/k^2)] del número total de un rango de n mediciones estará en el intervalo construido. La regla empírica puede describir cuando los datos tienden a ser forma más o menos del montículo o datos que tienden a apilarse cerca del centro de la distribución.
El intervalo (m+-s) contiene aproximadamente el 68% de las mediciones
El intervalo (m +-2s) contiene aproximadamente el 95% de las mediciones
El intervalo (m +-3s) contiene aproximadamente el 99,7% de las mediciones
Al comparar ambas herramientas veremos que el teorema de Chebyshev es una
estimación de la fracción de mediciones que residen en un intervalo particular y la regla empírica es más precisa en esa estimación.
Estas dos herramientas permiten detectar errores en el cálculo de la desviación
estándar, indica la mayoría de las veces las mediciones que caen dentro de las desviaciones estándar de su media, puede ser útil para localizar errores grandes en el cálculo de la desviación estándar.