Está en la página 1de 35

Medidas de

Dispersión
ESTADÍSTICA DESCRIPTIVA
Medidas de
Dispersión
• A la variedad que muestra un conjunto de
observaciones, se le denomina . Una
medida de dispersión presenta información
respecto a la cantidad total de variabilidad
presente en el conjunto de datos. Si los datos son
iguales, se dice que no hay dispersión.
• A continuación se describen las medidas de
dispersión más utilizadas:
Para redondear el valor de una medida de
variación, conserve un decimal más que los
Regla de
presentes en el conjunto original de datos. Redondeo
para
Por ejemplo, si la lista de datos tienen un solo
decimal, el resultado de cualquiera de las
medidas de
medidas de dispersión o variación tendrá dos
decimales, etc. dispersión
• Es la diferencia entre el valor más pequeño y el más
grande en un conjunto de datos.
Rango = (valor máximo) - (valor mínimo)

• El rango utiliza solo los valores máximo y mínimo


de los datos, por lo que es muy sensible a los
valores extremos. El rango no es resistente.
Rango • Debido a que el rango utiliza solo los valores
máximo y mínimo, no toma en cuenta todos los
valores y, por lo tanto, no refleja realmente la
variación entre todos los valores de los datos
(Triola, 2018, p. 98).
• Encuentre el rango de estas
velocidades de datos (en Mbps) para
Telcel: 38.5, 55.6, 22.4, 14.1, 23.1.

• El rango se encuentra restando el


valor mayor menos el valor menor:
Ejemplo • Rango = 55.6 - 14.1 = 41.50 Mbps
• El rango de 41.50 Mbps se muestra
con un decimal más que los presentes
en los valores de datos originales, por
la regla de redondeo para medidas
de dispersión mencionada
anteriormente.
Calcula el rango de
una muestra de la 22, 40, 26, 44, 21,
edad de 10 41, 26, 46, 36, 63
personas.

La persona más
tiene 63 años, el
Ejemplo joven tiene 21 años
y la persona mayor
rango es:

R = 63 – 21 = 42.0
• Cuando los valores de un conjunto de datos se
encuentran ubicados cerca de su media, la
dispersión es menor que cuando están
esparcidos.
• Se puede pensar que es posible medir la
Varianza dispersión en función del esparcimiento de los
valores alrededor de su media.
Esta medición se efectúa mediante la
Fórmulas de la Varianza
• Fórmula de la varianza poblacional:

• Fórmula de la varianza muestral:

• Lo más común es usar la fórmula de la varianza muestral


Las unidades de la varianza son los cuadrados de las
unidades de los valores de datos originales. (Si los
valores de datos originales están en metros, la
varianza tendrá unidades de metros2; si están en
segundos, la varianza tendrá unidades de seg2).

Propiedades
importantes El valor de la varianza puede aumentar
dramáticamente con la inclusión de valores atípicos

de la (La varianza no es resistente).

Varianza
El valor de la varianza nunca es negativo. Es cero
solo cuando todos los valores de datos son el mismo
numero.
Ejemplo:
• Encontrar la varianza de las velocidades de
datos (en Mbps) para Telcel: 38.5, 55.6, 22.4,
14.1, 23.1.
• Media = 30.74
• s2 = (38.55-30.74)2 + (55.6-30.74)2 + (22.4-
30.74)2 + (14.1-30.74)2 + (23.1-30.74)2 / 5 =
• s2 = (38.55-30.74)2 + (55.6-30.74)2 + (22.4-
30.74)2 + (14.1-30.74)2 + (23.1-30.74)2 / 5 =
• s2 = 60.99 + 618.02 + 69.55 + 276.89 + 58.37 /
5=
• s2 = 1083.82 / 5 = 216.7640
Ejemplo • Calcula la varianza de las edades de un grupo de 10
personas:
22, 40, 26, 44, 21, 41, 26, 46, 36, 63
• Se obtiene la media de las edades = 36.5

La razón de dividir, en la varianza muestral, entre n – 1,


en lugar de entre n, es una consideración teórica
conocida como
Desviación Estándar
• Para obtener la medida de dispersión en unidades originales (no
cuadradas), se debe obtener la raíz cuadrada de la varianza y a este
procedimiento se le denomina .
• A continuación se muestra la fórmula de la desviación estándar:
La desviación estándar es Su valor nunca es negativo.
una medida de cuánto se Es cero solo cuando todos
desvían los valores de los valores de datos son
datos de la media. exactamente iguales.

Propiedades
Los mayores valores de s
indican mayores
La desviación estándar s
puede aumentar
de la
cantidades de variación.
dramáticamente con uno o
mas valores atípicos. Desviación
Estándar
Las unidades de medida
son las mismas que las
unidades de los valores de
datos originales.
• Lo que se necesita cuando se tienen dos poblaciones diferentes es una varianza
relativa en lugar de una de varianza absoluta; dicha medida la constituye el
, el cual expresa la desviación estándar como un
porcentaje de la media.
• A continuación se presenta la fórmula del coeficiente de variación:
Ejemplo
• Calcular el coeficiente de variación de los siguientes datos:

• El objetivo es saber cuál tiene mayor variabilidad, los pesos de las


personas de 26 años o los de 12 años.
El coeficiente de variación para las personas de 26 años es:

El coeficiente de variación para las personas de 12 años es:

Si se comparan las desviaciones estándar, se puede concluir que las dos


muestras presentan la misma variabilidad; sin embargo, en el momento
de obtener el coeficiente de variabilidad, la impresión es diferente.
Ejercicio
• Calcula la media, la varianza, la desviación típica y el coeficiente de
variación, tras encuestar a 25 familias sobre el número de hijos que
tenían, se obtuvieron los siguientes datos:
• Realizar la tabla de frecuencias y las medidas de tendencia central.
No. De hijos (Xi) No. De Familias (ni)
0 5
1 6
2 8
3 4
4 2
Medidas de Posición
Percentiles
Un percentil es un conjunto de n observaciones X1, X2…Xn el p-ésimo percentil P es el valor de
X, tal que p por ciento o menos de las observaciones son menores que P y (100 – p) por ciento
o menos de las observaciones son mayores que P.
Los subíndices en P sirven para distinguir un percentil del otro. El percentil quincuagésimo es la
mediana y se designa como P50.

El vigésimo quinto percentil suele representar el primer cuartil y se expresa como Q1.

Al quincuagésimo percentil (la mediana) se le conoce como segundo cuartil o cuartil medio y se
representa por Q2. Al septuagésimo quinto percentil se le llama tercer cuartil y es Q3.
¿Qué son los
cuartiles?

• Los cuartiles son una herramienta


que usamos en la estadística y
que nos sirve para administrar
grupos de datos previamente
ordenados.

• Los cuartiles son los tres valores


de la variable que dividen a un
conjunto de datos ordenados en
cuatro partes iguales.
Cálculo de cuartiles
Cálculo de cuartiles
Cálculo de
los cuartiles
para datos
agrupados
Cálculo de
los cuartiles
para datos
agrupados
Ejemplo de
cuartiles
• Calcular los cuartiles de la
distribución de la tabla:
Ejemplo de cuartiles
En primer lugar crearemos una
nueva columna con los valores de
la frecuencia acumulada:

En la primera casilla colocamos la


primera frecuencia absoluta.

En la segunda casilla sumamos el


valor de la frecuencia acumulada
anterior más la frecuencia absoluta
correspondiente y así
sucesivamente hasta la última, que
tiene que ser igual a:
Cálculo del primer cuartil
Cálculo del primer cuartil
Cálculo del segundo cuartil
Cálculo del
tercer cuartil
Cuando se quiere encontrar los cuartiles para el conjunto de
datos, se utilizan las siguientes fórmulas:
• La amplitud del intercuartil (IQR) es la diferencia entre el tercero y
el cuarto cuartil, lo que significa:

• Lo que indica una magnitud mayor de variabilidad entre el 50%


central de las observaciones relevantes; un IQR pequeño indica
una magnitud pequeña de variabilidad entre las observaciones
relevantes.

• Para obtener la amplitud (R), se puede hacer una comparación,


formando la razón del IQR y multiplicando por 100; esto quiere
decir, 100(IQR/R) lo cual indica que el porcentaje de IQR es de
toda la amplitud.
Referencias
• https://ekuatio.com/medidas-de-dispersion-recorrido-desviacion-
media-varianza-y-desviacion-tipica/

También podría gustarte