Está en la página 1de 32

MEDIDAS DE

DISPERSIÓN
CORTEZ TELLO KAROL YASMÍN
Rango.
MEDIDAS DE Varianza.
DISPERSIÓN Desviación estándar.
Coeficiente de variación.
Llamadas también medidas de variabilidad, miden el grado de separación de los
datos respecto a un valor central.
Son útiles porque:
1. Permiten juzgar la confiabilidad de la medida de tendencia central.
2. Los datos demasiados dispersos tienen un comportamiento especial.
3. Es posible comparar dispersión de diversas muestras.
4. Permite determinar el tipo de población, tipo muestreo.
5. Mide la bondad de ajuste en un análisis de regresión.
6. Cuantifica los riesgo en toma de decisiones.
MEDIDAS DE DISPERSIÓN

ABSOLUTAS RELATIVAS

Rango Coeficiente de
Variación

Rango Intercuartílico

Varianza

Desviación Estándar
MEDIDAS DE DISPERSIÓN: ABSOLUTAS
Rango o amplitud: R
Se define como la diferencia entre el valor máximo y el valor mínimo de un
conjunto de datos, es decir:
Indica la diferencia o variación que
R = X máx. – X mín. existe en un conjunto de datos entre el
valor máximo y el valor mínimo.

CARACTERÍSTICAS:
• Solo usa dos datos para su cálculo.
• Hace referencia al recorrido que hace la variable desde el valor mínimo hasta el valor
máximo.
• Es afectado por valores atípicos, por lo que no se recomienda su uso.
• Es la medida de dispersión mas sencilla de calcular.
• El rango aumenta o se mantiene al incrementar el número de datos.
• Se usa cuando el número de datos es pequeño.
EJEMPLO
Se tiene el tiempo de espera (en minutos), de los pacientes que acudieron al
servicio de medicina en el Hospital San Pedro en diciembre 2020.
10
10 13 22 26 16 23 35 43 17 32 41 35 24 23 27 16 20 50
50 48

Determine la variabilidad total de los tiempos de espera.

X mín. = 10 X máx. = 50

R = 50 – 10 = 40 min.
RANGO INTERCUARTÍLICO
Se define como la diferencia entre el primer y tercer cuartil, es decir:
Indica la variabilidad total del
RIC = Q3 – Q1 50% de los datos centrales
entre el cuartil 1 y cuartil 3.

CARACTERÍSTICAS:

• Su cálculo es sencillo, solo usa dos cuartiles.


• Hace referencia al recorrido que hace la variable desde el cuartil 1 hasta el cuartil 3.
• No es afectado por valores atípicos o extremos, se recomienda su uso.
• El rango aumenta o se mantiene al incrementar el número de datos.
• Excluye el 25% mas alto y el 25% mas bajo.
• Se usa cuando la mediana es representativa a un conjunto de datos.
EJEMPLO
Si Q1=8,82 años; Q3=15,65 años corresponde la experiencia (en años) del personal
que labora en la clínica Limatambo.
a.-¿Entre qué valores se encuentra el 50% intermedio de estos datos?

El 50% de los trabajadores con experiencia intermedia se encuentran entre


8,82 y 15,65 años.

b.- ¿Cuál es el rango intercuartílico?

RIC = 15.65 – 8.82 = 6.83 años.


VARIANZA
Es una medida de Dispersión que indica cómo las observaciones se separan de la
Media Aritmética.
Se define como el promedio de las desviaciones al cuadrado de cada uno de los
datos con respecto a la media.
Indica el grado de variabilidad de los datos con respecto a la media.

CARACTERÍSTICAS:

• Sus unidades están elevadas al cuadrado.


• Se usa cuando la media es representativa a un conjunto de datos.
• Esta medida de dispersión será grande si las observaciones están distantes de la media y
pequeña si están cerca.
• Es mayor o igual a cero.
Para obtener sus valores depende como se presentan los datos.

DATOS NO AGRUPADOS DATOS AGRUPADOS


117 161 116 Sin Intervalos Con Irtevalos
353 123 376
EJEMPLO
Los siguientes son tiempos de hospitalización en días de una muestra aleatoria de
10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5.
Determine el grado de variabilidad del tiempo de hospitalización.
∑ 𝑥𝑖 = 55 ; 𝜂 = 10 ; x = = 5,5

= 2.28 días

Al trabajar con la varianza las unidades están elevadas al cuadrado por lo que dificulta su
interpretación, es decir no es recomendable usar la varianza para analizar datos, en este caso
recurriremos a su alternativa la desviación estándar
DESVIACIÓN ESTÁNDAR
La desviación estándar o desviación típica es una medida de variabilidad de los
datos respecto a la media aritmética.
Se define como la raíz cuadrada de la varianza.
Indica la dispersión promedio de los datos con respecto a la media.

CARACTERÍSTICAS:
• Sus unidades no están elevadas al cuadrado.
• Se usa cuando la media es representativa a un conjunto de datos.
• Cuanto menor sea la desviación estándar, menor será la dispersión (más
homogénea) y cuanto mayor sea la desviación típica, mayor dispersión (menos
homogénea).
• Es mayor o igual a cero.
EJEMPLO
Retomando el ejemplo de los tiempos de hospitalización en días de una muestra
aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5.
Determine la desviación estándar de los tiempo de hospitalización.

La dispersión promedio del tiempo de hospitalización en la muestra es de 1,51 días


con respecto al promedio.

𝑆 = = = = 1.51 días.
MEDIDAS DE DESPERSIÓN: RELATIVAS
COEFICIENTE DE VARIACIÓN
Es una MEDIDA RELATIVA de variabilidad de los datos entre la media y la
desviación estándar de una población. Expresa qué tanto por ciento la desviación
estándar representa de la media aritmética.
CV = *1OO%

Si 00 < C.V. ≤ 10%, poca dispersión.


Si CV ≤ 33%, Población HOMOGENEA
Si 10 < C.V. ≤ 33%, dispersión aceptable.
Si 33 < C.V. ≤ 50%, alta dispersión.
Si CV > 33%, Población
Si C.V. > 50%, dispersión muy alta. HETEROGENEA
Es útil para comparar la variabilidad relativa de datos de dos o más distribuciones
expresados en unidades iguales o diferentes. Habrá mayor dispersión en la
distribución que tenga mayor coeficiente de variación y viceversa.
EJEMPLO
Tiempos de hospitalización en días de una muestra aleatoria de 10 pacientes. 5, 7,
6, 4, 5, 7, 8, 5, 3, 5.
Determine el porcentaje de variación de los tiempo de hospitalización
Con respecto a la media. En la muestra la desviación estándar es el
𝐂𝐕 = *100% = *100% = 27.2% 27.2% de la media, es decir, el 27.2% de la
variación de los tiempos de hospitalización
respecto de la media. Además, la
dispersión de los tiempos de hospitalización
es aceptable y se trata de una población
homogénea.
EJEMPLO
Supongamos que de dos poblaciones se han obtenido los siguientes datos:
Grupo 1 Grupo 2
μ = 25 años 21 años ¿Qué grupo es más
homogéneo o menos variable?
PESO TALLA
μ = 72.5 Kg 165 cm = *100% = 6.9%

σ = 5 Kg 5 cm
N = 15 15
= *100% = 3.03%

La dispersión de las tallas del grupo 2 es menor que la dispersión de los pesos del grupo 1 .
MEDIDAS DE
TENDENCIA
CENTRAL
CORTEZ TELLO KAROL YASMÍN
Medidas de tendencia central: Son indicadores estadísticos que muestran hacia que valor (o
valores) se agrupan los datos.
• La media aritmética
• La moda
• La mediana
MEDIA ARITMETICA (PROMEDIO)
Se calcula para variables medidas en escala de intervalo o razón.
Suma de todos los datos numéricos y se divide entre el total de datos de una
muestra o población.
Ejemplo:
Una persona que trabaja en forma independiente durante 6 meses generó los
siguientes ingresos de 200, 600, 500, 400, 260, 350. ¿Cuanto es el ingreso
promedio?
Desarrollo
X̅̅ = = 385
El ingreso promedio del trabajador independiente fue de 385 soles mensuales.
MEDIANA (Me)
Valor central que divide en 2 un conjunto de datos ordenados con la misma
cantidad de datos, donde el 50% de los datos son menores a dicho valor y el
otro 50% serán mayores.
Se calcula para variables medida en escala ordinal, intervalo y razón.

ALTURA MEDIANA
Ejemplo
Se ha registrado la talla de 5 alumnos: 1.60, 1.50, 1.55, 1.80, 1.65. Calcular la
estatura mediana.
Desarrollo:
El tamaño de muestra: n = 5, es un número impar

Primer paso: Ordenar los datos de menor a mayor


1° 2° 3° 4° 5°
1.50 1.55 1.60 1.65 1.80
Segundo paso: Ubicar el dato de posición central:
Posición de la mediana = (n+1)/2. Posición: (5+1)/2 = 3°
Tercer paso: Me = 1.60
50% 50%

El 50% de 5 alumnos tienen una


talla máxima de 1.60 cm, y
el otro 50% tienen una talla
mayor a 1.60 cm.
Estatura promedio es 1.60
Mediana para datos agrupados es:
Ejemplo
De la muestra seleccionada se registró las edades de jubilados que recibieron
atención de salud en un policlínico del seguro, cuyos datos están en la
siguiente tabla de distribución de frecuencias:

¿Cuál es la edad máxima del 50% de jubilados atendidos en el policlínico?


Desarrollo:

El 50% de jubilados tiene una edad máxima


de 67 años.
MODA (Mo)
Es el dato que más veces se repite en una muestra o población.
Se calcula para variables medidas en escala nominal, ordinal, intervalo o
razón.
Moda para datos agrupados:
Ejemplo
La siguiente tabla de frecuencias muestra el gasto en compra de recetas
médicas de los pacientes que fueron atendidos en Dermatología. ¿Cuánto es
el gasto frecuente en compra de sus medicamentos?
Desarrollo

Con frecuencia los pacientes de dermatología gastan en medicamentos la suma


de 73.96 soles.

También podría gustarte