Está en la página 1de 36

Estadística

M E DI DAS DE T E N DENCIA
CE N T RA L Y DE DI S P ERSION
Objetivos
• Describir la totalidad de datos a través de las medidas de tendencia central y dispersión.
• Identificar el valor de la variable al que tienden a concentrarse los datos.
• Definir un valor promedio que describe la distancia que existe entre los datos y su media.
Descripción numérica de datos
Medidas de tendencia cental
Los procedimientos estadísticos para obtenerlas dependerán de dos cuestiones:

✓La forma en que organicemos nuestros datos, es decir, datos libres o datos agrupados.
✓Si el grupo de datos observados es una población (todas las observaciones) o una muestra
(selección de solo algunos datos de la población). En el caso de poblaciones, notarás que todas
las medidas se representan con letras del alfabeto griego; mientras que para muestras se
representan con letras de nuestro alfabeto.
Medidas de tendencia cental
Media Aritmética
• Media = suma de valores dividida para su número de valores

Para una población de N valores: Para una muestra de n valores:


Media Aritmética
• Es la medida más común de tendencia central
• Afectada por valores extremos o atípicos (outliers)
Mediana
• En una lista ordenada, la mediana es el número de en medio (50% por
encima, 50% por debajo)
• No resulta afectada por valores extremos
Mediana
Moda
• Valores que aparece más a menudo
• No afectada por valores extremos
• Usada para valores numéricos y categóricos
• Puede no haber una moda / Puede haber varias moda
Moda
Medida de Tendencia Central: Ejemplo
Cuál es la mejor medida de Centralización?
• Media: se usa generalmente, salvo que existan valores extremos (Outliers).
• En ese caso se usa la Mediana, porque no es sensible a valores extremos.

• Ejemplo: Mediana de los precios de un inmueble para una región: es


menos sensibles a outliers.
Formas de Distribución: Posiciones relativas de
la media y mediana
• Describe cómo se distribuye los datos
• Medidas de forma
• Simétrica o Asimétrica
Medida de variabilidad o de dispersión
Rango
• Medida más simple de variación
• Diferencia entre la mayor y la menor de las variaciones
Rango
• Desventaja:
Ignora el modo en el que se distribuyen los datos
Rango
• Desventaja:
Sensible a outliers
Rango Intercuartílico
• Se pueden eliminar algunos problemas de outliers
• Elimina valores muy grandes y muy pequeños calculando el rango de la
parte central del 50% de los datos
Rango Intercuartílico
Cuartiles
Cuartiles
• Calcular un cuartil determinando el valor en la posición adecuada en los
datos ordenados:
• Posición primer cuartil: Q1 = 0.25(n+1)
• Posición segundo cuartil: Q2 = 0.50(n+1)
(Posición de la mediana)
• Posición tercer cuartil: Q3 = 0.75(n+1)

Donde n es el número de valores observados


Cuartiles
• Ejemplo: Calcular el primer cuartil
Varianza
• Media de las desviaciones al cuadrado de los valores a la media

Varianza Poblacional Varianza Muestral


Desviación estándar
• Medida de variación más comúnmente usada
• Muestra la variación alrededor de la media
• Tiene las mismas unidades de medidas que los datos originales
Desviación estándar Poblacional Desviación estándar Muestral
Desviación estándar
Desviación estándar
Desviación estándar
Regla Empírica
• Si la distribución de los datos parece una campana (normal), entonces el
intervalo:
Coeficiente de variación
• Medida de la variación relativa
• Siempre en porcentaje (%)
• Muestra la variación relativa respecto a la media
• Se puede usar para comparar dos o más conjuntos de datos, medios en
diferentes unidades.
Coeficiente de variación
• Stock A • Stock B
• Precio medio ultimo año = US$ 50,00 • Precio medio ultimo año = US$ 100,00
• Desviación estándar = US$ 5,00 • Desviación estándar = US$ 5,00

𝑆 $5 𝑆 $5
𝐶𝑉𝐴 = ∗ 100% = ∗ 100% = 10% 𝐶𝑉𝐵 = ∗ 100% = ∗ 100% = 5%
𝑥ҧ $50 𝑥ҧ $100

Ambos Stock tienen la misma desviación estándar, pero


el Stock B es menos variable en relación a su precio
Para datos agrupados
MEDIA ARITMETICA:
Para datos agrupados
MEDIANA:
Para datos agrupagos
MODA
1. Localizar la clase modal.
2. Aplicar la siguiente formula:
Para datos agrupados
MODA:
Para datos agrupados
VARIANZA:

También podría gustarte