Está en la página 1de 13

Media aritmética

Promedio aritmético resultante de sumar todos los datos y


dividirlo por el número de los datos totales

 Es la medida más
∑ usada para
◦ Datos no agrupados: 𝜇= (Media poblacional) representar datos
 A todos los datos
otorga el mismo valor
 Sensible a valores
atípicos

𝑥̅ = (Media muestral)  Centro de gravedad
de la distribución
 Puede definirse como
esperanza
∑ . matemática
◦ Datos agrupados: 𝑥̅ = (Media muestral)
Mediana (Me)
Conjunto de datos o dato que divide en 2 un conjunto de datos ya
ordenado, por lo que el 50% de los datos son mayores a la mediana y
el 50% menores

◦ Si los datos son impares es el dato ubicado en la posición


del medio
◦ Si en el conjunto de datos hay un número par de
datos se suman entre ellos y se saca el promedio
◦ Para datos agrupados:
𝑛
−𝐹
𝑀𝑒 = 𝐿𝑖 + 2 (a)
𝑓𝑖
Moda (Mo)
Es el valor del conjunto de datos que aparece con mayor frecuencia, o la clase
que más se repite. Los valores extremos no afectan a la moda.
Una distribución puede ser:
𝐿𝑖: Límite inferior del
intervalo modal
Unimodal: Si tiene una sola moda 𝑓 : Frecuencia anterior
al intervalo modal
Bimodal: Si tiene dos modas 𝑓 : Frecuencia
siguiente al intervalo
modal
Multimodal: Si tiene dos o más modas a: Amplitud del intervalo
de clase
Para datos agrupados: 𝑓𝑖: frecuencia modal

𝑀o = 𝐿𝑖 + (a)
( ) ( )
Medidas de dispersión

4
Medidas de dispersión
Rango o recorrido (R): Diferencia entre los valores mayor y
menor en la distribución

Varianza (S2) muestral: Otorga información sobre la


forma como se dispersan los datos alrededor a) Calcule la diferencia
de la media de cada valor con la
media
∑ (𝑥 − 𝑥) b) Eleve al cuadrado
𝑆 = cada una de las
𝑛−1 diferencias
c) Sume las diferencias
Para datos agrupados: elevadas al cuadrado
∑ (𝑥 − 𝑥) . 𝑓𝑖 d) Divida por n-1
x𝑖: Marca de clase de 𝑆 =
cada intervalo o el dato 𝑛−1
estudiado
Desviación estándar (S): Otorga información sobre la forma como se
dispersan los datos alrededor de la media

6
Error estándar: Medida de la desviación estándar utilizada para
graficar el +/- de la media de un tratamiento:
𝑆
𝐸𝑟𝑟𝑜𝑟 𝑠𝑡𝑑 𝐸 =
𝑛

Coeficiente de variación: medida relativa de la dispersión y se define


como el porcentaje de dispersión de los datos respecto a la media.
Dicho coeficiente se encuentra entre 0 y 1:

𝑺
𝑪𝒗𝒙 = (“La desviación estándar es xxx% de la media)
𝒙
Medidas de dispersión
Rango -Su utilidad es limitada, medida pobre de
dispersión.
Varianza -Es el promedio de las diferencias al cuadrado
(Eliminar signos negativos)

Desviación estándar - Es el promedio de las diferencias que existen


entre los datos y la media.
Error estándar - Representa la incertidumbre de una medida
(Cuanto mayor sea el tamaño muestral, menor
será nuestra incertidumbre)
Coeficiente de variación Relación entre e tamaño de la media y la
variabilidad de la variable. A mayor valor mas
heterogeneidad de los valores de la variable

8
Medidas de posición o
parámetros de localización

9
Cálculo de cuartiles:
 Cuartil 1 (Q1): Es el dato por debajo del cuál se encuentra el 25% de los datos

 Cuartil 2 (Q2): Es el dato por debajo del cuál se encuentra el 50% de los datos

 Cuartil 3(Q3): Es el dato por debajo del cuál se encuentra el 75% de los datos

10
Medidas de posición datos agrupados
Para el cálculo de cualquier medida de posición a partir de una distribución
agrupada de datos, determino el percentil equivalente (Q1 = P25; D3=P30, etc)
y aplico:
𝐿𝑖 : Límite inferior del
. intervalo que contiene el
percentil k o mayor
𝐹( ) : Frecuencia
acumulada anterior a la
Recuerde: clase del que contiene el
- Q1 corresponde al percentil 25 percentil k
a: Amplitud del intervalo
- Q3 corresponde al percentil 75 de clase
- D2 corresponde al percentil 20 n: Cantidad de datos de
- D6 corresponde al percentil 60 la muestra
….. 𝑓𝑖 : frecuencia absoluta
de la clase que contiene
el percentil k
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil:
IQR=Q3-Q1

•IQR grande, indica mayor variabilidad entre el 50% central de las


observaciones relevantes.

•IQR pequeño indica una magnitud pequeña de variabilidad entre las


observaciones relevantes.

12
Diagrama de cajas y bigotes o
diagrama de Tuckey
Representación gráfica que describe el comportamiento de los datos
respecto a los cuartiles Q1, Q2 y Q3
Me permite:
Visualizar la centralidad y la distribución de los datos
Determinar outliers o datos atípicos para cualquier tipo de distribución
Comparar entre dos tratamientos o distribuciones

También podría gustarte