Está en la página 1de 7

FORMULARIO

ESTADISTICA MAT-1135 “C”


“MEDIDAS ESTADÍSTICAS PARA UNA VARIABLE”
Auxiliar : Univ. Edson J. Alvarez Pedraza

MEDIDAS DE TENDENCIA CENTRAL


MEDIA ARITMÉTICA (media o promedio)

ORDENACIÓN DE DATOS POBLACIÓN

∑𝑋 ∑𝑋
𝑋̅ = 𝑀(𝑥) = 𝜇 = 𝑀(𝑥) =
𝑛 𝑁

TABULACIÓN DISCRETA CLASIFICACIÓN DE DATOS

∑ 𝑓𝑋 ∑ 𝑓𝑋
𝑋̅ = 𝑋̅ =
𝑛 𝑛

MEDIANA (valor central de un conjunto de datos)


ORDENACIÓN DE DATOS TABULACIÓN DISCRETA

Cuando se tiene un número impar de datos 𝑛


Se calcula: se compara con la frecuencia cumulada
2
inmediata superior 𝐹𝑗
𝑀𝑒 = 𝑋𝑛+1 𝑛
2 Si < 𝐹𝑗 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑙𝑎 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 𝑒𝑠:
2
Cuando se tiene un número par de datos 𝑀𝑒 = 𝑋𝑗
𝑛
Si = 𝐹𝑗 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑙𝑎 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 𝑒𝑠:
𝑋𝑛⁄2 + 𝑋 𝑛⁄2 +1 2
𝑋𝑗 + 𝑋𝑗+1
𝑀𝑒 = 𝑀𝑒 =
2 2
CLASIFICACIÓN DE DATOS
Donde:
𝑛
Se calcula: buscando la frecuencia cumulada 𝑳𝒊𝒏𝒇 : Es el limite inferior de la clase de la mediana
2
𝐹𝑗 inmediata superior a este valor 𝒏 ∶ Es el Número de datos (Frecuencia total)

𝑛 𝒇𝑱 ∶ Frecuencia Absoluta de la Clase de la mediana


− 𝐹𝑗−1
𝑀𝑒(𝑥) = 𝐿𝑖𝑛𝑓 + ( 2 )∗𝑐 𝑭𝒋−𝟏 ∶ Frecuencia acumulada de la Clase
𝑓𝑗 anterior a la Clase de la mediana
𝒄 ∶ Amplitud del intervalo de Clase

Auxiliar: Univ. Edson J. Alvarez Pedraza


MODA (El valor que ocurre con mayor frecuencia)

ORDENACIÓN DE DATOS TABULACIÓN DISCRETA

Si existe una sola Moda, se llama (Unimodal) Se debe buscar la Mayor Frecuencia, su valor
Si ningún número se repite, no existe una Moda correspondiente será la Moda
Si se repiten dos números igual de veces, Si todas las Frecuencias son iguales, no existe Moda
entonces existirán dos Modas (Bimodal) Si se presenta varias Frecuencias iguales y mayores a
las restantes, existirá Varias Modas (Distribución
Multimodal)

CLASIFICACIÓN DE DATOS
Donde:
Previamente se busca la Frecuencia Modal 𝑳𝒊𝒏𝒇 ∶ Limite inferior de la Clase
𝑓𝑗 (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎) que contiene a la Moda
∆𝟏 ∶ 𝑓𝑗 − 𝑓𝑗−1
∆1 ∆𝟏 ∶ 𝑓𝑗 − 𝑓𝑗+1
𝑀𝑜(𝑥) = 𝐿𝑖𝑛𝑓 + ( )∗𝑐
∆1 + ∆2 𝒄 ∶ Amplitud del intervalo de la Clase Modal

Relación entre Media, Mediana y Moda

 Si media = moda = mediana, la distribución es simétrica


 Si media > mediana, la distribución es asimétrica con cola a la derecha (sesgada a la
derecha).
 Si media < mediana, la distribución es asimétrica con cola a la izquierda (sesgada a la
izquierda

Auxiliar: Univ. Edson J. Alvarez Pedraza


MEDIDAS DE POSICIÓN
CUARTILES PERCENTILES DECILES
 Cuartiles: agrupan 25% cada uno (son 3) dividir el total de datos entre 4
 Percentiles: agrupan 1% cada uno (son 99) dividir el total de datos entre 100
 Deciles: agrupan 10% cada uno (son 9) dividir el total de datos entre 10

ORDENACIÓN DE DATOS

𝑄𝑚 = 𝑋𝑚(𝑛−1) ; 𝑚 = 1,2,3
+ 1
4
Si el subíndice No es entero

𝑚(𝑛−1)
𝑄𝑚 = 𝑋𝑗 + [( + 1) − 𝑗] ∗ (𝑋𝑗+1 − 𝑋𝑗 ) ; 𝑚 = 1,2,3
4

Donde:
𝒋 ∶ Es el subindice que corresponde al entero inmediato inferior a
𝑋𝑚(𝑛−1)
+ 1
4
𝑿𝒋+𝟏 ∶ Son los datos correspondientes a los subindices indicados
𝒏 ∶ Es el número de datos (Frecuencia total)

TABULACIÓN DISCRETA

𝑚(𝑛−1)
Inicialmente se calcula : + 1 de éste resultado se toma el entero inmediato
4
inferior, este será el valor de 𝐶. Luego se busca la Frecuencia Acumulada dentro de la
cual está contenida 𝐶 (es decir, la 𝐹𝑗 inmediata superior)

𝑆𝑖 𝐶 < 𝐹𝑗 → 𝑄𝑚 = 𝑋𝑗

𝑚(𝑛 − 1)
𝑆𝑖 𝐶 = 𝐹𝑗 → 𝑄𝑚 = 𝑋𝑗 + [( + 1) − 𝐶] ∗ (𝑋𝑗+1 − 𝑋𝑗 )
4

Auxiliar: Univ. Edson J. Alvarez Pedraza


CLASIFICACIÓN DE DATOS

𝑚∗𝑛
Primero se calcula el valor obtenido se compara con las Frecuencias Acumuladas
4
(el número de la Clase del Cuartil será el valor de 𝑗 )

𝑚∗𝑛
− 𝐹𝑗−1
𝑄𝑚 = 𝐿𝑖𝑛𝑓 + ( 4 )∗𝑐
𝑓𝑗

Donde:
𝑭𝒋−𝟏 ∶ Es la Frecuencia acumulada anterior a la Clase del cuaritl
𝒇𝒋 ∶ Frecuencia Absoluta de la Clase del cuartil
𝑳𝒊𝒏𝒇 ∶ Limite inferior de la Clase del cuartil
𝒄 ∶ Es la Amplitud del intervalo de la Clase del cuartil

Para hallar el valor de “m”


4 𝑄𝑚 − 𝐿𝑖𝑛𝑓
𝑚= [𝐹𝑗−1 + 𝑓𝑗 ( )]
𝑛 𝑐

MEDIDAS DE DISPERSIÓN
DESVIACIÓN MEDIA
(desviación media absoluta o desviación promedio)

ORDENACIÓN DE DATOS DATOS AGRUPADOS

∑|𝑥𝑗 − 𝑥̅ | ∑ 𝑓𝑗 |𝑥𝑗 − 𝑥̅ |
𝐷𝑀 = 𝐷𝑀 =
𝑛 𝑛

DESVIACIÓN MEDIANA

UNA ORDENACIÓN DE DATOS DATOS AGRUPADOS

∑ |𝑥𝑗 − 𝑀𝑒| ∑ 𝑓𝑗 |𝑥𝑗 − 𝑀𝑒|


𝐷𝑀 = 𝐷𝑀 =
𝑛 𝑛

Auxiliar: Univ. Edson J. Alvarez Pedraza


VARIANZA

POBLACIONAL VARIANZA MUESTRAL

∑ (𝑥 − 𝜇)2 ∑ (𝑥 − 𝑥̅ )2
𝜎 = 2 𝑠2 =
𝑁 𝑛−1

∑ 𝑥2
2 ∑ 𝑥2 𝑛𝑥
2
𝜎 = − 𝜇2 2
𝑠 = −
𝑁 𝑛−1 𝑛−1
VARIANZA PARA DATOS AGRUPADOS

VARIANZA POBLACIONAL VARIANZA MUESTRAL

2
∑ 𝑓 (𝑥 − 𝜇)2 2
∑ 𝑓 (𝑥 − 𝑥̅ )2
𝜎 = 𝑠 =
𝑁 𝑛−1

∑ 𝑥2 𝑓 ∑ 𝑥2𝑓 𝑛𝑥
2
𝜎2 = − 𝜇2 2
𝑠 = −
𝑁 𝑛−1 𝑛−1

DESVIACIÓN ESTANDAR

POBLACIONAL MUESTRAL

∑ (𝑥 − 𝜇)2 ∑ (𝑥 − 𝑥̅ )2
𝜎=√ 𝑠=√
𝑁 𝑛−1

DESVIACIÓN ESTANDAR PARA DATOS AGRUPADOS

POBLACIONAL MUESTRAL

∑ 𝑓 (𝑥 − 𝜇)2 ∑ 𝑓 (𝑥 − 𝑥̅ )2
𝜎= √ 𝑠=√
𝑁 𝑛−1

Auxiliar: Univ. Edson J. Alvarez Pedraza


COEFICIENTE DE VARIACIÓN (coeficiente de dispersión)

𝑆
𝐶𝑉 = ∗ 100
𝑥

0 ≤ 𝐶𝑉 ≤ 10% VARIABILIDAD MUY BAJA


10% < 𝐶𝑉 ≤ 25% BAJA VAIABILIDAD
25% < 𝐶𝑉 ≤ 40% VARIABILIDAD MODERNA
40% < 𝐶𝑉 ≤ 50% ALTA VARIABILIDAD
𝐶𝑉 > 50% VARIABILIDAD MUY ALTA

Si CV es menor al 50% significa baja dispersión, es decir que la media aritmética es una buena
representación de un conjunto de datos

MEDIDAS DE FORMA
COEFICIENTES DE ASIMETRÍA DE PEARSON

Primer coeficiente de Pearson

𝑥 − 𝑀𝑜  Si 𝐴𝑆𝑝 < 0: la distribución tiene una asimetría


𝐴𝑆𝑝 = negativa, puesto que la media es menor que la
𝑠
moda.
Segundo coeficiente de Pearson  Si 𝐴𝑆𝑝 = 0: la distribución es simétrica.

3 (𝑥 − 𝑀𝑒 )  Si 𝐴𝑆𝑝 > 0: la distribución tiene una asimetría


𝐴𝑆𝑝 = positiva, ya que la media es mayor que la moda
𝑠

COEFICIENTE DE ASIMETRÍA DE FISHER

 Si 𝐴𝑆𝑓 < 0: la distribución tiene una asimetría negativa y


se alarga a valores menores que la media.
∑ 𝑓 (𝑥 − 𝑥)3
𝐴𝑆𝑓 =
𝑛 ∗ 𝑠3  Si 𝐴𝑆𝑓 = 0: la distribución es simétrica.

 Si 𝐴𝑆𝑓 > 0: la distribución tiene una asimetría positiva y se


alarga a valores mayores que la media.

Auxiliar: Univ. Edson J. Alvarez Pedraza


COEFICIENTE DE ASIMETRÍA DE CURTOSIS

∑ 𝑓 (𝑥 − 𝑥 )4
𝐾= − 3
𝑛 ∗ 𝑠4

𝐾 > 0 𝐾= 0 𝐾< 0

Auxiliar: Univ. Edson J. Alvarez Pedraza

También podría gustarte