15.09 Media - Desviación - CV - Rango - !09

MEDIDAS DE TENDENCIA CENTRAL
1. Media o promedio ( X́ ( Xb), estadístico−μ , Parámetro): Sirve para comparar grupos de datos entre
sí, o un grupo de datos contra estándares, objetivos o metas. SIEMPRE Y CUANDO SEA REPRESENTATIVA
DE LOS DATOS
a. “…cantidad numérica alrededor de la cual los valores de la variable aleatoria tienden a agruparse”.
(Canavos).
b. Valor de la variable (tiene las mismas unidades de la variable) que “intenta” representar un grupo
de datos, a través de un valor central. El término “intenta” hace referencia a que la media solo
representa al grupo de datos cuya precisión tiene un Coeficiente de Variación (CV) menor a 15%.
Característica de los datos. Con ella se pueden comparar los datos, con otros datos, o con la
metas, estándares u objetivos.
c. Datos Precisos: aquellos muy cercanos (parecidos, poco dispersos); ayuda a evaluar la precisión, la
desviación estándar y el Coeficiente de Variación.
d. Datos Exactos: cercanos a la meta. Ayuda a evaluar la exactitud, la media.
e. Si la media representa a los datos, puedo compararla a ella con estándares, con otros grupos de
datos. Si la media no representa a los datos, debe emplearse otro cálculo (mediana) para hacerlo.
f. Valor de la variable respecto al cual los demás datos están en equilibro (centroide de los datos –
Centro de gravedad de los datos, datos a la izquierda y derecha, con el mismo peso). Al calcular la
diferencia entre cada dato y la media, la sumatoria de las diferencias a su izquierda y derecha,
coinciden.
g. Susceptible a valores extremos de la variable.
h. Cuando la media está afectada por valores extremos de la variable, ésta se puede mejorar a través
de la Media Truncada ( X́ tr ( % ) ), la cual elimina igual porcentaje de datos extremos, bajos y altos,
para solo promediar los restantes.
i. La media solo se calcula para datos de variables cuantitativas (discretas o continuas).
∑ xi
i=1
x́= : promedio en tabla general de datos , o datos NO AGRUPADOS
n
m m
x i∗f i
x́=∑ x i∗hi=∑ =¿: promedio en tablas de frecuencias , o datos AGRUPAGOS ,¿
i=1 i=1 n
m
x́=∑ x i∗hi
i=1
~
2. Mediana ( X −me):
a. Valor de la variable (tiene las mismas unidades de la variable) por debajo y por encima del cual hay
igual cantidad de datos (50%). Es el “ombligo” de los datos.
b. La mediana, es el centro de los datos (en cantidad), por tener por debajo y por encima de ella la
misma cantidad.
c. Su función es reflejar la tendencia central de los datos (datos centrado o no, simétrico o no), sin
verse afectada por valores extremos. Poder reemplazar a la media, en caso de que ésta no
represente a los datos. La mediana me ayuda a saber si los datos son o no simétricos, a través de la
distancia que hay entre ella y sus datos extremos.
d. Cuando la media no es representativa de los datos, la mediana los representa.
e. PARA DATOS DE UNA VARIABLE CUALITATIVA CON ORDEN Y DE CANTIDAD IMPAR, SÍ SE PUEDE
ESTIMAR LA MEDIANA.
f. Cuando los datos son extremos, no causan ningún efecto sobre la mediana.
g. Es el caso extremo de la Media Truncada, en el cual se eliminan todos los datos, menos uno o dos
centrales. Para calcular la mediana en datos NO AGRUPADOS: se organiza la columna de datos en
forma ascendente o descendente, para luego buscar el dato o datos centrales:
x → mediana para número de datosimpar
{(
me=~x= x n + x
(n +12 )
( 2 ) ( n2 +1 )
2 ) → mediana para número de datos par
Para calcular la mediana en datos agrupados en tablas de frecuencia por intervalos (cuando se
tenga una T de F simple, la mediana se calcula como datos NO AGRUPADOS:
n
a( −F (i−1) )
2
me=LI i + : para T de F por I
fi
3. Moda (me): para datos no agrupados de variables cualitativas o discretas o tablas de frecuencia
simple, es el valor de la variable que más se repite.
Sin embargo, para variables cuantitativas o discretas donde no hay valores repetidos y se agrupa en T de
F por I, la moda será un valor de la variable alrededor del cual se concentra una importante cantidad de
datos. Gráficamente, la moda en un Histograma se reflejará en el rectángulo de mayor altura, así como en
el diagrama de dispersión se verá en el punto más alto; en la caja y bigotes, la moda estará en uno de los
valores dentro de la parte de la caja más corta (sector de mayor densidad y concentración de datos).
MULTIMODAL: cuando en un grupo de datos o tabla de frecuencia, hay varias modas.
Moda en T de F Simple :dato que más se repite

a( f i−f (i−1 ))
mo=LI i +
(2∗f i−f ( i−1 )−f (i+1 ))
a(f i−f (i−1 ))

mo=LI i + : Moda en T de F por Intervalos
(2∗f i−f ( i−1 )−f (i+1 ))
i: el intervalo que mayor frecuencia absoluta.
4. Relación empírica entre media – mediana – moda: si los datos son relativamente simétricos y solo
tienen una moda (unimodal), se cumple que:
Igualmente, el valor de la mediana siempre se encontrará entre la media y la moda.
x́ → ~
x → mo, y además la media es muy diferente a la moda, entonces los datos son
ASIMETRICOS (datos tienen sesgo); Pero si la media y la moda son muy
similares, los datos son SIMÉTRICOS; LAS TRES MEDIDAS SON MUY SIMILARES.
mo → ~
x → x́ , y además la media es muy diferente a la moda, entonces los datos son
ASIMETRICOS (datos tienen sesgo); Pero si la media y la moda son muy

similares, los datos son SIMÉTRICOS; LAS TRES MEDIDAS SON MUY SIMILARES.
Xb ≈ mo ≈ me → datos simétricos, en forma de campana; las definiciones de
cada una de estas medidas, se cumplen en la campana.
Xb ≠ mo ≠ me → datos asimétricos, en forma de joroba, con sesgo
MEDIDAS DE DISPERSIÓN
Miden el grado de dispersión de los datos
Rango: Distancia o recorrido entre los datos extremos de una variable. A mayor distancia entre estos datos,
mayor dispersión y menor precisión entre ellos. Esta característica se ve afectada por valores extremos, cuando
una gran cantidad de los datos pueden estar muy concentrados alrededor de un valor, pero la distancia entre los
valores extremos da una idea diferente de su poca dispersión.
R=xmáx −x mín
Rango Intercuartílico: valores de la variable entre los cuales hay el 50% de datos. ESTE RANGO NO TIENE EN
CUENTA LOS DATOS EXTREMOS. Se evalúa entre los CUARTILES 3 Y 1. Se elimina un 25% de datos inferiores y un
25% de datos superiores.
Desviación estándar (S): evalúa la diferencia promedio que cada dato (datos no agrupados) o cada grupo de
datos (datos agrupados en tablas de frecuencia), tiene con su media. Si todos los datos de una muestra fueran
iguales, su desviación sería 0. A medida que los datos se diferencian entre sí, aumenta su variabilidad y entre
ellos, medida respecto a su media. Si la medición de una variable, en algún proceso, debería arrojar siempre datos
similares (el peso, la longitud, la densidad de un producto, por ejemplo), se esperaría que su desviación estándar
fuera lo más cercana a cero posible, entendiendo “posible” como la consideración de una relación de
Beneficio/Costos adecuada para el proceso. En estos casos, el problema recae en determinar cuánto es cercano a
0. LA DESVIACIÓN ESTÁNDAR MIRA QUÉ TAN PRECISOS O CERCANOS O PARECIEOS, SON LOS DATOS.
Si varios grupos de datos tienen la misma media, la comparación a través de sus desviaciones estándar permite
saber cuál de ellos es más o menos preciso, o qué resultados son más o menos dispersos.
n
( x ¿¿ i−x́ )2
s=
√
∑ (n−1) :desviación estándar para T de E de D ¿
i=1
m
( x ¿¿ i−x́ )2∗f i
s=
√∑
i=1 ( n−1 )
:en tablas de frecuencias ¿
m
( x ¿¿ i−x́ )2∗f i
s=
√∑
i=1 ( n−1 )
¿
√ ( x ¿¿ i− x́)2∗f i
N
(x ¿¿i−μ)2 m
σ= ∑
i=1 N
o S=
√ ∑
i=1 ( n−1 )
¿¿
Coeficiente de variación (CV): cuando las muestras de datos no tienen la misma media, o corresponden a
procesos diferentes (cantidad de llamadas recibida por día VS valor facturado por día), o cuando debemos
determinar si ella es cercana o no a 0, la desviación estándar no es suficiente para determinar la precisión de los
datos; en estos casos el CV permite, a través de porcentaje, darle peso a este criterio.
CV ≤ 7 % precisa
s
CV = %
x́
{
7 % <CV ≤ 15 % precisión aceptable
15 %<CV ≤20 % precisión regular
CV >20 % poco precisa
Sí CV <15 % → X́ sí representa a sus datos
El CV, EN UN SENTIDO PRÁCTICO NO DEBE DECIRME QUE YO ESTOY BIEN O MAL, SINO
QUE DEBE MARCAR UN PUNTO PARA REALIZAR MEJORAS
MEDIDAS DE POSICIÓN
Hacen referencia al valor de la variable por debajo del cual hay cierto
porcentaje de datos (Mediana)
Son, como la mediana, valores de la variable por debajo del cual hay un porcentaje de datos.
Percentiles ( Pk ): dividen los datos en 100 partes; cada una de ellas contiene un 1% de ellos. Es un valor de la
variable por debajo del cual hay k% de datos.
n∗k
a( −F (i−1) )
100
pk =LI i + , con k=1, 2 , … ,100
fi
Deciles d k : dividen los datos en 10 partes; cada una de ellas contiene un 10% de ellos. Es un valor de la variable
por debajo del cual hay k*10% de datos.
d k =LI i +
a ( n∗k
10
−F )( i−1 )
, con k =1 ,2 , … , 10
fi
Cuartiles q k : dividen los datos en 4 partes; cada una de ellas contiene un 25% de ellos. Es un valor de la variable
por debajo del cual hay k*25% de datos. Estas medidas colaboran en la construcción de la Caja y Bigotes.
n∗k
a( −F( i−1 ))
4
q k =LI i+ ,con k=1 , 2, 3 ó 4
fi
La fórmula del percentil permite despejar el k, lo que es útil cuando se requiere saber qué porcentaje de datos
está por debajo de cierto valor en particular de la variable.
MEDIDAS DE ASIMETRÍA Y CURTOSIS
Hacen referencia a la simetría de los datos y a la concentración de ellos
respecto y alrededor de la media.
Asimetría: evalúa si los datos, respecto a la media, tienen mayor presencia hacia la izquierda (sesgo positivo), o
mayor presencia hacia la derecha (sesgo negativo), o mayor presencia alrededor de la media (datos simétricos).
m
1
∑ ( x i− x́ )3∗f i g1 >0,5 → sesgo positivo
g 1=
n i=1
1
m
2
( ∑ (x i−x́) ∗f i )
n i =1
3
2 {
→ −0,5< g 1< 0,5→ datos simétricos
g 1 ←0,5→ sesgo negativo
Curtosis o Apuntalamiento (K ó g2): mide el grado de concentración que presentan las respuestas hacia el centro
de los datos. Por medio del Coeficiente de Curtosis, podemos identificar si existe una alta concentración de valores
(Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica), alrededor de la
moda de los datos.
m
1
∑ (x i−x́)4∗f i
n
g2= i=1 ¿ ¿

15.09 Media - Desviación - CV - Rango - !09

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

15.09 Media - Desviación - CV - Rango - !09

Cargado por

Copyright:

Formatos disponibles

MEDIDAS DE TENDENCIA CENTRAL

x → mediana para número de datosimpar

Moda en T de F Simple :dato que más se repite

a(f i−f (i−1 ))

i: el intervalo que mayor frecuencia absoluta.

ASIMETRICOS (datos tienen sesgo); Pero si la media y la moda son muy

También podría gustarte