Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Orden de la clase:
Métodos numéricos para describir información
Medidas de tendencia central
Media.
Mediana.
Moda.
Medidas de posición.
Cuartiles.
Deciles.
Percentiles.
Medidas de Dispersión
Desviación Estándar
Coeficiente de variación.
Regla Empirica.
Desarrollo de la clase.
∑(𝑥𝑖 − 𝑥̅ ) = 0
𝑖=1
2
𝑓1 𝑚1 + 𝑓2 𝑚2 + ⋯ + 𝑓𝑘 𝑚𝑘
𝑥̅ =
𝑓1 + 𝑓2 + ⋯ + 𝑓𝑘
Media Geométrica
La media geométrica G de un conjunto de n números positivos 𝑋1 , 𝑋2 , … , 𝑋𝑛 es la
raíz n-esima del producto de esos números:
𝐺 = 𝑛√𝑋1 𝑋2 … 𝑋𝑛
Media Armónica
La media armónica H de un conjunto de datos 𝑋1 , 𝑋2 , … , 𝑋𝑛 es el reciproco de la
media aritmética de los recíprocos de los datos:
1 𝑛
𝐻= =
1 𝑛 1 1
∑ ∑
𝑛 𝑗=1 𝑥𝑗 𝑋
Mediana
La mediana es el valor que divide en dos partes iguales a un conjunto de datos ya
ordenado. La mediana no se ve afectada por los valores extremos, de manera que
pueden utilizarse cuando están presentes.
La mediana es el valor medio de un conjunto de datos ordenado de menor a
mayor.
El 50% de los valores son menores que la mediana y el otro 50% son mayores.
𝑛+1
𝑃𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =
2
Calcule el valor de la mediana siguiendo una de las dos reglas:
Regla 1: Si la muestra tiene un tamaño n impar, la mediana es el valor
colocado en el medio.
Regla 2: Si la muestra tiene un tamaño n par, entonces la mediana es el
valor equivalente al promedio de los dos valores colocados en el medio.
3
Moda
La moda es el valor del conjunto de datos que aparece con mayor frecuencia. Al
igual que la mediana y a diferencia de la media, los valores extremos no afectan a
la moda.
CUARTILES, DECILES Y PERCENTILES.
Si un conjunto de datos esta ordenado, el valor central (o la media de los centrales)
que divide al conjunto en dos mitades iguales, es la mediana. Extendiendo esa idea
podemos pensar en aquellos valores que dividen al conjunto en cuatro partes
iguales. Esos valores denotados 𝑄1, 𝑄2 𝑦 𝑄3 se llaman primer, segundo y tercer
cuartiles, respectivamente. El 𝑄2 coincide con la mediana.
Las posiciones de los cuartiles se pueden calcular así:
Para el cuartil 1
𝑛+1
𝑄1 =
4
Para el cuartil 3
3(𝑛 + 1)
𝑄3 =
4
Ejemplo: Los 121 fondos de inversión, se clasifican de acuerdo con el nivel de riesgo
(bajo, medio y alto) y el tamaño de capital invertido (pequeño, mediano y gran
capital). Calcule el primer cuartil 𝑄1 y el tercer cuartil 𝑄3 del rendimiento en 2003 de
los dos fondos de inversión de alto riesgo para pequeños capitales.
Valor Clasificado 37,3 39,2 44,2 44,5 53,8 56,6 593 62,4 66,5
Clasificación 1 2 3 4 5 6 7 8 9
(𝑛 + 1)
𝑄1 = = 2.5
4
4
Por lo tanto, resulta que el valor clasificado como 2.5, que está justo en la mitad
entre los valores como segundo y tercero. Como el valor clasificado en la posición
2 es 39.2 y el tercero es 44.2, el primer cuartil es el que se ubica exatamente en la
mitad, es decir:
39.2 + 44.2
𝑄1 = = 41.7
2
Para el tercer cuartil:
3(9 + 1)
𝑄3 = = 7.5
4
Luego
59.3 + 62.4
𝑄3 = = 60.85
2
Mientras que los valores que los dividen en 100 partes iguales se llaman
percentiles, denotados por 𝑃1 , 𝑃2 , 𝑃3 , … , 𝑃99 . El 5ª decil y el percentil 50 coinciden con
la mediana. El percentil 25 coincide con el primer cuartil, y el percentil 75 coincide
con el tercer cuartil.
Colectivamente, cuartiles, deciles y percentiles se denominan cuantiles.
Para calcular tanto las posiciones de los deciles como de los percentiles se puede
utilizar la siguiente formula:
Ejemplo:
Se tiene una muestra de las edades de los trabajadores de una micro-empresa
33, 26, 66, 45, 28, 59, 33, 36, 26, 45, 62, 45.
Calcular los cuartiles 1, 2 y 3. Los deciles 1, 3, 5, 9. Los percentiles 9, 10 y 50
Para 𝑄1 = 3.25, lo que implica que el 𝑄1 se encuentra entre la posición 3 y 4 a una
distancia de 0.25 de la posición 3.
Ahora encontramos la distancia entre estos dos valores
33 − 28 = 5
0.25 ∗ 5 = 1.25
Entonces
𝑄1 = 28 + 1.25 = 29.25
5
Para encontrar el 𝑄2 , calculamos su posición:
𝑛+1
𝑃𝑄2 = = 6.5
2
Luego
45 + 36
𝑄2 = = 40.5
2
3(𝑛 + 1) 3(12 + 1)
𝑃𝑄3 = = = 9.75
4 4
59 − 45 = 14
Para ubicar el 𝑄3 hay que moverse a 0.75 de distancia a partir del 9no.
0.75(14) = 10.5
𝑄3 = 45 + 10.5 = 55.5
Deciles
12 + 1
𝐷1 = = 1.3
10
𝐷1 = 26
Para el decil 3
(12 + 1)30
𝑃𝐷3 = = 3.9
100
6
El tercer Decil se localiza entre el tercer y cuarto valor y se encuentra a 0.9 de la
distancia entre ellos,
33 − 28 = 5
Para ubicar el tercer decil, hay que moverse a 0.9 de la distancia del tercer valor y
el cuarto, por lo que:
09 ∗ 5 = 4.5
Para terminar el procedimiento, sumamos 4.5 al primer valor, y resulta así que el
tercer decil es:
𝐷3 = 28 + 4.5 = 32.5
𝑛+1
𝑃𝐷5 = = 6.5
2
45 + 36
𝐷5 = = 40.5
2
9(𝑛 + 1)
𝑃𝐷9 = = 11.7
10
66 − 62 = 4
Para ubicar el decil 9, hay que moverse 0.7 de la distancia entre los datos 11 y 12
0.7 ∗ 4 = 2.8
𝐷9 = 62 + 2.8 = 64.8
𝑛+1
𝑃10 = = 1.3
10
7
Luego
𝑃10 = 26
Para el percentil 50
𝑛+1
𝑃50 = = 6.5
2
Entonces
𝑃50 = 40.5
Para el percentil 90
9(𝑛 + 1)
𝑃90 = = 11.7
10
𝑃90 = 62 + 2.8
La dispersión o variación de los datos intenta dar una idea de cuán esparcidos se
encuentran éstos. Hay varias medidas de tal dispersión, siendo las más comunes el
rango, la desviación media, el rango semi-intercuartil, el rango percentil 10-90 y la
desviación típica.
EL RANGO
El rango de un conjunto de números es la diferencia entre el mayor y el menor de
todos ellos. El rango mide la distribución total del conjunto de datos. Aunque el rango
es una medida simple de la variación total de los datos, no toma en cuenta como se
distribuyen los datos entre el valor máximo y el valor mínimo. Entonces, debemos
tener la precaución de que el rango en ningún momento nos entrega información de
cómo están distribuidos los datos en ese intervalo. Pueden ocurrir varias cosas,
puede que los datos estén distribuidos de manera uniforme, o agrupados en torno
a la media, o cerca de los extremos.
RANGO INTERCUARTIL
El rango intercuartil es la diferencia entre el tercer cuartil y el primer cuartil de un
conjunto de datos
𝑅𝑎𝑛𝑔𝑜 𝐼𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙 = 𝑄3 − 𝑄1
LA DESVIACIÓN MEDIA.
La desviación media o desviación promedio, de un conjunto de n números
𝑋1 , 𝑋2 , … , 𝑋𝑛 se denota por MD y se define como
VARIANZA MUESTRAL
9
Ejercicio: Que conjunto de datos se encuentra más disperso
Conjunto 1: 3, 3, 5, 6, 8
Conjunto 2: 1, 3, 5, 6,10
Observaciones
1. Para encontrar 𝑥̅ se usa la suma de todas las 𝑥
2. La suma de las desviaciones con respecto a la media siempre es cero.
3. La suma de las desviaciones al cuadrado se encuentra elevando al cuadrado
cada desviación y luego sumando dichos valores.
𝑆𝐶 (𝑥 )
𝑠2 =
𝑛−1
Además,
(∑ 𝑥 )2
𝑆𝐶 (𝑥 ) = ∑ 𝑥 2 −
𝑛
Y sustituyendo,
(∑ 𝑥 )2
∑ 𝑥2 −
𝑠2 = 𝑛
𝑛−1
Las unidades de la desviación son las mismas unidades que se utilizan para los
datos, en el caso de la varianza no tiene mucho sentido hablar de unidades.
10
A veces surge la pregunta del por que no se calcula la varianza de los datos de una
muestra con un valor de n en vez de (𝑛 − 1) el denominador. Esto es porque el valor
resultante da una mejor estimación de la desviación típica de la población total. Para
grandes valores de 𝑛 (𝑛 > 30), no hay prácticamente diferencia entre ambas
definiciones. Además, cuando se necesita esa mejor estimación, siempre podemos
𝑛
obtenerla multiplicando la aquí definida por √𝑛−1.
2
∑𝑛𝑗=1(𝑋𝑗 − 𝑎)
𝑠=√
𝑛
𝑁1 𝑠1 2 + 𝑁2 𝑠2 2
𝑠=
𝑁1 + 𝑁2
Nótese que esto es la media ponderada de las varianzas, este resultado admite
generalización a más conjuntos.
11
MEDIA Y DESVIACION ESTANDAR DE DATOS AGRUPADOS Y NO
AGRUPADOS
x f
1 5
2 9
3 8
4 6
Solución
Luego
∑ 𝑥 = ∑ 𝑥𝑓 = 71
∑ 𝑓 = 28
∑ 𝑥 2 = 209
Ahora
∑ 𝑥𝑓
𝑥̅ =
∑𝑓
(∑ 𝑥𝑓 )2
∑ 𝑥 2𝑓 −
∑𝑓
𝑠2 = = 1.073
∑𝑓 − 1
x f Mi
1 2 40
2 2 50
12
3 7 60
4 13 70
5 11 80
6 11 90
7 4 100
Solución
Se usaran las marcas de clase como valores representativos de cada clase.
∑ 𝑥𝑓
𝑥̅ = = 75.6
∑𝑓
Para la varianza
(∑ 𝑥𝑓 )2
∑ 𝑥 2𝑓 −
∑𝑓
𝑠2 = = 221.1
∑𝑓 − 1
𝑥𝑖 − 𝑥̅
𝑧𝑖 =
𝑠
COEFICIENTE DE VARIACIÓN
𝑠
𝐶. 𝑉 = ∗ 100
𝑥̅
REGLA EMPIRICA
Es posible que dos conjunto de datos distintos tengan el mismo rango pero difieran
considerablemente en el grado de variación de los datos. En consecuencia, el rango
es una medida relativamente insensible a la variación de los datos. La varianza
13
tiene importancia teórica, pero es difícil de interpretar porque las unidades de
medición de la variable de interés están elevadas al cuadrado. En cambio, las
unidades de medición de la desviación estándar son las unidades de la variable. Si
la desviación estándar se combina con la media del conjunto de datos, resulta fácil
interpretarla.
Si un conjunto de datos tiene una distribución aproximadamente simétrica se
pueden utilizar las siguientes reglas prácticas para describir el conjunto de datos:
14
REFERENCIAS BIBLIOGRAFICAS
Johnson, & Kuby. (2004). Estadística Elemental lo Esencial. México: Tercera
Edición Thomson.
Levine, Krehbiel, & Berenson. (2012). Estadística Descriptiva. México: Pearson.
15