Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Descriptiva - 1
Estadística Descriptiva - 1
GLG-213
• Histogramas
• Diagramas de tallos y hojas
• Diagramas de cajas y bigotes
yi ni hi
0 1 0.0625
1 6 0.375
2 5 0.3125
3 3 0.1875
4 1 0.0625
10 16 1
x1=2, x2= 𝟏, x3=3, x4= 𝟏, x5=2, x6= 𝟏, x7=3, x8= 𝟎, x9=2, x10= 𝟏, x11=2, x12= 𝟑, x13=4, x14= 𝟏, x15=1,
x16= 𝟐
1 IIII I 6
2 IIII 5
3 III 3
I
4 1
Totales 16
yi ni hi %
0 1 0.0625 6.25
1 6 0.375 37.5
2 5 0.3125 31.25
3 3 0.1875 18.75
4 1 0.0625 6.25
10 16 1 100
http://www.iesdionisioaguado.org/mates/images/stories/cuartoeso/histograma.jpg
x1 + x2 + ⋯ + xn
X=
n
n
i=1 xi
x = M(x)= (1)
n
n
17 + 11 + 26 + 33 + 9 + 12 108
xi= = = 18
6 6
i=1
n×x= xi (2)
i=1
18 + 18 + 18 + 18 + 18 + 18 = 108
xi ai
x i 1
n
a
i 1
i
n n
i=1 yi ni i=1 yi ni
y = M(y) = n = (4)
i=1 ni n
1.5 7.0 4.5 5.6 7.5 5.8 10.5 1.8 13.5 1.3 16.5 1.1 19.5 0.5 143 .55
x 6.21% Cu
7.0 5.6 5.8 1.8 1.3 1.1 0.5 23.1
xi es un valor individual, en este caso el promedio del intervalo de
n
clase, y fi es la frecuencia de los intervalos respectivos.
x f i i
x i 1
n *Para este cálculo se asume que la desviación de los valores del
f
i 1
i promedio del intervalo de clase dentro de cada intervalo de clase
será más o menos balanceada.
Universidad Mayor de San Andrés
Moda, mediana y media
𝑥 𝑛 +𝑥 𝑛
2 2 +1
𝑥 = 𝑥𝑚𝑒 = 𝑀𝑒 = 2
(7)
𝑥 8 +𝑥 8 𝑥4 + 𝑥5 37 + 39
2 2 +1
𝑥 = 𝑥𝑚𝑒 = 𝑀𝑒 = = = = 38
2 2 2
2 5
3 3
4 1
Totales 16
• Acá la Moda es =1, ósea 1 hijos por familia es la frecuencia más alta.
𝑖𝑛
Percentiles i = i percentil
100
En la práctica sea hace más rápida tomando el logaritmo y luego el antilogaritmo de éste como sigue:
1
𝑙𝑜𝑔𝑥𝐺 = 𝑙𝑜𝑔 𝑛 𝑥1 𝑥2 … 𝑥𝑛 = 𝑙𝑜𝑔𝑥1 + 𝑙𝑜𝑔𝑥2 + ⋯ 𝑙𝑜𝑔𝑥𝑛
𝑛
𝑛
1
𝑙𝑜𝑔𝑥𝐺 = 𝑙𝑜𝑔𝑥𝑖
𝑛
𝑖=1
n n
log xi
i 1
log xi
i 1
n n
anti log e
e
3.915
n 5.00
• Por ejemplo: cuatro valores, 1, 2, 3, y 4 tienen una media de 2.5; pero los valores
2.3, 2.4, 2.6 y 2.7 también tienen una media de 2.5.
• Sin embargo ambos grupos tienen valores muy diferentes, pues los valores del
segundo grupo están mas cerca al valor promedio que los del primer grupo.
• Un valor que describa una medida de la diferencia media de los valores
individuales a partir del promedio se requiere para definir la variación en
distribución.
Varianza y desviación estándar (datos no tabulados)
• La diferencia entre los valores puede ser positiva o negativa, por lo que se requiere
elevarlos al cuadrado.
• El promedio de esta diferencia es la varianza (s2 o σ2 )
• Su raíz cuadrada es la desviación estándar s ó σ
• La fórmula de la varianza es:
n 2
xi x
1
s
2
n 1 i 1
n
xi x
1
s2
n 1 i 1
s2
1
4 1
1 2.52 2 2.52 3 2.52 4 2.52
1
s2 (2.25 0.25 0.25 2.25)
3
5
s2 1.67
3
s 1.67 1.29
• Para el caso de los valores x1=2.3, x2=2.4, x3=2.6 y x4=2.7, con media 2.5, la
varianza se calcula:
n
xi x
1
s 2
n 1 i 1
s2
1
4 1
2.3 2.52 2.4 2.52 2.6 2.52 2.7 2.52
1
s2 (0.004 0.001 0.001 0.004 )
3
1
s2 0.001 0.0033
3
s 0.0033 0.06
Universidad Mayor de San Andrés
Varianza y desviación estándar (datos no tabulados)
s
2 1 n
n 1 i 1
2
xi nx
2
• Para el caso de la primera serie de datos, ésta será:
s
2 1 n
n 1 i 1
x i
2
nx 2
s2
1
4 1
(12 2 2 3 2 4 2 ) 4 2.5 2
s 2 30 25 igual que arriba
1 5
3 3
s 2 1.67
s 1.29
Varianza y desviación estándar (datos tabulados)
i 1
s2 n
f
i 1
i b
x i son los valores individual es, que en este caso son los
promedios de cada intervalo de clase y f i son las frecuencia s.
b es el promedio de todos los factores de ponderación.
23.1 0.77
n 2
2 n i=1 n i y i −y n n 2
𝑆 = = i=1 hi yi − y (19)
𝑛−1 𝑛 𝑛−1
n
El factor se conoce como la corrección de Bessel.
𝑛−1
Peso (kg)
Frecuencia 4 8 9 10 7 6 6
Numero de escolares
Ejemplo 9
Las estaturas en cm. De un grupo de 103 personas se distribuye como sigue:
intervalos 150-155 155-160 160-165 165-170 170-175 175-180 180-185 185-190 190-195 195-200
ni 3 6 12 18 25 17 10 7 4 1
Para hallar la desviación típica, calculamos en una tabla todos los valores que
necesitamos sustituir en la fórmula de la varianza, Ot = 172.5 y c = 5
(método abreviado para calcular la varianza).
𝒄𝟐 𝒏𝒊 𝒖𝒊 𝟐
𝑺= 𝑺𝟐 = 𝒏𝒊 𝒖𝒊 𝟐 −
𝒏−𝟏 𝒏
𝟏 𝒏𝒊 𝒖𝒊 𝟐
=𝒄 𝒏𝒊 𝒖𝒊 𝟐 −
𝒏−𝟏 𝒏
𝟏 𝟒𝟗 𝟏
=𝟓 𝟑𝟕𝟕 − = 𝟓 𝟑𝟕𝟕 − 𝟎. 𝟒𝟕𝟔 = 𝟓 𝟑𝟕𝟔. 𝟓𝟐𝟒 − 𝟏𝟎𝟐
𝟏𝟎𝟐 𝟏𝟎𝟑 𝟏𝟎𝟐
𝑺 = 𝟓 𝟑. 𝟔𝟗𝟏 = 𝟗. 𝟔𝟎𝟕 𝒄𝒎
𝑥 = 𝑀𝑒 = 𝑥𝑚𝑜
𝑄3− 𝑄1 cuantiles
𝐾3 = (22)
2(𝑃90 −𝑃10 )
Sf i 1
n * s3
• Regla: Si hay solo un valor en los datos que es mas alto que los demás, éste es
reducido al segundo mas alto.
Pozo Espesor (m) Ley (g Au/ton)
1-39 1.7-4 m 1.5 - 8.3
40 8.0 9.1
41 3.0 10.1
42 1.0 12.0
43 2.0 13.4
44 3.0 21.7
45 2.0 44.0
• La ley mas alta final se reduce al valor mas alto siguiente, en este caso de 44.0 a
21.7 g/t. La media así obtenida es 4.3 g/t en contraste a 4.8 g/t. La diferencia de
0.5 g/t resulta de:
44.0 g/t 21.7 g/t
diferencia 0.5 g/t
45
Universidad Mayor de San Andrés
Distribuciones asimétricas
• Test estadístico para valores anómalos
– En estadística un valor analítico se denomina
anómalo si se desvía fuertemente de los otros
– Dorerfell (1962) genero un diagrama para la
determinación del umbral de valores anómalos
– La media y la desviación son calculados sin los
valores mas altos. Entonces un valor xA es
anómalo alto si cae fuera del siguiente rango:
XA x s*g
g se obtiene en el diagrama de umbral de valores anómalos
Universidad Mayor de San Andrés
Distribuciones asimétricas
• Una veta de Qz + Au ha sido investigada por una socavón. La veta fue sistemáticamente
muestreada cada 3m a lo largo de su rumbo. Las muestras contienen la siguientes leyes:
XA x s*g
Los últimos valores son notoriamente altos. El test mostrara si deben ser reducidos.
• Segundo
Consideramos el siguiente valor mas alto y la media y la desviacion son calculadso otra vez pero
sin el valor de 38.9 (y sin claramente sin el 68.5)
XA x s*g
X A 8.99 6.72 * 4 35.87
Entonces el valor de 38.9 también debe ser reducido
• Cuarto
Los valores eliminados deben ser reducidos al ultimo valor que fue reducido
X A 35.8 36 g/ton
• Quinto
Después de reducir los dos mas altos valores 38.9 y 68.5 a 36 g/ton la nueva media calculada es
x 11.8 g/ton
Teorema de Tchbyshev.- Dado un conjunto de observaciones x1, x2,…xn, entre la media aritmética y ± k
veces la desviación, existe por lo menos el:
1 x 2
1
2
y e
2
La cual describe el área debajo la curva de la distribución normal
Parte del material brindado en esta presentación, fue tomado del libro:
Estadística Descriptiva Conceptos y aplicaciones. Rufino Moya Calderón, 2008