Está en la página 1de 99

Estadística descriptiva

GLG-213

Universidad Mayor de San Andrés


Introducción
• La primera labor que se debe realizar cuando
tenemos una base de datos es describirlos
• La mejor forma de analizar datos es analizarlos
gráficamente
• Existen múltiples formas de representar
nuestros datos
• Primero debemos aprender a elaborar a
mano, usando softwares (R, excel, etc.)

Universidad Mayor de San Andrés


Histogramas y formas de visualización de datos

• Histogramas
• Diagramas de tallos y hojas
• Diagramas de cajas y bigotes

Universidad Mayor de San Andrés


Universidad Mayor de San Andrés
Universidad Mayor de San Andrés
Universidad Mayor de San Andrés
Universidad Mayor de San Andrés
Universidad Mayor de San Andrés
Universidad Mayor de San Andrés
Gráficos de frecuencias
• Recordamos que una frecuencia absoluta es el números de
veces que se repite una observación (ni)
• La frecuencia relativa es el cociente entre una frecuencia
absoluta y el número total de observaciones (hi)
Número Frecuencias Frecuencias

de hijos absolutas relativa

yi ni hi

0 1 0.0625
1 6 0.375
2 5 0.3125
3 3 0.1875
4 1 0.0625
10 16 1

Universidad Mayor de San Andrés


Gráficos de frecuencias
Se realiza una encuesta a un conjunto de 16 familias sobre el número de hijos- Los resultados son:

x1=2, x2= 𝟏, x3=3, x4= 𝟏, x5=2, x6= 𝟏, x7=3, x8= 𝟎, x9=2, x10= 𝟏, x11=2, x12= 𝟑, x13=4, x14= 𝟏, x15=1,
x16= 𝟐

Número de hijos Conteo Frecuencias absolutas


yi ni
0 I 1

1 IIII I 6

2 IIII 5

3 III 3
I
4 1
Totales 16

Universidad Mayor de San Andrés


Gráficos de frecuencias

Número Frecuencias Frecuencias Frecuencias

de hijos absolutas relativa relativas

yi ni hi %
0 1 0.0625 6.25
1 6 0.375 37.5
2 5 0.3125 31.25
3 3 0.1875 18.75
4 1 0.0625 6.25
10 16 1 100

Universidad Mayor de San Andrés


Construcción del histograma

Universidad Mayor de San Andrés


• Ver otras formas de ajustar el ancho de cada
bloque:
• https://en.wikipedia.org/wiki/Histogram#:~:te
xt=The%20intervals%20are%20placed%20tog
ether,%E2%80%9320.5%20and%2022.5%E2%
80%9332.5.
• Función “ceiling”…?

Universidad Mayor de San Andrés


Gráficos de frecuencias

http://www.iesdionisioaguado.org/mates/images/stories/cuartoeso/histograma.jpg

Universidad Mayor de San Andrés


Histogramas

Universidad Mayor de San Andrés


Polígono de frecuencia

Universidad Mayor de San Andrés


Universidad Mayor de San Andrés
Universidad Mayor de San Andrés
Diagrama de caja y bigotes

Universidad Mayor de San Andrés


Media aritmética
• La media aritmética de una muestra x1, x2...xn se define como la suma de
todos los valores observados en la muestra, dividida por el número total
de observaciones n. Es decir:

x1 + x2 + ⋯ + xn
X=
n

n
i=1 xi
x = M(x)= (1)
n

Universidad Mayor de San Andrés


Media aritmética

Universidad Mayor de San Andrés


Media aritmética
• Ejemplo 1:
• Sean los valores (Au g/ton): 17, 11, 26, 33,
9,12, determinar la ley media.
n
1 x1 + x2 + ⋯ + xn
x= xi=
n n
i=1

n
17 + 11 + 26 + 33 + 9 + 12 108
xi= = = 18
6 6
i=1

Universidad Mayor de San Andrés


Media aritmética
• Se cumple la condición que:
a condición que:
n

n×x= xi (2)
i=1

18 + 18 + 18 + 18 + 18 + 18 = 108

ces 18, cumpliéndose


6 veces 18, cumpliéndose (2)

Universidad Mayor de San Andrés


Media aritmética
• Ejemplo 2
• Los siguientes datos derivan de medidas de
densidad (g/cm3): 3.2, 3.3, 3.4, 3.5, 3.6. La
media es:
3.2  3.3  3.4  3.5  3.6
x  3.4 g/cm3
5
n
n  x  5  3.4  17
n×x= xi (2)n
i=1
x
i 1
i  3.2  3.3  3.4  3.5  3.6  17

Universidad Mayor de San Andrés


Media aritmética ponderada
• Permite calcular un promedio que toma en
cuenta la importancia o el peso que tiene cada
valor sobre el total.
𝑛
𝑖=1 𝑥𝑖 𝑤𝑖
𝑥= 𝑛
𝑖=1 𝑤𝑖

𝑥 es el símbolo para la media aritmética


𝑥𝑖 es el símbolo para las observaciones individuales
𝑤𝑖 es el peso asignado a cada observación

Universidad Mayor de San Andrés


Media aritmética ponderada
• Si xi es una muestra individual y ai es el factor
de peso, por ejemplo longitud del testigo de
las secciones analizadas, entonces la media es:
x1  a1  x 2  a 2  x3  a3  ...x n  a n
x
a1  a 2  a3 ...  a n
o de forma más corta :

 xi  ai
x i 1
n

a
i 1
i

Universidad Mayor de San Andrés


Media aritmética ponderada
Muestra No. Cu (%) Longitud de
testigo(m)
1 2.8 0.8
2 2.5 0.3
3 4.6 1.0
4 6.8 0.5
5 5.6 0.5

Universidad Mayor de San Andrés


Media aritmética ponderada
Muestra Cu (%) Longitud de
No. testigo(m)
1 2.8 0.8 2.8  0.8  2.5  0.3  4.6  1.0  6.8  0.5  5.6  0.5
x
0.8  0.3  1.0  0.5  0.5
2 2.5 0.3
3 4.6 1.0 13.79
x  4.45%Cu
4 6.8 0.5 3.1
5 5.6 0.5

Universidad Mayor de San Andrés


Media aritmética ponderada
(datos tabulados)
Si los datos han sido clasificados en clases o intervalos(cuyo valor central es yi),
además de ser descritas en una tabla sus frecuencias (ni, i=1,2)… , entonces la
fórmula de la media aritmética será:
y1 n1 + y2 n2 + ⋯ + ym ni
y = M(y) =
n

n n
i=1 yi ni i=1 yi ni
y = M(y) = n = (4)
i=1 ni n

Universidad Mayor de San Andrés


Distribución de frecuencias para muestras con especificaciones diferentes
Análisis de Cu de depósitos tipo Kuroko
Muestra No. Cu (%) Longitud (m) Muestra No. Cu (%) Longitud (m)
1 2.8 0.8 16 6.9 1.0
2 2.5 0.3 17 5.8 1.0
3 4.6 1.0 18 8.8 0.7
4 6.8 0.5 19 7.3 0.4
5 5.6 0.5 20 10.4 0.5
6 7.2 0.9 21 15.2 0.4
7 6.8 0.9 22 8.3 0.8
8 5.5 0.4 23 3.1 1.1
9 9.5 1.0 24 2.0 1.0
10 14.9 1.3 25 1.3 1.0
11 20.1 0.5 26 1.5 0.9
12 11.2 0.3 27 3.8 1.2
13 16.5 0.7 28 1.1 1.0
14 4.0 0.4 29 1.4 1.0
15 7.8 0.6 30 0.8 1.0
Ʃ = 23.1 m

Universidad Mayor de San Andrés


Media aritmética (datos tabulados)

• Los testigos son a menudo cortados en secciones para análisis de acuerdo a


unidades geológicas, y así las longitudes de los testigos tienen longitud variables.
Por lo que los valores individuales tienen un soporte de muestra diferente. Los
valores de la tabla no pueden ser evaluados de una sola vez. Por ejemplo, sería
incorrecto si la muestra 2 con una longitud de 0.3 m sea tratada de igual manera
que la muestra 9 con una longitud de 1.0 m. Por lo que las muestras deben ser
ponderadas de acuerdo a sus longitudes.

Universidad Mayor de San Andrés


Media aritmética (datos tabulados)
• Determinar intervalos de clase usando el
método de Sturges:
RangoR
Intervalo de clase 
1  3.322 log n

• Determinar el valor medio de cada clase


• Sumar las longitudes de testigos de cada clase
y usar este valor como un valor de
ponderación
• Determinar la media aritmética ponderada
Universidad Mayor de San Andrés
Media aritmética (datos tabulados)

• Primero podemos usar la regla de Sturges para definir un rango de clases:

Valor minimo  0.8


Valor máximo  20.1
n  30
RangoR 20.1  0.8
Intervalo de clase    3.26  3
1  3.322 log n 1  3.322 log( 30)

Longitudes de testigos Suma de Frecuencia


Clase %Cu en cada clase longitudes relativa (%)
0.1-3 0.8; 0.3; 1.0; 1.0: 0.9; 1.0; 1.0; 1.0 7 30.3
3.1-6 1.0; 0.5; 0.4; 0.4; 1.0; 1.1; 1.2 5.6 24.2
6.1-9 0.5; 0.9; 0.9; 0.6; 1.0; 0.7; 0.4; 0.8 5.8 25.1
9.1-12 1.0; 0.3; 0.5 1.8 7.8
12.1-15 1.3 1.3 5.6
15.1-18 0.7; 0.4 1.1 4.8
18.1-21 0.5 0.5 2.2
Suma 23.1 100.0 %

Universidad Mayor de San Andrés


Media aritmética (datos tabulados)
Promedio de clase xi Suma de
Clase %Cu
% Cu* longitudes
0.1-3 1.5 7
3.1-6 4.5 5.6
6.1-9 7.5 5.8
9.1-12 10.5 1.8
12.1-15 13.5 1.3
15.1-18 16.5 1.1
18.1-21 19.5 0.5
Suma 23.1

1.5  7.0  4.5  5.6  7.5  5.8  10.5  1.8  13.5  1.3  16.5  1.1  19.5  0.5 143 .55
x   6.21% Cu
7.0  5.6  5.8  1.8  1.3  1.1  0.5 23.1
xi es un valor individual, en este caso el promedio del intervalo de
n
clase, y fi es la frecuencia de los intervalos respectivos.
 x  f  i i
x i 1
n *Para este cálculo se asume que la desviación de los valores del
f
i 1
i promedio del intervalo de clase dentro de cada intervalo de clase
será más o menos balanceada.
Universidad Mayor de San Andrés
Moda, mediana y media

Universidad Mayor de San Andrés


Mediana
• Dado un conjunto de n observaciones x1, x2...xn, de la variable
x, se define a la mediana como aquel valor que no es
superado ni supera a más de las n observaciones, arregladas
en orden de magnitud creciente o decreciente
Mediana de datos no tabulados
• Se tienen 2 casos número de observaciones impar y par. En el
caso de que los datos sean impares: se ordena los datos de
forma creciente: x1, x2...xn, donde xn…x2 x1
𝑥 = 𝑥𝑚𝑒 = 𝑀𝑒 = 𝑥 𝑛+1 (6)
2

Universidad Mayor de San Andrés


Mediana
Ejemplo
Se tienen las siguientes observaciones: 43. 51, 37, 39, 19,
24,27, entonces:
Se ordena los datos: x1=43, x2=51, x3=37, x4=39, x5=19,
x6=24, x7=27, en orden creciente:

19, 24, 27, 37, 39, 43, 51

x(1) x(2) x(3) x(4) x(5) x(6) x(7)

Universidad Mayor de San Andrés


Mediana
Existen n=7, número impar de observaciones, entonces la
mediana es el valor de la observación que ocupa la posición
central, es decir

𝑥 = 𝑥𝑚𝑒 = 𝑀𝑒 = 𝑥 𝑛+1 =𝑥 7+1 =𝑥 4 = 37


2 2

Universidad Mayor de San Andrés


Mediana
• En el caso de que n sea par, se ordenan los datos y se
observan dos valores centrales y , pudiéndose tomar como
mediana cualquiera de dos valores centrales de ellos, o
cualquier valor entre estos dos. Se acostumbra tomar como
mediana la semisuma de ambos valores:

𝑥 𝑛 +𝑥 𝑛
2 2 +1
𝑥 = 𝑥𝑚𝑒 = 𝑀𝑒 = 2
(7)

Universidad Mayor de San Andrés


Mediana
Ejemplo
Se tienen las siguientes observaciones: 43, 51, 37, 39, 19, 24, 27,
62. Determine la mediana de la muestra:
La muestra x143, x251, x337, x439, x519, x624, x727, x862 ordenada
de forma ascendente es:
19, 24, 27, 37, 39, 43, 51, 62

x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8)

Universidad Mayor de San Andrés


Mediana
Ejemplo
Existen n=8, un número par de observaciones, entonces la
mediana es el promedio de las dos observaciones centrales y

𝑥 8 +𝑥 8 𝑥4 + 𝑥5 37 + 39
2 2 +1
𝑥 = 𝑥𝑚𝑒 = 𝑀𝑒 = = = = 38
2 2 2

Universidad Mayor de San Andrés


Moda
• La moda de una muestra x1, x2...xn, es aquel valor de la variable que se
presenta con mayor frecuencia; es decir es el que más se repite y se
denota por “Mo” o “xmo”.
Ejemplo Número de Frecuencias
hijos absolutas
yi ni
0 1
1 6

2 5
3 3

4 1
Totales 16

• Acá la Moda es =1, ósea 1 hijos por familia es la frecuencia más alta.

Universidad Mayor de San Andrés


Cuantiles
𝑖(𝑛+1)
Deciles i= i decil
10

𝑖𝑛
Percentiles i = i percentil
100

Universidad Mayor de San Andrés


Cuantiles
Existen otros estadígrafos que dividen a los datos en otras proporciones que
no son la mitad, como lo hacen los cuantiles (cuartiles, deciles y
percentiles)
• Cuartiles.- Son valores que dividen a un conjunto de datos ordenados en
forma ascendente o descendente en cuatro partes iguales, y se denotan
por Qi, i= 1,2,3.
Para datos no tabulados:

1. Se ordenan los datos de forma ascendente: x1, x2...xn


𝑛+1
2. Si el valor es entero =Q1
4

Segundo cuartil: Q2=Mediana


3(𝑛 + 1)
Tercer cuartil: 75%, si el numero es un entero usamos
4

Universidad Mayor de San Andrés


Media geométrica
• La media geométrica simple “Mg” o de n
observaciones x1, x2,…xn positivas, está dada
por la raíz enésima del producto de los n
valores observados, es decir:
𝑛
𝑛
𝑛
𝑥𝐺 = 𝑀𝑔 = 𝑥1 𝑥2 … 𝑥𝑛 = 𝑥𝑖
𝑖=1

Universidad Mayor de San Andrés


Media geométrica
• Se dice que es media geométrica porque es el
término central de una progresión geométrica
de un número impar de observaciones
• Ejemplo: Hallar la media geométrica de los
números 3,5,8,3,5,2.
• Solución: En este caso n= 6, x1=3, x2=5, x3=8,
x4=3, x5=5 y x6=2, entonces la media
geométrica es:
6 6
• 𝐺
𝑥 = 3 ∗ 5 ∗ 8 ∗ 3 ∗ 5 ∗ 2 = 3600 = 3.915
Universidad Mayor de San Andrés
Media geométrica

En la práctica sea hace más rápida tomando el logaritmo y luego el antilogaritmo de éste como sigue:

1
𝑙𝑜𝑔𝑥𝐺 = 𝑙𝑜𝑔 𝑛 𝑥1 𝑥2 … 𝑥𝑛 = 𝑙𝑜𝑔𝑥1 + 𝑙𝑜𝑔𝑥2 + ⋯ 𝑙𝑜𝑔𝑥𝑛
𝑛
𝑛
1
𝑙𝑜𝑔𝑥𝐺 = 𝑙𝑜𝑔𝑥𝑖
𝑛
𝑖=1

Ahora basta calcular el antilogaritmo de la expresión anterior para obtener


𝑛
𝑖=1 𝑙𝑜𝑔𝑥𝑖  n 
𝑥𝐺 = 𝑎𝑛𝑡𝑖 𝑙𝑜𝑔
𝑛

 log xi 
 i 1 
 n 
 
 
anti log  e  

Universidad Mayor de San Andrés


Media geométrica
• Calcular:
𝑛
x log xi
𝑛
𝑛
3 1.10 𝑥𝐺 = 𝑀𝑔 = 𝑥1 𝑥2 … 𝑥𝑛 = 𝑥𝑖
5 1.61
𝑖=1
8 2.08
3 1.10
5 1.61
2 0.69
∏ 3600 3.915

 n   n 

 log xi 
 i 1 

 log xi 
 i 1 
 n   n 
   
   
anti log  e  
e  
 3.915

Universidad Mayor de San Andrés


Media geometrica
• Calcular: 𝑛
𝑛
𝑛
Pozo N ley g/t (x)
𝑥𝐺 = 𝑀𝑔 = 𝑥1 𝑥2 … 𝑥𝑛 = 𝑥𝑖
1 5.2 𝑖=1
2 1.5
3 35.9
 n 
4 9.8

 log xi 
 i 1 
5 17.7  
 n 
 
anti log  e  

Universidad Mayor de San Andrés


Media geométrica
• Calcular: 𝑛
𝑛
𝑛
Pozo N ley g/t (x)
𝑥𝐺 = 𝑀𝑔 = 𝑥1 𝑥2 … 𝑥𝑛 = 𝑥𝑖
1 5.2 𝑖=1
2 1.5
3 35.9
 n 
4 9.8

 log xi 
 i 1 
5 17.7  
 n 
 
anti log  e  

n 5.00

media aritm 14.02

media geom 8.66 antilog 8.66

Universidad Mayor de San Andrés


Universidad Mayor de San Andrés
Varianza y desviación estándar
• Es claro de la figura en forma de campana de una distribución de frecuencias
simétricas, que diferentes curvas en forma de campana, amplias o estrechas
pueden tener el mismo valor promedio.

• Por ejemplo: cuatro valores, 1, 2, 3, y 4 tienen una media de 2.5; pero los valores
2.3, 2.4, 2.6 y 2.7 también tienen una media de 2.5.
• Sin embargo ambos grupos tienen valores muy diferentes, pues los valores del
segundo grupo están mas cerca al valor promedio que los del primer grupo.
• Un valor que describa una medida de la diferencia media de los valores
individuales a partir del promedio se requiere para definir la variación en
distribución.
Varianza y desviación estándar (datos no tabulados)

• La diferencia entre los valores puede ser positiva o negativa, por lo que se requiere
elevarlos al cuadrado.
• El promedio de esta diferencia es la varianza (s2 o σ2 )
• Su raíz cuadrada es la desviación estándar s ó σ
• La fórmula de la varianza es:
n 2

   xi  x 
1
s 
2

n  1 i 1

• Por qué se usa la expresión (n-1) en vez de n en la ecuación?. El numero de grados


de libertad se muestra en el denominador. Con un gran numero de muestras la
diferencia entre n y n-1 es casi insignificante.

Universidad Mayor de San Andrés


Varianza y desviación estándar (datos no tabulados)

• En el ejemplo las muestras x1=1, x2=2, x3=3 y x4=4 la varianza sería:

n
   xi  x 
1
s2 
n  1 i 1

s2 
1
4 1

1  2.52  2  2.52 3  2.52 4  2.52 
1
s2  (2.25  0.25  0.25  2.25)
3
5
s2   1.67
3

Universidad Mayor de San Andrés


Varianza y desviación estándar (datos no tabulados)

• La desviación estándar es:

s  1.67  1.29
• Para el caso de los valores x1=2.3, x2=2.4, x3=2.6 y x4=2.7, con media 2.5, la
varianza se calcula:
n
   xi  x 
1
s 2

n  1 i 1

s2 
1
4 1

2.3  2.52  2.4  2.52 2.6  2.52 2.7  2.52 
1
s2  (0.004  0.001  0.001  0.004 )
3
1
s2   0.001  0.0033
3

• La desviación estándar será

s  0.0033  0.06
Universidad Mayor de San Andrés
Varianza y desviación estándar (datos no tabulados)

• La formula tradicional tiene la desventaja que se deben efectuar varios


cálculos repetitivos con decimales. Para hacerlos más rápidamente se usa
la siguiente formula:

s 
2 1 n
 
n  1  i 1
 
2
xi  nx 
2


• Para el caso de la primera serie de datos, ésta será:
s 
2 1 n

n  1  i 1
 
x i
2
 nx 2


s2 
1
4 1

(12  2 2  3 2  4 2 )  4  2.5 2 
s 2  30  25   igual que arriba
1 5
3 3
s 2  1.67
s  1.29
Varianza y desviación estándar (datos tabulados)

• El calculo de la varianza de valores no equivalentes se realiza mejor organizando a


los datos en intervalos clase, como vimos antes.
• La varianza es entonces calculada usando la siguiente formula modificada de la
varianza:
n
 n 

i 1
f i  xi    f i  x 2
2

 i 1 
s2  n

f
i 1
i b

x i son los valores individual es, que en este caso son los
promedios de cada intervalo de clase y f i son las frecuencia s.
b es el promedio de todos los factores de ponderación.

Universidad Mayor de San Andrés


Varianza y desviación estándar (datos tabulados)
Promedio de clase xi Suma de
Clase %Cu
% Cu* longitudes
0.1-3 1.5 7
3.1-6 4.5 5.6
6.1-9 7.5 5.8
 n  2
n 2
9.1-12
12.1-15
10.5
13.5
1.8
1.3 f
i 1
i  xi    fi x
 i 1 
15.1-18 16.5 1.1 s2  n
18.1-21 19.5
Suma
0.5
23.1
f
i 1
i b

• Usando el ejemplo del Cu en depósitos tipo Kuroko, el valor b es la media


de todas las longitudes =0.77, y el valor promedio es de 6.21% Cu.
• La varianza es:
7  1.5 2  5.6  4.5 2  5.8  7.5 2...0.5  19.5 2  23.1  6.212
s 
2

23.1  0.77

1380 .38  810 .33 489 .54


s2    21.92
22.33 22.33
s  21.92  4.68
Varianza de la muestra
n
Note que 𝑆 2 = S´2
𝑛−1

Entonces para datos tabulados:

n 2
2 n i=1 n i y i −y n n 2
𝑆 = = i=1 hi yi − y (19)
𝑛−1 𝑛 𝑛−1

n
El factor se conoce como la corrección de Bessel.
𝑛−1

Universidad Mayor de San Andrés


Varianza de la muestra
• Ejemplo
El siguiente cuadro muestra la distribución de acuerdo a su peso expresado
en kilogramos, de 50 escolares:

Intervalo 20-25 25-30 30-35 35-40 40-45 45-50 50-55

Peso (kg)
Frecuencia 4 8 9 10 7 6 6

Numero de escolares

Universidad Mayor de San Andrés


• Hallar la varianza de la muestra suponiendo que los datos se encuentran
uniformemente distribuidos en cada intervalo de clase, lo cual justifica que se
tome el punto medio de cada intervalo, como representativo de dicho intervalo
entonces:
1. Se determina el punto medio de cada clase
2. Se encuentra la media aritmética de los datos tabulados
3. Se halla la diferencia entre marca de clase y la media aritmética
4. Se eleva al cuadrado las desviaciones, luego se divide por n-1 o por n

Universidad Mayor de San Andrés


Varianza de la muestra
• Ej.
Intervalos yi ni niyi yi-yi (yi-yi)2 ni(yi-yi) 2 𝑛 𝑖 𝑦 𝑖 1875
20 25 22.5 4 90 -15 225 900 𝑦= 𝑛
= 50 = 37.5
25 30 27.5 8 220 -10 100 800
n 2
30 35 32.5 9 292.5 -5 25 225
2 i=1 ni yi − y 4050
35 40 37.5 10 375 0 0 0 𝑆′ = = = 81
𝑛 50
40 45 42.5 7 297.5 5 25 175
45 50 47.5 6 285 10 100 600 n 2
2 i=1 ni yi − y 4050
50 55 52.5 6 315 15 225 1350 𝑆 = = = 82.653
37.5 50 1875 4050
𝑛−1 49

Universidad Mayor de San Andrés


Varianza de la muestra
• Ejemplo
Las frecuencias cardíacas de 5 niños son:
130, 132, 127, 129, 132 pulsaciones por minuto
Determinar la varianza de la frecuencia cardíaca de la muestra
xi x i2
127 16129
129 16641
130 16900
132 17424
132 17424
650 84518

Universidad Mayor de San Andrés


Varianza de la muestra
xi x i2
127 16129
129 16641
130 16900 650
𝑀(𝑥) = = 130
132 17424 5
132 17424
𝑥𝑖 2 84518
650 84518 𝑀(𝑥)2 = = = 16903.6
𝑛 5

Luego aplicamos la formula:


2
𝑆´2 = 𝑀 𝑦 2 − 𝑀 𝑦 = 16903.6 − 16900 = 3.6
2
Calculo de S2 primero calculamos 𝑥𝑖
2
𝑥𝑖 = (650)2 =422500
𝑛
1 𝑛
𝑖=1 𝑥𝑖
2 1 422500 1 18
𝑆2 = 𝑥2 − 𝑛 = 4 84518 − = 84518 − 84500 = = 4.5
𝑛−1 5 4 4
𝑖=1

Universidad Mayor de San Andrés


Desviación típica o estándar

• La desviación típica o desviación estándar “S” de las observaciones x1,


x2...xn, de una variable x, se define como la raíz cuadrada positiva de la
varianza. Es decir

𝐷(𝑥) = 𝑆 = 𝑉(𝑋) = 𝑆 2 (20)

Universidad Mayor de San Andrés


Desviación típica o estándar

Ejemplo 9
Las estaturas en cm. De un grupo de 103 personas se distribuye como sigue:

intervalos 150-155 155-160 160-165 165-170 170-175 175-180 180-185 185-190 190-195 195-200
ni 3 6 12 18 25 17 10 7 4 1

Para hallar la desviación típica, calculamos en una tabla todos los valores que
necesitamos sustituir en la fórmula de la varianza, Ot = 172.5 y c = 5
(método abreviado para calcular la varianza).

Universidad Mayor de San Andrés


Desviación típica o estándar
intervalos ni yi ui=(yi-Ot)/c ui*ni ni*ui2
150 155 3 152.5 -4 -12 48
155 160 6 157.5 -3 -18 54
160 165 12 162.5 -2 -24 48
165 170 18 167.5 -1 -18 18
170 175 25 172.5 0 0 0
175 180 17 177.5 1 17 17
180 185 10 182.5 2 20 40
185 190 7 187.5 3 21 63
190 195 4 192.5 4 16 64
195 200 1 197.5 5 5 25
103 7 377

Universidad Mayor de San Andrés


Desviación típica o estándar

𝒄𝟐 𝒏𝒊 𝒖𝒊 𝟐
𝑺= 𝑺𝟐 = 𝒏𝒊 𝒖𝒊 𝟐 −
𝒏−𝟏 𝒏

𝟏 𝒏𝒊 𝒖𝒊 𝟐
=𝒄 𝒏𝒊 𝒖𝒊 𝟐 −
𝒏−𝟏 𝒏

𝟏 𝟒𝟗 𝟏
=𝟓 𝟑𝟕𝟕 − = 𝟓 𝟑𝟕𝟕 − 𝟎. 𝟒𝟕𝟔 = 𝟓 𝟑𝟕𝟔. 𝟓𝟐𝟒 − 𝟏𝟎𝟐
𝟏𝟎𝟐 𝟏𝟎𝟑 𝟏𝟎𝟐

𝑺 = 𝟓 𝟑. 𝟔𝟗𝟏 = 𝟗. 𝟔𝟎𝟕 𝒄𝒎

Universidad Mayor de San Andrés


Distribuciones asimétricas
• ASIMETRIA
Indica la deformación horizontal de las distribuciones de
frecuencia.
1. En caso de que la curva sea simétrica, entonces la media
aritmética, la mediana y la moda, coinciden.

𝑥 = 𝑀𝑒 = 𝑥𝑚𝑜

Universidad Mayor de San Andrés


Distribuciones asimétricas
2. Si la simetría es positiva, se tiene una ramificación hacia la
derecha y la media aritmética es mayor que la moda y la
mediana quedará entre ambas:

𝑥𝑚𝑜 < 𝑀𝑒 < 𝑥

Universidad Mayor de San Andrés


Distribuciones asimétricas
3. Si la simetría es negativa, se tiene una ramificación hacia la
izquierda. La media aritmética es menor que la moda. La
mediana estará también al medio de las dos.

𝑥 < 𝑀𝑒 < 𝑥𝑚𝑜

Universidad Mayor de San Andrés


Curtosis
• Se entiende por curtosis, la medida de deformación vertical de una
distribución de frecuencias, es decir la medida de apuntamiento o
achatamiento de una distribución.
• El grado de curtosis o alargamiento puede medirse en función de
momentos o de los cuantiles.
n 4
i=1 ni yi − y 𝑀4 momentos
𝐾1 = = (21)
𝑆4 𝑀2

𝑄3− 𝑄1 cuantiles
𝐾3 = (22)
2(𝑃90 −𝑃10 )

Universidad Mayor de San Andrés


Curtosis

K1 >3 leptocúrtica K1 =3 mesocúrtica K1<3 platicúrtica

K3 > 0.263 leptocúrtica K3 = 0.263 mesocúrtica K3 < 0.263 platicúrtica

Universidad Mayor de San Andrés


Distribuciones asimétricas
• Una medida absoluta de asimetría estará dada por:
𝐴𝑠 = 𝑥 − 𝑥𝑚𝑜
As será negativa si la distribución tiene asimetría negativa
As, será nulo (As=0) si la distribución es simétrica
As, será positiva si la distribución tiene asimetría positiva

Universidad Mayor de San Andrés


Distribuciones asimétricas
• La mayoría de los valores en geología no son
simétricos, sino que mas o menos jalan hacia
la derecha (positivamente asimétricos)
• Esos irregularmente altos valores o
enriquecimientos frecuentemente convierten
la mineralización en yacimientos económicos

Universidad Mayor de San Andrés


Distribuciones asimétricas
• La experiencia muestra que incluso después
de hacer los respectivos análisis de dilución,
una simple media aritmética a menudo da una
ley promedio que es muy alta en comparación
a la verdadera ley del deposito
• Sin embargo esos valores altos son muy
importantes para el desarrollo económico del
prospecto

Universidad Mayor de San Andrés


Distribuciones asimétricas
• En principio dos metodologías se distinguen para la estimación
de verdaderas leyes promedios:
– Los valores altos son examinados para ver si son aceptables o
si deben ser tratados como erráticos. La media es calculada
como un promedio aritmético normal
– Los valores son transformados y examinados como
distribución normal logarítmica. EL promedio geométrico es
incrementado por un factor de multiplicación. El promedio
geométrico es siempre menor al aritmético.

Universidad Mayor de San Andrés


Distribuciones asimétricas
• Medida de asimetría
 ( xi  x ) 3

Sf  i 1

n * s3

donde x i son los valores individual es, x es la media aritmetica ,


s es la desviacion estándar y n es el número de muestras.
Si la distribuci on es asimetrica hacia la derecha entonce Sf  0
y si es asimetrica hacia la izquierda entonces Sf  0

Universidad Mayor de San Andrés


Distribuciones asimétricas
• Ejemplo
Análisis de 6 intersecciones de yacimiento de Fe-Ni:
Diamantina Ley de Ni xi - x (xi – x)3
(%)
1 0.9 -0.85 -0.61
2 1.2 -0.55 -0.17
3 1.5 -0.25 -0.02
4 1.9 0.15 0.00
5 2.4 0.65 0.27
6 2.6 0.85 0.61
Suma 0.1
La media es 1.75, la desviación estándar es 0.67 y la (desviación estándar)3 es 0.3
0.1
Sf   0.6
6 * 0.3
Reduciendo el valor más alto al siguiente mas alto

• Regla: Si hay solo un valor en los datos que es mas alto que los demás, éste es
reducido al segundo mas alto.
Pozo Espesor (m) Ley (g Au/ton)
1-39 1.7-4 m 1.5 - 8.3
40 8.0 9.1
41 3.0 10.1
42 1.0 12.0
43 2.0 13.4
44 3.0 21.7
45 2.0 44.0

• La ley mas alta final se reduce al valor mas alto siguiente, en este caso de 44.0 a
21.7 g/t. La media así obtenida es 4.3 g/t en contraste a 4.8 g/t. La diferencia de
0.5 g/t resulta de:
44.0 g/t  21.7 g/t
diferencia   0.5 g/t
45
Universidad Mayor de San Andrés
Distribuciones asimétricas
• Test estadístico para valores anómalos
– En estadística un valor analítico se denomina
anómalo si se desvía fuertemente de los otros
– Dorerfell (1962) genero un diagrama para la
determinación del umbral de valores anómalos
– La media y la desviación son calculados sin los
valores mas altos. Entonces un valor xA es
anómalo alto si cae fuera del siguiente rango:
XA  x  s*g
g  se obtiene en el diagrama de umbral de valores anómalos
Universidad Mayor de San Andrés
Distribuciones asimétricas
• Una veta de Qz + Au ha sido investigada por una socavón. La veta fue sistemáticamente
muestreada cada 3m a lo largo de su rumbo. Las muestras contienen la siguientes leyes:

Numero de Ley (g Au/t) Número de muestra Ley (g Au/t)


muestra
2 1.5 12 9.0
11 2.3 15 12.0
9 2.4 5 12.1
4 2.6 7 13.0
3 3.2 16 13.7
1 3.5 14 17.2
6 4.8 8 17.8
10 5.5 13 24.5
17 7.7 18 38.9
19 68.5

XA  x  s*g
Los últimos valores son notoriamente altos. El test mostrara si deben ser reducidos.

Universidad Mayor de San Andrés


Distribuciones asimétricas
• Primero
La media y la desviación son calculadas sin el valor mas alto = 68.5 g/ton
La media es 10.65 g/ton, la desviación estándar es 9.6, el valor g se obtiene de la grafica de
valores altos anómalos y para un nivel de significancia de (Si) 5% n = 19: g = 4
Entonces calculamos:
XA  x  s*g
X A  10.65  9.6 * 4  49.05
Entonces el valor de 68.5 debe ser reducido

• Segundo
Consideramos el siguiente valor mas alto y la media y la desviacion son calculadso otra vez pero
sin el valor de 38.9 (y sin claramente sin el 68.5)

XA  x  s*g
X A  8.99  6.72 * 4  35.87
Entonces el valor de 38.9 también debe ser reducido

Universidad Mayor de San Andrés


Distribuciones asimétricas
• Tercero
El siguiente valor alto examinado es 24.5 y calculamos la media y la desviación sin este valor igual
que hicimos antes
XA  x  s*g
X A  8.02  5.58 * 4  30.34
Entonces el valor de 24.5 es aceptable

• Cuarto
Los valores eliminados deben ser reducidos al ultimo valor que fue reducido
X A  35.8  36 g/ton

• Quinto
Después de reducir los dos mas altos valores 38.9 y 68.5 a 36 g/ton la nueva media calculada es

x  11.8 g/ton

Universidad Mayor de San Andrés


Interpretación y Aplicaciones de la desviación típica

Teorema de Tchbyshev.- Dado un conjunto de observaciones x1, x2,…xn, entre la media aritmética y ± k
veces la desviación, existe por lo menos el:

100 (1-1/k2) % con k≥ 1

de las observaciones sin que importe, como se distribuye el conjunto de datos.

• Para k = 1 no se puede precisar


• Para k = 2. Entre2S y 2S deben estar a lo menos 100(1-1/22)=75% de las observaciones (o 3/4)
• Para k = 3. Entre3S y 3S deben estar a lo menos 100(1-1/32)=88.89% de las observaciones (u 8/9)
• Para k = 4. Entre4S y 4S deben estar a lo menos 100(1-1/42)=93.75% de las observaciones (o 15/16)

Sin embargo el teorema es muy conservativo!!

Universidad Mayor de San Andrés


Universidad Mayor de San Andrés
La Distribución Normal
Entre 𝒙 −1S y 𝒙 +1S se encuentra el 68.27% de las observaciones

Entre 𝒙 −2S y 𝒙 +2S se encuentra el 95.45% de las observaciones

Entre 𝒙 −3S y 𝒙 +3S se encuentra el 99.73% de las observaciones

Entre 𝒙 −4S y 𝒙 +4S se encuentra el 99.99% de las observaciones

Universidad Mayor de San Andrés


La Distribución Normal
• Conocida como la campana de Gauss
• Una simple distribución no curre fácilmente en datos geológicos, debido a
la complejidad de un deposito
• Sin embargo la distribución normal es fundamental para la evaluación de
datos geológicos

Universidad Mayor de San Andrés


La Distribución Normal
• Si la curva es simétrica con respecto al punto
0, entonces los puntos de inflexión están
ubicados a   lo que es a un intervalo de la
desviación estándar.

Universidad Mayor de San Andrés


La Distribución Normal
• Matemáticamente la distribución normal se define como:

1  x  2
1  
2  
y e
 2
La cual describe el área debajo la curva de la distribución normal

Universidad Mayor de San Andrés


La Distribución Normal
• Se puede decir que el tamaño debajo la curva
de distribución entre los límites definidos se
relaciona a la probabilidad que existe de que
el valor de una variable aleatoria (xi) se
encuentre localizada entre los limites
definidos.

Universidad Mayor de San Andrés


La Distribución Normal
• Para el tratamiento de los datos geológicos el
teorema del límite central es de critica
importancia
• “Si muestras aleatorias e independientes son colectadas
repetidamente de una misma población (la cual puede tener
cualquier distribución), entonces la distribución de la media es
aproximadamente normal. La aproximación a la distribución
normal se incrementa con un incremento en el tamaño de la
muestras (n)” (Kreyszig, 1968).

Universidad Mayor de San Andrés


La Distribución Normal
• Según Kreyszig (1968) un numero de n=30
muestras es aproximado para que existe una
población normal
• Koch y Link (1970) indican un número de 50 a
100 para distribuciones geológicas, excepto
para oro y elementos traza

Universidad Mayor de San Andrés


Universidad Mayor de San Andrés
Tabla de distribución normal de
frecuencias estandarizada
• Usando la tabla de distribución de frecuencias
estandarizadas, demostrar que 68.27% se
encuentra entre   y - 
1.   y -  se encuentran a +1 y -1
2. En la tabla para x = -1 el valor  ( x ) es 0.1587,
entonces 15.87% de los valores están fuera
del área definida por el intervalo   a -1
3. Para x = +1  ( x ) es 0.8413 u 84.13%, o sea
84.13% de los valores están dentro del límite
  a 1 Universidad Mayor de San Andrés
Tabla de distribución normal de
frecuencias estandarizada
• Ejemplo
Se han cortado fragmentos de granito; el diámetro medio es 40 mm y la
desviación es 10 mm. Los diámetros mayores a 60 se excluyeron. Cual es la
proporción de éstos fragmentos excluidos?
Primero: La distribución es normal así que debe ser estandarizada
• Se debe transformar la media de 40 mm a 0, para poder usar la tabla
xi  u
x( u )  x( u ) 
60  40
2
 10

El valor de x = +2, equivale a  ( x ) = 0.9772, por lo que 97.72% de todos los


valores son menores que x(u) . En otra palabras la probabilidad de que un
fragmento tenga un diametro mayor a 60 mm es de 2.28% (100-97.72)
Universidad Mayor de San Andrés
Derechos de autor

Parte del material brindado en esta presentación, fue tomado del libro:
Estadística Descriptiva Conceptos y aplicaciones. Rufino Moya Calderón, 2008

Universidad Mayor de San Andrés

También podría gustarte