Está en la página 1de 52

UNIDAD Nº 02:

ESTADISTICA DESCRIPTIVA DE DATOS


PROPÓSITO DE LA UNIDAD N° 02

El propósito de la unidad Nº 02, es proporcionar una


breve introducción a las:
• Herramientas elementales de la teoría estadística y
• Al uso que se les puede dar en problemas de
estimación de recursos minerales, etc.
ESTADISTICA DESCRIPTIVA
Es la rama de las Matemáticas que:
• Recolecta,
• Presenta y
• Caracteriza un conjunto de datos,
POR EJEMPLO:
• Precipitación histórica de una región,
• Rendimiento de pozos de agua subterránea,
• Temperatura en los meses de verano, etc.

Con el FIN de describir apropiadamente las diversas


características de ese conjunto ...
ESTADÍSTICA DESCRIPTIVA

Se denomina estadística descriptiva a las cantidades


matemáticas y se divide en:
• Medidas de Tendencia Central
La Media,
La Mediana,
La moda, etc.
• Medidas de Dispersión
Varianza
Desviación Estándar
Rango
Resumen e interpretan algunas
de las propiedades de un
conjunto de datos (muestra).
¿QUÉ NO HACEN?
No miden las propiedades de la
población de la que se extrajo la
ETAPAS DE UN ESTUDIO ESTADÍSTICO

1. Recogida de datos
2. Ordenación, tabulación y
gráficos
3. Descripción de características
4. Análisis formal
1. RECOGIDA DE DATOS
DEFINICIONES

1. UNIVERSO
El universo es la masa total del material de interés y la
fuente de información.
El universo puede ser:
• Todo el depósito mineral
• Una estructura mineralizada dentro del depósito
• Un block dentro de la estructura
• Una formación geológica
• Un acuífero
• Los suelos de una área donde se construirá un edificio.
• Un bosque, etc.
CARACTERISTICAS DEL UNIVERSO
El universo puede tener:
• LÍMITES BIEN DEFINIDOS, tal como podría
tener una formación geológica o
• LÍMITES CONFUSOS, como a menudo
tienen los depósitos minerales.

¡ES IMPORTANTE QUE EL UNIVERSO SEA


CUIDADOSAMENTE DEFINIDO EN
CUALQUIER ESTUDIO!
DEFINICIONES
2. UNIDAD DE MUESTREO
Una unidad de muestreo es una porción del universo sobre
la que se efectúan las mediciones.
Esta unidad puede ser:
• Una muestra recogida a mano de cinco libras,
• Un pedazo de testigo de diamantina de 10 m de longitud,
etc.
• Una muestra de suelo.
• Una muestra de mineral
Cuando se hacen conjeturas sobre las características de un
universo, se debe especificar cual es la unidad de muestreo.
DEFINICIONES
En universos relacionados a la vida cotidiana la unidad de
muestreo es generalmente:
• Un individuo,
• Una persona o
• Un animal
Sobre las que se puede medir características tales como:
• peso,
• estatura, etc.
En este tipo de problemas existe una “unidad de muestreo
natural”.
DEFINICIONES
3. POBLACIÓN
Es la colección de datos que corresponde a las características de la
totalidad de individuos, objetos, cosas o valores en un proceso de
investigación.
Para su estudio, en general se clasifican en Poblaciones Finitas y
Poblaciones Infinitas.

• POBLACIONES FINITAS:
Constan de un número determinado de elementos, susceptible a ser
contado.
Ejemplo: Los empleados de una fábrica, elementos de un lote de
producción, etc.

• POBLACIONES INFINITAS:
Tienen un número indeterminado de elementos, los cuales no pueden
ser contados.
Ejemplo: Los números naturales.
DEFINICIONES

Así también las poblaciones pueden ser clasificadas en


Reales e Hipotéticas,
Poblaciones reales:
Son aquellas concretas, que ya existen.
Ejemplo: La cantidad de pozos de agua subterránea.
Poblaciones hipotéticas:
Son las formas imaginables en que se podría presentar un
suceso.
Ejemplo: Estimaciones de la precipitación dentro de diez
años.
2. ORDENACIÓN, TABULACIÓN Y
GRÁFICOS
ESTADISTICA DESCRIPTIVA
HISTOGRAMA
El histograma es aquella representación gráfica de
estadísticas de diferentes tipos.
HISTOGRAMA
¿PARA QUÉ SIRVE?

La utilidad del histograma tiene que ver con la posibilidad de


establecer de:
• Manera visual,
• Ordenada y
• Fácilmente comprensible

Todos los datos numéricos estadísticos que pueden tornarse


difíciles de entender.
Hay muchos tipos de histogramas y cada uno se ajusta a
diferentes necesidades como también a diferentes tipos de
información.
Histograma
Supóngase que se dispone de n valores de muestreo xi, i=1,2, ….n.
El primer paso en el análisis de estos valores consiste en agruparlos
en clases y categorías y en contar el número de muestras
pertenecientes a cada clase denominada como frecuencia de clase.
Histograma
HISTOGRAMA
La forma, de una distribución se refiere a la descripción del aspecto
general de la distribución.
Una distribución puede ser simétrica, sesgada a la derecha, sesgada
a la izquierda, bimodal, multimodal, etc.
Histograma
Un histograma consiste en una serie de rectángulos que tienen:
• Sus bases sobre un eje horizontal con longitud igual al tamaño
de clase y
• Sus alturas son proporcionales a la frecuencia de clase.
Un histograma es una herramienta valiosa para detectar
visualmente valores erráticos o valores anormalmente altos o
bajos.
Sin embargo, la forma de un histograma es afectada por el
tamaño de las clases utilizadas para agrupar las muestras.
Histograma
Ejemplo :

UBICACIÓN
DE 100
MUESTRAS
DE V (PPM)

No existe una regla general en cuanto al número óptimo de clases (L) o intervalos;
sin embargo existen técnicas que permiten determinar para n observaciones:
Sturges: L=1+3,32 log(n)
Dixon and Kronwell: L= 10 log(n)
Velleman: L= 2n
¿CÓMO SE CONSTRUYE UN HISTOGRAMA DE FRECUENCIAS?
Para el ejemplo, n=100 se obtienen valores de 7,64, 20 y 20 respectivamente.
Se ha optado por L= 10 para trazar el histograma.

Histograma de V
Frecuencia de V con anchos de clase de
10 ppm
FRECUENCIA ACUMULADA:
¿CÓMO SE CONSTRUYE UN HISTOGRAMA DE FRECUENCIAS?
FRECUENCIA ACUMULADA: En estimación de reservas mineras es interesante
observar la frecuencia acumulada sobre un límite inferior (cut off).
La tabla muestra la frecuencia acumulada para la variable V; observamos que en
vez de registrar las muestras inferiores a ciertos cut off, el histograma acumulado
es una función creciente entre 0% a 100%.

Frecuencia acumulada
FORMAS CLÁSICAS DE HISTOGRAMAS
A continuación se presentan las formas de histogramas de valores
geológicos (ley, acumulación, potencia, etc.) más frecuentes:
Distribución simétrica:
Esta forma es muy poco frecuente con valores geológicos excepto
cuando:
• La mineralización muestreada tiene una ley relativamente alta
(por ejemplo algunos depósitos de Fe) y
• Cuando la variable considerada tiene poca variabilidad (por
ejemplo, la potencia de algunos depósitos tabulares o el peso
específico de la mayoría de las mineralizaciones)
FORMAS CLÁSICAS DE HISTOGRAMAS
Distribución sesgada a la derecha:
Esta forma es bastante frecuente con valores geológicos. Como se
puede ver esta forma refleja bastantes valores bajos y muy pocos
valores altos, caso muy típico de la mayoría de las mineralizaciones.
FORMAS CLÁSICAS DE HISTOGRAMAS
Distribución sesgada a la izquierda
Esta forma es poco frecuente en valores
geológicos.
Casos específicos de histogramas
Esta es una distribución sesgada a la derecha; sin embargo, se
puede observar la presencia de valores muy altos (valores
erráticos) alejados de la mayoría de los valores: la presencia de
valores erráticos dificulta la estimación de reservas.
Casos específicos de histogramas
Esta es una distribución llamada multimodal, se presenta cuando se
han mezclado poblaciones (diferentes tipos de mineralización,
diferentes unidades de muestreo, etc.)
En estos casos se recomienda dialogar con el geólogo.
Casos específicos de histogramas
Esta forma inesperada, imposibilita la aplicación de
métodos estadísticos de estimación de recursos.
Se recomienda también consultar con el geólogo.
Polígono de Frecuencias
3. DESCRIPCIÓN DE CARACTERÍSTICAS
PARÁMETROS ESTADÍSTICOS
Un parámetro estadístico es un número que se obtiene a
partir de los datos de una distribución estadística.
Los parámetros estadísticos ¿Para que sirven?
Sirven para sintetizar la información dada por una tabla o
por una gráfica.
Hay tres tipos parámetros estadísticos:
• De centralización o Tendencia Central
• De posición.
• De dispersión.
MEDIDAS DE TENDENCIA CENTRAL
La tendencia central, se refiere al valor más característico del
conjunto de valores.
Las medidas de tendencia central mas comunes son:
• La media aritmética,
• La mediana,
• la moda,
• La media geométrica, etc.
Para ser efectivas, las medidas de tendencia central deben
identificar el valor que mejor resume el conjunto total de
valores; en otras palabras,
¡ES EL VALOR ALREDEDOR DEL CUAL SE DISTRIBUYEN
LOS VALORES RESTANTES!
MEDIA ARITMÉTICA
La media aritmética de un conjunto N valores x1,
x2, x3,…..xN se denota por y se define como:

Ejemplo:
La media aritmética de los números 8, 3, 5, 12, 10 es:

8+3+5+12+10/5 = 38/5 = 7,6


MEDIA ARITMÉTICA PONDERADA
A veces se asocia a los números x1, x2,…xk ciertos factores o
pesos f1, f2,..,fk que dependen de la significación o importancia
de cada uno de los números.
La media aritmética ponderada viene dada por:

Si los números 1, 2,……, k se presentan f1, f2, f3, ……fk veces,


respectivamente (es decir, se presentan con frecuencias f1,
f2,….fk).

Ejemplo: Si los números 5, 8, 6 y 2 se presentan con


frecuencias 3, 2, 4 y 1 respectivamente, la media aritmética
es:
3(5)+2(8)+4(6)+1(2)/3+2+4+1 = 5,7
MEDIANA
La mediana de una colección de datos ordenados en orden de
magnitud es el valor medio o la media aritmética de los dos valores
medios:
Ejemplo 1: Calcular la mediana de los números 3, 5, 4, 6, 4, 10, 8, 8, 8
• Inicialmente de deben ordenar los números:

3, 4, 4, 5, 6, 8, 8, 8, 10

• El valor medio de esta colección es 6,


• por tanto, la mediana (m)= 6

Ejemplo 2:
Calcular la mediana de los valores 5, 5, 7, 9, 11, 12, 15, 18, los valores
medios de esta colección son: 9 y 11; luego:

Mediana=m= 9+11/2 = 10
MEDIANA
Geométricamente, la mediana es el valor de x que
corresponde a la vertical que divide un histograma
en dos partes de igual área.
MODA
La moda de una serie de números es aquel valor que se presenta con
la mayor frecuencia , vale decir, es el valor más común.
La moda puede no existir, incluso si existe puede no ser única.

Ejemplo 1: Obtener la moda de la siguiente colección de valores (2, 2,


5, 7, 9, 9, 9, 10, 10, 11, 12, 18)
El número mas común es el 9; por lo tanto:
M= 9

La moda puede no existir, incluso si existe puede no ser única.


Ejemplo 2: Obtener la moda de los siguientes números (3, 5, 8, 10,
12, 15, 16)
Esta colección no tiene moda.
Media, Mediana y Moda
LA MEDIA GEOMÉTRICA (G)
La Media Geométrica de una serie de N valores x1, x2,x3,….,xN
es la raiz N-ésima del producto de los valores medidos:
N
G=x1x2x3…xN

Ejemplo: Calcular la media geométrica de los números 2, 4 y 8:


3
G=(2)(4)(8) = 4
CONCLUSIÓN
Resulta interesante analizar si las medidas de tendencia central descritas en la
mayoría de los casos cumplen con su objetivo :
• Por definición una medida RESISTENTE de tendencia central es aquella que no
es mayormente afectada por cambios, no importa en que magnitud de una
porción pequeña del número total de valores:
• Considérese el siguiente conjunto de valores: (1, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 6).
Para este conjunto se tiene que:
Media aritmética = 3,5
Mediana = m = 3,5
Moda = M = 3ó4
Media Geométrica = G = 3,84

Como se puede ver todas las medidas de tendencia central reportan


aproximadamente el mismo valor.
Este valor es además representativo del conjunto de valores. Esto ocurre debido a
que la distribución del conjunto de valores en estudio es simétrico.
Sin embargo, si el valor más alto fuera 60 en lugar de 6 se tendría que:

Media aritmética = = 8,0


Mediana = m = 3,5
Moda = M = 3ó4
Media Geométrica = G = 3,84

El cambio de un solo valor ha hecho que la media aritmética reporte un


valor que de ninguna manera representa al conjunto de valores.

Fíjese que la media aritmética es mayor que cualquiera de los 11 primeros


valores.

¡¡Estas observaciones lleva a concluir que la media aritmética es una


medida NO RESISTENTE de tendencia central!!

Obviamente que una medida no resistente no tiene las propiedades que


uno desearía para dicha medida.
CONCLUSIÓN
Es cierto que en el caso anterior el valor máximo (60) podría ser
considerado como valor errático y ser desestimado para el
cálculo de la media.
Sin embargo, si se tienen dos o más valores altos, estos
posiblemente formen parte de la distribución y
desestimarlos ¡no sería razonable!!

Nótese que la mediana, la moda y la media geométrica


no han sido afectadas por el cambio.

La mediana es todavía igual a 3,5 y aún representa a 11 de los 12


valores.
La misma observación es válida para la moda.
La media geométrica, es igual a 3,84, aún representa a 11 de los
12 valores.
CONCLUSIÓN
Cuando la distribución es sesgada (no-simétrica):
La mediana, la moda y la media geométrica
¡SON MEDIDAS DE TENDENCIA CENTRAL MUCHO MÁS
RESISTENTES QUE LA MEDIA ARITMÉTICA!
RECOMENDACIÓN

Se podrá utilizar la media aritmética como medida


confiable de tendencia central cuando la forma de la
distribución es simétrica.
Si la distribución es sesgada a la derecha, como ocurre a
menudo con valores geológicos, una medida confiable de
tendencia a central resulta ser la
¡media geométrica!
Se insiste en esta recomendación porque en
nuestro medio existe una predisposición
injustificada a utilizar la media aritmética en sus
diversas formas como medida de tendencia
central independientemente de la forma de la
distribución!
RECOMENDACIÓN
SE PUEDE UTILIZAR LA
MEDIA ARITMÉTICA MEDIDA CONFIABLE ES LA
COMO MEDIDA MEDIA GEOMÉTRICA
CONFIABLE
MEDIDAS DE DISPERSIÓN
La dispersión, se refiere al ancho de la
distribución; describe la variabilidad de los
valores con respecto a su tendencia central, vale
decir:

¡DESCRIBE CUAN DISPERSOS RESTAN LOS


VALORES DE LA TENDENCIA CENTRAL!

La DESVIACIÓN ESTÁNDAR es una de las


medidas de dispersión más frecuentemente
utilizadas.

También podría gustarte