Está en la página 1de 24

TEORÍA DE BÁSICA DE ESTADÍSTICA

JOSE GREGORIO FREITES


freitesjose@hotmail.com
contacto@cursosgeomin.com.ve
www.cursosgeomin.com.ve
CONTENIDO
• Estadística descriptiva.
• Terminos estadisticos basicos.
• Resumen de estadisticos principales.
• Medidas de dispersion.
• Histograma.
• Distribucion normal.
• Distribucion log-normal.
• Valores erraticos (outlier).
• Gráfico de probabibilidad.
• Gráfico Q-Q.
• Correlacion lineal.

2
TEORIA BASICA DE ESTADISTICA

3
ESTADISTICA DESCRIPTIVA
La estadística es una ciencia encargada de estudiar el
comportamiento de las poblaciones mediante datos numéricos
obtenidos de éstas.

La estadística se vale de diversos métodos y procedimientos para


recoger, clasificar, resumir y analizar datos y para hacer inferencias
científicas partiendo de tales datos que corresponden a muestras
representativas de la población que se estudia. La estadística se
puede dividir en varias categorías, entre las cuales se tiene la
“estadística descriptiva” y la “inferencia estadística”.

La estadística descriptiva implica el estudio del conjunto de


observaciones, mediante el empleo de métodos gráficos, tabulares o
numéricos

4
TERMINOS ESTADISTICOS BASICOS
Universo: se define como la totalidad del espacio que abarca el área
de interés y el conjunto de muestra o poblaciones inherentes al
estudio.

Individuo: cualquier elemento que porte información sobre el


fenómeno que se estudia.

Muestra: una muestra es una parte del universo sobre la cual son
hechas las mediciones. Es un ítem, una unidad básica, o un
individuo. Una muestra no puede ser divisible en unidades simple.

Población: una población está definida como el conjunto de


muestran que poseen una características en común. Puede haber
una población dentro un mismo universo. Las poblaciones son
medidas de un único atributo dentro de un universo.

5
RESUMEN DE ESTADISTICOS PRINCIPALES
Estadísticos principales:

Media:

Moda: Intervalo de clase con mayor frecuencia.

Mediana: La mitad de toda la distribución de frecuencias.

Varianza: En teoría de probabilidad, la varianza de una


variable aleatoria es una medida de dispersión definida como
la esperanza del cuadrado de la desviación de dicha variable
respecto a su media.

Desviación estándar: La desviación estándar es la raíz


cuadrada de la varianza, es una medida de dispersión
alternativa expresada en las mismas unidades de los datos de
la variable objeto de estudio. La varianza tiene como valor
mínimo 0. 6
MEDIDAS DE DISPERSION
Coeficiente de Variación: Es una medida de dispersión útil para
comparar dispersiones a escalas distintas pues es una medida
adimensional. Su fórmula expresa la desviación estándar como
porcentaje de la media aritmética, mostrando una mejor interpretación
porcentual del grado de variabilidad que la desviación típica o
estándar.. A mayor valor de CV mayor heterogeneidad de los valores
de la variable; y a menor CV, mayor homogeneidad en los valores de
la variable.
S
CV  _
X
CV > 1 es una coeficiente de variacion alta.

Si el objetivo de la estadística es la interpolacion, el coeficiente de


variacion puede servir para acusar algunos problemas. Por ejemplo,
coeficientes grandes indican la presencia de algunos valores erráticos
altos que podrían estar impactando la estimación.

7
HISTOGRAMA
Histograma:
Es una representación gráfica de una variable en forma de barras,
donde la superficie de cada barra es proporcional a la frecuencia de
los valores representados. En el eje vertical se representan las
frecuencias, y en el eje horizontal los valores de las variables,
normalmente señalando las marcas de clase, es decir, la mitad del
intervalo en el que están agrupados los datos.
Se utiliza cuando se estudia una variable aleatoria contínua, tal como
tenores, grados químicos, espesores y por comodidad, sus valores se
agrupan en clases. Es muy útil para obtener una apreciación visual
de la tendencia de la distribución probabilística de la variable.

8
EFECTO PROPORCIONAL
Frecuencia
Mo PPM

Una característica de los valores distribuidos


normalmente es que usualmente no presentan
efecto proporcional. Para distribuciones
lognormales un scatter plot entre medias y
desviaciones por banco, mostrara la relación
entre ambos valores.
9
DISTRIBUCION NORMAL
Distribución Normal:

1 1 / 2(( x   ) / )
2

f (x)  e
 2 10
DISTRIBUCION LOG-NORMAL
Distribución LogNormal
Valores bajos no significativos

Altos erráticos

1 1/2((xα)/β)2
f ( x)  e
x 2
Donde - media de los logaritmos de x
 - desviación estándar de los logaritmos de x 11
IDENTIFICACION DE OUTLIER
Por ejemplo, datos con valores que superan
tres veces ladesviación estándar con respect-
to a la media pueden clasificarse como
Outlier (valores altos erráticos).

12
VALORES ERRATICOS (OUTLIER)
Valores altos erráticos

• La ocurrencia asilada de valores altos merece atención y tratamiento especial.

• Lo más crítico es definer si se trata de valores altos erráricos.

• Estos valores son fácilmente identificables en los histogramas y gráficos de


Frecuencias acumulada.

• Estos casos son frecuentes en yacimientos de baja ley y/o minerals preciosos.

• Por lo general representan menos del 5% del total de la población; no obstante,


debido a su valor alto afectan el valor metálico global entre un 20 a 40%.
13
VALORES ERRATICOS (OUTLIER)
14
Alto errático
VALORES ERRATICOS (OUTLIER)
http://pubs.usgs.gov/of/2009/1103/ofr2009-1103-rev-jan2010.pdf 15
EJEMPLO DE MANEJO DE OUTLIERS
http://www.avantimining.com/i/pdf/Kitsault_Resource_Audit_Memo_179701_02_MA_009.pdf

16
DISCUCIÓN EN LINKEDIN SOBRE OUTLIER
https://www.linkedin.com/groups/950677/950677-120881122

17
DISCUCIÓN EN LINKEDIN SOBRE OUTLIER
18
DISCUCIÓN EN LINKEDIN SOBRE OUTLIER
19
GRAFICO DE PROBABIBILIDAD
20
Q-Q PLOT
• Ploteos de Quantile-Quantile
• Una linea recta indica que las dos distribuciones tienen la misma
forma
• Una linea a 45 grados indica que los promedios y las varianzas son
las mismas

21
CORRELACION LINEAL
• Simplemente una grafica x-y de los datos
• Demuestra cuan bien dos variables estan relacionadas
• Descubre pares de datos no usuales o anormales

Hay tres casos entre dos variables: Y=mX+b


• Correlacionadas positivamente
• Correlacionadas negativamente
• No correlacionados

22
COEFICIENTE DE CORRELACION
En estadística, el coeficiente de correlación de Pearson es una medida de la
relación lineal entre dos variables aleatorias cuantitativas

23
GRACIAS
En matemáticas no se
deben despreciar ni los
errores más diminutos.

Isaac Newton

24

También podría gustarte