Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BASADRE GROHMANN
Facultad:
FAIN E.A.P. Ing. de Minas
Curso:
Anlisis Estadstico de
Datos Mineros
Trabajo:
1 Informe
Estudiante:
Fernando Alonso Ocaa
Miranda
Cdigo:
2012-36947
TACNA PER
2015
MEDIA
Construccin
geomtrica
para
hallar
medias aritmtica, geomtrica, armnica ycuadrtica de dos nmeros a y b.
las
Por ejemplo, la media geomtrica de la serie de nmeros 34, 27, 45, 55, 22, 34
(seis valores) es
Media armnica
La media armnica es un promedio muy til en conjuntos de nmeros que se
definen en relacin con alguna unidad, por ejemplo la velocidad (distancia por
unidad de tiempo).
Por ejemplo, la media armnica de los nmeros: 34, 27, 45, 55, 22, y 34 es:
Generalizaciones de la media
Existen diversas generalizaciones de las medias anteriores.
Media generalizada
Las medias generalizadas, tambin conocidas como medias de Hlder, son una
abstraccin de las medias cuadrticas, aritmticas, geomtricas y armnicas. Se
definen y agrupan a travs de la siguiente expresin:
- mximo,
- media cuadrtica,
- media aritmtica,
- media geomtrica,
- media armnica,
- mnimo.
Media-f generalizada
Esta media puede generalizarse para una funcin montona como la media-f
generalizada:
donde
sea una funcin inyectiva e
un intervalo. Escogiendo
formas particulares para f se obtienen algunas de las medias ms conocidas:
- media aritmtica,
- media armnica,
- media generalizada,
- media geomtrica,
De hecho la definicin anterior vale an para una funcin acotada aunque no sea
continua.
Media estadstica
La media estadstica se usa en estadstica para dos conceptos diferentes aunque
numricamente similares:
-La media muestral, que es un estadstico que se calcula a partir de la media
aritmtica de un conjunto de valores de una variable aleatoria.
-La media poblacional, valor esperado o esperanza matemtica de una variable
aleatoria.
En la prctica dada una muestra estadstica suficientemente grande el valor de la
media muestral de la misma es numricamente muy cercano a la esperanza
matemtica de la variable aleatoria medida en esa muestra. Dicho valor esperado,
slo es calculable si se conoce con toda exactitud la distribucin de probabilidad,
cosa que raramente sucede en la realidad, por esa razn, a efectos prcticos la
llamada media se refiere normalmente a la media muestral.
Media muestral
La media muestral es una variable aleatoria, ya que depende de la muestra, si
bien es una variable aleatoria en general con una varianza menor que las
variables originales usadas en su clculo. Si la muestra es grande y est bien
escogida, puede tratarse la media muestra como un valor numrico que aproxima
con precisin la media poblacional, que caracteriza una propiedad objetiva de la
poblacin. Se define como sigue, si se tiene una muestra estadstica de
valores
de valores para una variable aleatoria X con distribucin
de probabilidad F(x,) [donde es un conjunto de parmetros de la distribucin] se
define la media muestral n-sima como:
Media poblacional
La media poblacional tcnicamente no es una media sino un parmetro fijo que
coincide con la esperanza matemtica de una variable aleatoria. El nombre "media
poblacional" se usa para significar que valor numrico de una media muestral es
numricamente cercano al parmetro media poblacional, para una muestra
adecuada y suficientemente grande.
MEDIANA
. Es decir:
otros
dos
que
quedan
por
,
estn
encima
,
por
del
debajo
siguiente
Datos agrupados
Al tratar con datos agrupados, si coincide con el valor de una frecuencia
acumulada, el valor de la mediana coincidir con la abscisa correspondiente. Si no
coincide con el valor de ninguna abcisa, se calcula a travs de semejanza de
tringulos en el histograma o polgono de frecuencias acumuladas, utilizando la
siguiente equivalencia:
Donde
son
que
las
,
frecuencias
absolutas
acumuladas
tales
xi
fi
Ni
13
21 > 19.5
30
33
37
39
es la abscisa a calcular, la
es la amplitud de los intervalos seleccionados
Nmero de alumnos
. As, aplicando la
n
impar,
se
xi
fi
Ni+w
13
19 = 19
28
32
36
38
Nmero de alumnos
(Donde n= 38 alumnos
hay
hay
fi
Ni
2
5
estudiantes.
estudiantes.
[x11-x12]
f1
N1
N(i-2)
[x(i-1)1-x(i-1)2]
f(i-1)
f(i-1)-N(i-2)=N(i-1)
[xi1-xi2]
fi
fi-Ni-1=Ni
[x(i+1)1-x(i+1)2]
f(i+1)
f(i+1)-Ni=N(i+1)
[xM1-xM2]
fM
fM-N(M-1)=NM
Consideramos:
- x11 valor mnimo< Entonces:
MODA
En estadstica, la moda es el valor con una mayor frecuencia en una distribucin
de datos.
Se hablar de una distribucin bimodal de los datos adquiridos en una columna
cuando encontremos dos modas, es decir, dos datos que tengan la misma
frecuencia absoluta mxima. Una distribucin trimodal de los datos es en la que
encontramos tres modas. Si todas las variables tienen la misma frecuencia
diremos que no hay moda.
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el intervalo modal.
La moda, cuando los datos estn agrupados, es un punto que divide al intervalo
modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que
verifiquen que:
Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los
intervalos anterior y posterior, respectivamente, al intervalo modal.
Donde:
=
Siendo:
: cada dato
: El nmero de datos
: la media aritmtica de los datos
Variable aleatoria
Aplicando este concepto a una variable aleatoria con media = E[X], se define
su varianza, Var(X) (tambin representada como
o, simplemente 2), como
donde
donde
.
Ejemplos:
Distribucin exponencial
La distribucin exponencial de parmetro es una distribucin continua con
soporte en el intervalo [0,) y funcin de densidad
Es decir, 2 = 2.
Dado perfecto
Un dado de seis caras puede representarse como una variable aleatoria discreta
que toma, valores del 1 al 6 con probabilidad igual a 1/6. El valor esperado es
(1+2+3+4+5+6)/6 = 3,5. Por lo tanto, su varianza es:
Propiedades de la varianza
Algunas propiedades de la varianza son:
donde
Cov(X,Y)
es
la covarianza de X e Y.
, donde Cov(X,Y) es la
covarianza de X e Y.
Varianza muestral
En muchas situaciones es preciso estimar la varianza de una poblacin a partir de
una muestra. Si se toma una muestra con reemplazamiento
de n valores de ella, de entre todos los estimadores posibles de la varianza de
la poblacin de partida, existen dos de uso corriente:
Cua
ndo los datos estn agrupados:
A los dos (cuando est dividido por n y cuando lo est por n-1) se los
denomina varianza muestral. Difieren ligeramente y, para valores grandes de n, la
diferencia es irrelevante. El primero traslada directamente la varianza de la
muestra al de la poblacin y el segundo es un estimador insesgado de la varianza
de la poblacin. De hecho,
mientras que:
Desviacin tpica
La desviacin tpica o desviacin estndar (denotada con el smbolo o s,
dependiendo de la procedencia del conjunto de datos) es una medida de
dispersin para variables de razn (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raz cuadrada de la varianza de
la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas
de tendencia central, sino que necesitamos conocer tambin la desviacin que
presentan los datos en su distribucin respecto de la media aritmtica de dicha
distribucin, con objeto de tener una visin de los mismos ms acorde con la
donde
Cuando los casos tomados son iguales al total de la poblacin se aplica la frmula
de desviacin estndar poblacional. As la varianza es la media de los cuadrados
de las diferencias entre cada valor de la variable y la media aritmtica de la
distribucin.
Aunque esta frmula es correcta, en la prctica interesa el realizar inferencias
poblacionales, por lo que en el denominador en vez de , se usa
segn
la correccin de Bessel. Esta ocurre cuando la media de muestra se utiliza para
centrar los datos, en lugar de la media de la poblacin. Puesto que la media de la
muestra es una combinacin lineal de los datos, el residual a la muestra media se
extiende ms all del nmero de grados de libertad por el nmero de ecuaciones
de restriccin en este caso una. Dado esto a la muestra as obtenida de una
muestra sin el total de la poblacin se le aplica esta correccin con la frmula
desviacin estndar muestral.
Ejemplo:
Aqu se muestra cmo calcular la desviacin estndar de un conjunto de datos.
Los datos representan la edad de los miembros de un grupo de nios: {4, 1, 11,
13, 2, 7}
1. Calcular el promedio o media aritmtica
.
En este caso, N = 6:
Sustituyendo N por 6
Sustituyendo N por 6;
Sustituyendo
por 6,33
CUARTIL
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales. Aparecen citados en la literatura cientfica
por primera vez en 1879 por D. McAlister.1
La diferencia entre el tercer cuartil y el primero se conoce como rango
intercuartlico. Se representa grficamente como la anchura de las cajas en los
llamados diagramas de cajas.
Dada una serie de valores X1,X2,X3 ...Xn ordenados en forma creciente, podemos
pensar que su clculo podra efectuarse:
Pero esto conduce a distintos mtodos de clculo de los cuartiles primero (as
como tercero) segn la propia mediana se incluya o excluya en la serie de la
primera (respecto de la segunda) mitad de valores.
Clculo con datos no agrupados
No hay uniformidad sobre su clculo. En la bibliografa se encuentran hasta cinco
mtodos que dan resultados diferentes. 2 Uno de los mtodos es el siguiente:
dados n datos ordenados,
ASIMETRA ESTADSTICA
Medidas de asimetra
Coeficiente de asimetra de Fisher
En teora de la probabilidad y estadstica, la medida de asimetra ms utilizada
parte del uso del tercer momento estndar. La razn de esto es que nos interesa
mantener el signo de las desviaciones con respecto a la media, para obtener si
son mayores las que ocurren a la derecha de la media que las de la izquierda. Sin
embargo, no es buena idea tomar el momento estndar con respecto a la media
de orden 1. Debido a que una simple suma de todas las desviaciones siempre es
cero. En efecto, si por ejemplo, los datos estn agrupados en clases, se tiene
que:
en donde
representa la marca de la clase -sima y denota la frecuencia
relativa de dicha clase. Por ello, lo ms sencillo es tomar las desviaciones al cubo.
El coeficiente de asimetra de Fisher, representado por
, se define como:
donde
es la desviacin estndar.
Si
Si
Si la distribucin es simtrica,
y
. Si la distribucin es
asimtrica positiva la media se sita por encima de la moda y, por tanto,
.
Coeficiente de asimetra de Bowley
Est basado en la posicin de los cuartiles y la mediana, y utiliza la siguiente
expresin:
Utilidad
La asimetra resulta til en muchos campos. Muchos modelos simplistas asumen
una distribucin normal, esto es, simtrica en torno a la media. La distribucin
normal tiene una asimetra cero. Pero en realidad, los valores no son nunca
perfectamente simtricos y la asimetra de la distribucin proporciona una idea
sobre si las desviaciones de la media son positivas o negativas. Una asimetra
positiva implica que hay ms valores distintos a la derecha de la media.
Las medidas de asimetra, sobre todo el coeficiente de asimetra de Fisher, junto
con las medidas de apuntamiento o curtosis se utilizan para contrastar si se puede
aceptar que una distribucin estadstica sigue la distribucin normal. Esto es
necesario para realizar numerosos contrastes estadsticos en la teora de
inferencia estadstica.
CURTOSIS
En teora de la probabilidad y estadstica, la curtosis es una medida de la forma.
As, las medidas de curtosis tratan de estudiar la proporcin de la varianza que se
explica por la combinacin de datos extremos respecto a la media en
contraposicin con datos poco alejados de la misma. Una mayor curtosis implica
una mayor concentracin de datos muy cerca de la media de la distribucin
coexistiendo al mismo tiempo con una relativamente elevada frecuencia de datos
muy alejados de la misma. Esto explica una forma de la distribucin de
frecuencias con colas muy elevadas y con un centro muy apuntado.
Definicin
Un coeficiente de apuntamiento o de curtosis es el basado en el cuarto momento
con respecto a la media y se define como:
donde
es el 4 momento centrado o con respecto a la media y
la desviacin estndar.
es
es el momento de
Si la distribucin es leptocrtica
Si la distribucin es platicrtica
Si la distribucin es mesocrtica
y
y
y
Histograma
El histograma es un grfico para la distribucin de una variable cuantitativa
continua que representa frecuencias mediante el volumen de las reas. Un
histograma consiste en un conjunto de rectngulos con:
a. bases en el eje horizontal, centros en las marcas de clase y longitudes iguales a
los tamaos de los intervalos de clase
b. reas proporcionales a las frecuencias de clase.
En el caso de un histograma para intervalos desiguales slo se sealizan los
valores sobre el eje horizontal, el eje vertical no tiene sentido porque las
frecuencias corresponden al rea de cada rectngulo.
CONCLUSIN:
La Estadstica es una ciencia matemtica que se utiliza para describir, analizar e
interpretar ciertas caractersticas de un conjunto de individuos llamado poblacin.
Cuando nos referimos a muestra y poblacin hablamos de conceptos relativos
pero estrechamente ligados. Una poblacin es un todo y una muestra es una
fraccin o segmento de ese todo.
Podemos dividir la estadstica en dos ramas; la estadstica descriptiva, que se
dedica a los mtodos de recoleccin, descripcin, visualizacin y resumen de
datos originados a partir de los fenmenos en estudio; y la estadstica inferencial,
que se dedica a la generacin de los modelos, inferencias y predicciones
asociadas a los fenmenos en cuestin.
La estadstica trata en primer lugar, de acumular la masa de datos numricos
provenientes de la observacin de multitud de fenmenos, procesndolos de
forma razonable. Mediante la teora de la probabilidad analiza y explora
la estructura matemtica subyacente al fenmeno del que estos datos provienen y,