Está en la página 1de 26

UNIVERSIDAD NACIONAL JORGE

BASADRE GROHMANN

Facultad:
FAIN E.A.P. Ing. de Minas
Curso:
Anlisis Estadstico de
Datos Mineros
Trabajo:
1 Informe
Estudiante:
Fernando Alonso Ocaa
Miranda
Cdigo:
2012-36947

TACNA PER
2015

MEDIA

Construccin
geomtrica
para
hallar
medias aritmtica, geomtrica, armnica ycuadrtica de dos nmeros a y b.

las

Comparacin de la media aritmtica, la mediana y la moda de dos distribuciones


log-normal con diferente asimetra.
En matemticas y estadstica una media o promedio es una medida de tendencia
central que segn la Real Academia Espaola (2001) [] resulta al efectuar una
serie determinada de operaciones con un conjunto de nmeros y que, en
determinadas condiciones, puede representar por s solo a todo el conjunto.
Existen distintos tipos de medias, tales como la media geomtrica, la media
ponderada y la media armnica aunque en el lenguaje comn, el trmino se refiere
generalmente a la media aritmtica.
Ejemplos de medias:
Existen numerosos ejemplos de medias
, una de las pocas
propiedades compartidas por todas las medias es que cualquier media est
comprendida entre el valor mximo y el valor mnimo del conjunto de variables:
Adems debe cumplirse que:
Media aritmtica
La media aritmtica es un promedio estndar que a menudo se denomina
"promedio".

La media se confunde a veces con la mediana o moda. La media aritmtica es el


promedio de un conjunto de valores, o su distribucin; sin embargo, para las
distribuciones con sesgo, la media no es necesariamente el mismo valor que la
mediana o que la moda. La media, moda y mediana son parmetros
caractersticos de una distribucin de probabilidad. Es a veces una forma de medir
el sesgo de una distribucin tal y como se puede hacer en las
distribuciones exponencial y de Poisson.
Por ejemplo, la media aritmtica de 34, 27, 45, 55, 22, 34 (seis valores)
es
Media aritmtica ponderada
A veces puede ser til otorgar pesos o valores a los datos dependiendo de su
relevancia para determinado estudio. En esos casos se puede utilizar una media
ponderada. Si
es un conjunto de datos o media muestral
y
son nmeros reales positivos, llamados "pesos" o factores de
ponderacin, se define la media ponderada relativa a esos pesos como:

La media es invariante frente a transformaciones lineales, cambio de origen y


escala, de las variables, es decir si X es una variable aleatoria e Y es otra variable
aleatoria que depende linealmente de X, es decir, Y = aX + b (donde a representa
la magnitud del cambio de escala y b la del cambio de origen) se tiene que:
Media geomtrica
La media geomtrica es un promedio muy til en conjuntos de nmeros que son
interpretados en orden de su producto, no de su suma (tal y como ocurre con la
media aritmtica). Por ejemplo, las velocidades de crecimiento.

Por ejemplo, la media geomtrica de la serie de nmeros 34, 27, 45, 55, 22, 34
(seis valores) es
Media armnica
La media armnica es un promedio muy til en conjuntos de nmeros que se
definen en relacin con alguna unidad, por ejemplo la velocidad (distancia por
unidad de tiempo).

Por ejemplo, la media armnica de los nmeros: 34, 27, 45, 55, 22, y 34 es:

Generalizaciones de la media
Existen diversas generalizaciones de las medias anteriores.
Media generalizada
Las medias generalizadas, tambin conocidas como medias de Hlder, son una
abstraccin de las medias cuadrticas, aritmticas, geomtricas y armnicas. Se
definen y agrupan a travs de la siguiente expresin:

Eligiendo un valor apropiado del parmetro m, se tiene:

- mximo,

- media cuadrtica,

- media aritmtica,

- media geomtrica,

- media armnica,

- mnimo.

Media-f generalizada
Esta media puede generalizarse para una funcin montona como la media-f
generalizada:

donde
sea una funcin inyectiva e
un intervalo. Escogiendo
formas particulares para f se obtienen algunas de las medias ms conocidas:

- media aritmtica,

- media armnica,

- media generalizada,

- media geomtrica,

Media de una funcin


Para una funcin continua sobre un intervalo [a,b], se puede calcular el valor
medio de funcin sobre [a,b] como:

De hecho la definicin anterior vale an para una funcin acotada aunque no sea
continua.
Media estadstica
La media estadstica se usa en estadstica para dos conceptos diferentes aunque
numricamente similares:
-La media muestral, que es un estadstico que se calcula a partir de la media
aritmtica de un conjunto de valores de una variable aleatoria.
-La media poblacional, valor esperado o esperanza matemtica de una variable
aleatoria.
En la prctica dada una muestra estadstica suficientemente grande el valor de la
media muestral de la misma es numricamente muy cercano a la esperanza
matemtica de la variable aleatoria medida en esa muestra. Dicho valor esperado,
slo es calculable si se conoce con toda exactitud la distribucin de probabilidad,
cosa que raramente sucede en la realidad, por esa razn, a efectos prcticos la
llamada media se refiere normalmente a la media muestral.
Media muestral
La media muestral es una variable aleatoria, ya que depende de la muestra, si
bien es una variable aleatoria en general con una varianza menor que las
variables originales usadas en su clculo. Si la muestra es grande y est bien
escogida, puede tratarse la media muestra como un valor numrico que aproxima
con precisin la media poblacional, que caracteriza una propiedad objetiva de la
poblacin. Se define como sigue, si se tiene una muestra estadstica de
valores
de valores para una variable aleatoria X con distribucin
de probabilidad F(x,) [donde es un conjunto de parmetros de la distribucin] se
define la media muestral n-sima como:

Media poblacional
La media poblacional tcnicamente no es una media sino un parmetro fijo que
coincide con la esperanza matemtica de una variable aleatoria. El nombre "media
poblacional" se usa para significar que valor numrico de una media muestral es
numricamente cercano al parmetro media poblacional, para una muestra
adecuada y suficientemente grande.

MEDIANA

Visualizacin geomtrica de la moda, la mediana y la media de una funcin


arbitraria de densidad de probabilidad.
En el mbito de la estadstica, la mediana representa el valor de la variable de
posicin central en un conjunto de datos ordenados.
Clculo:

Existen dos mtodos para el clculo de la mediana:


1. Considerando los datos en forma individual, sin agruparlos.
2. Utilizando los datos agrupados en intervalos de clase.

A continuacin veamos cada una de ellas:


Datos sin agrupar
Sean
los datos de una muestra ordenada en orden creciente y
designando la mediana como
, distinguimos dos casos:
a) Si n es impar, la mediana es el valor que ocupa la posicin
una vez
que los datos han sido ordenados (en orden creciente o decreciente), porque ste
es el valor central. Es decir:
.
Por ejemplo, si tenemos 5 datos, que ordenados son:
,
,
,
,
=> El valor central es el tercero:
. Este valor,
que es la mediana de ese conjunto de datos, deja dos datos por debajo ( , ) y
otros dos por encima de l ( , ).
b) Si n es par, la mediana es la media aritmtica de los dos valores centrales.
Cuando es par, los dos datos que estn en el centro de la muestra ocupan las
posiciones

. Es decir:

Por ejemplo, si tenemos 6 datos, que ordenados son:


,
,
,
. Aqu dos valores que
del
dato

otros

dos

que

quedan

por

,
estn

encima

,
por
del

debajo
siguiente

. Por tanto, la mediana de este grupo de datos es la media

aritmtica de estos dos datos:

Datos agrupados
Al tratar con datos agrupados, si coincide con el valor de una frecuencia
acumulada, el valor de la mediana coincidir con la abscisa correspondiente. Si no
coincide con el valor de ninguna abcisa, se calcula a travs de semejanza de
tringulos en el histograma o polgono de frecuencias acumuladas, utilizando la
siguiente equivalencia:

Donde

son

que

las
,

frecuencias

absolutas

acumuladas

tales

son los extremos, interior y exterior, del intervalo

xi

fi

Ni

13

21 > 19.5

30

33

37

39

donde se alcanza la mediana y


mediana. Se observa que
para el diagrama.

es la abscisa a calcular, la
es la amplitud de los intervalos seleccionados

Ejemplos para datos sin agrupar


Ejemplo 1: Cantidad (N) impar de datos
Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase
viene dada por la siguiente tabla:
Calificaciones

Nmero de alumnos

Primero se hallan las frecuencias absolutas acumuladas


frmula
asociada
a
la
mediana
para
obtiene

. As, aplicando la
n
impar,
se

Ni-1< n/2 < Ni = N19 < 19.5 < N20


Por tanto la mediana ser el valor de la variable que ocupe el vigsimo
lugar.En este ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5
con lo que Me = 5 puntos, la mitad de la clase ha obtenido un 5 o menos, y la
otra mitad un 5 o ms.
Ejemplo 2: Cantidad (N) par de datos

xi

fi

Ni+w

13

19 = 19

28

32

36

38

Las calificaciones en la asignatura de Matemticas de 38 alumnos de una


clase viene dada por la siguiente tabla (debajo):
Calificaciones

Nmero de alumnos

Primero se hallan las frecuencias absolutas acumuladas


. As, aplicando la
frmula asociada a la mediana para n par, se obtiene la siguiente
frmula:
divididos entre dos).

(Donde n= 38 alumnos

Ni-1< n/2 < Ni = N18 < 19 < N19


Con lo cual la mediana ser la media aritmtica de los valores de la variable
que ocupen el decimonoveno y el vigsimo lugar. En el ejemplo el lugar
decimonoveno lo ocupa el 5 y el vigsimo el 6 con lo que Me = (5+6)/2 = 5,5
puntos, la mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5
o ms.
Ejemplo para datos agrupados
Entre
1.50
y
1.60
Entre
1.60
y
1.70
Entre 1.70 y 1.80 hay 3 estudiantes.

hay
hay

Mtodo de clculo general:


xi

fi

Ni

2
5

estudiantes.
estudiantes.

[x11-x12]

f1

N1

N(i-2)

[x(i-1)1-x(i-1)2]

f(i-1)

f(i-1)-N(i-2)=N(i-1)

[xi1-xi2]

fi

fi-Ni-1=Ni

[x(i+1)1-x(i+1)2]

f(i+1)

f(i+1)-Ni=N(i+1)

[xM1-xM2]

fM

fM-N(M-1)=NM

Consideramos:
- x11 valor mnimo< Entonces:

MODA
En estadstica, la moda es el valor con una mayor frecuencia en una distribucin
de datos.
Se hablar de una distribucin bimodal de los datos adquiridos en una columna
cuando encontremos dos modas, es decir, dos datos que tengan la misma
frecuencia absoluta mxima. Una distribucin trimodal de los datos es en la que
encontramos tres modas. Si todas las variables tienen la misma frecuencia
diremos que no hay moda.
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el intervalo modal.
La moda, cuando los datos estn agrupados, es un punto que divide al intervalo
modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que
verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los
intervalos anterior y posterior, respectivamente, al intervalo modal.

Moda de datos agrupados


Para obtener la moda en datos agrupados se usa la siguiente frmula:

Donde:
=

-inferior de la clase modal

= es el delta de frecuencia absoluta modal y la frecuencia absoluta


premodal.
= es el delta de frecuencia absoluta modal y la frecuencia absoluta
postmodal.
= Amplitud del intervalo modal
Propiedades
Sus principales propiedades son:
-Clculo sencillo.
-Interpretacin muy clara.
-Al depender slo de las frecuencias, puede calcularse para variables cualitativas.
Es por ello el parmetro ms utilizado cuando al resumir una poblacin no es
posible realizar otros clculos, por ejemplo, cuando se enumeran en medios
periodsticos las caractersticas ms frecuentes de determinado sector social. Esto
se conoce informalmente como "retrato robot".
Inconvenientes
-Su valor es independiente de la mayor parte de los datos, lo que la hace muy
sensible a variaciones muestrales. Por otra parte, en variables agrupadas en
intervalos, su valor depende excesivamente del nmero de intervalos y de su
amplitud.
-Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos
fuera de la moda, no afectan en modo alguno a su valor.
-No siempre se sita hacia el centro de la distribucin.
-Puede haber ms de una moda en el caso en que dos o ms valores de la
variable presenten la misma frecuencia (distribuciones bimodales o multimodales).
VARIANZA
En teora de probabilidad, la varianza (que suele representarse como ) de
una variable aleatoria es una medida de dispersin definida como la esperanza del
cuadrado de la desviacin de dicha variable respecto a su media.

Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable


mide una distancia en metros, la varianza se expresa en metros al cuadrado.
La desviacin estndar es la raz cuadrada de la varianza, es una medida de
dispersin alternativa expresada en las mismas unidades de los datos de la
variable objeto de estudio. La varianza tiene como valor mnimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores
atpicos y no se aconseja su uso cuando las distribuciones de las variables
aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras
medidas de dispersin ms robustas.
El trmino varianza fue acuado por Ronald Fisher en un artculo publicado en
enero de 1919 con el ttulo The Correlation Between Relatives on the Supposition
of Mendelian Inheritance.
Definicin
Si tenemos un conjunto de datos de una misma variable, la varianza se calcula de
la siguiente forma:

Siendo:

: cada dato
: El nmero de datos
: la media aritmtica de los datos

Variable aleatoria
Aplicando este concepto a una variable aleatoria con media = E[X], se define
su varianza, Var(X) (tambin representada como
o, simplemente 2), como

Desarrollando la definicin anterior, se obtiene la siguiente definicin alternativa (y


equivalente):

Si una distribucin no tiene esperanza, como ocurre con la de Cauchy, tampoco


tiene varianza. Existen otras distribuciones que, aun teniendo esperanza, carecen

de varianza. Un ejemplo de ellas es la de Pareto cuando su ndice k satisface 1


< k 2.
Caso continuo
Si la variable aleatoria X es continua con funcin de densidad f(x), entonces

donde

y las integrales estn definidas sobre el rango de X.


Caso discreto
Si la variable aleatoria X es discreta con pesos x1 p1, ..., xn pn y n es la
cantidad total de datos, entonces tenemos:

donde

.
Ejemplos:
Distribucin exponencial
La distribucin exponencial de parmetro es una distribucin continua con
soporte en el intervalo [0,) y funcin de densidad

Tiene media = 1. Por lo tanto, su varianza es:

Es decir, 2 = 2.
Dado perfecto
Un dado de seis caras puede representarse como una variable aleatoria discreta
que toma, valores del 1 al 6 con probabilidad igual a 1/6. El valor esperado es
(1+2+3+4+5+6)/6 = 3,5. Por lo tanto, su varianza es:

Propiedades de la varianza
Algunas propiedades de la varianza son:

siendo a y b nmeros reales cualesquiera. De


esta propiedad se deduce que la varianza de una constante es cero, es
decir,

donde

Cov(X,Y)

es

la covarianza de X e Y.

, donde Cov(X,Y) es la
covarianza de X e Y.

Varianza muestral
En muchas situaciones es preciso estimar la varianza de una poblacin a partir de
una muestra. Si se toma una muestra con reemplazamiento
de n valores de ella, de entre todos los estimadores posibles de la varianza de
la poblacin de partida, existen dos de uso corriente:

Cua
ndo los datos estn agrupados:

A los dos (cuando est dividido por n y cuando lo est por n-1) se los
denomina varianza muestral. Difieren ligeramente y, para valores grandes de n, la
diferencia es irrelevante. El primero traslada directamente la varianza de la
muestra al de la poblacin y el segundo es un estimador insesgado de la varianza
de la poblacin. De hecho,

mientras que:

Propiedades de la varianza muestral


Como consecuencia de la igualdad
, s2 es un estadstico insesgado
de . Adems, si se cumplen las condiciones necesarias para la ley de los
grandes nmeros, s2 es un estimador consistente de .
Ms an, cuando las muestras siguen una distribucin normal, por el teorema de
Cochran,
tiene la distribucin chi-cuadrado:

Desviacin tpica
La desviacin tpica o desviacin estndar (denotada con el smbolo o s,
dependiendo de la procedencia del conjunto de datos) es una medida de
dispersin para variables de razn (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raz cuadrada de la varianza de
la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas
de tendencia central, sino que necesitamos conocer tambin la desviacin que
presentan los datos en su distribucin respecto de la media aritmtica de dicha
distribucin, con objeto de tener una visin de los mismos ms acorde con la

realidad al momento de describirlos e interpretarlos para la toma de decisiones.


Interpretacin y aplicacin
La desviacin tpica es una medida del grado de dispersin de los datos con
respecto al valor promedio. Dicho de otra manera, la desviacin estndar es
simplemente el "promedio" o variacin esperada con respecto a la media
aritmtica.
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una
tiene una
media
de
7.
Sus
desviaciones
estndar muestrales
son 7, 5 y 1 respectivamente. La tercera muestra tiene una desviacin mucho
menor que las otras dos porque sus valores estn ms cerca de 7.
La desviacin estndar puede ser interpretada como una medida
de incertidumbre. La desviacin estndar de un grupo repetido de medidas nos da
la precisin de stas. Cuando se va a determinar si un grupo de medidas est de
acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital
importancia: si la media de las medidas est demasiado alejada de
la prediccin (con la distancia medida en desviaciones estndar), entonces
consideramos que las medidas contradicen la teora. Esto es coherente, ya que
las mediciones caen fuera del rango de valores en el cual sera razonable esperar
que ocurrieran si el modelo terico fuera correcto. La desviacin estndar es uno
de tres parmetros de ubicacin central; muestra la agrupacin de los datos
alrededor de un valor central (la media o promedio).
Desglose
La desviacin estndar (DS/DE), tambin llamada desviacin tpica, es una
medida de dispersin usada en estadstica que nos dice cunto tienden a alejarse
los valores concretos del promedio en una distribucin. De hecho,
especficamente, el cuadrado de la desviacin estndar es "el promedio del
cuadrado de la distancia de cada punto respecto del promedio". Se suele
representar por una S o con la letra sigma, .
La desviacin estndar de un conjunto de datos es una medida de cunto se
desvan los datos de su media. Esta medida es ms estable que el recorrido y
toma en consideracin el valor de cada dato.
Distribucin de probabilidad continua
Es posible calcular la desviacin estndar de una variable aleatoria continua como
la raz cuadrada de la integral

donde

Distribucin de probabilidad discreta


La Desviacin Estndar es la raz cuadrada de la varianza de la distribucin de
probabilidad discreta:

Cuando los casos tomados son iguales al total de la poblacin se aplica la frmula
de desviacin estndar poblacional. As la varianza es la media de los cuadrados
de las diferencias entre cada valor de la variable y la media aritmtica de la
distribucin.
Aunque esta frmula es correcta, en la prctica interesa el realizar inferencias
poblacionales, por lo que en el denominador en vez de , se usa
segn
la correccin de Bessel. Esta ocurre cuando la media de muestra se utiliza para
centrar los datos, en lugar de la media de la poblacin. Puesto que la media de la
muestra es una combinacin lineal de los datos, el residual a la muestra media se
extiende ms all del nmero de grados de libertad por el nmero de ecuaciones
de restriccin en este caso una. Dado esto a la muestra as obtenida de una
muestra sin el total de la poblacin se le aplica esta correccin con la frmula
desviacin estndar muestral.

Ejemplo:
Aqu se muestra cmo calcular la desviacin estndar de un conjunto de datos.
Los datos representan la edad de los miembros de un grupo de nios: {4, 1, 11,
13, 2, 7}
1. Calcular el promedio o media aritmtica

.
En este caso, N = 6:

Sustituyendo N por 6

2. Calcular la desviacin estndar

Sustituyendo N por 6;

Sustituyendo

por 6,33

CUARTIL
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales. Aparecen citados en la literatura cientfica
por primera vez en 1879 por D. McAlister.1
La diferencia entre el tercer cuartil y el primero se conoce como rango
intercuartlico. Se representa grficamente como la anchura de las cajas en los
llamados diagramas de cajas.
Dada una serie de valores X1,X2,X3 ...Xn ordenados en forma creciente, podemos
pensar que su clculo podra efectuarse:

Primer cuartil (Q1) como la mediana de la primera mitad de valores;

Segundo cuartil (Q2) como la propia mediana de la serie;

Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.

Pero esto conduce a distintos mtodos de clculo de los cuartiles primero (as
como tercero) segn la propia mediana se incluya o excluya en la serie de la
primera (respecto de la segunda) mitad de valores.
Clculo con datos no agrupados
No hay uniformidad sobre su clculo. En la bibliografa se encuentran hasta cinco
mtodos que dan resultados diferentes. 2 Uno de los mtodos es el siguiente:
dados n datos ordenados,

Para el primer cuartil:

Para el tercer cuartil:

ASIMETRA ESTADSTICA

En punteado negro: la media, en punteado gris: lamoda.

Ejemplo de datos experimentales con una asimetra positiva (respuesta


gravitrpica de los coleptilos del trigo).
Definicin
Las medidas de asimetra son indicadores que permiten establecer el grado de
simetra (o asimetra) que presenta una distribucin de probabilidad de
una variable aleatoria sin tener que hacer su representacin grfica.
Como eje de simetra consideramos una recta paralela al eje de ordenadas que
pasa por la media de la distribucin. Si una distribucin es simtrica, existe el
mismo nmero de valores a la derecha que a la izquierda de la media, por tanto, el
mismo nmero de desviaciones con signo positivo que con signo negativo.
Decimos que hay asimetra positiva (o a la derecha) si la "cola" a la derecha de la
media es ms larga que la de la izquierda, es decir, si hay valores ms separados
de la media a la derecha. Diremos que hay asimetra negativa (o a la izquierda) si
la "cola" a la izquierda de la media es ms larga que la de la derecha, es decir, si
hay valores ms separados de la media a la izquierda.

Medidas de asimetra
Coeficiente de asimetra de Fisher
En teora de la probabilidad y estadstica, la medida de asimetra ms utilizada
parte del uso del tercer momento estndar. La razn de esto es que nos interesa
mantener el signo de las desviaciones con respecto a la media, para obtener si
son mayores las que ocurren a la derecha de la media que las de la izquierda. Sin
embargo, no es buena idea tomar el momento estndar con respecto a la media
de orden 1. Debido a que una simple suma de todas las desviaciones siempre es
cero. En efecto, si por ejemplo, los datos estn agrupados en clases, se tiene
que:

en donde
representa la marca de la clase -sima y denota la frecuencia
relativa de dicha clase. Por ello, lo ms sencillo es tomar las desviaciones al cubo.
El coeficiente de asimetra de Fisher, representado por

, se define como:

donde

es el tercer momento en torno a la media y

es la desviacin estndar.

Si

, la distribucin es asimtrica positiva o a la derecha.

Si

, la distribucin es asimtrica negativa o a la izquierda.

Si la distribucin es simtrica, entonces sabemos que


. El recproco no es
cierto: es un error comn asegurar que si
entonces la distribucin es
simtrica (lo cual es falso).
Coeficiente de asimetra de Pearson
Slo se puede utilizar en distribuciones uniformes, unimodales y moderadamente
asimtricas. Se basa en que en distribuciones simtricas la media de la
distribucin es igual a la moda.

Si la distribucin es simtrica,
y
. Si la distribucin es
asimtrica positiva la media se sita por encima de la moda y, por tanto,
.
Coeficiente de asimetra de Bowley
Est basado en la posicin de los cuartiles y la mediana, y utiliza la siguiente
expresin:

En una distribucin simtrica el tercer cuartil estar a la misma distancia de la


mediana que el primer cuartil. Por tanto
.
Si la distribucin es positiva o a la derecha,

Utilidad
La asimetra resulta til en muchos campos. Muchos modelos simplistas asumen
una distribucin normal, esto es, simtrica en torno a la media. La distribucin
normal tiene una asimetra cero. Pero en realidad, los valores no son nunca
perfectamente simtricos y la asimetra de la distribucin proporciona una idea
sobre si las desviaciones de la media son positivas o negativas. Una asimetra
positiva implica que hay ms valores distintos a la derecha de la media.
Las medidas de asimetra, sobre todo el coeficiente de asimetra de Fisher, junto
con las medidas de apuntamiento o curtosis se utilizan para contrastar si se puede
aceptar que una distribucin estadstica sigue la distribucin normal. Esto es
necesario para realizar numerosos contrastes estadsticos en la teora de
inferencia estadstica.

CURTOSIS
En teora de la probabilidad y estadstica, la curtosis es una medida de la forma.
As, las medidas de curtosis tratan de estudiar la proporcin de la varianza que se
explica por la combinacin de datos extremos respecto a la media en
contraposicin con datos poco alejados de la misma. Una mayor curtosis implica
una mayor concentracin de datos muy cerca de la media de la distribucin
coexistiendo al mismo tiempo con una relativamente elevada frecuencia de datos
muy alejados de la misma. Esto explica una forma de la distribucin de
frecuencias con colas muy elevadas y con un centro muy apuntado.
Definicin
Un coeficiente de apuntamiento o de curtosis es el basado en el cuarto momento
con respecto a la media y se define como:

donde
es el 4 momento centrado o con respecto a la media y
la desviacin estndar.

es

No obstante, est ms extendida la siguiente definicin del coeficiente de curtosis:

donde al final se ha sustrado 3 (que es la curtosis de la Normal) con objeto de


generar un coeficiente que valga 0 para la Normal y tome a sta como referencia
de apuntamiento:
Tomando, pues, la distribucin normal como referencia, una distribucin puede
ser:

ms apuntada y con colas ms anchas que la normal leptocrtica.

menos apuntada y con colas menos anchas que la normal- platicrtica.

la distribucin normal es mesocrtica.

En la distribucin normal se verifica que


, donde
orden 4 respecto a la media y la desviacin tpica.
As tendremos que:

es el momento de

Si la distribucin es leptocrtica

Si la distribucin es platicrtica

Si la distribucin es mesocrtica

y
y
y

Otra forma de medir la curtosis se obtiene examinando la frmula de la curtosis de


la suma de variables aleatorias. Si Y es la suma de n variables
aleatorias estadsticamente independientes, todas con igual distribucin X,
entonces
hubiese definido como

, complicndose la frmula si la curtosis se


.

Histograma
El histograma es un grfico para la distribucin de una variable cuantitativa
continua que representa frecuencias mediante el volumen de las reas. Un
histograma consiste en un conjunto de rectngulos con:
a. bases en el eje horizontal, centros en las marcas de clase y longitudes iguales a
los tamaos de los intervalos de clase
b. reas proporcionales a las frecuencias de clase.
En el caso de un histograma para intervalos desiguales slo se sealizan los
valores sobre el eje horizontal, el eje vertical no tiene sentido porque las
frecuencias corresponden al rea de cada rectngulo.

Si en la distribucin se toman clases de la misma longitud, las frecuencias son


proporcionales a las alturas de los rectngulos del histograma ya que el rea se
obtiene multiplicando la base por la altura por lo que queda similar a un diagrama
de barras, solo que ahora las barras van una junto a otra por tratarse de una
variable continua

CONCLUSIN:
La Estadstica es una ciencia matemtica que se utiliza para describir, analizar e
interpretar ciertas caractersticas de un conjunto de individuos llamado poblacin.
Cuando nos referimos a muestra y poblacin hablamos de conceptos relativos
pero estrechamente ligados. Una poblacin es un todo y una muestra es una
fraccin o segmento de ese todo.
Podemos dividir la estadstica en dos ramas; la estadstica descriptiva, que se
dedica a los mtodos de recoleccin, descripcin, visualizacin y resumen de
datos originados a partir de los fenmenos en estudio; y la estadstica inferencial,
que se dedica a la generacin de los modelos, inferencias y predicciones
asociadas a los fenmenos en cuestin.
La estadstica trata en primer lugar, de acumular la masa de datos numricos
provenientes de la observacin de multitud de fenmenos, procesndolos de
forma razonable. Mediante la teora de la probabilidad analiza y explora
la estructura matemtica subyacente al fenmeno del que estos datos provienen y,

trata de sacar conclusiones y predicciones que ayuden al mejor aprovechamiento


del fenmeno.

También podría gustarte