Está en la página 1de 24

UNIVERSIDAD NACIONAL

JORGE BASADRE
GROHMANN
FACULTAD DE INGENIERA
E.A.P.

DE
INGENIERA
DE MINAS

CURSO
:
DATOS MINEROS
TEMA
N01

PROFESOR
:
QUINTANILLA
ALUMNO

CDIGO

ANLISIS ESTADSTICO DE
INFORME DE PRCTICA
ING. SALOMN ORTIZ
JOS AGREDA RAMIREZ
2012-36986

TACNA-PER
2014
MEDIA
Construccin geomtrica para hallar las medias aritmtica, geomtrica, armnica y
cuadrtica de dos nmeros a y b.

Comparacin de la media aritmtica, la mediana y


la moda de dos distribuciones log-normal con diferente asimetra.
En matemticas y estadstica una media o promedio es una medida de tendencia
central que segn la Real Academia Espaola (2001) resulta al efectuar una serie
determinada de operaciones con un conjunto de nmeros y que, en determinadas
condiciones, puede representar por s solo a todo el conjunto. Existen distintos tipos de
medias, tales como la media geomtrica, la media ponderada y la media armnica aunque
en el lenguaje comn, el trmino se refiere generalmente a la media aritmtica.

Media aritmtica:
La media aritmtica es un promedio estndar que a menudo se denomina "promedio".

La media se confunde a veces con la mediana o moda. La media aritmtica es el


promedio de un conjunto de valores, o su distribucin; sin embargo, para las
distribuciones con sesgo, la media no es necesariamente el mismo valor que la mediana o
que la moda. La media, moda y mediana son parmetros caractersticos de una
distribucin de probabilidad. Es a veces una forma de medir el sesgo de una distribucin
tal y como se puede hacer en las distribuciones exponencial y de Poisson.

Por ejemplo, la media aritmtica de 34, 27, 45, 55, 22, 34 (seis valores)
es

Media aritmtica ponderada

A veces puede ser til otorgar pesos o valores a los datos dependiendo de su relevancia
para determinado estudio. En esos casos se puede utilizar una media ponderada.
Si
es un conjunto de datos o media muestral y
son
nmeros reales positivos, llamados "pesos" o factores de ponderacin, se define la media
ponderada relativa a esos pesos como:

La media es invariante frente a transformaciones lineales, cambio de origen y escala, de


las variables, es decir si X es una variable aleatoria e Y es otra variable aleatoria que
depende linealmente de X, es decir, Y = aX + b (donde a representa la magnitud del
cambio de escala y b la del cambio de origen) se tiene que:

Media geomtrica

La media geomtrica es un promedio muy til en conjuntos de nmeros que son


interpretados en orden de su producto, no de su suma (tal y como ocurre con la media
aritmtica). Por ejemplo, las velocidades de crecimiento.

Por ejemplo, la media geomtrica de la serie de nmeros 34, 27, 45, 55, 22, 34 (seis
valores) es

Media armnica

La media armnica es un promedio muy til en conjuntos de nmeros que se definen en


relacin con alguna unidad, por ejemplo la velocidad (distancia por unidad de tiempo).

Por ejemplo, la media armnica de los nmeros: 34, 27, 45, 55, 22, y 34 es:

Generalizaciones de la media

Existen diversas generalizaciones de las medias anteriores.

Media generalizada

Las medias generalizadas, tambin conocidas como medias de Hlder, son una
abstraccin de las medias cuadrticas, aritmticas, geomtricas y armnicas. Se definen y
agrupan a travs de la siguiente expresin:

Eligiendo un valor apropiado del parmetro m, se tiene:

- mximo,

- media cuadrtica,

- media aritmtica,

- media geomtrica,

- media armnica,

- mnimo.

Media-f generalizada
Esta media puede generalizarse para una funcin montona como la media-f
generalizada:

donde
sea una funcin inyectiva e
un intervalo.
Escogiendo formas particulares para f se obtienen algunas de las medias ms
conocidas:

- media aritmtica,

- media armnica,

- media generalizada,

- media geomtrica,

Media de una funcin

Para una funcin continua sobre un intervalo [a,b], se puede calcular el valor
medio de funcin sobre [a,b] como:

De hecho la definicin anterior vale an para una funcin acotada aunque no


sea continua.

Media estadstica
La media estadstica se usa en estadstica para dos conceptos diferentes
aunque numricamente similares:

La media muestral, que es un estadstico que se calcula a partir de


la media aritmtica de un conjunto de valores de una variable aleatoria.

La media poblacional, valor esperado o esperanza matemtica de una


variable aleatoria.

En la prctica dada una muestra estadstica suficientemente grande el valor


de la media muestral de la misma es numricamente muy cercano a la
esperanza matemtica de la variable aleatoria medida en esa muestra. Dicho
valor esperado, slo es calculable si se conoce con toda exactitud la
distribucin de probabilidad, cosa que raramente sucede en la realidad, por
esa razn, a efectos prcticos la llamada media se refiere normalmente a la
media muestral.
Media muestral
La media muestral es una variable aleatoria, ya que depende de la muestra, si
bien es una variable aleatoria en general con una varianza menor que las
variables originales usadas en su clculo. Si la muestra es grande y est bien
escogida, puede tratarse la media muestra como un valor numrico que
aproxima con precisin la media poblacional, que caracteriza una propiedad
objetiva de la poblacin. Se define como sigue, si se tiene una muestra
estadstica de valores
de valores para una variable
aleatoria X con distribucin de probabilidad F(x,) [donde es un conjunto de
parmetros de la distribucin] se define la media muestral n-sima como:

Media poblacional
La media poblacional tcnicamente no es una media sino un parmetro fijo
que coincide con la esperanza matemtica de una variable aleatoria. El
nombre "media poblacional" se usa para significar que valor numrico de una

media muestral es numricamente cercano al parmetro media poblacional,


para una muestra adecuada y suficientemente grande.

MEDIANA

Visualizacin geomtrica de la moda, la mediana y la media de una funcin arbitraria de


densidad de probabilidad.
En el mbito de la estadstica, la mediana representa el valor de la variable de posicin
central en un conjunto de datos ordenados.
Clculo
Existen dos mtodos para el clculo de la mediana:
1. Considerando los datos en forma individual, sin agruparlos.

2. Utilizando los datos agrupados en intervalos de clase.


A continuacin veamos cada una de ellas:
Datos sin agrupar
Sean
los datos de una muestra ordenada en orden creciente y
designando la mediana como
, distinguimos dos casos:
a) Si n es impar, la mediana es el valor que ocupa la posicin
una vez que
los datos han sido ordenados (en orden creciente o decreciente), porque ste es el valor
central. Es decir:

Por ejemplo, si tenemos 5 datos, que ordenados son:

,
,
=> El valor central es el tercero:
es la mediana de ese conjunto de datos, deja dos datos por debajo (
por encima de l ( , ).

,
,

. Este valor, que


) y otros dos

b) Si n es par, la mediana es la media aritmtica de los dos valores centrales. Cuando


es par, los dos datos que estn en el centro de la muestra ocupan las posiciones
y

. Es decir:

Por ejemplo, si tenemos 6 datos, que ordenados son:


,

. Aqu dos valores que estn por debajo del

y otros dos que quedan por encima del siguiente dato


mediana de este grupo de datos es la media
datos:

aritmtica

. Por tanto, la
de estos dos

Datos agrupados
Al tratar con datos agrupados, si coincide con el valor de una frecuencia acumulada, el
valor de la mediana coincidir con la abscisa correspondiente. Si no coincide con el valor
de ninguna abcisa, se calcula a travs de semejanza de tringulos en el histograma o
polgono de frecuencias acumuladas, utilizando la siguiente equivalencia:

Donde

son

las

frecuencias

absolutas

acumuladas

tales

que
,
y
son los extremos, interior y exterior, del intervalo
donde se alcanza la mediana y
es la abscisa a calcular, la
mediana. Se observa que
es la amplitud de los intervalos seleccionados
para el diagrama.
Ejemplos para datos sin agrupar

xi

fi

Ni

13

21 > 19.5

30

33

37

39

Ejemplo 1: Cantidad (N) impar de datos


Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase viene
dada por la siguiente tabla:
Calificaciones

Nmero de alumnos

Primero se hallan las frecuencias absolutas acumuladas

. As, aplicando la frmula

asociada a la mediana para n impar, se obtiene

Ni-1< n/2 < Ni = N19 < 19.5 < N20

Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar.En este
ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5
puntos, la mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms.
Ejemplo 2: Cantidad (N) par de datos
Las calificaciones en la asignatura de Matemticas de 38 alumnos de una clase viene
dada por la siguiente tabla (debajo):
Calificaciones

Nmero de alumnos

xi

fi

Ni+w

13

19 = 19

28

32

36

38

Primero se hallan las frecuencias absolutas acumuladas


asociada
a
la
mediana
para
n
par,
se

. As, aplicando la frmula


obtiene
la
siguiente

frmula:
divididos entre dos).

(Donde n= 38 alumnos

Ni-1< n/2 < Ni = N18 < 19 < N19

Con lo cual la mediana ser la media aritmtica de los valores de la variable que
ocupen el decimonoveno y el vigsimo lugar. En el ejemplo el lugar decimonoveno lo
ocupa el 5 y el vigsimo el 6 con lo que Me = (5+6)/2 = 5,5 puntos, la mitad de la clase
ha obtenido un 5,5 o menos y la otra mitad un 5,5 o ms.
Ejemplo para datos agrupados
Entre
1.50
y
1.60
Entre
1.60
y
1.70
Entre 1.70 y 1.80 hay 3 estudiantes.

hay
hay

Mtodo de clculo general


xi

fi

Ni

[x11-x12]

f1

N1

N(i-2)

[x(i-1)1-x(i-1)2]

f(i-1)

f(i-1)-N(i-2)=N(i-1)

[xi1-xi2]

fi

fi-Ni-1=Ni

[x(i+1)1-x(i+1)2]

f(i+1)

f(i+1)-Ni=N(i+1)

2
5

estudiantes.
estudiantes.

[xM1-xM2]

fM

fM-N(M-1)=NM

Consideramos:
- x11 valor mnimo< Entonces:

MODA
En estadstica, la moda es el valor con una mayor frecuencia en una distribucin de
datos.
Se hablar de una distribucin bimodal de los datos adquiridos en una columna cuando
encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta
mxima. Una distribucin trimodal de los datos es en la que encontramos tres modas. Si
todas las variables tienen la misma frecuencia diremos que no hay moda.
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el intervalo modal.
La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal en
dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los
intervalos anterior y posterior, respectivamente, al intervalo modal.

Moda de datos agrupados


Para obtener la moda en datos agrupados se usa la siguiente frmula:

Donde:
=

-inferior de la clase modal

= es el delta de frecuencia absoluta modal y la frecuencia absoluta premodal.


= es el delta de frecuencia absoluta modal y la frecuencia absoluta postmodal.
= Amplitud del intervalo modal

Propiedades
Sus principales propiedades son:

Clculo sencillo.

Interpretacin muy clara.

Al depender slo de las frecuencias, puede calcularse


para variables cualitativas. Es por ello el parmetro ms
utilizado cuando al resumir una poblacin no es posible
realizar otros clculos, por ejemplo, cuando se enumeran
en medios periodsticos las caractersticas ms frecuentes
de

determinado

sector

social.

Esto

se

conoce

informalmente como "retrato robot".


Inconvenientes

Su valor es independiente de la mayor parte de los datos,


lo que la hace muy sensible a variaciones muestrales. Por
otra parte, en variables agrupadas en intervalos, su valor
depende excesivamente del nmero de intervalos y de su
amplitud.

Usa muy pocas observaciones, de tal modo que grandes


variaciones en los datos fuera de la moda, no afectan en
modo alguno a su valor.

No siempre se sita hacia el centro de la distribucin.

Puede haber ms de una moda en el caso en que dos o


ms valores de la variable presenten la misma frecuencia
(distribuciones bimodales o multimodales).

Varianza
En teora de probabilidad, la varianza (que suele representarse como
) de una variable
aleatoria es una medida de dispersin definida como la esperanza del cuadrado de la
desviacin de dicha variable respecto a su media.
Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide
una distancia en metros, la varianza se expresa en metros al cuadrado. La desviacin

estndar es la raz cuadrada de la varianza, es una medida de dispersin alternativa


expresada en las mismas unidades de los datos de la variable objeto de estudio. La
varianza tiene como valor mnimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores
atpicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias
tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de
dispersin ms robustas.
El trmino varianza fue acuado por Ronald Fisher en un artculo publicado en enero de
1919 con el ttulo The Correlation Between Relatives on the Supposition of Mendelian
Inheritance.1
ndice
[ocultar]

1 Definicin
o

1.1 Variable aleatoria

1.2 Caso continuo

1.3 Caso discreto

2 Ejemplos
o

2.1 Distribucin exponencial

2.2 Dado perfecto

3 Propiedades de la varianza

4 Varianza muestral
o

4.1 Propiedades de la varianza muestral

5 Vase tambin

6 Referencias

7 Enlaces externos
Definicin[editar]

Si tenemos un conjunto de datos de una misma variable, la varianza se calcula de la


siguiente forma:

Siendo:

: cada dato
: El nmero de datos
: la media aritmtica de los datos

Variable aleatoria[editar]
Aplicando este concepto a una variable aleatoria con media = E[X], se define
su varianza, Var(X) (tambin representada como
o, simplemente 2), como

Desarrollando la definicin anterior, se obtiene la siguiente definicin alternativa (y


equivalente):

Si una distribucin no tiene esperanza, como ocurre con la de Cauchy,


tampoco tiene varianza. Existen otras distribuciones que, aun teniendo
esperanza, carecen de varianza. Un ejemplo de ellas es la de Pareto cuando
su ndice k satisface 1 < k 2.
Caso continuo[editar]
Si la variable aleatoria X es continua con funcin de densidad f(x), entonces

donde

y las integrales estn definidas sobre el rango de X.


Caso discreto[editar]

Si la variable aleatoria X es discreta con pesos x1 p1, ..., xn pn y n


es la cantidad total de datos, entonces tenemos:

donde

.
Ejemplos[editar]
Distribucin exponencial[editar]
La distribucin exponencial de parmetro es una distribucin
continua con soporte en el intervalo [0,) y funcin de
densidad

Tiene media = 1. Por lo tanto, su varianza es:

Es decir, 2 = 2.
Dado perfecto[editar]
Un dado de seis caras puede representarse como una
variable aleatoria discreta que toma, valores del 1 al 6
con probabilidad igual a 1/6. El valor esperado es
(1+2+3+4+5+6)/6 = 3,5. Por lo tanto, su varianza es:

Propiedades de la varianza[editar]
Algunas propiedades de la varianza son:

siendo a y b nme
ros reales cualesquiera. De esta propiedad se
deduce que la varianza de una constante es
cero, es decir,

, donde Cov(X,Y) es la covarianza de X e Y.

, donde Cov(X,Y) es la covarianza de X e Y.


Varianza muestral[editar]
En muchas situaciones es preciso estimar la
varianza de una poblacin a partir de una muestra.
Si
se
toma
una
muestra
con
reemplazamiento
de n valores
de
ella, de entre todos los estimadores posibles de la
varianza de la poblacin de partida, existen dos de
uso corriente:

Cuando los datos estn agrupados:

A los dos (cuando est dividido por n y


cuando lo est por n-1) se los
denomina varianza muestral. Difieren
ligeramente y, para valores grandes
de n, la diferencia es irrelevante. El
primero traslada directamente la
varianza de la muestra al de la
poblacin
y
el
segundo
es
un estimador insesgado de la varianza
de la poblacin. De hecho,

mientras que

Propiedades de la varianza
muestral[editar]
Como

consecuencia

de

la

igualdad
, s2 es
un estadstico insesgado de
. Adems, si se cumplen las
condiciones necesarias para
la ley
de
los
grandes
nmeros, s2 es
un estimador
consistente de
.
Ms an, cuando las muestras
siguen una distribucin normal,
por el teorema de Cochran,
tiene
la distribucin
chicuadrado:

Desviacin tpica

La desviacin tpica o desviacin estndar (denotada con el smbolo o s,


dependiendo de la procedencia del conjunto de datos) es una medida de dispersin para
variables de razn (variables cuantitativas o cantidades racionales) y de intervalo. Se
define como la raz cuadrada de la varianza de la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer tambin la desviacin que presentan los
datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto
de tener una visin de los mismos ms acorde con la realidad al momento de describirlos
e interpretarlos para la toma de decisiones.
ndice
[ocultar]

1 Interpretacin y aplicacin

2 Desglose
o

2.1 Distribucin de probabilidad continua

2.2 Distribucin de probabilidad discreta

3 Ejemplo

4 Vase tambin

5 Enlaces externos
Interpretacin y aplicacin[editar]
La desviacin tpica es una medida del grado de dispersin de los datos con respecto al
valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el
"promedio" o variacin esperada con respecto a la media aritmtica.
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una
media de 7. Sus desviaciones estndar muestrales son 7, 5 y 1 respectivamente. La
tercera muestra tiene una desviacin mucho menor que las otras dos porque sus valores
estn ms cerca de 7.
La desviacin estndar puede ser interpretada como una medida de incertidumbre. La
desviacin estndar de un grupo repetido de medidas nos da la precisin de stas.
Cuando se va a determinar si un grupo de medidas est de acuerdo con el modelo
terico, la desviacin estndar de esas medidas es de vital importancia: si la media de las
medidas est demasiado alejada de la prediccin (con la distancia medida en
desviaciones estndar), entonces consideramos que las medidas contradicen la teora.
Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual sera
razonable esperar que ocurrieran si el modelo terico fuera correcto. La desviacin
estndar es uno de tres parmetros de ubicacin central; muestra la agrupacin de los
datos alrededor de un valor central (la media o promedio).

Desglose[editar]
La desviacin estndar (DS/DE), tambin llamada desviacin tpica, es una medida
de dispersin usada en estadstica que nos dice cunto tienden a alejarse los valores
concretos del promedio en una distribucin. De hecho, especficamente, el cuadrado de la
desviacin estndar es "el promedio del cuadrado de la distancia de cada punto respecto
del promedio". Se suele representar por una S o con la letra sigma, .
La desviacin estndar de un conjunto de datos es una medida de cunto se desvan los
datos de su media. Esta medida es ms estable que el recorrido y toma en consideracin
el valor de cada dato.
Distribucin de probabilidad continua[editar]
Es posible calcular la desviacin estndar de una variable aleatoria continua como la raz
cuadrada de la integral

donde

Distribucin de probabilidad discreta[editar]


La Desviacin Estndar es la raz cuadrada de la varianza de la distribucin de
probabilidad discreta:

Cuando los casos tomados son iguales al total de la poblacin se aplica la


frmula de desviacin estndar poblacional. As la varianza es la media de los
cuadrados de las diferencias entre cada valor de la variable y la media
aritmtica de la distribucin.
Aunque esta frmula es correcta, en la prctica interesa el realizar inferencias
poblacionales, por lo que en el denominador en vez de , se usa
segn la correccin de Bessel. Esta ocurre cuando la media de muestra se
utiliza para centrar los datos, en lugar de la media de la poblacin. Puesto que
la media de la muestra es una combinacin lineal de los datos, el residual a la
muestra media se extiende ms all del nmero de grados de libertad por el
nmero de ecuaciones de restriccin en este caso una. Dado esto a la
muestra as obtenida de una muestra sin el total de la poblacin se le aplica
esta correccin con la frmula desviacin estndar muestral.

Ejemplo[editar]

Aqu se muestra cmo calcular la desviacin estndar de un conjunto


de datos. Los datos representan la edad de los miembros de un grupo de
nios: {4, 1, 11, 13, 2, 7}
1. Calcular el promedio o media aritmtica

.
En este caso, N = 6:

Sustituyendo N por 6

2. Calcular
estndar

Sustituyendo N por 6;

Sustituyendo

por 6,33

la

desviacin

.
Cuartil
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro
partes porcentualmente iguales. Aparecen citados en la literatura cientfica por primera
vez en 1879 por D. McAlister.1
La diferencia entre el tercer cuartil y el primero se conoce como rango intercuartlico. Se
representa grficamente como la anchura de las cajas en los llamados diagramas de
cajas.
Dada una serie de valores X1,X2,X3 ...Xn ordenados en forma creciente, podemos pensar
que su clculo podra efectuarse:

Primer cuartil (Q1) como la mediana de la primera mitad de valores;

Segundo cuartil (Q2) como la propia mediana de la serie;

Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.

Pero esto conduce a distintos mtodos de clculo de los cuartiles primero (as como
tercero) segn la propia mediana se incluya o excluya en la serie de la primera (respecto
de la segunda) mitad de valores.
Clculo con datos no agrupados
No hay uniformidad sobre su clculo. En la bibliografa se encuentran hasta cinco
mtodos que dan resultados diferentes.2 Uno de los mtodos es el siguiente: dados n
datos ordenados,

Para el primer cuartil:

Para el tercer cuartil:

Asimetra estadstica

En punteado negro: la media, en punteado gris: lamoda.

Ejemplo de datos experimentales con una asimetra positiva (respuesta gravitrpica de los
coleptilos del trigo).
ndice
[ocultar]

1 Definicin

2 Medidas de asimetra
o

2.1 Coeficiente de asimetra de Fisher

2.2 Coeficiente de asimetra de Pearson

2.3 Coeficiente de asimetra de Bowley

3 Utilidad

4 Referencias

5 Enlaces externos

Definicin
Las medidas de asimetra son indicadores que permiten establecer el grado de
simetra (o asimetra) que presenta una distribucin de probabilidad de una variable
aleatoria sin tener que hacer su representacin grfica.
Como eje de simetra consideramos una recta paralela al eje de ordenadas que pasa por
la media de la distribucin. Si una distribucin es simtrica, existe el mismo nmero de
valores a la derecha que a la izquierda de la media, por tanto, el mismo nmero de
desviaciones con signo positivo que con signo negativo. Decimos que hay asimetra
positiva (o a la derecha) si la "cola" a la derecha de la media es ms larga que la de la
izquierda, es decir, si hay valores ms separados de la media a la derecha. Diremos que
hay asimetra negativa (o a la izquierda) si la "cola" a la izquierda de la media es ms
larga que la de la derecha, es decir, si hay valores ms separados de la media a la
izquierda.
Medidas de asimetra
Coeficiente de asimetra de Fisher
En teora de la probabilidad y estadstica, la medida de asimetra ms utilizada parte del
uso del tercer momento estndar. La razn de esto es que nos interesa mantener el signo
de las desviaciones con respecto a la media, para obtener si son mayores las que ocurren
a la derecha de la media que las de la izquierda. Sin embargo, no es buena idea tomar el
momento estndar con respecto a la media de orden 1. Debido a que una simple suma de
todas las desviaciones siempre es cero. En efecto, si por ejemplo, los datos estn
agrupados en clases, se tiene que:

en donde
representa la marca de la clase -sima y
denota la frecuencia relativa
de dicha clase. Por ello, lo ms sencillo es tomar las desviaciones al cubo.
El coeficiente de asimetra de Fisher, representado por

, se define como:

donde

es el tercer momento en torno a la media y

es la desviacin estndar.

Si

, la distribucin es asimtrica positiva o a la derecha.

Si

, la distribucin es asimtrica negativa o a la izquierda.

Si la distribucin es simtrica, entonces sabemos que


. El recproco no es
cierto: es un error comn asegurar que si
entonces la distribucin es
simtrica (lo cual es falso).
Coeficiente de asimetra de Pearson
Slo se puede utilizar en distribuciones uniformes, unimodales y moderadamente
asimtricas. Se basa en que en distribuciones simtricas la media de la
distribucin es igual a la moda.

Si la distribucin es simtrica,

. Si la distribucin es

asimtrica positiva la media se sita por encima de la moda y, por tanto,

Coeficiente de asimetra de Bowley


Est basado en la posicin de los cuartiles y la mediana, y utiliza la siguiente
expresin:

En una distribucin simtrica el tercer cuartil estar a la misma distancia de la


mediana que el primer cuartil. Por lo tanto:
Si la distribucin es positiva o a la derecha.
Utilidad
La asimetra resulta til en muchos campos. Muchos modelos simplistas asumen
una distribucin normal, esto es, simtrica en torno a la media. La distribucin
normal tiene una asimetra cero. Pero en realidad, los valores no son nunca
perfectamente simtricos y la asimetra de la distribucin proporciona una idea
sobre si las desviaciones de la media son positivas o negativas. Una asimetra
positiva implica que hay ms valores distintos a la derecha de la media.
Las medidas de asimetra, sobre todo el coeficiente de asimetra de Fisher, junto
con las medidas de apuntamiento o curtosis se utilizan para contrastar si se puede
aceptar que una distribucin estadstica sigue la distribucin normal. Esto es
necesario para realizar numerosos contrastes estadsticos en la teora de
inferencia estadstica.
Curtosis
En teora de la probabilidad y estadstica, la curtosis es una medida de la forma. As, las
medidas de curtosis tratan de estudiar la proporcin de la varianza que se explica por la
combinacin de datos extremos respecto a la media en contraposicin con datos poco
alejados de la misma. Una mayor curtosis implica una mayor concentracin de datos muy
cerca de la media de la distribucin coexistiendo al mismo tiempo con una relativamente
elevada frecuencia de datos muy alejados de la misma. Esto explica una forma de la
distribucin de frecuencias con colas muy elevadas y con un centro muy apuntado.
Definicin
Un coeficiente de apuntamiento o de curtosis es el basado en el cuarto momento con
respecto a la media y se define como:

donde
es el 4 momento centrado o con respecto a la media y
estndar.

es la desviacin

No obstante, est ms extendida la siguiente definicin del coeficiente de curtosis:

donde al final se ha sustrado 3 (que es la curtosis de la Normal) con objeto de generar un


coeficiente que valga 0 para la Normal y tome a sta como referencia de apuntamiento:
Tomando, pues, la distribucin normal como referencia, una distribucin puede ser:

ms apuntada y con colas ms anchas que la normal leptocrtica.

menos apuntada y con colas menos anchas que la normal- platicrtica.

la distribucin normal es mesocrtica.

En la distribucin normal se verifica que


respecto a la media y la desviacin tpica.

, donde

es el momento de orden 4

As tendremos que:

Si la distribucin es leptocrtica

Si la distribucin es platicrtica

Si la distribucin es mesocrtica

y
y
y

Otra forma de medir la curtosis se obtiene examinando la frmula de la curtosis de la


suma de variables aleatorias. Si Y es la suma de n variables aleatorias estadsticamente
independientes, todas con igual distribucin X, entonces,

Complicndose la frmula si la curtosis se hubiese definido

como.

También podría gustarte