Está en la página 1de 4

CONCEPTOS ESTADSTICA_PARTE 1

OJIVA
Una distribucin de frecuencia acumulativa nos
permite ver cuantas observaciones se hallan por
arriba o por debajo de ciertos valores, en lugar
de limitarnos a anotar los nmeros de elementos
dentro de los intervalos. Se llama ojiva a la
grfica de una distribucin de frecuencia
acumulativa. En las abscisas se colocan los
lmites superiores de cada intervalo de clase y en
las ordenadas se coloca la frecuencia acumulada
(absoluta o relativa) de la clase. La ojiva de una
distribucin de este tipo se muestra en la grafica
La ojiva es til para:
1. Calcular el nmero o el porcentaje de observaciones que corresponden a un intervalo determinado de la
variable.
2. Calcular los percentiles de la distribucin de los datos.

ASIMETRA
Las medidas de asimetra son indicadores que permiten establecer el grado de simetra (o asimetra) que
presenta una distribucin de probabilidad de una variable aleatoria sin tener que hacer su representacin
grfica. La asimetra en un conjunto de datos es el agrupamiento que ellos presentan a un lado de su
centro. Los valores situados a un lado de la mitad de los datos tienden a estar ms alejados que los valores
que se encuentran en el otro lado. Decimos que hay asimetra positiva (o a la derecha) si la "cola" a la
derecha de la media es ms larga que la de la izquierda, es decir, si hay valores ms separados de la
media a la derecha. Diremos que hay asimetra negativa (o a la izquierda) si la "cola" a la izquierda de la
media es ms larga que la de la derecha, es decir, si hay valores ms separados de la media a la izquierda.
Existen dos medidas de este tipo:
ndice de simetra de Pearson:

ndice de simetra de Fisher:

Si la distribucin es simtrica, ambos ndices son iguales a 0; si es asimtrica a la derecha,


ambos son positivos; y si es asimtrica a la izquierda, ambos ndices son negativos.
Existen tres tipos de curva de distribucin segn su asimetra:
1

Asimetra negativa: la cola de la distribucin se alarga para valores inferiores a la media.

Simtrica: hay el mismo nmero de elementos a izquierda y derecha de la media. En este caso,
coinciden la media, la mediana y la moda. La distribucin se adapta a la forma de la campana de
Gauss, o distribucin normal.

Asimetra positiva: la cola de la distribucin se alarga para valores superiores a la media.

CURTOSIS
La curtosis (o apuntamiento) es una medida de forma que mide cun escarpada o achatada est una
curva o distribucin.
Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que a mayor
grado de curtosis, ms escarpada (o apuntada) ser la forma de la curva.
Una mayor curtosis implica una mayor concentracin de datos muy cerca de la media de la distribucin
coexistiendo al mismo tiempo con una relativamente elevada frecuencia de datos muy alejados de la
misma. Esto explica una forma de la distribucin de frecuencias con colas muy elevadas y con un centro
muy apuntado.
Se suele medir con el coeficiente de curtosis:

Si este coeficiente es nulo, la distribucin se dice normal (similar a la distribucin normal de


Gauss) y recibe el nombre de mesocrtica.
Si el coeficiente es positivo, la distribucin se llama leptocrtica, ms puntiaguda que la anterior.
Hay una mayor concentracin de los datos en torno a la media.
Si el coeficiente es negativo, la distribucin se llama platicrtica y hay una menor concentracin
de datos en torno a la media. Sera ms achatada que la primera.

RANGO INTERCUARTIL
El rango intercuartlico IQR (o rango intercuartil) es una estimacin estadstica de la dispersin de una
distribucin de datos. Consiste en la diferencia entre el tercer y el primer cuartil. Mediante esta medida se
eliminan los valores extremadamente alejados. El rango intercuartlico es altamente recomendable cuando
la medida de tendencia central utilizada es la mediana (ya que este estadstico es insensible a posibles
irregularidades en los extremos).

Con el IQR podremos elaborar los diagramas de caja, que es un instrumento muy visual para evaluar
la dispersin de una distribucin.
El diagrama de caja es un grfico utilizado para representar una variable cuantitativa (variable numrica). El
grfico es una herramienta que permite visualizar, a travs de los cuartiles, cmo es la distribucin, su
grado de asimetra, los valores extremos, la posicin de la mediana, etc. Se compone de:

Un rectngulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro de la caja una lnea indica
dnde se encuentra la mediana (segundo cuartil Q2)

Dos brazos, uno que empieza en el primer cuartil y acaba en el mnimo, y otro que empieza en el tercer
cuartil y acaba en el mximo.

Los datos atpicos (o valores extremos) que son los valores distintos que no cumplen ciertos requisitos de
heterogeneidad de los datos.

Los diagramas de caja son muy tiles para comparar una variable en diferentes grupos.
Construccin del diagrama de caja
Para construir el diagrama de caja, debemos seguir los siguientes pasos:
1. Ordenar los datos.
2. Calcular los tres cuartiles (Q1, Q2 y Q3). Despus, dibujamos el rectngulo (caja) delimitado por el primer
y tercer cuartil, dibujando entre los dos cuartiles una lnea para indicar dnde est la mediana (segundo
cuartil).
3. Calcular el rango intercuartlico, que es el tercer cuartil menos el primero.

4. Se calculan los lmites admisibles inferior y superior (LI y LS) para identificar los valores extremos.
Los lmites marcarn los datos atpicos de la variable. Todos aquellos puntos que sean menores que LI (x
< LI) o mayores que LS (x > LS) son valores extremos. Es decir, son todos aquellos valores que no estn
en el intervalo [LI,LS].
5. El mnimo es el menor valor del conjunto que sea mayor o igual que LI. El mximo es el mayor valor del
conjunto que es menor o igual que LS.
Dibujamos los dos brazos. El primero va desde el primer cuartil hasta el mnimo. El segundo, desde el
tercer cuartil hasta el mximo.
6. Se dibujan los valores extremos, representados por puntos o crculos pequeos.

También podría gustarte