Está en la página 1de 3

Medidas de Posición

Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que comprenden el
mismo número de valores. Los más usados son los cuartiles, los deciles y los percentiles.

Percentiles: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el pe rce ntil de
orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85%

Cuartiles: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso
particular de los percentiles:

- El primer cuartil Q1 es el menor valor que es mayor que una cuarta parte de los datos
- El segundo cuartil Q2 , es el menor valor que es mayor que la mitad de los datos
- El tercer cuartil Q3 es el menor valor que es mayor que tres cuartas partes de los datos

Deciles: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambié n un caso
particular de los percentiles.

Dada la siguiente distribución en el número de hijos (xi) de cien familias, calcular sus cuartiles.

xi ni Ni Primer cuartil
0 14 14
1 10 24 Segundo cuartil
2 15 39
3 26 65
Tercer cuartil
4 20 85
5 15 100
n=100

Medidas de Dispersión

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de
dispersión nos dicen hasta qué punto estas medidas de tendencia central son representativas como síntesis de la
información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la
distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables
entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

Medidas de dispersión absolutas

Varianza (s2 ): es el promedio del cuadrado de las distancias entre cada observación y la media
aritmética del conjunto de observaciones.

Desviación estándar (s): La varianza viene dada por las mismas unidades que la variable, pero al cuadrado,
para evitar este problema podemos usar como medida de dispersión la desviación estándar que se define
como la raíz cuadrada positiva de la varianza.

Para estimar la desviación estándar de una población a partir de los datos de una muestra se
utiliza la fórmula (cuasi desviación estándar):

Rango (R). Es la diferencia entre el valor de las observaciones mayor y el menor. R = x max - x min
Medidas de dispersión relativas

Coeficiente de variación de Pearson: Cuando se quiere comparar el grado de dispersión de dos distribuciones que no
vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de
Pearson que se define como el cociente entre la desviación estándar y el valor absoluto de la media aritmética.
CV representa el número de veces que la desviación estándar contiene a la media aritmética y por lo tanto cuanto mayor
es CV mayor es la dispersión y menor la representatividad de la media.

Medidas de Forma

Comparan la forma que tiene la representación gráfica,


bien sea el histograma o el diagrama de barras de la
distribución, con la distribución normal.

Medida de asimetría

Se dice que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden mientras que una
distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la
derecha que por la izquierda. Si las frecuencias descienden más lentamente por la izquierda que por la derecha dire mos
que la distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de
Asimetría de Pearson:

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando
existe asimetría a la izquierda.

Medida de apuntamiento o curtosis. Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se
definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de


concentración medio alrededor de los valores centrale s de
la variable (el mismo que presenta una distribución
normal). Distribución leptocúrtica: presenta un elevado
grado de concentración alrededor de los valores centrales
de la variable. Distribución platicúrtica: presenta un
reducido grado de concentración alrededor de los valores centrales de la variable.
Skewness is a measure of the asymmetry of a distribution. This value can be positive or negative.

Negative skew indicates that the tail is on the left side of the distribution, which extends towards more negative
values.

Positive skew indicates that the tail is on the right side of the distribution, which extends towards more positive
values.

A value of zero indicates that there is no skewness in the distribution at all, meaning the distribution is perfectly
symmetrical.

Kurtosis is a measure of whether or not a distribution is heavy-tailed or light-tailed relative to a normal distribution.

The kurtosis of a normal distribution is 3.

If a given distribution has a kurtosis less than 3, it is said to be playkurtic, which means it tends to produce fewer and
less extreme outliers than the normal distribution.

If a given distribution has a kurtosis greater than 3, it is said to be leptokurtic, which means it tends to produce more
outliers than the normal distribution.

Note: Some formulas (Fisher’s definition) subtract 3 from the kurtosis to make it easier to compare with the normal
distribution. Using this definition, a distribution would have kurtosis greater than a normal distribution if it had a
kurtosis value greater than 0.

También podría gustarte