Está en la página 1de 13

UNIDAD II: Medidas descriptivas

1. Medidas de posición de tendencia central


1.1. Media aritmética
1.1.1. Para datos sin agrupar
1.1.2. Para datos agrupados
1.1.3. Propiedades de la media aritmética
1.1.4 Media aritmética ponderada
1.2. Mediana
1.2.1. Mediana para datos sin agrupar
1.2.2. Mediana para datos agrupados.
1.3. Modo
1.4. Relaciones entre media, mediana y modo
1.5. Media cuadrática
2. Medidas de posición relativas - Fractiles
2.1. Cuartiles
2.2. Deciles
2.3. Percentiles

3. Medidas de dispersión
3.1. Medidas de dispersión absolutas
3.1.1. Rango o amplitud
3.1.2. Variancia
3.1.2.1. Para datos sin agrupar
3.1.2.2. Para datos agrupados
3.1.3. Desvío estándar
3.1.3.1. Para datos sin agrupar
3.1.3.1.1. En la población
3.1.3.1.2. En la muestra
3.1.3.2. Para datos agrupados
3.1.3.2.1. En la población
3.1.3.2.2. En la muestra
3.1.4. Desvío medio

3.1.5. Rango semi-intercuartílico

3.2. Medidas de dispersión relativas


3.2.1. Coeficiente de variación
3.2.1.1. Para la población
3.2.1.2. Para la muestra

4. Medidas de asimetría

5. Medida de curtosis

1
UNIDAD II: Medidas descriptivas
1. MEDIDAS DE POSICIÓN DE TENDENCIA CENTRAL

Una de las características que interesa de un conjunto, ya sea población o muestra, es el centro
del mismo. Hay varias medidas para este centro: la media aritmética, la mediana, el modo, la media
cuadrática, la media geométrica, la media armónica y cada una tiene méritos en responder ciertas
preguntas. La media aritmética, sin embargo, es la que usaremos más frecuentemente. Definiremos las
medidas para datos no agrupados y para datos agrupados en una distribución de frecuencias.
Los resultados obtenidos a partir de datos sin agrupar y agrupados pueden no ser los mismos, ya
que en los agrupados se asume que todos los valores pertenecientes a cada clase tienen valores iguales
al punto medio de la misma.

1.1. Media aritmética

Es el promedio de un conjunto de datos. La idea de media o promedio formaliza el concepto


intuitivo de punto de equilibrio de las observaciones. Es decir, es el punto medio del recorrido de la
variable según la cantidad y magnitud de los valores obtenidos.
A los efectos de aclarar la notación de las ecuaciones presentadas, la letra griega “mu” (µ )
representará a la media de una población y para expresar la media de una muestra se usará “equis raya”
~
x

1.1.1. Media aritmética para datos sin agrupar

Supongamos que x1, x2, x3,… xn, son los resultados numéricos obtenidos de una muestra de
tamaño n. La media aritmética del conjunto de los n valores observados no agrupados será:

~ x + x2 +...... + xn n
x
x = 1 =∑ i (II.1)
n i =1 n

1.1.2. Media aritmética para los datos agrupados

Si los datos se encuentran agrupados en una tabla de distribución de frecuencias, podemos


obtener una media aritmética aproximada a través de la siguiente expresión, donde xi representa el
punto medio de cada clase y fi es la frecuencia absoluta de cada clase.

~ f x + f 2 x 2 + ...... + f k x k ∑f x i i k
f i xi
x= 1 1 = i =1
k
=∑ (II.2)
n n
∑ fi
i =1
i =1

2
1.1.3. Propiedades de la media aritmética

1.1.3.a) La interpretación de la media como centro (o punto de equilibrio) de los datos se apoya
en una propiedad que afirma que “la suma de las desviaciones entre cada valor observado y su media
aritmética es igual a cero”, cualquiera sea su distribución.

Supongamos la siguiente serie: x1, x2, x3, x4, x5. Los desvíos de esta serie con respecto a la media
son:
d1 = x1 - ~
x
d2 = x2 - ~
x
d3 = x3 - ~
x
d4 = x4 - ~x
d5 = x5 - x~
5

∑d i = ( x1 −~
x ) + ( x2 − ~
x ) + ( x3 − ~
x ) + ( x4 − ~
x ) + ( x5 − ~
x) =
i =1

x1 + x2 + x3 + x4 + x5 − 5~
x

Como sabemos que:


~ x + x2 + x3 + x4 + x5
x= 1 ∴ 5~
x = x1 + x2 + x3 + x4 + x5
5

Reemplazando:
5

∑d i = 5~
x − 5~
x =0
i =1

Genéricamente esta propiedad será:

∑( x
i =1
i −~
x) = 0 (II.3)

para datos agrupados:

∑ f (x i i −~
x) =0 (II.4)
i =1

1.1.3.b) Dado que en el cálculo de la media aritmética intervienen todos los valores de la serie,
este promedio es muy sensible a la presencia de valores extremos en la distribución en cuestión.
Cuando en un grupo de datos hay algunos valores bastante diferentes del resto, ya sean muy pequeños
o bien muy grandes, la media se ve afectada (“arrastrada”) por estos datos que se alejan fuertemente y
se distorsiona como valor representativo, dejando de ser una buena medida de tendencia central.
1.1.3.c) La suma de los cuadrados de las desviaciones entre cada valor observado y su
media aritmética es un mínimo. Es decir que siempre será menor o a lo sumo igual que la suma de
los cuadrados de los desvíos tomados con respecto a cualquier otro valor.

n n
x ) 2 ≤ ∑ ( x − A) 2
∑ ( x −~ (II.5)
i =1 i i =1 i

k k

∑ f ( x − ~x ) ≤ ∑ f ( x − A)
2 2

i =1
i i
i =1
i i (II.6)

3
1.1.3.d) La media aritmética de una variable multiplicada por una constante, es igual a la
constante multiplicada por la media de la variable.

Si xi = k yi para i=1,…..,n, entonces:

∑ky i n
yi (II.7)
~
x= i =1
= k∑ =k~
y
n i =1 n

1.1.3.e) Si n1 valores observados tienen media ~ x1 , n2 valores observados tienen media a ~


x 2 ...,
~
nk valores a x k , entonces la media de todos los valores observados es:

~ n~x + n2 ~x2 +.... + nk ~


xk
x = 1 1 (II.8)
n1 + n2 +... + nk

es decir, una media ponderada de todas las medias. Por supuesto que los valores deberán estar
expresados en el mismo sistema de unidades.

1.1.4. Media aritmética ponderada

A veces se asocia a los valores x1, x2, x3, …….. xn ciertos factores o pesos w1, w2, w3 ……. wn,
que dependen de la importancia o significación de cada uno de los números. En este caso:
n

~ w x + w2 x2 + w3 x3 .... + wn xn ∑w x i i
x= 1 1 = i =1
(II.9)
w1 + w2 + ....... + wn n

∑wi
i =1

Esta expresión recibe el nombre de media aritmética ponderada. Nótese que la media
aritmética para los datos agrupados (fórmula II.2), puede considerarse como una media aritmética
ponderada donde las ponderaciones son: f1, f2, f3 ….fk.
k

∑fx i i k
f i xi
~
x= i =1
k
=∑ (II.9 bis)
n

i =1
fi i =1

1.2. Mediana

La mediana, a diferencia de la media no es el valor central del recorrido de la variable según la


magnitud (cantidad) de observaciones, sino que es un valor que divide al conjunto en dos mitades
iguales, de manera que, dado un conjunto de n valores observados, ordenados de forma creciente o
decreciente, llamaremos mediana (Md) a aquel valor de la serie que deja a ambos lados igual cantidad
de observaciones. En general, estén ordenados o no, el 50% de los datos son menores o iguales a la
mediana y el 50% restante son mayores o iguales a la Md.

1.2.1. Mediana para datos sin agrupar

4
Supongamos que los valores observados son 20, 15, 17, 21, 13, 19, 11. Ordenados según su
magnitud resulta:
11, 13, 15, 17, 19, 20, 21.

Menores a Md Mayores a Md

Vemos que su Md es 17, ya que deja tres valores por debajo y tres por encima. En este caso la
mediana queda determinada sin ambigüedades.
En general el lugar que ocupa esta medida de tendencia central se determina mediante la
fórmula:
n +1
2 (II.10)

Cuando el número de valores es par, todo valor comprendido entre los que ocupan el lugar n/2 y
(n+2)/2 cumple la condición exigida. En este caso se toma como mediana la semisuma de los dos
valores centrales.

Si las observaciones ya ordenadas fueran 11, 13, 15, 17, 19, 20, el valor de la mediana sería
igual a 16.

1.2.2. Mediana para los datos agrupados

En el caso de variables discretas donde cada categoría es el valor de la variable, se puede tomar
como un caso de intervalo de amplitud 1 y en este caso el cálculo de la mediana funciona exactamente
como lo visto para datos sin agrupar. Esto vale también para el resto de las medidas que se verán en
esta sección (cuartiles, deciles y percentiles).
Cuando trabajamos con variables agrupadas por intervalos es imposible determinar con precisión
los valores que toman los datos, ya que esa información se ha perdido en privilegio del agrupamiento
en intervalos. Por lo tanto, en este caso, debemos buscar otro método para determinar el valor de la
mediana.
I) Cálculo a partir de la frecuencia relativa

Sabiendo que la mediana divide al conjunto de las observaciones en dos grupos iguales, es claro
que ella se ubicará en el intervalo donde las frecuencias relativas acumuladas alcanzan el valor 0,50.
El cálculo de la mediana se haría con la siguiente fórmula:

md = Li ,md + 0 , 50− Fri −1 ⋅wi (II.11)


 fri 

Es decir, la mediana sería el valor que resulta del siguiente conjunto de operaciones:

1°) Restarle a 0,50, el valor de la frecuencia relativa acumulada anterior al intervalo que
contiene el valor 0,50 (Fr i-1),
2°) dividir ese resultado por la frecuencia relativa del intervalo que contiene el valor 0,50 (fri),
3°) multiplicar ese resultado por la amplitud del intervalo que contiene al valor 0,50 (w), y
4°) sumarle a la cantidad así obtenida al valor que toma el límite inferior del intervalo que
contiene el valor 0,50 de la frecuencia relativa.

II) Cálculo a partir de frecuencias absolutas


n
La mediana se ubicará en el intervalo donde las frecuencias absolutas toman el valor , lo cual
2
es lo mismo que decir que la mediana de una distribución se ubicará en el intervalo en el cual la
frecuencia absoluta acumulada alcanza el 50% de los datos.

5
Por lo tanto la fórmula para calcular la mediana sería:
 n +1 
 −Fi −1 
md =Li ,md + 2 .wi (II.12)
 fi 
 
 

Es decir, la mediana sería el valor que resulta del siguiente conjunto de operaciones:
1°) Dividir el número de casos más uno entre 2 y a ese resultado restarle la frecuencia absoluta
acumulada hasta el intervalo anterior al que contiene al caso central (Fi-1),
2°) dividir ese resultado por la frecuencia absoluta del intervalo que contiene al caso central (f i)
3°) multiplicar ese resultado por la amplitud del intervalo que contiene al dato central (w), y
4°) sumarle a la cantidad así obtenida el valor que toma el límite inferior del intervalo que
contiene al caso central.

1.2.3. Propiedades de la mediana

1.2.3.a) Es poco sensible a las variaciones de los términos extremos. Puesto que es un valor que
se basa en la secuencia ordenada de las observaciones de un conjunto de datos, la existencia de algunos
valores extremos no afectará su valor. Por lo tanto si un conjunto contiene unos cuantos valores
extremos y un agregado muy alto de observaciones, la mediana podrá ser una medida de tendencia
central mucho más deseable que la media.
1.2.3.b) El número de las desviaciones positivas es igual al número de las desviaciones
negativas.

1.2.3.c) La mediana es un valor tal que, en una distribución de frecuencias, la frecuencia de los
valores que le son mayores es igual a la frecuencia de los valores que le son menores.-

1.3. Modo o Moda

En la práctica el valor modal o modo es definido como el valor de la característica observada


que se repite con mayor frecuencia. Si todos los valores son diferentes no hay modo.
No presenta dificultades individualizar el modo en el caso de variables cuantitativas discretas.
Por el contrario las cosas se complican cuando el fenómeno bajo estudio es continuo y está agrupado
en clases, ya que el modo variará según la amplitud de clase que se haya elegido para organizar la
distribución de frecuencias.

1.3.1. Modo de datos sin agrupar


Si la cantidad de datos fuera pequeña ya sea de naturaleza discreta o continua, una inspección
ocular del conjunto permitiría determinar el modo observando el valor que más se repite.
1.3.2. Modo de datos de variables discretas en tablas de frecuencias
Si los datos de variables discretas estuvieran agrupados de manera que cada clase fuera un valor
diferente de la variable, la clase que más frecuencia tenga será el modo del conjunto de datos.
1.3.3. Modo de datos de variables continuas, agrupados en tablas de frecuencias
La clase con la frecuencia más alta recibirá el nombre de clase modal y el valor del modo se
obtendrá mediante una fórmula de interpolación.
1.3.3.a) Cálculo a partir de la frecuencia relativa

6
 ∆1 
mo = Li ,mod +  .w
 (II.13)
 ∆2 + ∆2i 

El modo sería el valor que resulta del siguiente conjunto de operaciones:


1°) calcular ∆1: restarle a la frecuencia relativa de la clase modal el valor de la frecuencia relativa
del intervalo anterior. (El símbolo: ∆, es la letra “delta”, en general se utiliza para expresar
diferencias),
2°) calcular ∆2: restarle a la frecuencia relativa de la clase modal el valor de la frecuencia
relativa del intervalo posterior.
3°) dividir ∆1 por la suma de ambos valores.
4°) multiplicar ese resultado por la amplitud del intervalo.
5°) sumarle a la cantidad así obtenida el valor que toma el límite inferior del intervalo que
contiene el valor modal.
1.3.3.b) Cálculo a partir de la frecuencia absoluta

 ∆1 
mo = Li , modo +
 ∆ +∆ 
.w (II.14)
 1 2 

donde ∆1 y ∆2 están calculados con el mismo procedimiento pero tomando las frecuencias absolutas.

1.4. Relaciones entre media, mediana y moda


Obviamente, si todas las observaciones estuvieran concentradas en un solo valor de la variable,
media, mediana y moda coincidirían en el mismo. Si las observaciones se fueran distribuyendo en
forma simétrica, a la izquierda y a la derecha de ese valor central, media, mediana y modo seguirían
coincidiendo. Supongamos ahora que las observaciones de la parte izquierda se alejan del valor central
más que las observaciones de la parte derecha, generando una distribución asimétrica hacia la
izquierda. Dado que la media es la suma de los valores de las observaciones dividida por la cantidad
total de datos, su valor se correrá a la izquierda también y por el mismo motivo, la media será menor
que la mediana y ambas menor que la moda. En una distribución asimétrica a la derecha, la media, es
mayor que la mediana y que la moda.
Este corrimiento de la media se explica porque si tomamos un conjunto de datos cualquiera a los
cuales calculamos media, mediana y moda y agregamos un dato extremo y volvemos a calcular la
media, la mediana y la moda, veremos que la media puede variar notablemente, mientras que la
mediana y la moda permanecen más estables. Esta estabilidad les otorga una propiedad denominada
robustez estadística, característica de las medidas basadas en el orden – como la mediana. Las medidas
basadas en la suma – como la media – se ven más afectadas por las observaciones extremas y son, por
lo tanto, poco robustas.
Cuando las medidas de posición se calculan a partir del conjunto total de observaciones que
conforman la población serán calculadas con N (tamaño de la Población) y su identificación será a
través de μ para la media y de Md y Mo para la mediana y modo respectivamente.

1.5. Media cuadrática


La media cuadrática de una serie de observaciones es la raíz cuadrada del promedio de los datos
al cuadrado. Para datos muestrales se calcula a través de la siguiente expresión:

7
n

2
x1 + x + ....... + x
2 2 ∑x 2
i
(II.15)
mc = 2
= n i =1
n n

Este tipo de promedio se usa frecuentemente en silvicultura para calcular el diámetro medio
cuadrático de una masa forestal.

2. MEDIDAS DE POSICIÓN RELATIVAS


2.1. Cuartiles
La mediana, como vimos separa en dos mitades el conjunto ordenado de observaciones, sea este
conjunto la población o una muestra. Podemos aún dividir cada mitad en dos de tal manera que
resulten cuatro partes iguales. Los límites de cada una de esas cuartas partes de n son los cuartiles,
identificados con la letra Q más un subíndice según a cual de los tres cuartiles nos estemos refiriendo.
Se llama primer cuartil Q1 a la mediana de la mitad que contiene los datos más pequeños. Este
cuartil es un valor mayor o igual al 25% de los datos y menor o igual al 75% restante.
Se llama tercer cuartil Q3 a la mediana de la mitad formada por las observaciones más grandes.
Este cuartil es un valor mayor o igual al 75% de los datos y menor o igual al 25% restante.
La mediana es el segundo cuartil Q2.
2.1.1. Cuartiles para datos sin agrupar
El primer cuartil, en caso de que n sea impar será:
Q1 = x n +1
4
(II.16)
y en caso de que n sea par será:
x n  + x n +2 
   
Q1 = 4  4  (II.17)
2
El tercer cuartil, en caso de que n sea impar será:
Q3 = x
(
n +1
4
)⋅3 (II.18)

y en el caso de que n sea par será:


x n  + x n +2 
 ⋅3 ⋅3
Q3 = 4

 4  (II.19)
2

2.1.2. Cuartiles para datos agrupados


Son obtenidos de manera análoga a la mediana, con las salvedades correspondientes.
2.1.2.a) Cálculo a partir de las frecuencias relativas

 0 , 25 −Fri −1
Q1 =Li ,Q +

 f ri


. w

(II.20)  0 , 75 −Fri −1
Q3 =Li ,Q3 +
 f ri


. w (II.21)
 

8
2.1.2.b) Cálculo a partir de las frecuencias absolutas

 n +1 
 −Fi −1 
Q1 =Li ,Q1 + 4 .w (II.22)
 f 
 i

 

 n +1 
 .3 −Fi −1 
Q3 =Li , Q3 + 4 .w (II.23)
 fi 
 
 

2.2. Deciles
Los deciles son valores que resultan de dividir la población o la muestra en diez partes iguales,
de manera que en cada una se encuentra el 10% de los datos. Hay 9 deciles de interés: D 1, D2, ….., D9,
que tienen interpretación y se obtienen de manera análoga a la mediana y los cuartiles. Ejemplos:

10% de los datos ≤ D1 ≤ 90% de los datos 40% de los datos ≤ D4 ≤ 60% de los datos

D5 = Q2 = Md 90% de los datos ≤ D9 ≤ 10% de los datos


Cálculo para datos agrupados
Genéricamente, el decil i-ésimo puede obtenerse con la siguiente expresión:

 n +1 
 .i −Fi −1 
Di =Li , Di + 10 .w (II.24)
 fi 
 
 

2.3. Percentiles
Los Percentiles son valores que resultan de dividir la población o la muestra en cien partes
iguales, de manera que en cada una se encuentra el 1% de los datos. Hay 99 percentiles de interés: P1,
P2, ….., P99, que tienen interpretación y se obtienen de manera análoga a la mediana, cuartiles y
deciles. Ejemplos:

8% de los datos ≤ P8 ≤ 92% de los datos 35% de los datos ≤ P35 ≤ 65% de los datos

P50 = D5 = Q2 = Md 95% de los datos ≤ P95 ≤ 5% de los datos


Cálculo para datos agrupados
Genéricamente, el Percentil i-ésimo puede obtenerse con la siguiente expresión:

 n +1 
 .i −Fi −1 
Pi =Li , Pi + 100 .w (II.25)
 fi 
 
 

3. MEDIDAS DE DISPERSION

Dado un conjunto de datos, estas medidas indican la variabilidad que existe entre ellos. Si todos
los datos fueran iguales, cualquiera de estas medidas serían cero.

9
La magnitud de las medidas de dispersión depende de la cercanía de los datos entre sí. Si los
datos son cercanos unos de otros, la magnitud de las medidas de dispersión será pequeña y grande en
caso contrario.

3.1. Medidas de dispersión absolutas

3.1.1. Rango (R) o Amplitud: es la medida de dispersión más fácil y sencilla de calcular. Resulta de la
diferencia entre xMAX y xMIN.
Cuando los datos están agrupados en una distribución de frecuencias el rango puede obtenerse
mediante la diferencia entre el límite superior del último intervalo y el límite inferior del primero.

R = xMAX - xMIN (II.26)

3.1.2. Variancia (σ 2): es el promedio de los cuadrados de los desvíos de cada observación respecto
de la media aritmética, por lo tanto mide el grado de dispersión que presentan los datos alrededor de la
misma. Algunas de sus características son:
a) σ 2 ≥ 0
b) Expresa la variabilidad en unidades cuadráticas respecto de las unidades de x.

Si el conjunto de datos es una población, la variancia poblacional está dada por la siguiente
expresión:

σ 2=Σ N
(x i - µ )2 (II.27)

N
Si esos mismos datos estuvieran agrupados en una tabla de distribución de frecuencias, podemos
calcular la variancia a través de:

σ 2 ≅ (Σ k fi xi2) - N (II.28)

µ 2
Donde xi representa el punto medio de cada clase y fi es la frecuencia absoluta de cada clase.

Si el conjunto de datos es una muestra, la variancia muestral está dada por la siguiente expresión:
n K

∑ ( xi − ~x ) 2 (∑ f i xi ) − n~ (II.29)
2
x2
S =
2 i=
∧S = 2 i =1
n −1 n −1

3.1.3 Desvío estándar (σ ): Es la raíz cuadrada de la variancia. Tiene las mismas propiedades que σ 2,
con la ventaja que expresa la variabilidad en las mismas unidades que x.
Sus expresiones poblacionales y muestrales son respectivamente:

(II.30)
σ = √σ 2 y S = √ S2

10
3.1.4 Desvío Medio (DM): Es el promedio de los valores absolutos de los desvíos de cada xi respecto
de la media. Para la población completa y datos sin agrupar, su expresión es:

(II.3 1)
DM = Σ N
| xi - µ |
N

3.1.5 Rango semi-intercuartílico (Q): si consideramos que en el intervalo Q1 hasta Q3 se encuentra el


50% de los datos centrales, esta medida expresa la mitad de la distancia entre ellos.
(II.32)
Q = (Q3- Q1) / 2
3.2. Medidas de dispersión relativas

3.2.1. Coeficiente de Variación (CV): relaciona la variabilidad absoluta de un conjunto de datos


respecto de su medida de tendencia central.
Podemos expresarlo en forma de proporción:

(II.33)
CV = σ /µ o cv = S / ~x
O en forma porcentual

(II.34)
CV % = (σ /µ ) 100 o cv % = (S / ~x ) 100

• No tiene unidades.
• Permite comparar la variabilidad de dos conjuntos de datos de naturaleza y/o dimensiones
diferentes.

4. MEDIDAS DE ASIMETRÍA

4.1. Sesgo. Grado de asimetría de la distribución de un conjunto de datos. Puede medirse a través de la
desigualdad de los valores medios.

4.1.1. Distribución simétrica: tiene la misma forma a ambos lados del eje central. La media, la
mediana y el modo se localizan al centro y son iguales.
~
x = M o = Md (II.35)

4.1.2. Distribución con asimetría positiva: La curva de frecuencias (polígono de frecuencias


suavizado) tiene una “cola” más larga a la derecha del máximo de la curva. La distribución está
sesgada a la derecha o tiene un sesgo positivo. En este caso la media aritmética es la mayor de las
medidas de tendencia central.

11
4.1.3. Distribución con asimetría negativa: La curva de frecuencias (polígono de frecuencias
suavizado) tiene una “cola” más larga a la izquierda del máximo de la curva. La distribución está
sesgada a la izquierda o tiene un sesgo negativo. La media aritmética es la menor de las medidas de
tendencia central.
A B C

A: distribución simétrica; B: distribución con asimetría positiva; C: distribución con asimetría negativa

4.2. Índice absoluto de asimetría. En esta expresión restamos de la media (promedio) el modo, o
aproximadamente 3 veces la diferencia entre la media y la mediana.

IA =~
x − M o ≅ 3( ~
x −M d ) (II.36)

4.3. Coeficiente de asimetría de Karl Pearson. Mide el grado de asimetría en relación al desvío
estándar.

(~
x − M o ) 3( ~
x − Md ) (II.37)
CA = ≅
S S

5. MEDIDA DE CURTOSIS

Una medida del grado de agudeza o apuntamiento de una curva de distribución es el Coeficiente
de curtosis.
a) Es un valor adimensional que sirve como medida del “pico” de una distribución.
b) Ofrece información sobre la forma de la distribución de la población o de la muestra con
que estemos trabajando.
c) Siempre se usa en comparación con la distribución normal.

5.1. Coeficiente de curtosis para datos sin agrupar

Para los datos sin agrupar de una población, el cálculo se realiza mediante la siguiente expresión:

(II.3 N 8)
[ ∑ ( xi − µ ) 4 / N ]
a4 = i =1

σ4
5.2. Coeficiente de curtosis para datos agrupados

Para los datos agrupados en una distribución de frecuencias este coeficiente se calcula mediante:
k
[ ∑ f i ( xi − µ ) 4 / N ] (II.39)
a4 = i =1

σ4

12
En el caso que se tratara de una muestra utilizaremos ~
x en reemplazo de µ y s2 en reemplazo de
σ 2.

• Si a4 = 3, la distribución se dice que es mesocúrtica. Los datos están centrados alrededor de


la media en forma similar a la distribución normal. (Figura A).
• Si a4 > 3, la distribución es leptocúrtica. Los datos están más concentrados alrededor de la
media que en una distribución normal. (Figura B).
• Si a4 < 3, la distribución es platicúrtica. Los datos están menos concentrados alrededor de la
media que en una distribución normal. (Figura C).

B
A C

13

También podría gustarte