Documentos de Académico
Documentos de Profesional
Documentos de Cultura
- En el caso de
la variables numéricas o que son medidos en escala de intervalo o
de razón, los intervalos o clases deben determinarse antes de que
se construya la distribución de frecuencias (este procedimiento es
válido tanto para el procesamiento manual de los datos como para
el procesamiento con ayuda de software).
En la determinación de los intervalos o clases no existe un número
establecido, en su construcción, por lo general se formulan entre 5
y 15. La construcción de los intervalos o clase de las variables
numéricas se pueden presentan los casos de variables discretas y
el de variables continúas:
Datos discretos: Cuando los datos son discretos y el rango de
variación es pequeño se efectúa la tabulación agrupándolos en
clases o puntos.
Ejemplo: La siguiente información corresponde al número de
hijos por familia en el asentamiento humano “Micaela Bastidas”
de la Provincia de Maynas, información obtenida por los
estudiantes del curso de estadística I-S-2005, se pide construir
una tabla de distribución de frecuencias.
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
5 3 6 2 1 5 4 2 1 3 5 3 2 1 6
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 4 3 2 1 4 3 1 4 2 3 1 5 6 4
0 0
2 5
TABLA Nº 02
ASENTAMIENTO HUMANO “MIACAELA BASTIDAS”-MAYNAS
NÚMERO DE HIJOS POR FAMILIA – 2005
Xi fi Fi F hi hi % H% H%
01 7 7 34 0.21 21 21 100
02 6 13 27 0.18 18 39 79
03 7 20 21 0.21 21 60 61
04 5 25 14 0.14 14 74 40
05 6 31 9 0.18 18 92 26
06 3 34 3 0.08 8 100 8
Total 34 1.00 100
Fuente: Datos obtenidos por estudiantes de estadística UNAP-2005
Interpretación:
X3: En la tercera clase se han agrupado a las familias que tienen
en promedio 3 hijos
f5: Existen 6 familias que tienen en promedio 5 hijos
h3%: El 21% de las familias del AAHH “Micaela Bastidas” tienen en
promedio 3 hijos.
Clases de Intervalos:
C = R/m
Entero Decimal
PAR PAR
E1 E1
E E = m (C + u) - R y/o
E E = C (m + 1) - R
E2 E2
E1 = E2 E1 = E2
Se selecciona el menor
IMPAR
E1 positivo
IMPAR
E1 E
E E2
E2 E1 E2
E1 E 2
1.15 1.50 1.65 1.45 1.04 1.63 1.55 1.58 1.60 1.63 1.45
1.27 1.49 1.68 1.20 1.62 1.35 1.47 1.58 1.36 1.40 1.39
1.69 1.63 1.55 1.58 1.10 1.63 1.45 1.27 1.49 1.68 1.20
1.62 1.35 1.47 1.58.
R = 0.65
m = 6
TABLA Nº 03
DISTRITO DE BELÉN- PROVINCIA DE MAYNAS
POBLADORES POR ESTATURA EN
METROS – 2005
X’i-1 -- X’i Xi fi F F hi hi % H H
% %
1.04 -- 1.09
2 2 37 0.05 5 5 100
1.15 5
1.15 -- 1.20
3 5 35 0.08 8 13 95
1.26 5
1.26 -- 1.31
5 10 32 0.14 14 27 87
1.37 5
1.37 -- 1.42
7 17 27 0.19 19 46 73
1.48 5
1.48 -- 1.53 9 26 20 0.24 24 70 54
1.59 5
1.59 -- 1.64
11 37 11 0.30 30 100 30
1.70 5
Total 37 1.00 100
Fuente:
Interpretación:
X5 : En la tercera clase se han agrupado a los pobladores que
tienen en promedio 1.415 mts. de estatura
f3 : Existen 05 pobladores que tienen una estatura promedio de
1.315 metros
F2 : Los pobladores del Distrito de Belén que tienen una estatura
inferior a 1.26 mts. Son 05.
F4 :27 pobladores del Distrito de Belén tienen estatura iguales o
superiores a 1.37 mts.
h6 :0.30 es la proporción de la muestral de pobladores del Distrito
de Belén que tienen estatura promedio de 1.645 mts.
h3 % : El 14% de la muestra de pobladores del Distrito de Belén
tienen estatura promedio de 1.315 mts.
H4%: De la muestra de pobladores del Distrito de Belén el 46%
tienen estatura menor de 1.48 mts.
H3 %: El 87% de la muestra de pobladores del Distrito de Belén
tienen estatura igual o superior a 1.26 mts.
Diagrama circular
GRÁFICO Nº 01
NIVEL DE AUTOESTIMA DE LOS ESTUDIANTES
UNIVESITARIOSDE LA UNAP-2005
Autoestima baja
23.0%
Autoestima alta
77.0%
Barras simples
GRÁFICO Nº 02
FACULTAD DE ENFERMERÍA UNAP
ESTUDIANTES POR NIVEL DE AUTOESTIMA – 2004.
100
%
80
77
60
40
20 23
0
Autoestima baja Autoestima alta
Nivel de autoestima
Fuente: Datos obtenidos por los estudiantes
TABLA Nº 04
FACULTAD DE ENFERMERÍA UNAP
ESTUDIANTES POR RENDIMIENTO ACADÉMICO SEGÚN NIVEL
DE AUTOESTIMA – 2004
Nivel de Autoestima
Rendimiento Total
Baja Alta
académico
n % N % n %
Muy bueno 1 0.7 4 2.6 5 3.3
Bueno 5 3.3 22 14.5 27 17.8
Regular 27 17.8 87 57.2 114 75.0
Malo 2 1.3 4 2.6 6 3.9
Total 35 23.0 117 77.0 152 100
Fuente: Elaborado por los estudiantes de enfermería IS-2004
Barras Compuestas
GRÁFICO Nº 03
FACULTAD DE ENFERMERÍA UNAP
ESTUDIANTES POR RENDIMIENTO ACADÉMICO SEGÚN
NIVEL DE AUTOESTIMA – 2005.
% E stu d ia n te s
100
87
80
60
40
27 Autoestim a
20 22
Baja
0 5 Alta
Muy bueno Bueno R egular M alo
Rendimiento académico
Barras Superpuestas
GRÁFICO Nº 04
FACULTAD DE ENFERMERÍA UNAP
ESTUDIANTES POR RENDIMIENTO ACADÉMICO SEGÚN NIVEL
DE AUTOESTIMA – 2005.
% E S T U D IA N T E S
100
80 81 76 67
90
80
70
60
50
40
30 33
Autoestima
20 24
20 19 Alta
10
0 Baja
Muy bueno Bueno Regular Malo
Rendimiento académico
10 -
8 –
6 –
4 –
2 –
Tallo Hojas
10 4
11 5 0
12 7 0 7 0
13 5 6 9 5
14 5 5 9 7 0 5 9 7
15 0 5 8 8 5 8 8
16 5 3 0 3 8 2 9 3 3 8 2
Periféricos lejanos
Periférico
Cercado superior
Bigote
QU
Caja
Mediana
QL
Bigote
Cercado inferior
MEDIDAS DE RESUMEN
Competencias:
resolución de problemas.
resolución de problemas.
y deformación.
2 MEDIDAS DE RESUMEN:
Después de construir tablas y gráficos, a partir de una colección de datos, se
requiere medidas más exactas. Las estadísticas de resumen proporcionan
medidas para describir un conjunto de datos.
MEDIA
La media o promedio aritmético de un conjunto de datos (X) es simplemente
la suma (X) dividida entre el número de observaciones (n), cuando se
obtiene de una muestra la media se representa por X y se obtiene de una
población se representa por . La media de la población ( ) es un
parámetro y se determina con el conjunto completo de las unidades de
observación (N) definida por el investigador, por ejemplo todos los docentes
de la provincia de Maynas, todas las escuelas primarias de la región de
Loreto, la media muestral (X), es un estadígrafo inferencial que se obtiene
de un subconjunto representativo de la población, preferentemente una
muestra aleatoria, de unidades de observación (n).
Características de la media:
Para un conjunto de observaciones o una distribución de frecuencias la
media aritmética es única.
La media aritmética de una constante C es la misma constante C.
La media aritmética cuando se modifica o cambia algún valor se afecta,
es decir que también cambia o se modifica.
Si a los valores de una variable en estudio (X), se le suma o se resta
una constante C, la media aritmética estará sumada o restada en la
constante C.
Si: Y=X+C Y = X + C
MEDIANA
La mediana (Me) es otra de las medidas de tendencia central, se define
como el valor medio en un conjunto de observaciones ordenadas
crecientemente o decrecientemente: el punto máximo del 50% de las
observaciones que caen en la parte inferior o el punto mínimo del otro 50%
de las observaciones que caen en la parte superior
La mediana puede determinarse para cualquier serie de datos que pueda
ordenarse, esto es que sólo se requiere una escala ordinal de medición.
Por ejemplo, en un salón de clase de educación secundaria, suponga que
los alumnos están clasificados por su rendimiento académico, cada
elemento de estudio tendrá un rango según las calificaciones obtenidas, la
mayor calificación obtenida por la mitad de los alumnos, representa la
mediana con respecto a esta escala.
Cuando n es muy pequeña, las observaciones pueden clasificarse
rápidamente, de modo que puede determinarse en forma sencilla. Cuando
n es muy grande, el proceso de determinar la mediana toma tiempo, en la
actualidad con la ayuda de software y las microcomputadoras el cálculo se
hace relativamente fácil. Ante la falta de modernización en nuestro medio
todavía incluiremos métodos aproximados para estimar la mediana de
distribuciones de frecuencia agrupadas.
Matemáticamente la mediana para una serie de datos se define como:
{
X .. . .. .. . .. . , n
n +1
2
es impar
Me=
X +X n
2
n
2
+1
. . .. , n es par
2
( )
n
− F k −1
Me =L. R . I . + 2
fk ck
Dónde:
L.R.I.: Limite real inferior de la clase mediana
F k – 1: Frecuencia acumulada ascendente anterior al de la clase mediana.
f k : Frecuencia simple correspondiente a la clase mediana.
C k : Amplitud del intervalo que pertenece a la clase mediana
n / 2 : Rango que determina la clase mediana.
Ventajas de la mediana:
La mediana no es una medida sensible como la media aritmética, es
decir no está afectada por valores extremos y por lo tanto es más
representativa que la media aritmética cuando los valores de la variable
en estudio tienen valores extremos o en distribuciones poco simétricas.
La mediana se calcula aún en tablas de distribución de frecuencias que
tienen extremos ilimitados.
Es la medida más adecuada cuando la variable pertenece a la escala
ordinal.
MODA
La moda es el valor de la variable que ocurre con más frecuencia, es decir
el valor más común o el más popular en una serie de datos o en una tabla
de distribución de frecuencias, la moda no siempre existe, existen series de
datos que tienen una sola moda (unimodal), dos modas (bimodal) y más de
dos modas (multimodal), es la medida de tendencia central que mejor
representa a las variables de escala nominal. La moda en una tabla de
distribución de frecuencias puede diferir marcadamente de la moda real,
así mismo la moda varía mucho de muestra a muestra y no puede
depender de dar una buena estimación de la moda de la población, si no
tenemos un tamaño de muestra grande.
La moda de una serie de datos es el valor de la variable que se presenta
en mayor número de veces.
El cálculo de la moda de datos agrupados en distribuciones de frecuencias
se obtiene teniendo presente lo siguiente:
Mo 1
(
Δ1
= L . R . I .+ Δ + Δ C K
2
)
Dónde:
Ventajas de la Moda
Al igual que la mediana no es una medida que pueda estar afectada por
valores extremos.
Su uso es el más adecuado cuando los datos están medidos en una
escala nominal.
El cálculo de la moda no depende de la magnitud de las observaciones,
por tanto permanece invariable si se incrementa o se varia el número de
ellas.
La moda no es una medida única, es decir un conjunto de datos puede
tener más de una moda.
Cuando existen más de dos modas en una distribución se hace difícil su
interpretación.
X ó Me ó Mo X Me Mo X Me Mo
MEDIA PONDERADA
Cuando se tienen algunos datos con mayor peso e importancia que otros por
ejemplo un examen final tiene más peso que el examen parcial, esto
conduce a determinar un promedio ponderado, esto también sucede cuando
se particionan en sub-muestras, conociéndose sus medias y tamaños
también se puede encontrar la media de toda la muestra sin conocer los
datos originales a lo que se le denomina media global, la importancia radica
en identificar la variable y luego el peso o tamaño de muestra; luego la media
ponderada o media global se define:
k
∑ X p
X̄
i i
i=1
p= k
∑ X i
i=1
k
∑ x̄ i ni
X̄ G=
i=1
k
∑ ni
i=1
PROMEDIO GEOMÉTRICO
Se define como la raíz n-ésima del producto de todas las observaciones de
la variable, es usada para promediar los datos que se encuentra medido en
una escala de razón. Carece de significado si alguno de los valores no
tiene valor o es negativo, es usado en datos que están en progresión
geométrica, en los números índices.
La media geométrica o promedio es empleada en la microbiología cuando
se quiere calcular títulos de disolución promedio, cantidades de
proporciones y cantidades en proporciones o tasas de crecimiento y
cuando es necesario realizar alguna transformación logarítmica.
La media geométrica se define para datos en serie (no agrupados) y para
datos de distribuciones de frecuencias (agrupados)
√∏ x
n
X̄ G =
n
¿ i¿
i=1
X̄ G = Antilogaritmo
1
∑
n i=1
log xi
(
n
)
Para datos en tablas de distribución de frecuencias (TDF)
√∏
k
X̄ x
n fi
G = ¿ i ¿
i=1
Empleado logaritmos: se tiene que es el antilogaritmo de la media
aritmética de los logaritmos de las marcas de clase ponderadas por las
frecuencias absolutas.
X̄ ( )
n
1
G = Antilogaritmo ∑
n i=1
xi log xi
PROMEDIO ARMONICO
Está definida como el inverso del promedio de una serie invertida de datos;
es utilizada para promediar fenómenos físicos cuyas unidades presentan:
razón inversa, razones de cambio (% o tasas), los valores de los datos
difieren significativamente y cuando la muestra es relativamente pequeña.
Así por ejemplo cuando se desea promediar velocidades de un automóvil
que recorre los primeros 10 Km., a 25 kph. Y las segundas a 55 kmh, a
simple inspección puede decirse que la velocidad media entre 25 y 55 es
40 kph, lo que está errado dado que en física se define como la distancia
total que recorre el móvil dividida entre el tiempo total que emplea en
recorrer tal distancia, operando se tiene que la velocidad media resulta
38.82 kph. Lo que se puede comprobar utilizando el promedio armónico.
El promedio armónico no tiene significado cuando alguno de los valores de
los datos es cero. Se define para datos en serie (no agrupados) y para
datos de distribuciones de frecuencias (agrupados)
X̄ H = n
n
1
; x ≠0 ,
i ∀i
∑
i=1
x i
X̄ =
n
; x ≠0 , ∀ i
(x ) f
H n i
1
∑ i
i=1
i
X XG XH
Q =X r r
4
( n + 1)
D =X r r
10
( n + 1)
P =X
r r
100
( n + 1)
X −X k +1 k
1
C r= X +( X
k k +1− X ) Fracción
k
C r
k
=L . R . I +
( (r k ) n
f
−
j
F j −1
) C j
Dónde:
L.R.I.: Limite real inferior de la clase cuantil
r=k-1
Cuartiles:
Q =L . R . I
r +
( (r 4 ) n
f
−
j
F j−1
) C j
Deciles
D =L . R . I
r +
( (r 10 ) n
f
−
j
F j −1
) C j
Percentiles
P =L . R . I
r +
( (r 100 ) n
f
−
j
F j−1
) C j
INTRODUCCIÓN
Las medidas descriptivas que se acaban de estudiar han estado referidas a
describir un método básico para describir un conjunto de datos como los
promedios que resumen los valores de una variable a un solo valor, existen
medidas estadísticas que muestran la variación de los datos alrededor del
promedio tan importante como el mismo promedio, que se denominan
medidas de dispersión o concentración. Por ejemplo, si tomamos en cuenta
dos grupos de alumnos de dos diferentes secciones A y B que tienen el
mismo promedio en las calificaciones por alumno. Esto podría interpretarse
como que las calificaciones en las dos secciones es la misma, lo que sería
erróneo dado que puede ser que en una de las secciones por ejemplo en A
las calificaciones fuera estabilizada en el sentido que todos los alumnos
tuviesen aproximadamente la misma calificación y en la sección B la
mayoría de los alumnos tengan calificaciones bajas y pocos tengan
calificaciones altas, de esta manera se pude concluir que una medida de
tendencia central de una distribución no es suficiente para un análisis
descriptivo de una distribución.
DEFINICIÓN
Las medidas de dispersión o concentración son magnitudes que miden el
grado de dispersión o concentración de los valores de una variable con
respecto a un valor de una medida de tendencia central; son dos los
propósitos fundamentales de las medidas de dispersión: 1ª. La confiabilidad
de los promedios y, 2ª Control de la variación de los valores de la variable.
Por lo general se puede hablar indistintamente de concentración y de
dispersión.
Las medidas de dispersión de uso más frecuente son: Recorrido o rango,
recorrido intercuantílico, recorrido semi-intercuantílico, desviación media,
varianza, desviación estándar y coeficiente de variación.
R. I. P. = P 90 - P 10
{
∑ ( x i− x̄ )
2
, Datos en serie
n
S=
2
∑ ( x i− x̄ ) f
2
i
, Datos en distribuciones
n de frecuencias
VARIANZA DE COCHRAN
Conocida como varianza de la muestra, es usada cuando n es pequeña ( n
30 ), algunos software estadísticos y calculadoras de bolsillo lo
consideran como varianza muestral y a la varianza ordinaria como
varianza poblacional
{
∑ ( x i − x̄ )
2
, Datos en serie
S= n−1
2
∑ ( x i − x̄ ) f
2
i
, Datos en distribuciones
n−1 de frecuencias
La concentración o dispersión de los valores de la variable van ha
depender de la magnitud de la varianza así cuanto mayor sea la varianza
los valores de la varianza se encontraran más dispersos con respecto a la
media aritmética y cuanto menor sea ésta los valores de la variable
estarán más concentrados alrededor de la media aritmética.
{ {∑ x f }
k
x̄
2 2
1
i i− n ; Si n> 30
S= n
2 i=1
{∑ x f }
k
x̄
2 2
1
i i− n si n≤30
n−1 i=1
CARACTERÍSTICAS DE LA VARIANZA
1º. La varianza de una constante es cero
2ª. La varianza de una constante multiplicada por una variable es la
constante al cuadrado por la varianza de la variable.
3ª. Si a una variable se le suma o se le resta una constante la varianza de
la variable no varía.
VARIANZA GLOBAL
Cuando se tiene una muestra particionada en sub-muestras cada una con
un tamaño y media aritmética determinada; y se quiere determinar su
varianza, a la que se denomina varianza global o total, no es necesario
conocer los valores de todos y cada una de las observaciones, basta
conocer la media, varianza y el tamaño de cada una de las sub-muestras:
( )
k 2
k
∑ ni ( s i + x̄ i )
2 2
∑n i
x̄ i
S
2
i =1 i=1
G= −
n
n
DESVIACIÓN ESTANDAR (TÍPICA)
La desviación estándar o típica está dada por la raíz cuadrada positiva de
la varianza, como medida de dispersión es más usada que la varianza, por
la razón de que la varianza tiene como unidades el cuadrado de las
unidades originales y al tomar la raíz cuadrada tendremos una medida de
dispersión en unidades originales, la desviación estándar se designa por
(S).
√s
2
S=
COEFICIENTE DE VARIACIÓN (CV.)
Es una medida de variabilidad o de dispersión relativa que generalmente
se presenta en porcentajes, también se le conoce como coeficiente de
variabilidad, se encuentra dado por el cociente o razón entre la
desviación estándar y la media aritmética:
S
C . V .= x 100
x̄
Cuando es necesario comparar la variabilidad de dos ó más conjuntos de
datos en serie o en distribuciones de frecuencias en cuanto a las
variables del estudio se tiene que:
Si sus medias aritméticas son aproximadamente iguales o iguales y
además están expresadas en las mismas unidades de medida, entonces
la serie de datos o distribución de frecuencias que tiene la mínima
desviación estándar o varianza es la más homogénea y la de máxima
desviación estándar o varianza la más heterogénea.
Si tenemos como resultado medias aritméticas diferentes pero sus
desviaciones estándar o varianzas resultan aproximadamente iguales o
iguales y además están expresadas en las mismas unidades de medida,
entonces la serie de datos o distribución de frecuencias que tiene la
mayor media aritmética es mejor que la de menor desviación estándar o
varianza.
Si al determinar las medidas de resumen determinamos que las medias
aritméticas y las desviaciones estándar difieren marcadamente y
además están expresadas en diferentes unidades de medida, entonces
la serie de datos o distribución de frecuencias que tiene el menor
coeficiente de variación es la que tiene menor dispersión relativa o es
más homogénea y la de mayor coeficiente de variación es la
heterogénea.
Esto nos dice que cuando las medias aritméticas y desviaciones estándar
no son iguales o aproximadamente iguales y las series de datos o
distribuciones de frecuencias que se están comparando presentan
distintas unidades de medida es imperativo el uso del coeficiente de
variación como medida relativa de dispersión
Cuando se trata del estudio de una sola serie de datos o una distribución
de frecuencias, en la práctica se dice que un coeficiente de variación
mayor que el 50% indica un alto grado de dispersión y como
consecuencia de ello la media aritmética no es muy representativa de la
población, para valores inferiores al 50% y más cercanos a cero la media
aritmética será tanto más representativa.
MEDIDAS DE ASIMETRÍA
Son medidas que indican el grado de deformación horizontal o la
inclinación de la distribución de datos con respecto a un eje vertical que
pase por la mediana, la curva normal se toma como referencia para
establecer la deformación horizontal, dado que la curva normal es
simétrica y se caracteriza porque en ella la media aritmética es igual o
aproximadamente igual a la mediana y a la moda respectivamente ( X =
ó ≈ Md = ó ≈ Mo), las distribuciones que no poseen estas características
no son simétricas y se dice que tienen asimetría y esta puede ser positiva
o negativa según sea el valor del coeficiente de asimetría que es una
medida cuantitativa del grado de deformación horizontal de la distribución
de los datos:
CAS 1=
3 ( x̄ − Md )
s
x̄ − Mo
CAS 2=
s
Tercer coeficiente de asimetría o media asimétrica: (CAS3 )
Fue formulado por Arthur Boeley es un coeficiente basado en los
cuarteles y se utiliza en distribuciones de frecuencias (tablas) en donde
no es posible determinar la media aritmética y consecuentemente la
desviación estándar es decir en distribuciones de frecuencias con
intervalos de clase con extremos ilimitados, su formula es:
Q3 +Q1 − 2 Q 2
CAS 3 =
Q 3 −Q1
Cuarto coeficiente de asimetría o media asimétrica: (CAS4)
Es parecido al tercer coeficiente de asimetría pero se basa en los
percentiles y se usa en los mismos casos y su formula es:
CAS = ó 0
Coeficiente de curtosis.
Es una medida cuantitativa del grado de deformación vertical de una
distribución, se denota por Ck y se define como:
Q 3− Q 1
Ck =
2 ( P 90 − P10 )
0 ⅛ ¼ ⅜ ½
Platicúrtica Mesocúrtica Leptocúrtica
MOMENTOS
Al describir otros aspectos importantes de una serie de datos o una
distribución de frecuencias se hacen uso de los Momentos, estos se
definen como promedios de distintas potencias de las desviaciones de los
valores de los datos con respecto a algún valor B, la teoría de los
momentos fue dada por PEARSON, quien derivó su nombre debido a su
semejanza con la teoría de los momentos que se estudia en Mecánica,
de acuerdo a su definición existen n momentos, pero los que se utilizan
son los cuatro primeros momentos:
{
n
1
' n
∑xr i ; Datos en serie
m = M (X) =
r i=1
r 1
n
n
∑ x r fi ;
i=1
i Datos en distribución de frecuencias
r = 0, 1, 2, 3, ……
n
1
m
'
0 ¿
n
∑x0=1
i=1
i ; si x ≠ 0 ; ∀ i
i
n
1
m
'
0 ¿
n
∑ x 0 fi = 1 ;
i=1
i si x i ≠ 0 ; ∀ i
n
1
m
'
1 ¿
n
∑ x 1 = x̄
i=1
i ; Media aritmética
n
1
m
'
1 ¿
n
∑ x 1 fi = x̄ ;
i=1
i Media aritmética
Segundo Momento con respecto al origen: Para datos en serie
(sin agrupar)
n
1
m
'
2 ¿
n
∑x2
i=1
i
n
1
m
'
2 ¿
n
∑ x 2 fi
i=1
i
n
1
m
'
3 ¿
n
∑x3
i=1
i
n
1
m
'
2 ¿
n
∑ x 2 fi
i=1
i
{
1
n
∑ ( x − X̄ )
r
m = M [ ( X − X̄¯ ) ] =
r Datos en serie
n
i
r 1
n
i=1
n
∑ ( x i − X̄ )r Datos en distribución de frecuencias
i =1
r = 0, 1, 2, 3, ……
n i =1
μ3
CAS = 3
S , donde 3 = m3
Si existen valores de datos muy altos en comparación de la media
aritmética, el coeficiente de asimetría tendría un valor positivo y la
serie de datos o la distribución de frecuencias sería segada hacia
la derecha, en cambio sí que existen valores de datos muy
pequeños en relación a la media aritmética, el coeficiente de
asimetría sería negativo y la serie de datos estaría sesgada hacia
la izquierda y finalmente si los valores de los datos estuvieran
distribuidas casi aproximadamente en forma simétrica alrededor
de la media aritmética, el coeficiente se aproximará a cero y
tendríamos:
μ = ∫ ( xi − X̄ ) f ( x ) dx
4
4
μ4
k= 4
σ
Dado que en la distribución normal la curtosis tiende o es igual a 3
entonces el coeficiente de curtosis estandarizado es:
μ4
k= 4 − 3
σ
Si k se acerca o tiende a cero por la derecha o por la izquierda
entonces la distribución es Mesocúrtica, moderada o normal.
Si k se hace más pequeña negativamente (se aleja de cero
negativamente) la distribución será Platicúrtica.
Si k se hace más grande (se aleja de cero positivamente) la
distribución será Leptocúrtica.
Su uso queda condicionado al tamaño de la muestra, esto es de que si la
muestra no es grande su uso es poco recomendable