Está en la página 1de 22

MEDIDAD DE TENDENCIA CENTRAL

GENERALIDADES.

En una distribución de frecuencias se observan diferentes características que tienen relación


con el comportamiento de las variables. Una de las primeras observaciones se refieren a la
ubicación o posición de los datos alrededor de un valor central; así en las distribuciones de
frecuencias pueden existir diferentes valores centrales para la misma forma de distribución, o
también un solo valor central para diferentes formas de distribución. La importancia de estas
características condice en general a la determinación de promedios o estadígrafos de posición.

Estos estadígrafos localizan el centro de la distribución de frecuencias, por esto se denominan


también estadígrafos de posición o de localización, como por ejemplo: media aritmética,
media armónica, media geométrica, moda, mediana, cuartiles, etc.

MEDIA ARITMETICA.

Llamado también promedio aritmético, es un estadígrafo que localiza el centro de la


distribución en base al centro de gravedad y se obtiene a partir del siguiente razonamiento:

 3+ 4+5
Sean las notas de un alumno: 3, 4, 5 entonces el promedio será: x = =4
3
i=k

x i
Luego se puede decir que: x = i =1

Para datos agrupados donde x1, x2, ......., xk son las marcas de clase y f1, f2, ......., fk las
frecuencias absolutas k, el numero de clases, entonces:
i=k

x i fi
x= i =1

N
Ejemplo: Supongamos que la siguiente distribución de frecuencias corresponde a una
encuesta del numero ovejas que posee cada familia en una comunidad de 30 habitantes.

Clases fi xi xifi
[10 - 26> 4 18 72
[26 - 42> 12 34 408
[42 - 58> 7 50 350
[58 - 74> 4 66 264
[74 - 90> 2 82 164
[90 - 106| 1 98 98
30 1356

1
i =k

x1356 i fi
Donde: x = i =1
;x =
= 45,2  45
N 30
Donde el promedio de ovejas es de 45 en una comunidad de 30 habitantes.

PROPIEDADES DE LA MEDIA ARITMÉTICA:

1.- La media aritmética de una constante es la misma constante.


C =C

2.- Si a todos los datos le sumamos (o restamos) una constante, la media aritmética de esta
serie es la misma sumada(o restada) por la constante.¨
f1 + f 2 + ...... + f n  C  x  C

3.- Si a todas los datos los multiplicamos (o dividimos) por una constante c, distinta de cero ,
su media queda multiplicada o dividida por dicha constante.
( f 1 + f 2 + ...... + f n )(*o /)C  x (*o /)C
4.- La suma de los desvíos respecto de la media aritmética es siempre igual a cero.

i =m

 (x
i =1
i − x) fi = 0

Donde m es el tamaño del intervalo de clase


5.- La suma de los desvíos cuadráticos respecto de un origen de trabajo, es mínimo si este
origen es la media aritmética.

i =m

 (x
i =1
i − A) 2 f i = 0 si A= x

Donde m es el tamaño del intervalo de clase.

METODO CORTO:

Tomando la segunda propiedad de la media aritmética se tiene:

Si las marcas de clase Xi son remplazados por una constante di entonces la media aritmética
seria igual a:
i =k

d i fi
x= i =1
+ A donde: A es la frecuencia absoluta de clase central o también llamado de
N
trabajo.
Donde: di es una desviación de variación del ancho del intervalo de clase(w).

2
Por otro lado si ui es una desviación de variación unitaria se tiene:
i =k

u i fi
x=w i =1
+A
N

Ejemplo:

Clase fi xi xifi di difi ui uifi


[10 - 26> 4 18 72 -32 -128 -2 -8
[26 - 42> 12 34 408 -16 -192 -1 -12
[42 - 58> 7 50 350 0 0 0 0
[58 - 74> 4 66 264 16 64 1 4
[74 - 90> 2 82 164 32 64 2 4
[90 - 106| 1 98 98 48 48 3 3
30 1356 -144 -9

− 144
Para el primer caso el promedio será: x = + 50 = 45,2 ; Para el segundo caso será:
30
−9
x = 16 + 50 = 45,2
30

MEDIA PODERADA.

Se entiende por media ponderada, la media aritmética de n medias muestrales.

x1 + x2 + ..... + xn
x1 , x2 ,...., xn  X =
n

MEDIA ARMONICA:

La media armónica H de un conjunto de n números x1, x2, ........xn; es el reciproco de la media


aritmética de los recíprocos de los números.

i =k
1 N 1 1 1
H= i =k
1
= i =k
1
ó = x Para datos simples.
 
H N i =1 i

i =1 xi i =1 xi

N
Ejemplo:
3 3
La media harmónica de 2, 4, 8 es: H = = 3 = 3,42857
1 1 1 7
+ +
2 4 8

3
i =k
1 N 1 1 fi
H= i =k
fi
= i =k
fi
ó = x Para datos agrupados.
 
H N i =1 i

i =1 xi i =1 xi

N
Ejemplo:

Determinar el tiempo promedio empleado en la producción por articulo de cuarenta obreros.

Minutos Nº de
por obreros
Articulo
xi fi
10 5
15 20
16 10
20 5
40

40 10
H= = 14 = 14,7692
5 20 10 5 13
+ + +
10 15 16 20

MEDIA GEOMÉTRICA:
La media geométrica G de un conjunto de N números x 1, x2, ...... , xn es la raíz N-esima del
producto de los n números:
i =k
G = N xi x 2 ...x n = N  xi Ejemplo: La media geométrica de: 2, 4, 8 es: G = 3 2 x 4 x8 = 4
i =1
i =k

 Logx i
Utilizando logaritmos seria: log G = i =1

N
Ejemplo2:
Calcular el crecimiento promedio porcentual de producción de estaño según el siguiente
cuadro:

Año Producción % de la producción


En TMF respecto al año anterior.
Log xi
Xi
1972 6.031 - -
1973 6.650 10,2636 1,011299718
1974 6.897 3,7143 0,569876978
1975 7.366 6,8000 0,832508912
1976 8.876 20,4996 1,311745387
3,725430995

4
3.725430995
LogG = = 0,9313577488  G = AntiLog (0,9313577588 ) = 8.538031
4
Respuesta: EL crecimiento porcentual promedio anual de estaño es 8,54%
i =k

f i log xi
Para datos agrupados seria: G = utilizando logaritmos: log G = i =1
N f11 f 22 fnk
x x
1 2 ...x k
N
La media geométrica tiene algunos inconvenientes como por ejemplo si algún x i es igual “0”
entonces G=0 ó si algún xi es negativo entonces G es imaginario, luego es preciso buscar una
forma diferente de calcular la media geométrica:

Luego:

Sean los % de los


datos datos
observados xi
Co -
C1 C1/Co
C2 C2/C1
: :
: :
Cn Cn/C n-1
C1 C 2 C n C
G=N . ...  G = N n ; pero la variación porcentual es: 1-G=r luego: G=r+1
C O C1 C n −1 Co
entonces remplazando este valor en la anterior
C C
formula: r + 1 = N n  (r + 1) n = n  C n = C o (1 + r ) N esta última función es muy utilizada
Co Co
para cálculos de crecimiento de población o la tasa de interés compuesto.

MODA:
La moda de una serie estadística es la frecuencia más alta de la serie estadística o dicho de otra
manera es el valor más frecuente.
Ejemplo:

20, 40, 30, 40, 50, 110, 20, 50, 40, 15 donde la moda de esta serie es: Mo=40.

A) Si la distribución de frecuencias tiene un solo máximo, se dice que la distribución es


unimodal

B) Si la distribución de frecuencias tiene más de un máximo, se dice que la distribución es


multimodal, bimodal, trimodal, etc.

5
C) Si todas las frecuencias son iguales se dice que la distribución no tiene moda y se trata
de una distribución uniforme:

Para datos agrupados la determinación de la definición de la moda se puede hacer de forma


geométrica así:

Mo=Moda
Lo=Limite real inferior de
la clase modal.
no=Frecuencia absoluta de
la clase modal.
f1=Frecuencia absoluta
anterior a la clase modal.
f2=Frecuencia absoluta
posterior a la clase modal.
w=Amplitud o ancho del
intervalo de clase.

Lo Mo (Lo+w+Mo)

EF EG M − L0 L0 + w − M 0 M − L0 L0 + w − M 0 1
=  0 =  0 =  M 0 = LO + w
AB DC f 0 − f1 f0 − f2 1 2 1 +  2

Ejemplo:
1
Intervalos Universitar M 0 = LO + w.
ios 1 +  2
fi 20
M 0 = 50 + 10 = 52 ,86  53
20 - 30 10 20 + 50
30 – 40 20
40 – 50 40
50 – 60 60
60 – 70 10
70 - 80 5
Total 145

6
MEDIANA:

Es un estadígrafo que localiza el “Centro” de la distribución en base a la posición media o


central que ocupa, un ves ordenados o clasificados los datos, como se ve en el siguiente
ejemplo:

2, 7, 10, 5, 12  2, 5, 7, 10, 12 luego la mediana es 7.


7 + 10
Si la serie fuera par entonces la media sería: 2, 5, 7, 10, 12, 16  = 8,5
2
La media para datos agrupados seria:
Me=Mediana
L j-1=Limite real inferior de la
clase que contiene la
mediana.
Lj =Limite real superior de la
clase que contiene la
mediana.
F j-1 =La frecuencia
acumulada que corresponde a
x j-1.
F j = La frecuencia
acumulada que corresponde a
fj.
N/2 = La mitad de la
frecuencia total.
w = El ancho de intervalo de
clase.

N
Me − L Me − L − F j −1
AB AC j −1 w j −1 w 2
=  =  =  Me = L j −1 + w
BD CE N F j − F j −1 N fj fj
− F j −1 − F j −1
2 2
Ejemplo:
N
Edades Xi Univ. Fi − F j −1
Me = L j −1 + 2
15 – 19 17 5 5 w
fj
20 – 24 22 10 15
25 – 29 50
27 20 35 − 15
30 – 34 32 10 45 Me = 24 ,5 + 2 5 = 27
35 – 40 37 5 50 20
Total 50

FRACTILES:

El concepto de la mediana puede extenderse a otros estadígrafos conocidos como cuartiles,


deciles, percentiles, etc. Es decir que si la mediana divide en dos partes iguales la distribución

7
de frecuencias, entonces es posible dividirla también en cuatro partes iguales (cuartiles), o en
diez partes iguales(deciles), o cien partes iguales(percentiles), y así sucesivamente.

Por tanto la formulas serian:

N
(n) − F j −1
Cuartil: Me = L j −1 + 4 w Donde n indica la posición
fj del fractil.

N
(n) − F j −1
Decil: Me = L j −1 + 10 w
fj

N
(n) − F j −1
Percentil: Me = L j −1 + 100 w
fj

CUARTILES

Son los que dividen la serie o el histograma de frecuencias en cuatro partes iguales.
Son los valores de la variable que dividen en cuartos a los datos ordenados; cada conjunto de
datos posee tres cuartiles. El primer cuartil Q1, es el número tal que cuando mucho el 25 % de
los datos es menor en valor que Q1 y cuando mucho el 75% de de los datos es mayor que Q1.
El segundo cuartil es la mediana. El tercer cuartil, Q3, es el número tal que cuando mucho el
75% de los datos es menor en valor que Q3 y cuando mucho el 25% de datos es mayor que
Q3. (Según el cuadro siguiente)
Datos clasificados en orden creciente
25% 25% 25% 25%

Q1 Q2 Q3
N
(n) − F j −1
Q1 = L j −1 + 4 w
fj

Siendo:

Frecuencia del cuartil uno


Suma de todas las frecuencias anteriores a la clase del primer cuartil
w ═Tamaño de clase del primer cuartil
Limite inferior de la clase del primer cuartil

8
N
(2) − F j −1
Q2 = L j −1 + 4 w ; El cuartil dos coincide con la mediana, ya que
f2

N
(3) − F j −1
Q3 = L j −1 + 4 w
f3
QUINTILES
Son los que dividen una serie o un histograma de frecuencias en cinco partes iguales se denota
por “T”
N   2N   3N   4N 
 5 − F j −1   5 2 − F j −1   5 3 − F j −1   5 4 − F j −1 
T1 = Li +   w j ; T2 = Li +   w j ; T3 = Li +   w j ; T4 = Li +  w j
 f r1   f r2   fr3   f r4 
       

DECILES
Son los que dividen una serie o un histograma de frecuencias en diez partes iguales se denota
por “D”

N   2N   5N 
 10 − F j −1   10 2 − F j −1   10 5 − F j −1 
D1 = L1 +   w j ; D2 = Li +   w j ;........; D5 = Li +  w j
 f D1   f D 2   f D 5 
     

5N N
El decil quinto es la mediana ya que: =
10 2

PERCENTILES

Son los que dividen una serie o un histograma de frecuencia en cien partes iguales. se denota
por “P”

Son los valores de la variable que dividen a un conjunto de datos ordenados en 100
subconjuntos iguales; cada conjunto de datos tiene 99 percentiles (consulte la figura
siguiente), El k–ésimo percentil, Pk, es un valor tal que cuando mucho k % de los datos son
mas pequeños en valor que Pk y cuando mucho (100 – k )% de los datos es mayor.

9
Datos clasificados en orden creciente
1% 1% 1% 1% 1% 1% 1%

Min P1 P2 P3 P98 P99 MAX


Datos clasificados en orden creciente

A lo mas K% A lo mas (100 – k)%


Min Pk Max

 N   50 N   99 N 
 100 − F j −1   100 − F j −1   100 − F j −1 
P1 = L1 +   w j ;...; P50 = L1 +   w j ;...; P99 = L1 +  w j
 f p1   f p 50   f p 99 
     

50 N N
La mediana es el percentil cincuenta ya que: =
100 2
Notas:

1. El primer cuartil y el 25avo percentil son iguales; es decir Q1 = P 25 también Q3 = P75


2. La mediana, el segundo cuartil, y el 50avo percentil son iguales X = P50 .Así, cuando
se pida encontrar P50, aplique el procedimiento para encontrar la mediana

El procedimiento para determinar el valor de cualquier k-ésimo percentil o cuartil implica


cuatro pasos básicos según se indica en la siguiente figura.

Paso 1
Ordenar los datos n, del más chico al más
Paso 2 grande
Calcular: Nk
100
100

Se obtiene un entero A Se obtiene un número con una


fracción
d(Pk) = A.5 d(Pk) = B, el siguiente entero
Paso 3 --------------------------- mas grande
--------------------------------------
Paso 4 Pk esta a la mitad entre --
el valor Pk es el valor del dato en la
Del dato en la A –ésima B-ésima posición
posición
Y el valor del siguiente
dato.
B-
ésima posición.
10
Ejemplo de aplicación

SALARIOS NUMERO DE Fi
POR DIA EMPLEADOS
50 – 60 8 8
60 – 70 10 18
70 – 80 16 34
80 – 90 14 48
90 – 100 10 58
100 –110 5 63
110 – 120 2 65
TOTAL 65

A) Calcular el primer cuartil de la distribución:

N 65
(n) − F j −1 1− 8
Q1 = L j −1 + 4 w  Q1 = 60 + 4 10 = 68,25
fj 10

B) Calcular el Segundo cuartil de la distribución.


N 65
(n) − F j −1 2 − 18
Q2 = L j −1 + 4 w  Q2 = 70 + 4 10 = 79,0625
fj 16

C) Calcular el 3 decil.

N 65
(n) − F j −1 3 − 18
D3 = L j −1 + 10 w  D3 = 70 + 10 10 = 70,9375
fj 16

D) Calcular 5 percentil.

N 65
(n) − F j −1 5−0
P5 = L j −1 + 10 w  P5 = 50 + 100 10 = 54,0625
fj 8

11
MEDIDAS DE VARIABILIDAD

Las medidas de tendencia central que se describen en él capitulo anterior, son útiles para la
identificación de un valor típico en un grupo de valores. Por el contrario, las medidas de
dispersión o variabilidad describen un grupo de valores en función de la variación o dispersión
de los datos incluidos en ese grupo. Existen varias técnicas para medir el grado de dispersión
en los conjuntos de datos en este capitulo describiremos: La desviación media, la desviación
intercuartilica, la varianza y la desviación típica.

RECORRIDO O RANGO (AMNPLITUD)

Es un estadígrafo sumamente sencillo pero frecuentemente influido por sus valores extremos,
descuidando los valores intermedios, por cuyo motivo su aplicación se restringe a una parte
especializada de la estadística, conocida como el control de calidad, y utilizado
frecuentemente en el sector industrial.
Se define como:
LA DIFENENCIA DEL VALOR MAS ALTO DE LA VARIABLE Y EL VALOR MAS
BAJO PARA UNA SERIE. PARA DATOS AGRUPADOS, ES LA DIFERENCIA ENTRE
EL LIMITE SUPERIOR DE LA ULTIMA CLASE, Y EL LIMITE INFERIOR DE LA
PRIMERA”
R = X max − X min
R = Lsm − Li1
LA DESVIACION MEDIA:

Es la diferencia entre cada valor del conjunto de datos y la media del grupo. Si se calculara la
media de la suma de diferencias más o menos entre cada valor y la media aritmética, la
respuesta en realidad siempre seria cero. Por esta razón, se suman los valores absolutos de las
diferencias. Es decir que, la desviación media son los promedios absolutos de los valores de la
variable con respecto a su media aritmética.

i=k i=k

 | x i −x | | x i − x | fi
Para datos simples seria: DM = i =1
para datos agrupados seria: DM = i =1

N N
Ejemplo:

Edades xi fi xifi |xi-x|fi


1352
14.5-19,5 17 5 85 50,25 x = = 27,05
50
19,5-24,5 22 10 220 50,50
203,5
24,5-29,5 27 20 540 1,00 DM = = 4,07
29,5-34,5 32 10 320 49,50 50
34,5-40,5 37.5 5 187.5 52,25
50 1352.5 203,50

12
DESVIACION MEDIANA

Es otro estadígrafo de dispersión, definido como:


“LA MEDIA ARITMETICA O PROMEDIO DE LOS DESVIOS, RESPECTO DE LA
MEDIANA, EXPRESADOS EN VALOR ABSOLUTO”.
Es decir:

DMe = M  X i − Me 
n

X i − Me
Para una serie simple DMe = i =1
n
m

f i X i − Me
Para datos agrupados DMe = i =1
n
RELACION GENERAL

DMe  DM  S
¨
DESVIACION INTERCUARTILICA:

Es una medida de dispersión que solo depende de dos valores que están situados en la mitad
central de los datos. Este indicador se usa cuando otras medidas de dispersión son afectadas
seriamente por los valores extremos o cuando se trata de distribuciones asimétricas.

13
Q3 − Q1
Q=
2
Ejemplo:
N 50
= = 12,5
Edades xi fi Fi 4 4
14,5-19,5 17 5 5 12,5 − 5
Q1 = 19,5 + 5 = 23,25
19,5-24,5 22 10 15 10
N 50
24,5-29,5 27 20 35 3 =3 = 37,5
50 4
29,5-34,5 32 10 45 37,5 − 35
34,5-40,5 37,5 5 50 Q3 = 29,5 + 5 = 30,75
10
50

VARIANZA.

Es una medida de dispersión, que mide la agrupación de los datos, al rededor de la media
aritmética, conocida también como el segundo momento central.

Según el concepto: Las diferencias de xi − x , nos darían las distancias entre los datos
observados y la media aritmética, pero la suma de estas diferencias serian siempre cero, por lo
que es necesario, hallar una forma en que esta suma no sea cero, por lo que se propone sumar
los números absolutos de estas diferencias así:  | xi − x |, luego el promedio de estas
i=k

x i −x
diferencias seria: DM = i =1 ; que como ya hemos visto es conocida como desviación
N
media. Pero otra manera de evitar los números negativos, para evitar la suma cero seria, elevar
las diferencias al cuadrado de la siguiente manera:  ( xi − x )2, el promedio de estas
i=k

(x − x)
2
i
diferencias seria: S 2 = i =1 , conocida como varianza para datos simples, para datos
N
i=k

 (x − x ) fi
2
i
agrupados seria: S 2 = i =1

N
Ejemplo:

Edades xi fi xifi (xi − x )2 fi


14,5-19,5 17,0 5 85,0 505,01 1352
. ,5
x= = 27,05
19,5-24,5 22,0 10 220,0 255,02 50
24,5-29,5 27,0 20 540,0 0,05 155111
. ,
s2 = = 31,02
29,5-34,5 32,0 10 320,0 245,02 50
34,5-40,5 37,5 5 187,5 546,01
50 1352,5 1551,11

14
DESVIACION TIPICA O STANDART.

La desviación típica o standart, es la medida porcentual de la agrupación de datos al rededor


de la media aritmética, para el caso anterior seria:

i=N

 (x − x ) fi
2
i
S= i =1
 S = 31,02 = 5,57 .
N

Problema.

En un grupo de 50 estudiantes la suma de los cuadrados de las desviaciones de sus


calificaciones respecto a su media aritmética es igual a 1.250, por otra parte la suma de los
cuadrados de las calificaciones es igual a 5.000 averiguar el promedio de calificaciones de
dicho grupo de universitarios:

Solución:

i =k 2

 ( xi − x )
i =1
= 1.250

xi2 = 5.000
N = 50
x =?

( )
i =k i =k i =k i =k i =k

 (x − x ) = 1.250   xi − 2 xi x + x 2 = 1.250   xi2 − 2 x  xi +  x 2 = 1.250


2 2
i
i =1 i =1 i =1 i =1 I =1

15
Si:
i =k

x i i =k i =k i =k i =k i =k
x= i =1
 Nx =  xi   xi2 − 2 x Nx +  x 2 = 1.250   xi2 − 2 Nx 2 +  x 2 = 1.250 Lu
N i =1 i =1 I =1 i =1 I =1
ego:

i =k
5.000 − 1.250
x
i =1
2
i − Nx 2 = 1.250  5.000 − 50 x = 1.250  x =
50
= 8,66

PROPIEDADES DE LA VARIANZA:

1) La varianza de una constante es 0, es decir:


i =k

 (c − c )
2

c, c, c  x = c; ci luego: s 2 = i =1
=0
N

2) Si la varianza de una serie estadística es multiplicada por una constante c, la varianza


es igual al producto de la constante al cuadrado por la varianza de la serie antes de ser
multiplicada por c.
i =k

 (x − x)
2
i
x1 , x 2 , x3 ,......x k  s 2 = i =1

N
Luego:

i =k i =k 2 i =k

 (cxi − cx )  c(xi − x ) c 2  ( xi − x )
2 2

cx1 , cx2 , cx3 ,......cxk  s c2 = i =1


 s c2 = i =1
 s c2 = i =1
E
N N N
ntonces:
sc2 = c 2 s 2
3) Si a los valores de una serie estadística se suma una constante c la varianza de la serie
no cambia.
i =k

 (x − x)
2
i
x1 , x 2 , x3 ,......x k  s 2 = i =1

i =k i =k

 (xi + c ) − (x + c )  (x + c − x − c )
2 2
i
x1 + c, x 2 + c, x3 + c,......x k + c  s c2 = i =1
 s c2 = i =1

N N

16
i =k

 (x − x)
2
i
luego: s c2 = i =1
 s c2 = s 2
N

i =k

 (x − A) la desviación es mínima si A = x :
2
4) En la expresión i
i =1
i =k
Si: L =  (xi − A)
2

i =1
La primera derivada seria:

L i =k
L i =k i =k i =k i =k
= −2 (xi − A) = 0  =  (xi − A)   xi −  A = 0   xi − NA = 0
A i =1 A i =1 i =1 i =1 i =1
De donde:
i =k

x i
A= i =1
 A= x
N
Demostración de condición de mínimo:

L i =k
2L i =k
2L
= 2 ( xi − A) (− 1)  2 = 2 (0 + 1)  2 = 2 N  2 N  0
2

A i =1  A i =1  A
i =k

 (x − A) es mínimo.
2
Luego si 2N>0, i
i =1

COEFICIENTE DE VARIACION

El coeficiente de variación o desviación relativa, es adimensional en el sentido de que este


estadígrafo es independiente de las unidades de medida y por este motivo, permite decidir el
mejor estadígrafa de posición, de modo que si la medida de tendencia central en cuestión,
tiene un coeficiente de variación mínimo, entonces es mejor.

Por otra parte, sirve para comparar fenómenos semejantes en tiempos distintos y viceversa,
(por ejemplo: consumo de leche con azúcar), así se pondría interés en conocer si la
distribución de leche. Tiene mayor o menor dispersión que la distribución del azúcar, en el
sentido de si, una desviación típica de 6,5 litros, ¿es mayor o menor?, que otra de 2.3 kilos.

El coeficiente de variación se define como:


“EL COEFICIENTE ENTRE UNA DESVIACION TIPICA Y SU CORRESPONDIENTE
ESTADIGRAFO DE POSICION”.
CVX =
S
(100)
X
CVMe =
S
(100)
Me
CVMo =
S
(100)
Mo

17
OTROS ESTADIGRAFOS Y MOMENTOS

MEDIDAS DE ASIMETRIA Y CURTOSIS

En una distribución de frecuencias, es necesario conocer la forma de la misma, por tanto, se


puede medir el apuntamiento o simetría por diferentes métodos, en este tema explicaremos
algunos como ser:
ESTADÍGRAFOS DE ASIMETRÍA O DEFORMACIÓN

(+)
(-)

Mo Me X
ASIMETRIA X Mo Me
POSITIVA ASIMETRIA
(Mo < X) POSITIVA
ESTADÍGRAFOS DE APUNTAMIENTO O CURTOSIS
(Mo > X)

Mo = X = Me Mo = X = Me Mo = X = Me
APUNTADA APLANADA NORMAL

18
COEFICIENTE DE ASIMETRÍA DE KARL PEARSON(Sesgo):

Definición:

x − Mo
Sk =
S

Interpretación:

Sk=0 La distribución es simétrica.


Sk>0 La distribución es sesgada a la derecha
Sk<0 La distribución es sesgada a la izquierda.

Ejemplo:

Sueldos Nº de xi xifi (xi – x )2fi Fi


14990
Bs. Empleados x= = 40.51
30 – 34 50 32 1600 3621 50 370
35 – 39 100 37 3700 1232 150 50
M o = 39,5 + 5 = 41,17
40 – 44 150 42 6300 333 300 50 + 100
45 – 49 50 47 2350 2106 350 9932
50 – 54 20 52 1040 2640 370 S= = 5,18
370
370 14990 9932

40,51 − 41,17
Sk = = −0,127 La distribución es sesgada a la izquierda.
5,18
Demostración gráfica:

Para evitar el uso de la moda, podemos recurrir a la formula empírica, llamada también
segundo coeficiente de Pearson.

3(x − M e )
SP =
S

19
Ejemplo:

N 370
= = 185
2 2
185 − 150
M e = 39 ,5 + 5 = 40 ,67
150

3(x − M e ) 3(40,51 − 40,67)


SP = ;Sp = = −0,09267
S 5,18

Este coeficiente, también indica al igual que el primero un sesgo a la izquierda.

CURTOSIS(Apuntamiento):

La curtosis, mide cuan putiaguda es una distribución, en general, por referencia a la normal, si
tiene un pico alto(leptocurtica), si es aplastada (platicurtica), o si es normal(mesocurtica), este
coeficiente viene definida por:

1
(Q3 − Q1 )
K= 2
P90 − P10
Interpretación:

Ejemplo:

Sueldos Nº de xi Fi 370
= 92,5
Bs. Empleados 4
30 – 34 50 32 50 92,5 − 50
Q1 = 34,5 + 5 = 36,625
35 – 39 100 37 150 100
40 – 44 150 42 300 370
3 = 277,5
45 – 49 50 47 350 4
50 – 54 20 52 370 277,5 − 150
Q3 = 39,5 + 5 = 43,75
370 150
370
10 = 37
100
37 − 0
1
(43,75 − 36,625) P10 = 29,5 +
50
5 = 30,24
K= 2 = 0,203 370
47,8 − 30,24 100
90 = 333

333 − 300
P90 = 44,5 + 5 = 47,8
50
20
La distribución de frecuencias es mesocurtica o tiene tendencia mesocurtica.

MOMENTOS
Los momentos son en realidad promedios o medias de las potencias de la diferencia de la
variable respecto a un valor constante, es decir:
i=N

 f (x i i − A) r
m= i =1

Los momentos mas usados son dos, respecto al origen y respecto a la media llamado también
momento central.

MOMENTOS RESPECTO AL ORIGEN.


Un momento respecto al origen se define como:

"EL PROMEDIO O MEDIA ARITMÉTICA DE LA VARIABLE ELEVADA A UNA


POTENCIA r".

Es decir si:
i= N

 f (x i i − A) r
ar = i =1

N
i= N i=N

 f (x − 0) r fx
r
i i i i
Donde A═0  a r = i =1
= i =1

N N

MOMENTOS CENTRALES RESPECTO A LA MEDIA


Este tipo de momentos, se definen como:
“EL PROMEDIO O MEDIA ARITMÉTICA DE LOS DESVÍOS RESPECTO DE LA
MEDIA ELEVADOS A LA POTENCIA r”

21
Es decir si:
i=N

 f (x i i − A) r
mr = i =1

N
i=N

 f (x i i − x)r
Donde A = x  mr = i =1
donde r es el momento r-esimo respecto a la media.
N

Por tanto cuando r = 2


i=N


i =1
fi ( X i − X )2
m2 = =S2
N
m2 = S2 momento central de segundo orden (varianza)
Cuando r = 3
i=N


i =1
fi ( X i − X )3
m3 =
N
Y así sucesivamente.

22

También podría gustarte