Está en la página 1de 7

aa

En un estudio sobre el numero de personas que formaban las ban-


das de \gangsters" en el Chicago de 1927, se obtuvieron los si-
guientes datos sobre 825 de dichas bandas:

Tama~no banda frecuencia


306
6 0 11
11 0 16
16 0 21
21 0 26
26 0 31
31 0 41
a

a
37
198
191
149
79
46
55
Tama~no banda frecuencia
41 0 51
51 0 76
76 0 101
101 0 201
201 0 501
501 0 1000
51
26
25
25
11
2
a

(El autor de este estudio, F.M. Thrasher, considero que las per-
sonas aisladas o los grupos de dos \gangsters" no constituan una
banda.)
Analizar descriptivamente estos datos.
1

El enunciado nos da la distribucion de frecuencias absolutas de unos


datos correspondientes a un caracter cuantitativo, n
umero de personas que
componen la banda, clasi cados por intervalos.
Siguiendo la notacion habitual (CB-seccion 2.2), entenderemos que los
intervalos son cerrados por la izquierda y abiertos por la derecha, menos el
u
ltimo que es cerrado por ambos lados; as por ejemplo, si una banda esta
compuesta por 501 \gansters", esta debera ser contabilizada en el u  ltimo
intervalo y no en el penultimo.
Las cuatro distribuciones de frecuencias (absolutas, relativas, absolutas
acumuladas y relativas acumuladas) son, respectivamente
aI1
I2
I3
I4
I5
I6
I7
I8
I9
I10
I11
I12
I13
a

a
Ii
306
6 0 11
11 0 16
16 0 21
21 0 26
26 0 31
31 0 41
41 0 51
51 0 76
76 0 101
101 0 201
201 0 501
501 0 1000
a

a
a

a
a

a
ni
37
198
191
149
79
46
55
51
26
25
25
11
2
895
a

a
a

a
fi
0 04134
0

00 22123
00 21341
00 16648
00 08827
00 05140
00 06145
00 05698
00 02905
00 02793
00 02793
00 01229
00 00224
1
a

a
Ni
37
235
426
575
654
700
755
806
832
857
882
893
895
a

La representacion gra ca de este tipo de datos es (CB-seccion 2.3.1) un


histograma para las distribuciones absolutas y relativas sin acumular y un
Fi
0 04134
0

00 26257
00 47598
00 64246
00 73073
00 78213
00 84358
00 90056
00 92961
00 95754
00 98547
00 99776
1
2

polgono de frecuencias acumuladas para las distribuciones acumuladas.


Consideraremos solamente un histograma para la distribucion de frecuen-
cias absolutas. Al ser el histograma una representacion por areas, debemos
calcular la altura de cada rectangulo de forma que se cumpla la ecuacion

Frecuencia absoluta (area) = base 1 altura


por lo que tomando, para simpli car, una amplitud unidad igual a 10, la
siguiente tabla nos da las longitudes de cada intervalo, el factor gi que mul-
tiplica a la amplitud unidad 10 para conseguir la longitud del intervalo y la
altura hi determinada como cociente hi = ni =gi , ya que, en ese caso, sera

Frecuencia absoluta = ni = (1 1 gi ) 1 (ni =gi ) = (base) 1 (altura)


a
aa
3

a
longitud gi hi (altura)
a a

I1 a
3 00 3
a
1230 3
a

I2 a
5 05
a
0
396 a

I3 a
5 05
a
0
382 a

I4 a
5 00 5
a
298 a

I5 a
5 05
a
0
158 a

I6 a
5 00 5
a
92 a

I7 a
10 a
1 55 a

I8 a
10 a
1 51 a

I9 a
25 20 5
a
100 4
a

I10 a
25 20 5
a
10 a

I11 a
100 10
a
20 5a

I12 a
300 30
a
00 37
a

I13 a
499 490 9
a
00 04
a

El histograma que se obtiene sera el de la pagina siguiente, el cual mues-


tra una clara asimetra a la derecha de la distribucion de frecuencias, al
descender mas despacio las frecuencias por el lado derecho.
En la determinacion de las medidas de posicion, dispersion y asimetra,
utilizaremos la siguiente tabla de calculos, en la cual, al estar los datos
agrupados en intervalos [ei01 ; ei ), juegan un papel esencial las marcas de
clase xi = (ei + ei01 )=2

Ii xi ni xi ni1 1
xi2 ni
306
a a a a

45 37 166 5
0
7490 25 0

6 0 11
a a a a

80 5 198 1683 143050 5


11 0 16
a a a a

13 5 191 2578 5
0 0
348090 75
16 0 21
a a a a

18 5 149 2756 5
0 0
509950 25
21 0 26
a a a a

230 5 79 18560 5 436270 75


26 0 31
a a a a

28 5 46
0
1311 373630 5
31 0 41
a a a a

36 55 1980 71280
41 0 51
a a a a

46 51 2346 107916
51 0 76
a a a a

630 5 26 1651 1048380 5


76 0 101
a a a a

880 5 25 22120 5 1958060 25


101 0 201
a a a a

151 25 3775 570025


201 0 501
a a a a

351 11 3861 1355211


501 0 1000 7500 5 2
a a a a

a
1501 a
11265000 5
a a

895 276780 5 37134280 25


a a a a
4

a
a

a
a

a
a
a

a
a

a
a

a
a

aa
a

a
a

a
3 101 201 501 1000
a a a a a a a a a a a

De la tabla de calculos se obtiene que la media aritmetica es

a= a
X
1 x 1nk
a X=1
1 13 x
= 895 ni = 27678
0
5 = 30 93:
0

n i=1
i i
i
i 1
895
Respecto a la mediana, a partir de la distribucion de frecuencias absolu-
tas obtenemos que es
n 895
N3 = 426 < a =
2 2 = 447 5 < 575 = N4
a 0

con lo que la mediana Me esta en el intervalo [16 ; 21), siendo la mediana el


valor
a a
5

n
a
= 16 + 447 149
5 426 5 = 16 72:
N j 01
= xj 1 + 2
0 0
0
Me 1 cj 1
0

nj
0

Se observa que la mediana Me = 16 72 se ve menos in uenciada por 0

los valores extremos |en este caso, muy altos| que la media aritmetica
a = 30 93. Este hecho hace que se recomienda utilizar la mediana en lugar
0

de la media como medida representativa de los datos.


Respecto a la moda, al tener los intervalos diferente amplitud, primero
debemos normalizar los intervalos calculando los cocientes
lj =a
nj
c

a
j
pero, como la longitud cj de cada intervalo es cj = 10 gj , sera

aa
1

lj =a
nj
cj
= nj
= a
hj
10 gj 10 1

siendo el

a
max l1 ; :::; lk = a
f
1 max h ; :::; h = 396 = 39 6
10 g1 k
10 f g a 0

y, por tanto, el intervalo modal el I2 = [6 ; 11), con lo que la moda sera

Md = xj 1+ l lj +1+ lcj = xj 1+ (h cj +hjh+1 =10)=10 = 6+ 123382


1 5 = 9 78:
1

3 + 382
1 0

j 1 j +1 j 1 j +1
0 0
0
0 0

Respecto a los cuantiles, si consideramos el primer cuartil, al ser

a a
37 < a41 n = 223 75 < 235
1
0

sera p1=4 [6 ; 11) y, en concreto,


2

1a n 0 Nj 01 895 37 a1
1+ 4 = 6 + 4 198
1 1 0
p1 = 4 = xj 0
nj
1 cj 5 = 10 716 1
0

el cual sera igual al centil 25.


Para calcular el sexto decil (que es igual al centil sesenta), acotamos el
valor
6

a106 n= a10060 n= a6
10 895 = 537

a
1 1 1

por las frecuencias absolutas acumuladas

a
= 426 < 537 < 575 = N4
N3
estando dicho valor, por tanto, en el intervalo [16 ; 21), y siendo igual a

a106
= 16 + 537149426 5 = 19 72:
1 n 0 Nj 01
p6=10 = xj 1 +
0
nj
1 cj
0
1
0

Respecto a las medidas de dispersion (CB-seccion 2.3.3), el recorrido es


igual a
R = xmax 0 xmin
= 750 5 4 5 = 746

a
0 0
0

al ser 750 5 la ultima marca de clase y 4 5 la primera.


0 0

Utilizando la tabla de calculos antes determinada, obtenemos que la

a
varianza es igual a

s2 = an1
X(
k
xi 0 a)2 n i = an1
X2
k
xi ni 0 a2 = 3713428 25 30 932 = 3192 417
0
0 0

i=1 i=1
895 0

a
que permite calcular la cuasivarianza
n s2
S2 = = 895 3192 417 = 3195 988: 0
1 1

a
0

n 1 894 0

Si calculamos sus races cuadradas, que expresan mejor la dispersion de


los datos al ser de esa manera los valores obtenidos numero de individuos,
la desviacion tpica es igual a

a
p a2
s= = 3192 417 = 56 50
p
s 0 0

y la cuasidesviacion tpica
= S 2 = 3195 988 = 56 53
S
p a p
0 0

valores que, como se ve, apenas si se diferencian, al ser grande el numero de


datos considerados.
7

a
a
El coe ciente de variacion de Pearson resulta igual a
s
Vp = a 100 =
56 50
0

30 93 100 = 182 67:

a
0
1 1
a 0

Por ultimo, el coe ciente de asimetra de Pearson (CB-seccion 2.3.4),


Ap =
a Md
0
= 30 93 9 78 = 0 374
0
0
0
0

s 56 50 0

con rma la asimetra a la derecha de la distribucion de frecuencias.

También podría gustarte