Está en la página 1de 9

EJERCICIO RESUELTO DE ESTADSTICA

Las estaturas de 27 jvenes, en cm, son las siguientes:


155

178

170

165

173

168

160

166

176

169

158

170

179

161

164

156

170

171

167

151

163

158

164

174

176

164

154

a) Tabular los datos en intervalos de clase de amplitud 5.


b) Incluir en la tabla las frecuencias absolutas acumuladas, las frecuencias relativas, los tantos
por ciento y las frecuencias relativas acumuladas.
c) Hallar la Media, la Mediana, la Moda, los Cuartiles y la Desviacin Tpica.
d) Dibujar los datos en un grfico adecuado.
Solucin:
a) Tabular los datos en intervalos de clase de amplitud 5.
Se trata de una variable estadstica continua, por lo que tiene sentido tabular los datos en
intervalos.
Calculamos los valores mayor y menor de la muestra: 179 y 151.
La diferencia es el rango: R = 179-151 = 28.
Localizamos el mltiplo de 5 (la amplitud de los intervalos) ms prximo a 28 pero mayor o
igual que 28: 30. sta ser la amplitud total de todos los intervalos de clase.
Dividiendo 30/5 = 6 obtenemos el nmero total de intervalos de clase.
Si empezamos el primero de los intervalos en 150 (por ejemplo) como la amplitud total de todos
los intervalos ser 30, terminaremos en 150+30 = 180. Estas elecciones son vlidas, porque
cubrimos desde el menor valor (151) hasta el mayor valor (179) de la muestra.
Construimos la tabla con los intervalos resultantes: [150, 155); [155, 160); [160, 165); [165,
170); [170, 175); [175, 180] y haciendo un recuento de cuantos datos de la muestra caen dentro
de cada uno de ellos (es decir, las frecuencias absolutas):

xi

fi

[150, 155)

[155, 160)

[160, 165)

[165, 170)

[170, 175)

[175, 180]

n = 27

La suma de la columna de las frecuencias es el nmero total de datos n = 27.


Aadimos una columna con las marcas de clase. stas son los puntos medios de cada uno de los
intervalos. Hay dos formas de calcularlos:
1) Sumamos los extremos del intervalo y dividimos el resultado entre 2. Por ejemplo, para el
primer intervalo, la marca de clase es (150+155)/2 = 152,5.
2) Calculamos la mitad de la amplitud de los intervalos: 5/2 = 2,5. Sumamos esta mitad al
extremo inferior de cada intervalo y nos sale la marca de clase. Para el primer intervalo es:
150+2,5 = 152,5.
La tabla, con la columna de marcas de clase, es:

xi

fi

152,5
[150, 155)

[155, 160)

157,5

[160, 165)

162,5

[165, 170)

167,5

[170, 175)

172,5

[175, 180]

177,5

n = 27

A partir de ahora, trabajamos la tabla como si fuera una tabla de datos sin agrupar en
intervalos (es decir, ignoraremos la primera columna). Entonces, para los clculos, supondremos
que los datos son las marcas de clase, con lo que sera como si 152,5 se repitiera 2 veces (su
frecuencia), 157,5 4 veces, etc.
b) Incluir en la tabla las frecuencias absolutas acumuladas, las frecuencias relativas, los tantos
por ciento y las frecuencias relativas acumuladas.
Las frecuencias absolutas acumuladas son la suma de las frecuencias absolutas de todas las filas
que estn por encima del dato actual, incluida la fila de dicho dato:

xi

fi

Fi

[150, 155) 152,5

2 El mismo valor que en fi

[155, 160) 157,5

6 El valor anterior de Fi (2) ms el de fi de al lado (4)

[160, 165) 162,5

12 El valor anterior de Fi (6) ms el de fi de al lado (6)

[165, 170) 167,5

17 12+5

[170, 175) 172,5

23 17+6

[175, 180] 177,5

27 23+4

n = 27

Las frecuencias relativas son los cocientes entre las frecuencias absolutas y n:

xi

fi

Fi

hi

[150, 155)

152,5

2 / 27 = 0,0740

[155, 160)

157,5

4 / 27 = 0,1481

[160, 165)

162,5

12

6 / 27 = 0,2222

[165, 170)

167,5

17

5 / 27 = 0,1852

[170, 175)

172,5

23

6 / 27 = 0,2222

[175, 180]

177,5

27

4 / 27 = 0,1481

n = 27

La suma de las frecuencias relativas debe ser 1. Si las sumamos escritas en forma de fraccin, en
efecto resulta 1. No es as en forma decimal a causa de los redondeos (se desprecian muchos
decimales).
Los tantos por ciento son las frecuencias relativas multiplicadas por 100:

xi

fi

Fi

hi

[150, 155)

152,5

2 / 27 = 0,0740

7,40%

[155, 160)

157,5

4 / 27 = 0,1481

14,81%

[160, 165)

162,5

12

6 / 27 = 0,2222

22,22%

[165, 170)

167,5

17

5 / 27 = 0,1852

18,52%

[170, 175)

172,5

23

6 / 27 = 0,2222

22,22%

[175, 180]

177,5

27

4 / 27 = 0,1481

14,81%

n = 27

Al igual que antes, la columna debera sumar 100. Si no es as es a causa de los errores que se
comenten redondeando.
Las frecuencias relativas acumuladas se calculan dividiendo las Fi entre n:
xi

Fi
fi

hi

Hi

[150, 155)

152,5

2 / 27 = 0,0740

7,40%

2 / 27 = 0,0740

[155, 160)

157,5

4 / 27 = 0,1481

14,81%

6 / 27 = 0,2222

[160, 165)

162,5

12

6 / 27 = 0,2222

22,22%

12 / 27 = 0,4444

[165, 170)

167,5

17

5 / 27 = 0,1852

18,52%

17 / 27 = 0,6296

[170, 175)

172,5

23

6 / 27 = 0,2222

22,22%

23 / 27 = 0,8519

[175, 180]

177,5

27

4 / 27 = 0,1481

14,81%

27 / 27 = 1

n = 27

c) Hallar la Media, la Mediana, la Moda, los Cuartiles y la Desviacin Tpica.


La frmula de la media aritmtica es:

es decir, sumamos cada dato xi multiplicado por su frecuencia fi y dividimos el resultado total
entre n. Para facilitar los clculos, creamos una columna con los productos de cada xi por su
correspondiente fi y sumaremos la columna, lo que nos dar el numerador de la frmula:

xi

fi

Fi

hi

Hi

xifi

[150,
155)

152,
5

2 / 27 =
0,0740

7,40%

2 / 27 =
0,0740

305

[155,
160)

157,
5

4 / 27 =
0,1481

14,81
%

6 / 27 =
0,2222

630

[160,
165)

162,
5

1
2

6 / 27 =
0,2222

22,22
%

12 / 27 =
0,4444

975

[165,
170)

167,
5

1
7

5 / 27 =
0,1852

18,52
%

17 / 27 =
0,6296

837,5

[170,
175)

172,
5

2
3

6 / 27 =
0,2222

22,22
%

23 / 27 =
0,8519

1035

[175,
180]

177,
5

2
7

4 / 27 =
0,1481

14,81
%

27 / 27 = 1

710

n=
27

Por lo que:

Si hemos estudiado el ejercicio 1, que es el mismo que ste pero con los datos sin agrupar en
intervalos, veremos que este resultado no coincide con el que all se obtuvo, aunque se trata del
mismo problema. La media correcta es la del ejercicio 1, porque all empleamos los datos
originales. Aqu hemos utilizado las marcas de clase, lo cual supone una aproximacin. Por
ejemplo, en el primer intervalo hay 2 datos, que realmente son 151 y 154. Pero nosotros hemos
hecho los clculos como si ambos fuesen 152,2.
Si hacemos los clculos con la calculadora cientfica, basta introducir los datos xi y sus
respectivas frecuencias fi y la calculadora nos da, no slo la media, sino tambin la desviacin

tpica y la suma de la columna xifi. En el ejercicio 1 se explic cmo manejar la calculadora para
esto. En este ejercicio, el primer dato a introducir en la calculadora ser la primera marca de
clase 152,5 y su frecuencia, 2; el segundo, 157,5 y su frecuencia 4; etc.
La mediana es el dato que ocupa la posicin (n+1)/2, ya que n = 27 es impar. Dicha posicin es
28/2 = 14. Dicho dato es 167,5 (observando la columna de frecuencias vemos que 152,2 ocupa
las dos primeras posiciones; 157,5 las 4 siguientes, es decir, la 3, 4, 5 y 6. 162,5 ocupa las 6
siguientes, hasta la 12. 167,5 ocupa las 5 siguientes, hasta la 17. Por tanto, ocupa la 14
posicin). Por consiguiente:
Me = 167,5
Al igual que antes, al compararlo con el ejercicio 1 no da el mismo resultado. El correcto es
aquel, porque aqu estamos aproximando, como explicamos antes.
La moda es el resultado que ms se repite. Esta muestra es bimodal porque tiene 2 modas: 162,5
y 172,5, ya que ambos se repiten 6 veces.
El primer cuartil Q1 es el primer dato de la muestra, una vez ordenada, que deja por debajo el
25% de los datos. Como los datos son 27, resulta que el 25% de 27 = 0,25 27 = 6,75. El primer
dato que deja por debajo a los 6,75 anteriores es el 7 (en realidad, ningn dato puede ocupar la
posicin 6,75). Con el mismo razonamiento que seguimos para calcular la mediana, deducimos
que:
Q1 = 162,5
El segundo cuartil coincide con la mediana, calculada anteriormente. Luego:
Q2 = 167,5
El tercer cuartil es el primer dato que deja por debajo el 75% de los datos de la muestra; esto es,
75% de 27 = 0,75 27 = 20,25 datos. Por tanto, ser el que ocupe la posicin 21, por lo que:
Q3 = 172,5
d) Dibujar los datos en un grfico adecuado.
Como se trata de una variable continua, el grfico ms adecuado es el histograma. Aqu si
empleamos los intervalos de clase, que constituirn las bases de los rectngulos, mientras que las
alturas sern las frecuencias absolutas.

También podría gustarte