Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Educar Esencial 1medio Noviembre
Educar Esencial 1medio Noviembre
1 Medio
UNIDAD 6. Estadstica
GUA N 5
TABLAS DE FRECUENCIAS, GRFICOS DE BARRAS
Y POLGONOS DE FRECUENCIAS
Cada da aparecen grficos o datos, por ejemplo en la prensa o en televisin. Quin fue el
jugador que convirti ms goles en la copa del mundo? Cmo ha variado el valor del dlar en
los ltimos meses? Cmo le fue a los distintos colegios en la prueba Simce? etc.
La estadstica descriptiva trata de la obtencin de datos, de cmo organizar estos datos para
que sean representativos y fciles de entender, y de cmo obtener informacin usando estos
datos.
Por ejemplo, la siguiente tabla muestra los puntajes obtenidos por 50 alumnos de IV medio en
la PSU de matemticas. Si observas la tabla, vers que es muy difcil extraer informacin
relevante de ella. Incluso preguntas simples como cul fue el puntaje ms alto? se hacen
difciles de responder. Por eso es necesario organizar estos datos.
480
520
550
690
320
520
450
630
510
680
670
570
460
500
530
580
540
470
710
510
500
620
510
520
350
570
450
630
480
400
700
460
510
750
400
540
790
720
450
640
690
580
490
670
430
500
610
540
610
480
Una forma de organizar estos datos es escribirlos ordenados, desde el menor hasta el mayor.
En un caso como este, con tantos datos, que adems son muy variados, esto no es muy eficiente.
Otra forma de organizar estos datos es mediante tablas de frecuencias, que ves a continuacin.
Como son muchos datos y muy diversos, decidimos clasificar los puntajes en 5 intervalos o
clases. En la primera columna de cada tabla anotamos los 5 intervalos que elegimos. La
eleccin de la cantidad de intervalos es arbitraria, nosotros usamos 5. (Te recomendamos usar
entre 4 y 8, porque, repetimos, la idea es que los datos sean fciles de visualizar).
Tabla de frecuencias:
La segunda columna de la tabla (frecuencia), muestra cuntos
alumnos obtuvieron un puntaje en cada intervalo. Por ejemplo,
11 alumnos obtuvieron un puntaje entre 600 y 699 puntos.
La tercera columna (frecuencia acumulada) muestra cuntos
alumnos hemos contado hasta el intervalo en cuestin. Por
ejemplo, hasta los 699 puntos hemos contado 45 alumnos
(2 + 13 + 19 + 11 = 45). Es decir hay 45 alumnos con puntajes
inferiores a 699 puntos.
Tabla de frecuencias
Intervalo
Frecuencia
Frecuencia
acumulada
300 399
2
2
400 499
13
15
500 599
19
34
600 699
11
45
700 799
5
50
Total
50
1
FUNDACIN CHILE MEJOR LICEO
20
18
16
Frecuencia
14
12
10
8
6
4
2
300 400 500 600 700 800
Puntajes
20
18
Frecuencia
16
14
12
10
8
6
4
2
250 350 450 550 650 750 850
Puntajes
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
299 399 499 599 699 799
Puntajes
2
FUNDACIN CHILE MEJOR LICEO
ACTIVIDADES
1. Las edades de 10 trabajadores son: 20, 21, 22, 24, 24, 25, 25, 25, 27 y 28.
a) Por qu no es conveniente en este caso agrupar los datos en intervalos?
b) Construye el polgono de frecuencia acumulada para estos datos.
c) Se parece el grfico que construiste en b) al del ejemplo de la gua?
2. Se realiza una encuesta a 1000 hombres y 1000 mujeres, todos casados, quienes
responden la siguiente pregunta: A qu edad se cas con su actual pareja?
La siguiente tabla muestra los resultados, segn sexo.
Edad
Mujeres
Hombres
15 19
3%
2%
20 24
18%
12%
25 29
38%
37%
30 34
22%
35%
35 44
13%
10%
45 54
6%
4%
174
176
182
180
173
167
177
166
169
178
168
179
165
176
185
160
171
167
166
177
173
172
169
3
FUNDACIN CHILE MEJOR LICEO
GUA N 2
MEDIA, MODA Y MEDIANA
Muchas veces usamos un solo nmero o informacin para representar la tendencia de toda una
serie de datos: La esperanza de vida de los chilenos es de 78 aos; El salario promedio en
Chile es de 660 dlares mensuales; La mayora de los chilenos se declara creyente.
Estos nmeros se conocen como medidas de tendencia central y son la media, la moda y la
mediana.
La Media aritmtica o promedio.
La media aritmtica (o simplemente la media) de un conjunto de datos es un valor que se
obtiene sumando todos los datos y luego dividiendo por el total. Se anota x .
Volvamos al ejemplo de los puntajes PSU:
La suma de los 50 puntajes da 27.480.
Por lo tanto el promedio de los 50 puntajes
27480
=549,6 .
es: x =
50
480
520
550
690
320
520
450
630
510
680
670
570
460
500
530
580
540
470
710
510
500
620
510
520
350
570
450
630
480
400
700
460
510
750
400
540
790
720
450
640
690
580
490
670
430
Tabla de frecuencias
Intervalo
Marca
Frecuencia
de clase
300 399
350
2
400 499
450
13
500 599
550
19
600 699
650
11
700 799
750
5
Total
50
Comparado con el promedio real (549,6) hay 8,4 puntos de diferencia, lo cual no es mucho y si
compruebas los dos promedios calculados, vers que el primero es muchsimo ms largo de
realizar, por lo cual el segundo es preferible, aunque sea menos preciso.
La moda.
La moda de un conjunto de datos es aquel que aparece ms veces. Si hay empate entre dos (o
tres o ms) datos, el conjunto de datos se denomina bimodal (o trimodal o multimodal). Si
ningn dato se repite, diremos que no hay moda.
En el caso de los puntajes PSU, el intervalo modal es 500 599 (pues es el intervalo que
presenta la mayor frecuencia).
4
FUNDACIN CHILE MEJOR LICEO
500
610
540
610
480
La mediana.
Si ordenamos los datos desde el menor hasta el mayor, la mediana es un valor bajo el cual
est el 50% de los datos. Si hay dos datos que ocupan el lugar central, se calcula el promedio
de ellos.
Por ejemplo:
a) La mediana de 1, 3, 5, 8, 9 es 5.
b) La mediana de 1, 3, 3, 5, 8, 8 es 4 (el promedio entre 3 y 5, pues estos son los datos
del centro).
Para datos agrupados por intervalos, se puede determinar la mediana aproximadamente
usando los polgonos de frecuencias relativas acumuladas. Esto lo veremos en las actividades.
Sin embargo cmo calcular esta mediana exactamente lo veremos en la siguiente gua.
Ejemplo:
Se encuesta a un curso de 25 alumnos y se les
pregunta cuntos hermanos tienes?. La
tabla de la derecha muestra los resultados de
la encuesta.
Cul es la media, la moda y la mediana?
Nmero de hermanos
Nmero de alumnos
0
2
1
10
2
8
3
4
4
0
5
1
Solucin:
a) Media.
0 2+1 10+2 8+3 4+ 4 0+5 1 43
x=
=
=1,72 .
25
25
Respuesta: Los alumnos del curso tienen, en promedio, 1,72 hermanos.
b) Moda.
La moda es 1, pues es el dato con la mayor frecuencia (10).
Respuesta: Los alumnos del curso tienen, en cuanto a moda, 1 hermano.
c) Mediana.
Como son 25 alumnos, el del medio es el alumno nmero 13. Hay 2 alumnos que no
tienen hermanos y 10 que tienen 1 hermano. Es decir, los primeros 12 alumnos tienen 0
1 hermano. Por lo tanto el alumno nmero 13 tiene 2 hermanos.
Respuesta: Los alumnos del curso tienen, en cuanto a mediana, 2 hermanos.
El ejemplo anterior te muestra que los valores de la media, la moda y la mediana pueden ser
bastante diferentes, por lo tanto hay que pensar bien cul es el ms representativo en cada
caso.
5
FUNDACIN CHILE MEJOR LICEO
ACTIVIDADES
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
6
FUNDACIN CHILE MEJOR LICEO
6. Un supermercado hace un estudio y descubre que las bolsas de mercadera que llevan las
personas pesan entre 500 gramos y 2 kilos. La siguiente tabla muestra los datos:
Peso de la bolsa (kg)
Nmero de bolsas
[0,5 - 0,8[
5
[0,8 1,1[
32
[1,1 1,4[
26
[1,4 1,7[
11
[1,7 2,0]
6
13
12
Frecuencia
11
10
9
8
7
6
5
4
3
2
1
10
11
12
7
FUNDACIN CHILE MEJOR LICEO
GUA N 3
CUARTILES
Las medidas de tendencia central resumen todo un conjunto de datos en un solo nmero pero
ese nmero puede no ser muy representativo. Los cuartiles permiten representar un poco
mejor los datos, dividiendo el conjunto de datos en cuatro partes iguales. Importante: los datos
deben estar ordenados de menor a mayor.
Hay tres cuartiles:
a) El primer cuartil (Q1) es un valor bajo el cual se encuentra el 25% de los datos (y por lo
n+1
tanto 75% de los datos estn sobre Q1). Si hay n datos, entonces Q1 ocupa el lugar
4
de los datos.
b) El segundo cuartil (Q2) es un valor bajo el cual se encuentra el 50% de los datos y equivale
n +1
a la mediana de los datos. Si hay n datos, entonces Q2 ocupa el lugar
de los datos.
2
c) El tercer cuartil (Q3) es un nmero bajo el cual se encuentra el 75% de los datos. Si hay n
3 (n + 1)
datos, entonces Q3 ocupa el lugar
de los datos.
4
Ejemplo 1: Calcular los tres cuartiles para los datos que representan las edades de 10
personas:
8, 9, 13, 15, 19, 20, 20, 21, 23 y 28.
Solucin:
1. Calculamos el primer cuartil.
Como n = 10, el primer cuartil debe ocupar el lugar 2,75 de los datos (11 : 4 = 2,75).
Sin embargo no existe un dato nmero 2,75. Existe el dato nmero 2, que es 9 y
existe el dato nmero 3, que es 13. Cul es el dato nmero 2,75?
Para responder esto se hace el siguiente clculo:
a) Entre el 2 dato (9) y el 3 (13) hay 4 de diferencia.
b) Multiplicamos 4 por 0,75 (que es la parte decimal de 2,75) y da 3.
c) Sumamos el resultado obtenido en b) al 2 dato: 9 + 3 = 12.
Respuesta: Q1 = 12.
2. Calculamos el segundo cuartil.
El segundo cuartil ocupa el lugar 5,5 de los datos (11 : 2 = 5,5).
Hacemos el clculo:
a) Entre el 5 dato (19) y el 6 (20) hay 1 de diferencia.
b) Multiplicamos 1 por 0,5 (la parte decimal de 5,5). Obtenemos como resultado 0,5.
c) Sumamos el resultado obtenido en b) al 5 dato: 19 + 0,5 = 19,5.
Respuesta: Q2 = 19,5.
(Ntese que el segundo cuartil corresponde a la mediana de los datos.)
3. Calculamos el tercer cuartil.
El tercer cuartil corresponde al dato nmero 8,25 (3 11 : 4 = 8,25).
Hacemos el clculo:
a) Entre el 8 dato (21) y el 9 (23) hay 2 de diferencia.
8
FUNDACIN CHILE MEJOR LICEO
Q1= 12
Q2= 19,5
23, 28
Q3= 21,5
Tabla de frecuencias
Intervalo Frecuencia
Frecuencia
acumulada
300 399
2
2
400 499
13
15
500 599
19
34
600 699
11
45
700 799
5
50
Total
50
Solucin:
1. Calculamos el primer cuartil.
Como n = 50, el primer cuartil ocupa el lugar 12,75
(51 : 4 = 12,75).
El primer intervalo tiene 2 datos, que es menos que 12,75.
Hasta el segundo intervalo hay 15 datos, que es ms que
12,75. Esto quiere decir que debemos buscar el dato nmero 10,75 del segundo
intervalo. (Debemos restar los 2 datos del primer intervalo).
a) El intervalo tiene una longitud igual a 100 y contiene 13 datos.
b) Dividimos 100 en 13 y luego multiplicamos por 10,75, lo cual da (aprox.) 82,69.
c) Sumamos el resultado obtenido en b) al lmite izquierdo del intervalo:
El primer cuartil es 400 + 82,69 = 482,69.
ACTIVIDADES
Q1= 12
Q2= 19,5
23, 28
Q3= 21,5
Ene.
34
Feb.
47
Mar.
1
Abr.
15
May.
57
Jun.
24
Jul.
20
Ago.
11
Sep.
19
Oct.
50
Nov.
28
Dic
37
[150 - 155[
4
[155 160[
22
[160 165[
56
[165 170[
32
[170 175]
5
10
FUNDACIN CHILE MEJOR LICEO
13
12
Frecuencia acumulada
11
10
9
8
7
6
5
4
3
2
1
2
3
tiempo (en minutos)
11
FUNDACIN CHILE MEJOR LICEO
GUA N 4
PERCENTILES
Los cuartiles dividen el conjunto de datos en 4 partes iguales. De la misma manera, los
quintiles dividen al conjunto de datos en 5 partes iguales, los deciles en 10 partes iguales y los
percentiles en 100 partes iguales. Todos ellos reciben el nombre genrico de medidas de
posicin.
En esta gua nos concentraremos en los percentiles. Veremos que la forma de calcularlos no
difiere mucho de la forma de calcular cuartiles y esa misma tcnica es aplicable a otras
medidas de posicin. Recuerda que los datos deben estar ordenados de menor a mayor.
Explicaremos el clculo de percentiles a travs de dos ejemplos:
Ejemplo 1: Una empresa utiliza cierta maquinaria y lleva un registro de cuntos das funcionan
antes que deba hacrseles algn tipo de mantenimiento. Los datos de los ltimos 19 registros
son los siguientes (los datos estn en horas):
32,5
62,1
70,0
42,0
62,4
71,7
47,2
63,2
76,3
50,2
63,9
80,7
59,0
65,2
82,7
60,1
66,4
61,5
68,1
La empresa decide dar de baja una maquinaria, si est bajo el percentil 12. A cuntas horas
equivale eso?
Solucin:
1. Calculamos qu posicin ocupa el percentil 12 (Lo escribimos P12).
Como n = 19, usamos n + 1 = 20.
Calculamos el 12% de 20: 0,12 * 20 = 2,4
Por lo tanto, P12 corresponde al dato que ocupa la posicin 2,4.
2. Calculamos el percentil 12.
El 2 dato es 42,0 y el 3er dato es 47,2. Nosotros buscamos el dato 2,4.
Hacemos el clculo:
a) Entre el 42,0 y 47,2 hay 7,2 de diferencia.
b) Multiplicamos 7,2 por 0,4 (la parte decimal de 2,4). Obtenemos como resultado 2,88,
que aproximamos a 2,9. (Como los datos tienen un nmero despus de la coma, los
resultados tambin).
c) Sumamos el resultado obtenido en b) al 2 dato: 42,0 + 2,9 = 44,9.
Respuesta: P12 = 44,9.
Entonces, la empresa debiera dar de baja a una mquina, si requiere de mantencin antes de
45 horas. Esto significa que debe dar de baja 2 mquinas.
12
FUNDACIN CHILE MEJOR LICEO
Tabla de frecuencias
Intervalo Frecuencia
Frecuencia
acumulada
[0 5[
4
4
[5 10[
12
16
[10 15[
17
33
[15 20[
21
54
[20 25[
10
64
[25 30[
5
69
13
FUNDACIN CHILE MEJOR LICEO
ACTIVIDADES
1. Los pediatras usan tablas de percentiles para ver si un nio crece de manera adecuada.
Santiago tiene 2 aos y medio, mide 98 cm y pesa 15 kilos y medio. De acuerdo con la
tabla, Santiago se encuentra en el percentil 95 segn su estatura y en el percentil 90
segn el peso.
Cmo le explicaras qu significan estos valores a alguien que no est familiarizado con el
concepto de percentil?
2. Un colegio analiza los promedios finales de sus alumnos. Para eso confecciona la siguiente
tabla:
Promedio
Nmero de alumnos
[3 4[
2
[4 5[
24
[5 6[
86
[6 7]
64
[10 - 14[
5
[14 18[
27
[18 22[
43
[22 26[
31
[26 30]
12
14
FUNDACIN CHILE MEJOR LICEO