Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAPÍTULO 2
DISTRIBUCIÓN DE FRECUENCIAS
2.1. Introducción
Una vez que se tiene el conjunto de datos, se debe expresar y clasificar de acuerdo a criterios adecuados
en la forma más simple que permita ver rápidamente todas las características permitidas para obtener
conclusiones útiles, sea directamente o a través de procesamiento de datos posteriores.
Un conjunto de datos puede ser resumido y clasificado de acuerdo a criterios convenientes en un cuadro o
tabla resumen las observaciones originales de informaciones de censos o de muestras objeto de estudio en
una tabla de distribución de frecuencias o tabla de frecuencias.
2.2.1. Frecuencias
Las frecuencias es el número de veces en que se presenta el valor de una variable, para señalar en términos
absolutos o relativos, la cantidad de datos contenidos en una o varias clases, se distinguen dos tipos de
frecuencias.
n
hi
, h 1
i 1
i
Cuando el número de observaciones es grande, pero el número de valores distintos que toma la variable es
pequeño, distribuiremos o agruparemos los resultados de las observaciones. Es decir, disponiendo los
datos en dos columnas: una para los valores distintos que toma la variable y otra para las frecuencias
absolutas de cada uno de ellos:
xi Conteo ni Ni hi Hi
x1 ||| n1 N1 h1 H1
x2 |||| n2 N2 h2 H2
x3 || n3 N3 h3 H3
||||
xm nm Nm hm Hm
Total n 1
Se observa que, en este tipo de distribución, el número de valores distintos de la variable m es inferior o
igual al número total de observaciones n . ( m n)
Ejemplo 1: Se realiza una encuesta a un conjunto de 20 familias sobre el número de hijos. Los resultados
en el orden obtenido son:
2 3 1 4 3 5 2 4 1 2
5 3 2 3 2 0 4 2 2 1
a) Construya una tabla de distribución de frecuencias para estos datos.
b) Interprete las siguientes frecuencias: n2 , N 3 , h4 , H 5 .
Solución:
a) Comenzamos ordenando los datos y luego la frecuencia con el que se repite algunos valores,
representamos por el método de los palotes, que consiste en poner una raya vertical o tarja cada vez que
aparece el valor en cuestión, destacando cada cinco unidades con el fin de facilitar el cómputo final ( |||| ) .
Luego, contamos el número de tarjas, con lo cual se obtiene las frecuencias absolutas ( ni ) , de la siguiente
manera:
xi Conteo ni Ni hi Hi
0 | 1 1 0,05 0,05
1 ||| 3 4 0,15 0,20
2 |||| || 7 11 0,35 0,55
3 |||| 4 15 0,20 0,75
4 ||| 3 18 0,15 0,90
5 || 2 20 0,10 1,00
Total 20 1,00
Para diferenciar los datos discretos de los continuos representaremos a este último por la variable
observada yi . En este caso debido a que la magnitud de la característica puede tomar, al menos
teóricamente, una infinidad de valores, el proceso de reducción, agrupación de los datos originales, que
conducen a la construcción de tablas de frecuencias, no es tan simple como en el caso de datos discretos y
no se puede proceder como en el caso ya estudiado: es más bien un problema de clasificación de datos
donde la subjetividad del hombre tiene una influencia que no debe ignorarse.
Paso 1. Número de clases ( m) , el número de clases viene a ser la cantidad de clases que se pueden hacer
con el conjunto de datos, lo más adecuado es que sea de cinco a veinte ( 5 m 20 ). Sin embargo, el
sentido común nos dice que el número de clases no deben ser pocas debido a que la condensación sería
mucha y con ello habría pérdida de información fuerte en relación con la contenida en el conjunto de datos
originales.
a) Tomar el número de clases ( m) igual al entero más próximo a m 2 n , siendo n el número de datos.
Paso 2. Rango o recorrido ( R ) , es la longitud del recorrido del conjunto de datos, es decir, la diferencia
entre el valor máximo ( X max ) y el valor mínimo ( X min ) .
R X max X min
Paso 3. Amplitud de clase o Intervalo de clase (ci ) , es la longitud del intervalo que define la clase, es
decir, ci yi yi1 , i 1, 2,..., m
Si los intervalos tienen igual longitud, denotamos por c yi yi1 , entonces C R / m .
Se construye los intervalos de clase de la manera siguiente:
ESTADÍSTICA PARA PLANIFICACIÓN 12 José Montaño Romero
Paso 4. Límites de clase ( yi yi1 ) , si el límite superior de una clase coincide con el límite inferior de la
clase siguiente, entonces al hacer la clasificación de una observación que coincide con el límite común de
clase, se encuentra frente a la disyuntiva, ¿a qué clase se asigna este valor? Para evitar esta dificultad se
suele tomar una de las alternativas siguientes:
1º. Considerar los intervalos de clase como intervalos de números reales abiertos a izquierda y cerrados a
derecha: yi1 yi ] yi1 , yi ] con esta alternativa cada clase excluye la observación que coincide con su
límite inferior.
2º. Considerar los intervalos de clase como intervalos de números reales abiertos a derecha y cerrados a
izquierda: yi1 yi [ yi1 , yi [ con esta alternativa cada clase excluye la observación que coincide con
su límite superior.
Paso 5. Marca de clase ( yi ) , es el punto medio del intervalo que representa a dicha clase y se calcula a
través de la fórmula siguiente:
yi1 yi
yi
2
Una vez tabulada los datos, presentamos la tabla de distribución de frecuencia completa:
ESTADÍSTICA PARA PLANIFICACIÓN 13 José Montaño Romero
Ejemplo 2: Los ingresos (en miles de bolivianos) mensuales de un grupo de pequeñas empresas
asentadas en el departamento de Cochabamba dedicadas a la confección de prendas de vestir han obtenido
los siguientes ingresos por la producción y venta de su producto.
15 6 18 60 13 10
19 14 17 57 15 12
27 16 13 59 18 8
22 20 17 45 20 40
0 25 21 40 30 6
14 28 7 36 60 8
6 30 60 28 12 10
8 4 8 36 46 30
9 6 14 39 50 2
5 10 7 52 50 8
a) Formar una tabla de todas las distribuciones de frecuencias menor que y mayor que, con intervalos de
amplitud constante.
b) Realizar las interpretaciones de: n4 , h6 , N 5 y H 4 .
c) Realizar las interpretaciones de N 6* y H 3* .
Solución:
a) procedemos a realizar los cálculos correspondientes para la construcción de la tabla.
ESTADÍSTICA PARA PLANIFICACIÓN 14 José Montaño Romero
C 60 / 7 8, 57 9
b) Interpretaciones de:
n4 6 . Seis empresas obtienen un ingreso de 27 a 36 mil bolivianos mensuales
h6 8% El 8% de las empresas tienen un ingreso entre 45 a 54 mil bolivianos mensuales.
N 5 50 Cincuenta empresas tienen un ingreso menor o igual a 45 mil bolivianos mensuales.
H 4 75% . El 75% de las empresas tienen menor o igual a 36 mil bolivianos mensuales.
c) Interpretaciones de:
N 6* 10 Diez empresas por lo menos tienen un ingreso entre 45 a 63 mil bolivianos mensuales
H 3* 48% El 48% de las empresas por lo menos tienen un ingreso entre 18 a 63 mil bolivianos
mensuales.
Paso1. Determinar el número de clases o intervalos de clases, es decir m . Cuando el valor de m no está
determinado previamente, una sugerencia para m está dada por la Regla de Sturges:
m 1 3, 322 log n
ESTADÍSTICA PARA PLANIFICACIÓN 15 José Montaño Romero
Donde:
log : logaritmo decimal
n : tamaño de la muestra
m : cantidad de intervalos (m N )
Paso 2. Determinar el rango que está dado por la diferencia entre el Valor Máximo ( X max M ) y el
Valor Mínimo ( X min m) que toma la variable en la muestra, es decir;
R M m 1u
Si los datos vienen dados por una unidad de medida, entonces 1u 1 , implica que es un entero.
Si los datos vienen dados por un decimal, entonces 1u 0,1 , implica que es un decimal.
Si los datos vienen dados por dos decimales, entonces 1u 0, 01 , implica que son dos decimales.
Paso 3. Determinar la amplitud de los intervalos (clase), es decir C i , i 1, 2,..., m , como sigue:
R
C
m
Donde, el valor de C estará dado por la unidad de medida, si no es exacto, siempre se aproxima el valor
superior.
Paso 4. Determinar unidades auxiliares, como generalmente el valor de C es aproximado hacia “arriba”,
para que todos los intervalos de clase tengan la misma amplitud, es necesario agregar una cantidad de P
unidades determinadas por:
P (C m) R
1. Los intervalos aparentes: utilizados principalmente para variables del tipo numérica discretas, se
determina de la siguiente manera:
LI 1 m , Ls1 LI 1 (C 1u )
LI 2 LI 1 C , Ls 2 LI 2 (C 1u )
LI 3 LI 2 C , Ls 3 LI 3 (C 1u )
LI 4 LI 3 C , Ls 4 LI 4 (C 1u )
……………… ……………………
LIm LI ( m 1) C , Lsm LIm (C 1u )
Siendo Lsm M P
ESTADÍSTICA PARA PLANIFICACIÓN 16 José Montaño Romero
2. Los intervalos reales: utilizados para variables numéricos discretos se obtienen de la siguiente manera:
LI 1 m (1/ 2)u , Ls1 LI 1 C
LI 2 LI 1 C , Ls 2 LI 2 C
LI 3 LI 2 C , Ls 3 LI 3 C
………….. ……………
LIm LI ( m 1) C , Lsm LIm C
Siendo Lsm M P 1u / 2
Paso 6. Se determina un representante de los intervalos de clase, el cuál recibe el nombre de Marca de
Clase, y está dado por el punto medio de cada intervalo, es decir:
yi1 yi
yi
2
Finalmente, se construye la tabla de frecuencias que más se emplea en la vida real, si es que comparamos
con la información que se tiene de las distintas instituciones que realizan una serie de análisis estadístico
de determinadas variables.
Ejemplo 3: La inversión de 60 pequeñas empresas del ramo artesanal (en miles de bolivianos) en el
departamento de Cochabamba, cuyos datos se reflejan.
4 5 0 8 2 10 13 12 14 16
11 13 12 17 15 19 22 24 26 21
25 20 25 23 28 31 33 35 34 31
29 28 37 39 43 42 40 38 44 46
50 49 52 48 49 51 52 48 53 54
62 60 61 59 58 47 48 52 28 40
a) Formar una tabla de frecuencias menor que y mayor que, con intervalos aparentes.
b) Realizar las interpretaciones de: n6 , h5 , N 4 y H 3 .
c) Realizar las interpretaciones de N 5* y H 3* .
Solución:
Se construye la tabla de frecuencias:
m 1 3,322 log 60 6, 90 7
Paso 2. Rango: R M m 1u
R 62 0 1 63
R
Paso 3. Amplitud del intervalo: C
m
63
C 9
7
ESTADÍSTICA PARA PLANIFICACIÓN 17 José Montaño Romero
Paso 4. Determinar unidades auxiliares, como generalmente el valor de C es aproximado hacia “arriba”,
para que todos los intervalos de clase tengan la misma amplitud, es necesario agregar una cantidad de P
unidades determinadas por:
P (C m) R
Paso 5. Los intervalos aparentes: utilizados principalmente para variables del tipo numérica discretas, se
determina de la siguiente manera:
LI 1 0 , Ls1 0 (9 1) 8
LI 2 0 9 9 , Ls 2 9 (9 1) 17
LI 3 9 9 18 , Ls 3 18 (9 1) 26
LI 4 18 9 27 , Ls 4 27 (9 1) 35
LI 5 27 9 36 , Ls 5 36 (9 1) 44
LI 6 36 9 45 , Ls 6 45 (9 1) 53
LI 7 45 9 54 , Ls 7 54 (9 1) 62
yi1 yi
Paso 6. Marca de Clase: yi
2
Finalmente, se construye la tabla de frecuencias.
Es la representación gráfica usual para variables cuantitativas sin agrupar o para variables cualitativas. En
el eje de ordenadas se representa los diferentes valores de la variable ( xi ) . Sobre cada valor levantamos
una barra de altura igual a la frecuencia (absoluta o relativa)
Ejemplo 4: Se muestra la siguiente tabla de distribución del número de trabajadores de una empresa
constructora, de acuerdo a su ocupación. Represente dicha información en un gráfico de barras.
Ocupación Trabajadores
Obreros 180
Ingenieros 20
Administradores 40
Secretarias 60
Ayudantes 100
Total 400
2.4.2. Histograma
En un histograma se representan las frecuencias de una variable estadística mediante áreas. De tal forma
que un histograma es un conjunto de rectángulos que tienen como base los intervalos de clase y cuya
superficie son las frecuencias (absolutas o relativas). Por tanto, las alturas son proporcionales a las
frecuencias, y será el cociente entre la frecuencia y la amplitud del intervalo.
Frecuencia ni
Altura del rectángulo ai
Amplitud de clase ci
Donde,
ai es la altura del intervalo
ci es la amplitud del intervalo
ni es la frecuencia del intervalo
El histograma se usa para representar variables cuantitativas continuas que han sido agrupadas en
intervalos de clase, la desventaja que presenta que no funciona para variables discretas, de lo contrario es
una forma útil y practica de mostrar los datos estadísticos.
yi/1 ─ yi/ ni
10 ─ 20 4
20 ─ 30 11
30 ─ 40 20
40 ─ 50 9
50 ─ 60 6
Total 50
yi/1 ─ yi/ ni hi
10 ─ 20 4 0,08
20 ─ 30 11 0,22
30 ─ 40 20 0,40
40 ─ 50 9 0,18
50 ─ 60 6 0,12
Total 50
ESTADÍSTICA PARA PLANIFICACIÓN 20 José Montaño Romero
Para representar el polígono de frecuencias, se trazan rectas uniendo los puntos medios de las bases
superiores de los rectángulos del histograma de frecuencias. Se obtiene el polígono de frecuencias
absolutas y el polígono de frecuencias relativas, reflejadas en la grafica siguiente.
yi/1 ─ yi/ ni Ni hi Hi N i* H i*
10 ─ 20 4 4 0,08 0,08 50 1,00
20 ─ 30 11 15 0,22 0,30 46 0,92
30 ─ 40 20 35 0,40 0,70 35 0,70
40 ─ 50 9 44 0,18 0,88 15 0,30
50 ─ 60 6 50 0,12 1,00 6 0,12
Total 50 1,00
ESTADÍSTICA PARA PLANIFICACIÓN 21 José Montaño Romero
Es el más usual en variables cualitativas. Se representan mediante círculos. A cada valor de la variable se
le asocia el sector circular proporcional a su frecuencia.
Para hallar el ángulo se emplea la siguiente proporción: al tener una circunferencia 360°, el cociente entre
la frecuencia absoluta (o relativa) total y la frecuencia absoluta (o relativa) que queramos representar será
igual al cociente entre los 360° de la circunferencia y el ángulo a determinar, así:
n 3600 3600 ni
ni n
1 3600
3600 hi
hi
Donde es el ángulo a determinar.
Solución:
Se puede comprobar que la suma de los seis sectores da 360º como se muestra en la siguiente figura.
La Prensa
9% Los Tiempos
25%
La Razón
11%
El Diario
20%
Opinión
23%
El Deber
12%
Son las siguientes: número, título, nota complementaria al título, encabezado, detalle y datos estadísticos,
fuente, elaboración y nota de pie.
1. Número
Es el código de identificación del cuadro.
2. Título
Es la descripción en forma sintética y lo suficientemente clara del contenido de la tabla estadística. Puede
contener otros subtítulos adicionales para poder así mostrar la tabla en forma completa. Cuando en un
trabajo de investigación se utilizan varias tablas estas se deben numerar en forma correlativa.
4. Encabezado
Son las referencias, que se escriben en la parte superior de las columnas, referidas a las variables y a los
datos numéricos.
6. Fuente
Se refiere a la institución o persona que proporciona los datos, es muy importante citar la fuente ya que
permite comprobar los datos y obtener información complementaria a la fuente original, la
responsabilidad sobre la veracidad de los datos se atribuye a la fuente.
7. Elaboración
Se debe plantear cuidadosamente su tamaño, las columnas y la distribución de la información por orden de
importancia, que, por lo general, no es el orden alfabético.
ESTADÍSTICA PARA PLANIFICACIÓN 23 José Montaño Romero
8. Nota de pie
Se escribe usualmente para clarificar algunos datos que corresponden a la tabla.
Sexo
Condición Final Total
Masculino (a) Femenino (b)
Aprobado 20 15 35
Desaprobados 10 5 15
Inhabilitados 5 5 10
35 25 60
Fuente: Oficina de Registro e Inscripción. Actas de Evaluación.
(p): Hombre
(b): Mujer
POR TIPO DE GASTO 2006 2007 2008 2009 2010 2011 2012 2013
CONSUMO 3,96 4,11 5,27 3,69 3,86 5,44 4,65 6,35
Gasto Final Adm.Púb. 3,27 3,77 3,91 3,82 3,07 7,24 4,89 9,29
Gasto Final Hog. 4.07 4,017 5,48 3,67 3,98 5,16 4,62 5,88
INVERSIÓN BRUTA -5,09 11,06 29,31 3,88 7,15 223,52 -4,63 16,08
Formación Brutal Capital 9,30 12,64 18,67 2,89 7,46 23,72 1,46 12,90
Público 15,56 20,89 17,45 4,96 8,54 17,45 5,77 17,53
Privado 3,66 4,37 20,10 0,54 6,19 31,32 -268,77 -66,83
Variación Existencias -162,91 41,31 -132,36 59,03 -4,27 15,41 -268,77 -66,83
SALDO TRANSACCIONES 108,14 -7,07 -62,39 -24,90 -26,92 -517,31 -88,74 502,61
Exportaciones 11,34 3,09 2,17 -10,76 9,85 5,88 11,92 4,09
Importaciones 5,16 4,37 9,43 -10,21 11,04 17,01 4,28 8,18
PIB (precios de mercado) 4,80 4,56 6,15 3,36 4,13 5,17 5,18 6,78
Fuente: Instituto Nacional de Estadística
Elaboración: Banco Central de Bolivia – Asesoría de Política Económica – Área de Investigaciones
ESTADÍSTICA PARA PLANIFICACIÓN 24 José Montaño Romero
PRÁCTICA Nº 2
1. Defina:
a) Frecuencia absoluta.
b) Frecuencia relativa
c) Desarrolle los pasos para construir la tabla de distribución de frecuencias
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 77 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 72 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 99 78 85 76 65 71 75
65 80 73 57 88 78 62 76 50 74
86 67 73 81 72 63 76 75 85 77
3. En la oficina de El Diario, el tiempo que se tarda en imprimir la primera plana fue registrado durante 50
días. A continuación, se transcriben los datos, aproximados a décimas de minuto:
20,1 20,8 22,8 21,9 22,0 20,7 20,9 25,0 22,2 22,8
19,5 25,3 20,7 22,5 21,2 23,8 23,3 20,9 22,9 23,5
21,8 23,7 20,3 23,6 19,0 25,1 25,0 19,5 24,1 24,2
23,9 21,3 21,5 23,1 19,9 24,2 24,1 19,8 23,9 22,8
22,7 19,7 24,2 23,8 20,7 23,8 24,3 21,1 20,9 21,6
a) Construya con los datos una distribución de frecuencia y una distribución de frecuencia acumulativa
“menor que”, usando intervalos de 0,8 minutos.
b) Construya con los datos un polígono de frecuencias.
c) Construya con los datos una ojiva de frecuencia “menor que”.
d) Por medio de la ojiva estime qué porcentaje de las veces la primera plana del periódico puede
imprimirse en menos de 24 minutos.
4. Las tarifas que pagan 30 familias de una zona de consumo de energía son:
45,01 48,01 30,25 39,50 45,60 58,02 33,99 43,70 60,02 51,82
52,02 56,70 49,80 53,50 57,80 45,50 45,40 46,50 59,50 61,50
35,50 41,30 64,50 65,02 36,70 39,90 58,90 62,30 48,02 63,50
5. Se tiene las notas de vencimiento de 100 estudiantes de la Universidad Mayor de San Simón,
correspondiente a la carrera de Contaduría Pública de la Facultad de Ciencias Económicas del primer
semestre:
50 53 48 62 84 41 67 51 36 56
64 34 36 44 26 20 51 58 69 43
52 31 51 23 25 23 68 62 59 33
31 57 64 51 62 56 19 63 59 64
42 52 67 66 70 52 72 66 51 66
79 54 33 70 44 42 29 19 30 74
59 58 43 64 60 59 52 63 69 60
52 82 75 70 59 32 35 66 67 51
30 75 42 43 59 93 62 73 81 86
79 53 58 82 63 73 48 79 63 51
384 288 312 368 464 272 352 464 416 304
376 272 320 448 392 352 288 241 360 479
290 320 300 550 390 250 450 490 380 280
450 350 250 225 325 425 440 340 240 244
454 354 254 452 352 252 367 340 525 510
7. Durante 60 días se ha observado el número de pasajeros que viajan de Cochabamba a La Paz por avión,
siendo estos los resultados:
40 45 58 43 55 57 49 42 43 53
65 58 65 60 51 39 35 51 63 50
37 42 65 48 50 57 35 59 38 50
36 54 46 49 65 55 47 52 62 55
37 55 39 58 53 40 46 64 48 50
59 45 63 65 49 45 52 35 44 63
8. En la siguiente tabla, los pesos de 40 estudiantes de la Universidad Mayor de San Simón, se registran
con aproximación de una libra:
xi ni hi Ni Hi
0 2
1 5
2 9
3 14 0,70
4 0,20
5
10. Si los valores de una variable discreta fluctúan entre cero y ocho en forma correlativa. Completar una
tabla de distribución simétrica en base a los datos siguientes: h9 130
8
, h7 0,115 , H 2 19, 2 , n5 16 .
11. De la frase: “La representación gráfica no es más que un medio auxiliar de la investigación estadística,
pues esta es fundamentalmente numérica”. Obtener la distribución de frecuencias de las vocales. Podría
graficar dicha distribución.
n
i 1
i 50 , n4 5 , h1 h5 , h2 h4 , H 4 0,96
Llenar la tabla y grafique a través del diagrama de frecuencias absolutas y diagrama de frecuencias
relativas.
14. Una muestra de 81 observaciones de una actividad, están dadas en la siguiente tabla:
15. La tabla siguiente recoge la distribución de la variable X : “Superficie en m2” del conjunto de
viviendas registradas en el Barcelonés con un máximo de 210 m2:
Superficie Número
(m2) Viviendas
( 0 – 30 ] 4050
( 30 – 60 ] 153900
( 60 – 90 ] 437400
( 90 – 120 ] 162000
( 120 – 150 ] 29160
( 150 – 180 ] 12150
( 180 – 210 ] 11340
Total 810000
16. Se ha observado la variable X : “Saldo en dólares” de 400 cuentas corrientes en una entidad bancaria
correspondientes a clientes con edades comprendidas entre 18 y 25 años. La distribución de frecuencias de
esta variable es la siguiente:
Saldo Número
(en dólares) Cuentas
( 50 – 70 ] 72
( 70 – 90 ] 16
( 90 – 110] 96
( 110 – 130 ] 104
( 130 – 150 ] 56
( 150 – 170 ] 16
( 170 – 190 ] 40
Total 400
Modelo de encuesta
Nombre…………………………………………….. Fecha………………………
Ocupación…………………………………………. Número entrevista…………
Si No No sabe
10. ¿Sabe de dónde vienen los recursos para el mantenimiento del parque?
Si No No sabe