Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 2. Distribuciones de Frecuencia PDF
Tema 2. Distribuciones de Frecuencia PDF
ESCALAS DE MEDICIÓN
Los datos se clasifican por niveles de medición. El nivel de medición de los datos rige los cálculos que se
llevan a cabo con el fin de resumir y presentar los datos. También determina las pruebas estadísticas que se deben
realizar. Por ejemplo, en la pista de una escuela secundaria hay ocho competidores para la carrera de 400 metros.
Para indicar el orden en que llegan a la meta dice que la media es de 4.5. ¿Qué revela este promedio? ¡Nada!
De hecho, existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. La medición más
baja, o más primaria, corresponde al nivel nominal. La más alta, o el nivel que proporciona la mayor información
relacionada con la observación, es la medición de razón.
En resumen, las propiedades de los datos de nivel de intervalo son las siguientes:
1. Las clasificaciones de datos se ordenan de acuerdo con la cantidad de características que poseen.
2. Diferencias iguales en la característica representan diferencias iguales en los números asignados a las
clasificaciones.
3. El punto cero representa la ausencia de características y la razón entre dos números es significativa.
TABLAS DE FRECUENCIAS
El primer procedimiento que se emplea para organizar y resumir un conjunto de datos es una tabla de
frecuencias. Una Tabla de Frecuencias es una agrupación de datos en clases mutuamente excluyentes que
muestra el número de observaciones en cada clase.
Para construir la tabla de frecuencias: primero se establecen las clases, las cuales serán las categorías en
caso de variables cualitativas y los intervalos de clase, en el caso de variables cuantitativas. Luego se determinan
las frecuencias de cada clase.
Las Frecuencias que se determinan en la tabla de frecuencias ya sea para variables cualitativas o para
variables cuantitativas son las siguientes:
Frecuencia absoluta: es el número de veces que se repite la variable estadística, es el número de veces
que aparece en la muestra dicho valor de la variable. Se representa por (𝑥𝑖 ).
Frecuencia relativa: es la proporción que representa la frecuencia absoluta en relación con el total. Se
representa por (𝑓𝑟 ) y es el cociente entre 𝑥𝑖 y el número total de datos (𝑛).
𝑥𝑖
𝑓𝑟 =
𝑛
Frecuencia relativa porcentual o Porcentaje: la frecuencia relativa es un tanto por uno, sin embargo, hoy
en día es bastante frecuente hablar siempre en términos de tantos por ciento o porcentajes, por lo que esta
medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por (𝑝𝑖 )
Frecuencia absoluta acumulada: es el número de veces que ha aparecido en la muestra un valor menor o
igual que el de la variable. Se representa por (𝐹𝑎 ), se obtiene sumando progresivamente las frecuencias absolutas.
Frecuencia relativa acumulada: es la proporción que representa la frecuencia acumulada en relación con el
total. Es la frecuencia absoluta acumulada dividida por el tamaño de la muestra. Se representa por (𝐹𝑟 )
𝐹𝑎
𝐹𝑟 =
𝑛
Ejemplo 2.1
Un estudio hecho en un conjunto de 24 personas con objeto de determinar su grupo sanguíneo ha
conducido a los siguientes resultados: A, B, A, A, A, AB, O, A, A, A, O, B, O, A, B, O, B, O, A, B, B, A, A,
O. Se le solicita lo siguiente: a. Construya la Tabla de distribución de frecuencias. b. Elabore Gráfico de barras y de
pastel para la variable. c. Interprete la información obtenida de acuerdo a aspectos resaltantes para el interesado.
(Resolución en Clase)
Usando Excel:
Ejemplo 2.2
Usted ha sido contratado como asesor de una importante empresa eléctrica que abastece de energía a un
gran sector de la capital, la cual se encuentra realizando un estudio sobre las características y el consumo de
electricidad de los hogares a los cuales abastece. El estudio está basado en una muestra de 40 hogares en los
cuales se midieron las siguientes variables: tipo de vivienda (casa o departamento), nivel socioeconómico del
grupo familiar, cuyos resultados se muestran en la tabla siguiente. Se le solicita lo siguiente: a. Construya la Tabla
de distribución de frecuencias. b. Elabore Gráfico de barras y de pastel para cada una de las variables. c. Interprete
la información obtenida de acuerdo a aspectos resaltantes para la empresa eléctrica.
(Resolución en clase)
Tipo de Vivienda Nivel socioeconómico Tipo de Vivienda Nivel socioeconómico
Departamento Bajo Departamento Medio
Casa Alto Casa Medio
Departamento Medio Departamento Alto
Casa Bajo Departamento Bajo
Departamento Medio Casa Medio
Casa Medio Casa Medio
Departamento Bajo Casa Medio
Departamento Medio Casa Bajo
Casa Medio Departamento Bajo
Casa Medio Casa Bajo
Departamento Bajo Casa Alto
Departamento Medio Casa Alto
Casa Medio Casa Bajo
Departamento Alto Casa Medio
Casa Medio Casa Medio
Casa Bajo Casa Medio
Departamento Medio Departamento Medio
Casa Medio Casa Medio
Departamento Medio Departamento Medio
Casa Medio Casa Bajo
Casa Medio
Ejemplo 2.3
Una importante agencia de turismo desea realizar un estudio sobre una muestra de 20 familias de clase
media y alta de Santiago que vacacionan dentro del país, con el fin de brindar distintas ofertas turísticas enfocadas
a este segmento de la población. Las variables son: destino, medio de transporte y tipo de alojamiento. Se le
solicita lo siguiente: a. Construya la Tabla de distribución de frecuencias. b. Elabora Gráfico de barras y de pastel
para cada una de las variables. c. Interprete la información obtenida de acuerdo a aspectos resaltantes para la
agencia de turismo.
(Resolución en clase)
Los intervalos deben ser inclusivos y no solaparse. Cada observación debe pertenecer a uno y sólo un
intervalo. Consideremos una distribución de frecuencias de las edades (redondeadas al año más próximo) de un
grupo de personas. Si la distribución de frecuencias contiene los intervalos “20-30 años” y “30-40 años”, ¿A cuál
de estas dos clases pertenecería una persona de 30 años?
Los límites o extremos de cada clase deben estar claramente definidos. Para evitar solapamientos, los
intervalos de edades podrían definirse de la forma siguiente: “20 años pero menos de 30”, seguido de “30 años
pero menos de 40”, y así sucesivamente. Otra posibilidad es definir los intervalos de edad del modo siguiente: “20-
29”, “30-39”, etc. Considerando que se analizará la edad como un número entero, no hay ningún solapamiento.
Ahora bien, si al realizar cálculos se desea considerar la edad como un variable continua, es decir, es
importante para el analista la fracción de años para realizar las interpretaciones, o si se trata de otro tipo de
variable que son específicamente continuas, entonces se debe considerar los intervalos iguales sin solapamientos
pero considerando todas las opciones decimales. De forma que se puede tomar para el ejemplo de las edades
como: [20 − 30] , (30 − 40] y así sucesivamente. De allí que, la selección de los límites es subjetiva. Hay que
asegurarse simplemente de definir unos límites que permitan comprender e interpretar claramente los datos.
Del proceso de aproximar el número de clases al entero más cercano y luego, al redondear el intervalo de
clase hacia arriba con el fin de obtener un tamaño conveniente de clase, se altera el valor del rango, pues se cubre
un rango más amplio o más pequeño que el necesario (𝑛𝑅 = 𝐼𝐶 . 𝑁° 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠), de allí que resulta natural poner
cantidades aproximadamente iguales en caso de excedente cada una de las dos colas de los datos, agregando al
mayor y quitándole al menor. Mientras que, si se presente un déficit en el nuevo rango respecto al rango real, se
debe considerar una amplitud de intervalo menor en una unidad para que se cubra todo el rango real, o se
presente un excedente.
Se procede a construir la tabla de distribución de frecuencias con las siguientes columnas: Intervalos de clase
(variable considerada), Marca de clase ((límite inferior + límite superior) /2), frecuencia Simple, Frecuencia
Acumulada, frecuencia relativa, Frecuencia Relativa acumulada, frecuencia relativa porcentual, Frecuencia relativa
porcentual acumulada.
Ejemplo 2.4
Una compañía de cambio de aceite que cuenta con varios talleres en el área metropolitana de Seattle. Registra las
siguientes cantidades diarias de cambios de aceite que se realizaron los pasados 60 días:
65 98 55 62 79 59 51 90 72 56
70 66 80 94 79 73 71 85 62 63
45 48 65 87 39 56 62 68 71 85
43 57 67 74 66 71 60 64 68 72
47 55 68 64 76 58 80 73 69 59
56 62 68 71 85 65 98 55 62 79
(a) Construye la tabla distribución de frecuencias utilice la regla de Sturges para determinar el número de
clases.
(b) Elabore el histograma y polígono de frecuencias absolutas correspondiente a la información obtenida.
(c) Determine, de acuerdo a la información registrada en los literales anteriores,
(c.1) el límite superior de la tercera clase.
(c.2) el o los intervalos con máxima frecuencia.
(c.3) marca de clase del segundo intervalo de clase.
(c.4) ¿Con qué frecuencia se realizaron más de 73 cambios o más en un día?
(c.5) ¿En qué porcentaje se realizaron menos de 55 cambios en un día?
(c.6) ¿Cuál es el porcentaje para la realización de entre 55 y 72 cambios en un día?
(d) Elabore la Ojiva.
Solución:
(a)
1. 𝑅𝑎𝑛𝑔𝑜 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 = 98 − 39 = 59
2. Regla de Sturges. No. de clases = 1 + 3,3 log 𝑛 = 1 + 3,3 log 60 = 6,9 ≈ 7 clases.
𝑅𝑎𝑛𝑔𝑜 59
3. Calculamos la amplitud del intervalo: 𝐼𝐶 = 𝑁° 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = 7
= 8,4 ≈ 9
4. Nuevo rango = No. De Clases × amplitud del intervalo = 7 × 9 = 63 diferencia = 4
5. Se tiene la tabla de distribución de frecuencias:
Límite Marca de
(fi) Fa fr Fr pi% Pi%
Superior Clase (Xi)
37 - 45 41 3 3 0,050 0,05 5,00 5,00
46 - 54 50 3 6 0,050 0,10 5,00 10,00
55 - 63 59 17 23 0,283 0,38 28,33 38,33
64 - 72 68 20 43 0,333 0,72 33,33 71,67
73 - 81 77 9 52 0,150 0,87 15,00 86,67
82 - 90 86 5 57 0,083 0,95 8,33 95,00
91 - 99 95 3 60 0,050 1,00 5,00 100,00
60 1,00 100
(b)
(c)
(c.1): el límite superior de la tercera clase es 63
(c.2): el intervalo con máxima frecuencia es de 64 a 72.
(c.3): la marca de clase del segundo intervalo de clase es 50.
(c.4) ¿Con qué frecuencia se realizaron más de 73 cambios o más en un día?:
17 de los 60 días se realizaron 73 o más cambios de aceite.
(c.5) ¿En qué porcentaje se realizaron menos de 55 cambios en un día?
El 10% de los 60 días, se realizaron menos de 55 cambios.
(c.6) ¿Cuál es el porcentaje para la realización de entre 55 y 72 cambios en un día?
El 62% de los días estudiados se registraron entre 55 y 72 cambios.
Ejemplo 2.6
El gerente de un Supermarket en Rhode Island, reunió la siguiente información sobre la cantidad de veces
que un cliente visita la tienda en un mes. Las respuestas de 51 clientes fueron las siguientes:
5 3 3 1 4 4 5 6 4 2 6 6 6 7 1
1 14 1 2 4 4 4 5 6 3 5 3 4 5 6
8 4 7 6 5 9 11 3 12 4 7 6 5 15 1
1 10 8 9 2 12
(a) Construye la tabla distribución de frecuencias utilice la regla de 2𝑐 para determinar el número de clases.
(b) Elabore el histograma y polígono de frecuencias absolutas correspondiente a la información obtenida.
(c) Determine, de acuerdo a la información registrada en los literales anteriores,
(c.1) ¿Cuántos clientes visitan la tienda más de 8 veces al mes?
(c.2) ¿Qué porcentaje de clientes visitan la tienda entre 3 y 8 veces al mes?
(c.3) ¿Interprete el intervalo de mayor frecuencia?
(c.4) ¿Cuántos clientes visitan la tienda menos de 5 veces al mes?
Ejemplo 2.7
La división de servicios alimentarios de un parque de atracciones en Orlando Florida, estudia la cantidad
que gastan al día en alimentos y bebidas las familias que visitan el parque de diversiones. Una muestra de 40
familias que visitó el parque ayer revela que éstas gastaron las siguientes cantidades de dólares:
77 18 63 84 38 54 50 59 54 56 36 26 34 52
41 58 58 53 51 62 43 52 53 63 62 50 61
60 60 45 66 83 71 63 58 61 71 62 65 44
(a) Construye la tabla distribución de frecuencias utilice la regla de 2𝑐 para determinar el número de clases.
(b) Elabore el histograma y polígono de frecuencias absolutas correspondiente a la información obtenida.
(c) Determine, de acuerdo a la información registrada en los literales anteriores,
(c.1) ¿Cuántas familias gastan 40 dólares o menos?
(c.2) ¿Qué porcentaje de familias gastan más de 51 dólares?
(c.3) ¿Interprete el intervalo de mayor frecuencia?
(c.4) ¿Qué porcentaje de familias gastan 62 dólares o menos?
(c.5) ¿Cuántas familias gastan más de 40 pero máximo 62 dólares?
Solución:
(a)
1. 𝑅𝑎𝑛𝑔𝑜 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 = 84 − 18 = 66
2. Regla de 2𝑐 > 𝑛 26 > 40. No. de clases = 6.
𝑅𝑎𝑛𝑔𝑜 66
3. Calculamos la amplitud del intervalo: 𝐼𝐶 = 𝑁° 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = = 11
6
Marca de
Gastos (fi) Fa fr Fr pi% Pi%
Clase (Xi)
[18, 29] 23,5 2 2 0,050 0,05 5,00 5,00
(29, 40] 34,5 3 5 0,075 0,13 7,50 12,50
(40, 51] 45,5 7 12 0,175 0,30 17,50 30,00
(51, 62] 56,5 18 30 0,450 0,75 45,00 75,00
(62, 73] 67,5 7 37 0,175 0,93 17,50 92,50
(73, 84] 78,5 3 40 0,075 1,00 7,50 100,00
Totales 40 1,00 100
77 18 63 84 38 54 50 59 54 56 36 26 34 52
41 58 58 53 51 62 43 52 53 63 62 50 61
60 60 45 66 83 71 63 58 61 71 62 65 44
(b)
(c) Determine, de acuerdo a la información registrada en los literales anteriores,
(c.1) ¿Cuántas familias gastan 40 dólares o menos?
R: 5 familias de las 40, gastan 40 dólares o menos en alimentos y bebidas.
(c.2) ¿Qué porcentaje de familias gastan más de 51 dólares?
R: 70% de las familias gastan más de 51 dólares en alimentos y bebidas.
(c.3) ¿Interprete el intervalo de mayor frecuencia?
R: La cantidad de dinero que más gastan las familias en el parque por alimentos y bebidas está
entre 51 y 62 dólares.
(c.4) ¿Qué porcentaje de familias gastan 62 dólares o menos?
R: 75% de las familias gastan 62 dólares o menos en alimentos y bebidas.
(c.5) ¿Cuántas familias gastan más de 40 pero máximo 62 dólares?
R: 25 familias gastan más de 40 pero menos de 62 dólares en alimentos y bebidas.
5. Usando Excel
En una nueva hoja, copiar las columnas correspondientes a la marca de clase y la frecuencia absoluta.