Está en la página 1de 13

UNIVERSIDAD CATÓLICA DEL TÁCHIRA

Facultad de Ciencias Económicas y Sociales


Escuela de Administración y Contaduría
Lcda. Keila Moncada
Cátedra: Estadística I. 2do. Año Contaduría Pública

TEMA 2: Distribuciones de Frecuencias

ESCALAS DE MEDICIÓN

Los datos se clasifican por niveles de medición. El nivel de medición de los datos rige los cálculos que se
llevan a cabo con el fin de resumir y presentar los datos. También determina las pruebas estadísticas que se deben
realizar. Por ejemplo, en la pista de una escuela secundaria hay ocho competidores para la carrera de 400 metros.
Para indicar el orden en que llegan a la meta dice que la media es de 4.5. ¿Qué revela este promedio? ¡Nada!
De hecho, existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. La medición más
baja, o más primaria, corresponde al nivel nominal. La más alta, o el nivel que proporciona la mayor información
relacionada con la observación, es la medición de razón.

Datos de nivel nominal


En el caso del nivel nominal de medición, las observaciones acerca de una variable cualitativa sólo se
clasifican y se cuentan. No existe una forma particular para ordenar las etiquetas. Para el nivel nominal, la
medición consiste en contar. A veces, para una mejor comprensión de lectura, estos conteos se convierten en
porcentajes.

Datos de nivel ordinal


El nivel inmediato superior de datos es el nivel ordinal. Si se tienen las calificaciones que los alumnos del
profesor James Bruner le otorgaron después de un curso de Introducción a las finanzas. Cada estudiante de la
clase respondió la pregunta: “En términos generales, ¿cómo calificas al profesor del curso?” La calificación variable
ilustra el uso de la escala ordinal de medición. Una calificación es más alta o mejor, que la siguiente: superior es
mejor que bueno, bueno es mejor que promedio, promedio es mejor que malo y malo es mejor que inferior. Sin
embargo, no es posible distinguir la magnitud de las diferencias entre los grupos. ¿La diferencia entre superior y
bueno es la misma que entre malo e inferior? No es posible afirmarlo. Si sustituye 5 por superior y 4 por bueno,
concluirá que la calificación superior es mejor que la calificación bueno, pero si suma una calificación de superior y
una de bueno no espere que el resultado tenga significado. Además, no debe concluir que la calificación de bueno
(calificación de 4) sea necesariamente dos veces más alta que malo (calificación de 2). Sólo tendrá claro que la
calificación bueno es mejor que la calificación malo, no en qué grado es mejor.

Datos de nivel de intervalo


El nivel de intervalo de medición es el nivel inmediato superior. Incluye todas las características del nivel
ordinal, pero, además, la diferencia entre valores constituye una magnitud constante. Un ejemplo de nivel de
intervalo de medición es la temperatura. Suponga que las temperaturas altas durante tres días consecutivos de
invierno en Boston son de 28, 31 y 20 grados Fahrenheit. Estas temperaturas se clasifican fácilmente, aunque,
además, es posible determinar la diferencia entre ellas, gracias a que un grado Fahrenheit representa una unidad
de medición constante. Diferencias iguales entre dos temperaturas son las mismas, sin importar su posición en la
escala. Es decir, la diferencia entre 10 y 15 grados Fahrenheit es de 5; la diferencia entre 50 y 55 grados también
es de 5. Es importante destacar que 0 es un punto más en la escala. No representa la ausencia de estado. Cero
grados Fahrenheit no representa la ausencia de calor, sino sencillamente el hecho de que hace frío. De hecho, 0
grados Fahrenheit equivale aproximadamente a –18 grados en la escala Celsius.
Las propiedades de los datos de nivel de intervalo son las siguientes:
1. Las clasificaciones de datos se ordenan de acuerdo con el grado que posea de la característica en
cuestión.
2. Diferencias iguales en la característica representan diferencias iguales en las mediciones.

Datos de nivel de razón


Todos los datos cuantitativos son registrados en el nivel de razón de la medición. El nivel de razón es el
más alto. Posee todas las características del nivel de intervalo, aunque, además, el punto 0 tiene sentido y la razón
entre dos números es significativa. Ejemplos de la escala de razón de medición incluyen salarios, unidades de
producción, peso, cambios en los precios de las acciones, la distancia entre sucursales y la altura. El dinero ilustra
bien el caso. Si tiene cero dólares, entonces no tiene dinero. El peso constituye otro ejemplo. Si el cuadrante de la
escala de un dispositivo correctamente calibrado se ubica en 0, entonces hay una ausencia total de peso. La razón
entre dos números también resulta significativa. Si Jim gana 40 000 anuales vendiendo seguros y Rob gana $80
000 al año en el negocio de los automóviles, entonces Rob gana el doble de lo que gana Jim.

En resumen, las propiedades de los datos de nivel de intervalo son las siguientes:

1. Las clasificaciones de datos se ordenan de acuerdo con la cantidad de características que poseen.
2. Diferencias iguales en la característica representan diferencias iguales en los números asignados a las
clasificaciones.
3. El punto cero representa la ausencia de características y la razón entre dos números es significativa.

TABLAS DE FRECUENCIAS

El primer procedimiento que se emplea para organizar y resumir un conjunto de datos es una tabla de
frecuencias. Una Tabla de Frecuencias es una agrupación de datos en clases mutuamente excluyentes que
muestra el número de observaciones en cada clase.
Para construir la tabla de frecuencias: primero se establecen las clases, las cuales serán las categorías en
caso de variables cualitativas y los intervalos de clase, en el caso de variables cuantitativas. Luego se determinan
las frecuencias de cada clase.
Las Frecuencias que se determinan en la tabla de frecuencias ya sea para variables cualitativas o para
variables cuantitativas son las siguientes:
Frecuencia absoluta: es el número de veces que se repite la variable estadística, es el número de veces
que aparece en la muestra dicho valor de la variable. Se representa por (𝑥𝑖 ).

Frecuencia relativa: es la proporción que representa la frecuencia absoluta en relación con el total. Se
representa por (𝑓𝑟 ) y es el cociente entre 𝑥𝑖 y el número total de datos (𝑛).
𝑥𝑖
𝑓𝑟 =
𝑛

Frecuencia relativa porcentual o Porcentaje: la frecuencia relativa es un tanto por uno, sin embargo, hoy
en día es bastante frecuente hablar siempre en términos de tantos por ciento o porcentajes, por lo que esta
medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por (𝑝𝑖 )

Para variables cuantitativas o cualitativas ordinales se calculan las frecuencias:

Frecuencia absoluta acumulada: es el número de veces que ha aparecido en la muestra un valor menor o
igual que el de la variable. Se representa por (𝐹𝑎 ), se obtiene sumando progresivamente las frecuencias absolutas.

Frecuencia relativa acumulada: es la proporción que representa la frecuencia acumulada en relación con el
total. Es la frecuencia absoluta acumulada dividida por el tamaño de la muestra. Se representa por (𝐹𝑟 )
𝐹𝑎
𝐹𝑟 =
𝑛

Frecuencia relativa porcentual acumulada: De igual forma es el porcentaje acumulado. La denotaremos


por (𝑃𝑖 ).

Ejemplo 2.1
Un estudio hecho en un conjunto de 24 personas con objeto de determinar su grupo sanguíneo ha
conducido a los siguientes resultados: A, B, A, A, A, AB, O, A, A, A, O, B, O, A, B, O, B, O, A, B, B, A, A,
O. Se le solicita lo siguiente: a. Construya la Tabla de distribución de frecuencias. b. Elabore Gráfico de barras y de
pastel para la variable. c. Interprete la información obtenida de acuerdo a aspectos resaltantes para el interesado.

(Resolución en Clase)

Usando Excel:
Ejemplo 2.2
Usted ha sido contratado como asesor de una importante empresa eléctrica que abastece de energía a un
gran sector de la capital, la cual se encuentra realizando un estudio sobre las características y el consumo de
electricidad de los hogares a los cuales abastece. El estudio está basado en una muestra de 40 hogares en los
cuales se midieron las siguientes variables: tipo de vivienda (casa o departamento), nivel socioeconómico del
grupo familiar, cuyos resultados se muestran en la tabla siguiente. Se le solicita lo siguiente: a. Construya la Tabla
de distribución de frecuencias. b. Elabore Gráfico de barras y de pastel para cada una de las variables. c. Interprete
la información obtenida de acuerdo a aspectos resaltantes para la empresa eléctrica.
(Resolución en clase)
Tipo de Vivienda Nivel socioeconómico Tipo de Vivienda Nivel socioeconómico
Departamento Bajo Departamento Medio
Casa Alto Casa Medio
Departamento Medio Departamento Alto
Casa Bajo Departamento Bajo
Departamento Medio Casa Medio
Casa Medio Casa Medio
Departamento Bajo Casa Medio
Departamento Medio Casa Bajo
Casa Medio Departamento Bajo
Casa Medio Casa Bajo
Departamento Bajo Casa Alto
Departamento Medio Casa Alto
Casa Medio Casa Bajo
Departamento Alto Casa Medio
Casa Medio Casa Medio
Casa Bajo Casa Medio
Departamento Medio Departamento Medio
Casa Medio Casa Medio
Departamento Medio Departamento Medio
Casa Medio Casa Bajo
Casa Medio
Ejemplo 2.3
Una importante agencia de turismo desea realizar un estudio sobre una muestra de 20 familias de clase
media y alta de Santiago que vacacionan dentro del país, con el fin de brindar distintas ofertas turísticas enfocadas
a este segmento de la población. Las variables son: destino, medio de transporte y tipo de alojamiento. Se le
solicita lo siguiente: a. Construya la Tabla de distribución de frecuencias. b. Elabora Gráfico de barras y de pastel
para cada una de las variables. c. Interprete la información obtenida de acuerdo a aspectos resaltantes para la
agencia de turismo.
(Resolución en clase)

Medio de Tipo de Medio de Tipo de


Destino Destino
transporte alojamiento transporte alojamiento
Centro Auto Cabaña Norte Auto Cabaña
Norte Bus Cabaña Centro Auto Hotel
Centro Auto Hotel Sur Auto Hotel
Norte Auto Hotel Sur Auto Cabaña
Centro Auto Hotel Centro Bus Cabaña
Sur Auto Cabaña Sur Auto Hotel
Sur Auto Cabaña Sur Auto Hotel
Norte Auto Cabaña Sur Auto Cabaña
Norte Auto Hotel Norte Avión Hotel
Sur Auto Cabaña Centro Auto Cabaña
Para elaborar la tabla de Distribución de Frecuencias para variables cuantitativas debemos establecer las
clases, que en este caso serán los intervalos de clase en los cuales agrupamos los datos. Para ello seguiremos los
siguientes pasos:

1. Obtención del rango (R):


Se entiende por rango (R) la diferencia que existe entre el dato mayor (VM) y el menor (Vm) de un
conjunto de datos.

2. Determinar el número de clases a utilizar:


Se pueden considerar tres métodos para determinar el número de clases a utilizar:
a. 2𝑐 ≥ 𝑛 donde c es el número de clases y n la cantidad de datos.
b. Regla de Sturges. No. de clases = 1 + 3,3 log 𝑛. (se aproxima al entero)
c. No. de clases = √𝑛 (se aproxima al entero)

3. Determinar la amplitud de los Intervalos de clase:


𝑅𝑎𝑛𝑔𝑜
Se llama clase a cada uno de los subconjuntos en los que se agrupan los datos: 𝐼𝐶 =
𝑁° 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠

Los intervalos deben ser inclusivos y no solaparse. Cada observación debe pertenecer a uno y sólo un
intervalo. Consideremos una distribución de frecuencias de las edades (redondeadas al año más próximo) de un
grupo de personas. Si la distribución de frecuencias contiene los intervalos “20-30 años” y “30-40 años”, ¿A cuál
de estas dos clases pertenecería una persona de 30 años?
Los límites o extremos de cada clase deben estar claramente definidos. Para evitar solapamientos, los
intervalos de edades podrían definirse de la forma siguiente: “20 años pero menos de 30”, seguido de “30 años
pero menos de 40”, y así sucesivamente. Otra posibilidad es definir los intervalos de edad del modo siguiente: “20-
29”, “30-39”, etc. Considerando que se analizará la edad como un número entero, no hay ningún solapamiento.
Ahora bien, si al realizar cálculos se desea considerar la edad como un variable continua, es decir, es
importante para el analista la fracción de años para realizar las interpretaciones, o si se trata de otro tipo de
variable que son específicamente continuas, entonces se debe considerar los intervalos iguales sin solapamientos
pero considerando todas las opciones decimales. De forma que se puede tomar para el ejemplo de las edades
como: [20 − 30] , (30 − 40] y así sucesivamente. De allí que, la selección de los límites es subjetiva. Hay que
asegurarse simplemente de definir unos límites que permitan comprender e interpretar claramente los datos.
Del proceso de aproximar el número de clases al entero más cercano y luego, al redondear el intervalo de
clase hacia arriba con el fin de obtener un tamaño conveniente de clase, se altera el valor del rango, pues se cubre
un rango más amplio o más pequeño que el necesario (𝑛𝑅 = 𝐼𝐶 . 𝑁° 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠), de allí que resulta natural poner
cantidades aproximadamente iguales en caso de excedente cada una de las dos colas de los datos, agregando al
mayor y quitándole al menor. Mientras que, si se presente un déficit en el nuevo rango respecto al rango real, se
debe considerar una amplitud de intervalo menor en una unidad para que se cubra todo el rango real, o se
presente un excedente.

4. Construir la tabla de distribución de frecuencias:

Se procede a construir la tabla de distribución de frecuencias con las siguientes columnas: Intervalos de clase
(variable considerada), Marca de clase ((límite inferior + límite superior) /2), frecuencia Simple, Frecuencia
Acumulada, frecuencia relativa, Frecuencia Relativa acumulada, frecuencia relativa porcentual, Frecuencia relativa
porcentual acumulada.
Ejemplo 2.4
Una compañía de cambio de aceite que cuenta con varios talleres en el área metropolitana de Seattle. Registra las
siguientes cantidades diarias de cambios de aceite que se realizaron los pasados 60 días:

65 98 55 62 79 59 51 90 72 56
70 66 80 94 79 73 71 85 62 63
45 48 65 87 39 56 62 68 71 85
43 57 67 74 66 71 60 64 68 72
47 55 68 64 76 58 80 73 69 59
56 62 68 71 85 65 98 55 62 79

(a) Construye la tabla distribución de frecuencias utilice la regla de Sturges para determinar el número de
clases.
(b) Elabore el histograma y polígono de frecuencias absolutas correspondiente a la información obtenida.
(c) Determine, de acuerdo a la información registrada en los literales anteriores,
(c.1) el límite superior de la tercera clase.
(c.2) el o los intervalos con máxima frecuencia.
(c.3) marca de clase del segundo intervalo de clase.
(c.4) ¿Con qué frecuencia se realizaron más de 73 cambios o más en un día?
(c.5) ¿En qué porcentaje se realizaron menos de 55 cambios en un día?
(c.6) ¿Cuál es el porcentaje para la realización de entre 55 y 72 cambios en un día?
(d) Elabore la Ojiva.

Solución:
(a)
1. 𝑅𝑎𝑛𝑔𝑜 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 = 98 − 39 = 59
2. Regla de Sturges. No. de clases = 1 + 3,3 log 𝑛 = 1 + 3,3 log 60 = 6,9 ≈ 7 clases.
𝑅𝑎𝑛𝑔𝑜 59
3. Calculamos la amplitud del intervalo: 𝐼𝐶 = 𝑁° 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = 7
= 8,4 ≈ 9
4. Nuevo rango = No. De Clases × amplitud del intervalo = 7 × 9 = 63 diferencia = 4
5. Se tiene la tabla de distribución de frecuencias:

Límite Marca de
(fi) Fa fr Fr pi% Pi%
Superior Clase (Xi)
37 - 45 41 3 3 0,050 0,05 5,00 5,00
46 - 54 50 3 6 0,050 0,10 5,00 10,00
55 - 63 59 17 23 0,283 0,38 28,33 38,33
64 - 72 68 20 43 0,333 0,72 33,33 71,67
73 - 81 77 9 52 0,150 0,87 15,00 86,67
82 - 90 86 5 57 0,083 0,95 8,33 95,00
91 - 99 95 3 60 0,050 1,00 5,00 100,00
60 1,00 100
(b)

(c)
(c.1): el límite superior de la tercera clase es 63
(c.2): el intervalo con máxima frecuencia es de 64 a 72.
(c.3): la marca de clase del segundo intervalo de clase es 50.
(c.4) ¿Con qué frecuencia se realizaron más de 73 cambios o más en un día?:
17 de los 60 días se realizaron 73 o más cambios de aceite.
(c.5) ¿En qué porcentaje se realizaron menos de 55 cambios en un día?
El 10% de los 60 días, se realizaron menos de 55 cambios.
(c.6) ¿Cuál es el porcentaje para la realización de entre 55 y 72 cambios en un día?
El 62% de los días estudiados se registraron entre 55 y 72 cambios.

(d) Elabore la Ojiva.


Ejemplo 2.5
96 62 102 85 92 106 110 95 105 112
Salarios semanales de 40 personas en miles de
108 86 110 68 118 99 98 74 91 80
pesos.
80 100 79 93 93 104 77 106 98 73
95 85 91 83 67 119 108 115 74 88
(a) Construye la tabla distribución de frecuencias utilice la regla de Sturges para determinar el número de
clases.
(b) Elabore el histograma y polígono de frecuencias absolutas correspondiente a la información obtenida.
(c) Determine, de acuerdo a la información registrada en los literales anteriores,
(c.1) ¿Cuántos empleados ganan 80 mil pesos o menos?
(c.2) ¿Qué porcentaje de empleados ganan más de 80 mil, pero hasta 100 mil pesos semanales?
(c.3) ¿Interprete el intervalo de mayor frecuencia?
(c.4) ¿Cuántos empleados ganan más de 100 mil pesos?

Ejemplo 2.6
El gerente de un Supermarket en Rhode Island, reunió la siguiente información sobre la cantidad de veces
que un cliente visita la tienda en un mes. Las respuestas de 51 clientes fueron las siguientes:

5 3 3 1 4 4 5 6 4 2 6 6 6 7 1
1 14 1 2 4 4 4 5 6 3 5 3 4 5 6
8 4 7 6 5 9 11 3 12 4 7 6 5 15 1
1 10 8 9 2 12

(a) Construye la tabla distribución de frecuencias utilice la regla de 2𝑐 para determinar el número de clases.
(b) Elabore el histograma y polígono de frecuencias absolutas correspondiente a la información obtenida.
(c) Determine, de acuerdo a la información registrada en los literales anteriores,
(c.1) ¿Cuántos clientes visitan la tienda más de 8 veces al mes?
(c.2) ¿Qué porcentaje de clientes visitan la tienda entre 3 y 8 veces al mes?
(c.3) ¿Interprete el intervalo de mayor frecuencia?
(c.4) ¿Cuántos clientes visitan la tienda menos de 5 veces al mes?

Ejemplo 2.7
La división de servicios alimentarios de un parque de atracciones en Orlando Florida, estudia la cantidad
que gastan al día en alimentos y bebidas las familias que visitan el parque de diversiones. Una muestra de 40
familias que visitó el parque ayer revela que éstas gastaron las siguientes cantidades de dólares:

77 18 63 84 38 54 50 59 54 56 36 26 34 52
41 58 58 53 51 62 43 52 53 63 62 50 61
60 60 45 66 83 71 63 58 61 71 62 65 44

(a) Construye la tabla distribución de frecuencias utilice la regla de 2𝑐 para determinar el número de clases.
(b) Elabore el histograma y polígono de frecuencias absolutas correspondiente a la información obtenida.
(c) Determine, de acuerdo a la información registrada en los literales anteriores,
(c.1) ¿Cuántas familias gastan 40 dólares o menos?
(c.2) ¿Qué porcentaje de familias gastan más de 51 dólares?
(c.3) ¿Interprete el intervalo de mayor frecuencia?
(c.4) ¿Qué porcentaje de familias gastan 62 dólares o menos?
(c.5) ¿Cuántas familias gastan más de 40 pero máximo 62 dólares?

Solución:
(a)
1. 𝑅𝑎𝑛𝑔𝑜 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 = 84 − 18 = 66
2. Regla de 2𝑐 > 𝑛 26 > 40. No. de clases = 6.
𝑅𝑎𝑛𝑔𝑜 66
3. Calculamos la amplitud del intervalo: 𝐼𝐶 = 𝑁° 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = = 11
6

4. Nuevo rango = No. De Clases × amplitud del intervalo = 6 × 11 = 66 diferencia = 0


5. Se tiene la tabla de distribución de frecuencias:

Marca de
Gastos (fi) Fa fr Fr pi% Pi%
Clase (Xi)
[18, 29] 23,5 2 2 0,050 0,05 5,00 5,00
(29, 40] 34,5 3 5 0,075 0,13 7,50 12,50
(40, 51] 45,5 7 12 0,175 0,30 17,50 30,00
(51, 62] 56,5 18 30 0,450 0,75 45,00 75,00
(62, 73] 67,5 7 37 0,175 0,93 17,50 92,50
(73, 84] 78,5 3 40 0,075 1,00 7,50 100,00
Totales 40 1,00 100

77 18 63 84 38 54 50 59 54 56 36 26 34 52
41 58 58 53 51 62 43 52 53 63 62 50 61
60 60 45 66 83 71 63 58 61 71 62 65 44

(b)
(c) Determine, de acuerdo a la información registrada en los literales anteriores,
(c.1) ¿Cuántas familias gastan 40 dólares o menos?
R: 5 familias de las 40, gastan 40 dólares o menos en alimentos y bebidas.
(c.2) ¿Qué porcentaje de familias gastan más de 51 dólares?
R: 70% de las familias gastan más de 51 dólares en alimentos y bebidas.
(c.3) ¿Interprete el intervalo de mayor frecuencia?
R: La cantidad de dinero que más gastan las familias en el parque por alimentos y bebidas está
entre 51 y 62 dólares.
(c.4) ¿Qué porcentaje de familias gastan 62 dólares o menos?
R: 75% de las familias gastan 62 dólares o menos en alimentos y bebidas.
(c.5) ¿Cuántas familias gastan más de 40 pero máximo 62 dólares?
R: 25 familias gastan más de 40 pero menos de 62 dólares en alimentos y bebidas.

5. Usando Excel
En una nueva hoja, copiar las columnas correspondientes a la marca de clase y la frecuencia absoluta.

También podría gustarte