Está en la página 1de 15

UNIVERSIDAD NACIONAL SAN CRISTÓBAL DE HUAMANGA 1

DEPARTAMENTO DE FÍSICA Y MATEMÁTICA


Escuela Profesional de Ingeniería Agrícola

5.2.TABLA DE FRECUENCIAS DE DATOS DE VARIABLE CONTINUA

Sean 𝑥1 , 𝑥2 , . . . , 𝑥𝑛 un conjunto de observaciones, siendo “n” el tamaño de la muestra


y donde los datos son del tipo continuo. En este caso debido a que la magnitud de la
característica puede tomar al menos una teóricamente, una infinidad de valores, el
proceso de reducción, agrupación o condensación de los datos originales, que
conducen a la construcción de tablas de frecuencia, no es tan simple como en el caso
discreto, puesto implica realizar algunos cálculos previos a la elaboración de la tabla
de frecuencias.

DEFINICIÓN 09: AMPLITUD DEL RECORRIDO ó RANGO ( R ), es la


longitud del recorrido del conjunto de datos. Es decir:

𝑅 = 𝑋𝑚á𝑥 − 𝑋𝑚𝑖𝑛

Donde :
𝑥𝑚 á𝑥 : Observación de valor máximo
𝑥𝑚 í𝑛 : Observación de valor mínimo

DEFINICIÓN 10: Se llama CLASES ó INTERVALOS DE CLASE a cada uno de


los grupos en que se divide el conjunto de datos.
Si la variabilidad de los datos es grande, entonces se fijará un número de intervalos
pequeños de tal forma que no se pierda la representatividad de la información. Por
otro lado, si no se conoce nada algo con respecto al comportamiento de los datos se
utiliza la REGLA DE STURGES:

𝑚 = 1 + 3.332 𝑙𝑜𝑔( 𝑛)

Donde:
m: Número de Intervalos
n: Número total de observaciones

Dr. Alex M. Pereda Medina Semana 02


DEFINICIÓN 11: AMPLITUD DE CLASE ( C ), es la longitud del intervalo que
2
define la clase y se define como:

𝑅
𝐶=
𝑚

CONSTRUCCIÓN DE LOS INTERVALOS DE CLASE

Los intervalos de clase se construyen partiendo de un 𝑥𝑚𝑖𝑛 , al que se le va asignado


consecutivamente a las clases, los limites inferior y superior de clase, de la siguiente
manera:

𝑙𝑖𝑚 𝑖𝑛𝑓: 𝑦0 = 𝑥𝑚 í𝑛 𝑙𝑖𝑚 𝑠𝑢𝑝: 𝑦1 = 𝑥𝑚 í𝑛 + 𝐶


𝑙𝑖𝑚 𝑖𝑛𝑓: 𝑦1 = 𝑥𝑚 í𝑛 +𝐶 𝑙𝑖𝑚 𝑠𝑢𝑝: 𝑦2 = 𝑥𝑚 í𝑛 + 2𝐶
.
.
lim inf:𝑦m-1=xmín + (m-1)𝑐 limsup: 𝑦𝑚 =xmín+mc=xmáx

DEFINICIÓN 12: LA MARCA DE CLASE es el punto medio del intervalo que


representa a dicha clase. Se denota por "𝑦𝑖 " 𝑖 = 1,2, . . . , 𝑚. Es decir:

𝑦𝑖−1 + 𝑦𝑖
𝑦′𝑖 =
2

DEFINICIÓN 13: La frecuencia absoluta (𝑛𝑖 ) de la clase i-ésima, es el número de


observaciones del conjunto original que pertenecen a dicha clase. Entonces, la tabla de
distribución de frecuencias tiene la siguiente forma:
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS DE DATOS DISCRETOS

Intervalo Marca de clase frecuencia


𝒚𝒊−𝟏 − 𝒚𝒊 𝒚′𝒊 𝒏𝒊

𝑦0 − 𝑦1 𝑦′1 𝑛1
𝑦1 − 𝑦2 𝑦′2 𝑛2
. . .
. . .
. . .
. . .
. . .
𝑦𝑚−1 − 𝑦𝑚 𝑦′𝑚 𝑛𝑚
Total n

EJEMPLO:

Dr. Alex M. Pereda Medina Semana 02


La Empresa ABC tiene en su nómina a 60 trabajadores que tienen acumulados desde el
3
mes julio a septiembre una cantidad de horas de trabajo pendientes de pago; los datos se
presentan a continuación:
Trabajador horas Trabajador horas Trabajador horas Trabajador horas Trabajador horas
1 74 13 64 25 94 37 63 49 69
2 70 14 60 26 90 38 61 50 70
3 78 15 68 27 98 39 65 51 74
4 72 16 62 28 92 40 60 52 68
5 76 17 66 29 96 41 66 53 70
6 110 18 84 30 79 42 75 54 104
7 108 19 80 31 75 43 80 55 100
8 118 20 88 32 81 44 76 56 107
9 108 21 82 33 80 45 80 57 102
10 112 22 86 34 80 46 75 58 106
11 80 23 65 35 63 47 75 59 79
12 85 24 60 36 80 48 101 60 100
Con los datos, realizar lo siguiente:
(a) Organizar los datos en una tabla de distribución de frecuencias.
(b) Interprete las frecuencias.
SOLUCIÓN:
(a) Pasos para organizar los datos en una tabla de distribución de frecuencias:
1º. Identificar el valor máximo y mínimo del conjunto de datos:
𝑥𝑚í𝑛 = 60, 𝑥𝑚á𝑥 = 118

2º. Determinar el recorrido de la variable o rango “R”:


𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛 = 118 − 60 = 58

3º. Determinar el número de intervalos a confeccionar “m”, aplicando la regla de


Sturges:
𝑚 = 1 + 3.3 𝑙𝑜𝑔( 𝑛) = 1 + 3.3 𝑙𝑜𝑔( 60) = 6.87 ≈ 7

4º. Calcular la amplitud del intervalo “C”:


𝑅 58
𝐶= = = 8.29 ≈ 8
𝑚 7

5º. Elaborar los intervalos:


Se inicia el proceso de construcción de los intervalos, el primer intervalo a
partir del valor mínimo 𝑥𝑚í𝑛 = 60

Dr. Alex M. Pereda Medina Semana 02


[Intervalo> 4
60 68
68 76
76 84
84 92
92 100
100 108
108 116

OBSERVACIÓN:

A. Un criterio para resolver el problema que el ultimo intervalo contenga al


valor máximo se estila sumar una unidad al calcular el rango de la variable,
es decir: 𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛 + 1 = 118 − 60 + 1 = 59, luego C = 59/7 =
8.43 , se redondea a 8 o por exceso a 9, si es grande el error se estima y se
distribuye en las clases.
B. Estimar el error y redistribuirlo en las clases, por tanto, al confeccionar los
intervalos hay que fijarse que el valor máximo esté contenido en el último
intervalo [108 – 116>, en efecto, no contiene a 118.

Para solucionar el inconveniente, aplicamos el criterio de calcular el exceso


asumido al aplicar el redondeo sobreestimando.

CALCULAR EL NUEVO RECORRIDO (R’): Si se efectúa el cálculo con


los resultados presentados en los pasos 3º y 4º el nuevo recorrido es:
R’ = C . m = 8 ( 7 ) = 56, Lo cual no es recomendable, puesto que
observamos que el séptimo intervalo no contiene a 118, por lo que, es
conveniente redondear la amplitud sobreestimando:
𝑅 58
𝐶= = = 8.29 ≈ 9
𝑚 7
El nuevo recorrido es R’ = C . m = 9 ( 7 ) = 63, lógicamente este cálculo
genera un exceso que debe calcularse y redistribuirlo en todos los intervalos
CALCULO DEL EXCESO “E”
E = R’ – R = 63 – 58 = 5
Si, el exceso es un número par, se redistribuye la mitad del exceso a los dos
extremos del recorrido original, para obtener una distribución de los datos
en forma simétrica. Es decir:

Dr. Alex M. Pereda Medina Semana 02


𝐸 𝐸
𝑥𝑚í𝑛 − , 𝑥𝑚á𝑥 + 5
2 2
Si, el exceso es número impar se presenta dos casos:
Cuando los datos están medidos considerando hasta las cifras decimales, el
exceso se distribuye en forma simétrica. Es decir:
𝐸 𝐸
𝑥𝑚í𝑛 − , 𝑥𝑚á𝑥 +
2 2
Cuando los datos son números enteros y el exceso es un número impar, nos
alejamos ligeramente de la simetría, para redistribuir el exceso de la forma
siguiente:
𝐸−1 𝐸+1
𝑥𝑚í𝑛 − [ ] , 𝑥𝑚á𝑥 + [ ]
2 2
Luego aplicando el criterio para números enteros se tiene:
𝐸−1 𝐸+1
𝑥𝑚í𝑛 − [ ] = 60 − 2 = 58, 𝑥𝑚á𝑥 + [ ] = 118 + 3 = 121
2 2

Con las observaciones hechas: Empezamos a elaborar los intervalos; donde


el primer intervalo esta dado por:
Extremo inferior + amplitud = 58 + 9 = 67
En consecuencia el primer intervalo es [ 58 - 67 > ; los demás intervalos se
confeccionan de forma similar.

6º. Construir la tabla de distribución de frecuencias:

[Horas> y’i 𝒏𝒊 𝑁𝑖 ℎ𝑖 ℎ𝑖 % 𝐻𝑖 𝐻𝑖 %
58 67 62.5 12 12 0,20 20 0,20 20
67 76 71.5 13 25 0,22 22 0,42 42
76 85 80.5 15 40 0,25 25 0,67 67
85 94 89.5 5 45 0,08 8 0,75 75
94 103 98.5 7 52 0,12 12 0,87 87
103 112 107.5 6 58 0,10 10 0,97 97
112 121 121.5 2 60 0,03 3 1,00 100
Total 60 1,00 100
(b) Interpretar las frecuencias
𝒏𝟑 : En la Empresa ABC, hay 15 trabajadores a quienes se les debe entre 76
y 85 horas de trabajo.
𝑵𝟑 : En la Empresa ABC, hay 40 trabajadores a quienes se les debe entre 58
y 85 horas de trabajo.

Dr. Alex M. Pereda Medina Semana 02


𝒉𝟐 : En la Empresa ABC, la proporción de trabajadores a quienes se les debe
6
entre 67 y 76 horas de trabajo, es de 0.22.
𝒉𝟐 % : En la Empresa ABC, al 22% de los trabajadores se les debe entre 67 y
76 horas de trabajo.
𝑯𝟓 % : En la Empresa ABC, al 87% de los trabajadores se les debe entre 58 y
103 horas de trabajo.

5.2.1. TABLA DE FRECUENCIAS DE DATOS DE VARIABLE


CUALITATIVA

En el caso de datos cualitativos, la tabla de distribución de frecuencias adoptara la


siguiente forma:

Variable Frec. abs. ni Frec. relativas hi hi %

Característica A nA hA 100 h A
Característica B nB hB 100 h B
. . . .
. . . .
Característica Z nZ hZ 100 h Z

Totales n 1.00 100 %

TÍTULO = Distribución de frecuencias + variable + unidad


de análisis + ubicación geográfica + ubicación temporal

EJEMPLO:

La Revista de AgroNegocios del Perú, efectuó una encuesta a pequeños agricultores


para conocer ¿Si están preparados para producir productos de calidad para exportar?.
Se seleccionó a un total de 419 parceleros en una muestra aleatoria simple. Los
siguientes datos reflejan las respuestas de las personas encuestadas a la pregunta.

Tabla 2: Distribución de frecuencias sobre la consulta con respecto a ¿si están


preparados para producir productos de calidad para exportar? a pequeños agricultores
realizada por la revista de AGRONEGOCIOS del Perú en septiembre de 2021

Dr. Alex M. Pereda Medina Semana 02


Respuesta Frec. abs. ni hi hi % 7
Si 293 0.70 70
No 80 0.19 19
No sabe resp 46 0.11 11

Total 419 1.00 100%

Fuente: Datos de la Revista AGRONEGOCIOS del Perú

Autor: Alex M. Pereda Medina

Nota: Las entrevistas fueron realizadas desde enero de 2021

Interpretación:

En la tabla 2, se observa que el 70% de los pequeños agricultores entrevistados


afirman que, si están preparados para producir productos de calidad para exportar, en
tanto que, el 19% menciona que no esta preparado y un 11% no sabe o no opina sobre
el tema de exportación.

Análogamente, en la muestra se tiene que 293 pequeños agricultores entrevistados


por la Revista AGRONEGOCIOS del Perú respondieron que, si están preparados para
producir productos de calidad para exportar, asimismo, 80 entrevistados afirman que
no están preparados y 46 parceleros no saben del tema de exportación.

Responda lo siguiente:

i. ¿Qué proporción de personas no saben responder frente a la pregunta?. 0.11


ii. ¿Qué porcentaje de personas contestaron Si están preparados para producir
productos de calidad para exportar? 70%

EJERCICIO:
Se solicito a 20 estudiantes de la UNSCH, llenar una ficha académica donde debían
registrar su auto evaluación en su formación profesional, según la siguiente escala:
Muy Buena (MB), Buena (B), Regular (R). Los datos son los siguientes:
R; MB; B; MB; MB; B; B; MB; R; MB; R; B; MB; B; R; B; MB; B; B; R.
Determinar:
(a) La variable de estudio.
(b) Elaborar una tabla de frecuencias.

Dr. Alex M. Pereda Medina Semana 02


5.3.REPRESENTACION TABULAR Y GRÁFICA.
8

La ejecución de una investigación implica que se ha recolectado una serie de datos y


clasificado la información; resultando imprescindible presentarla de manera adecuada
par que permita hacer un análisis útil.
Existen dos tipos de presentación: mediante cuadros estadísticos y gráficos:

5.3.1. CUADROS ESTADÍSTICOS.

En general un cuadro estadístico es un arreglo ordenado de filas y columnas de los


datos o series estadísticas o también características relacionadas con el objeto de
ofrecer información de fácil lectura, comparación e interpretación. Las características
pueden ser cualitativas, cuantitativas o una combinación de ellas.
El objetivo de las líneas (horizontales) y columnas (verticales) de un cuadro se
deben organizar de modo que se evidencie los aspectos que interesa mostrar y resalten
las comparaciones que se desean hacer notar. La tabla de distribución de frecuencias
es un caso especial de un cuadro estadístico.
PARTES DE UN CUADRO ESTADÍSTICO.
Las partes de un cuadro estadístico son:

(1) NÚMERO: Es el código de identificación del cuadro que permite ubicar en el


interior de un documento. Ejemplo: CUADRO Nº 01.

(2) TÍTULO: Es la descripción resumida del contenido del cuadro. La redacción del
título debe ser breve, claro y completo, de modo que se pueden deducir sin
ambigüedad que tipo de información contiene el cuadro. La redacción del un título
completo debe indicar:

QUÉ: Qué hay en el cuadro, se refiere al hecho observado o la característica principal.


Ejemplo: Número de hijos por padre de familia.

DONDE: Se refiere al lugar geográfico o institución a la que corresponde la


información. Ejemplo: I.E. “San Martín”

COMO: Como están ordenados o clasificados los datos en el cuadro. La variable


ubicada en la fila se identifica con la preposición “por” y las de la columna con la
preposición “según”. Ejemplo: Distribución de frecuencias de padres de familia según
número de hijos.

Dr. Alex M. Pereda Medina Semana 02


CUANDO: A qué momento o periodo de tiempo está referida la información.
9
Ejemplo: Abril del 2008

(3) CUADRO PROPIAMENTE DICHO:

Es la parte del cuadro que contiene la información y consta de un conjunto de casillas


o celdas, dispuestas en columnas y filas. Sus elementos esenciales son:
Encabezamiento de las columnas, columna principal o matriz y cuerpo.

ENCABEZAMIENTO: Es la primera fila del cuadro en el se explica las categorías


y el objeto de cada una de las columnas, es decir indica la naturaleza de los datos
inscritos en cada celda que se halla debajo. Deben ser breves y explícitos. Ejemplo:
Frecuencia Absoluta, Frecuencia Relativa.

COLUMNA PRINCIPAL O MATRIZ: Es aquella en la que se anotan las


categorías o las diferentes clases de la escala de clasificación utilizada. Ejemplo: Los
intervalos confeccionados, las categorías de la variable Estado Civil.
CUERPO: Es el conjunto de celdas o casillas, que son la intersección de filas y
columnas, donde están anotados los datos numéricos.
(4) NOTAS AL PIE Ó NOTAS EXPLICATIVAS: Contiene habitualmente la
fuente de los datos representados y cualquier nota aclaratoria sobre el contenido del
cuadro.

FUENTE: Es la indicación al pie del cuadro que sirve para nombrar la entidad
responsable de donde se obtuvieron los datos. Ejemplo: Departamento de Estadística
del Poder Judicial.
AUTOR: Es una indicación que se coloca debajo de la fuente y sirve para mencionar
al responsable que ha utilizado los datos originales o de la fuente.

Ejemplo:
Tabla 2: Distribución de frecuencias del número de horas que se adeuda a los
trabajadores de la Empresa ABC durante los meses de julio a septiembre de 2021.
[Horas> y’i 𝒏𝒊 𝑁𝑖 ℎ𝑖 ℎ𝑖 % 𝐻𝑖 𝐻𝑖 %
58 62.5 67 12 12 0,20 20 0,20 20
67 71.5 76 13 25 0,22 22 0,42 42
76 80.5 85 15 40 0,25 25 0,67 67
85 89.5 94 5 45 0,08 8 0,75 75
94 98.5 103 7 52 0,12 12 0,87 87

Dr. Alex M. Pereda Medina Semana 02


103 107.5 112 6 58 0,10 10 0,97 97
10
112 121.5 121 2 60 0,03 3 1,00 100
Total 60 1,00 100
Fuente: Datos del archivo de la Empresa ABC 2021
Autor: Alex M. Pereda Medina
Nota: Las horas de trabajo corresponden a labor extra que realizan los trabajadores
Interpretación:
En la tabla 2, se observa que un 20% de los trabajadores tienen entre 58 a menos de
67 horas de trabajo que la Empresa ABC les adeuda durante el periodo de julio a
septiembre de 2021, asimismo, se tiene que el máximo de horas de trabajo que
acumularon el 3% de los trabajadores oscila de 112 a 121 horas y que la mayoría de
trabajadores acumularon de 76 a 85 horas de trabajo que representan a un 25% del
total.

5.3.2. REPRESENTACIÓN GRÁFICA

Un gráfico es la representación de un fenómeno estadístico por medio de figuras


geométricas, (puntos, líneas, rectángulos, u otras formas geométricas) cuyas
dimensiones son proporcionales a la magnitud de los datos representados.
Su objeto principal es la representación de los datos de forma gráfica, que
permita de un solo golpe de vista darse cuenta del conjunto de elementos presentados
y de evidenciar sus variaciones características. El gráfico es un auxiliar del cuadro
estadístico, no lo sustituye si no que lo complementa.

VENTAJAS Y DESVENTAJAS DEL GRÁFICO:


EL gráfico tiene la ventaja sobre el cuadro, de permitir apreciar más rápidamente los
datos y abarcar todo su conjunto.
La construcción del grafico se basa en el cuadro estadístico, pero tiene sus
limitaciones como las siguientes:
(1) El gráfico no puede presentar tantos grupos de datos como una tabla. Un cuadro
puede tener 4 o más columnas de datos, sin embargo, representado esto en un
gráfico dificulta su comprensión.
(2) En los cuadros pueden darse valores exactos, en los gráficos muchas veces solo
valores aproximados.

Dr. Alex M. Pereda Medina Semana 02


5.3.3. PARTES DE UN GRÁFICO
11
Un gráfico debe contener las siguientes partes: Titulo, Grafico propiamente dicho y
notas explicativas.

5.3.4. REGLAS PRINCIPALES PARA EL TRAZADO DE GRÁFICOS


LINEALES

(1) Las frecuencias se ubican por lo general en el eje vertical y el método de


clasificación en el eje horizontal.
(2) Las dos escalas de los ejes deben guardar proporción de tal forma que el grafico
no muestre la impresión de fluctuaciones muy lentas o muy exageradas.
(3) La escala que representa la frecuencia debe empezar en cero. Cuando no puede
empezar de forma normal, se parte la escala con una línea en zigzag.
(4) El titulo se coloca generalmente en la parte superior del gráfico, precisando lo más
claro posible el contenido que expone.
(5) Debe indicar la unidad de medida utilizada.
(6) Cada escala debe ser rotulada de tal manera que se comprenda fácilmente que
representa: kg, libras, etc.
(7) Las escalas no deben tener muchas subdivisiones.
(8) El grafico generalmente progresa de izquierda a derecha y de abajo hacia arriba.
(9) Las líneas del propio grafico deben dibujarse más gruesas que las escalas.
(10) No deben trazarse más líneas coordenadas que las necesarias para la fácil lectura,
procurando que el cero aparezca en el diagrama.
(11) El grafico generalmente debe ir acompañado de la tabla que le dio origen.
(12) Para alcanzar su objetivo con sencillez no debe contener más líneas o símbolos
que los que el ojo pueda cómodamente seguir.

5.3.5. PRINCIPALES TIPOS DE GRÁFICO.

Hay varias formas de hacer la representación gráfica de un conjunto de datos


estadísticos; cada una de ellas posee ventajas por las que se adaptan mejor para
presentar un tipo de series estadísticas que otro. El investigador elegirá el más
conveniente.
Los más usuales son los siguientes:

Dr. Alex M. Pereda Medina Semana 02


1. Diagrama de barras
12
Gráfico 1: Distribución de frecuencias absolutas de la
respuesta a ¿Si están preparados para producir productos
de calidad para exportar?.
350
293
300

250

200

150

100 80
46
50

0
Si No No sabe resp

Fuente: Datos hipotéticos


Interpretación:

En el gráfico 1, se tiene que 293 pequeños agricultores entrevistados por la Revista


AGRONEGOCIOS del Perú respondieron que, si están preparados para producir
productos de calidad para exportar, asimismo, 80 entrevistados afirman que no están
preparados y 46 parceleros no saben del tema de exportación.

2. Pictogramas
Gráfico 02: Distribución de frecuencias absolutas del número de pulgones por
planta de tomate del Fundo ABC, año 2021
N° de pulgones Frecuencias absolutas ni

0 ******

2 *****

3 ****

4 *

Dr. Alex M. Pereda Medina Semana 02


Fuente: Datos hipotéticos
13
Nota: Un asterisco es equivalente a una planta
Interpretación:

3.Gráfico de sectores

Gráfico 3: Distribución de frecuencias absolutas de la


respuesta a ¿Si están preparados para producir productos
de calidad para exportar?.

11%

Si
19%
No
No sabe resp
70%

Fuente: Datos hipotéticos


Interpretación:

En el gráfico 1, se tiene que 293 pequeños agricultores entrevistados por la


Revista AGRONEGOCIOS del Perú respondieron que, si están preparados para
producir productos de calidad para exportar, asimismo, 80 entrevistados afirman
que no están preparados y 46 parceleros no saben del tema de exportación.

4.Diagrama de frecuencias

Grafico 04: Distribución de frecuencias absolutas del


número de pulgones por planta de tomate del Fundo ABC,
año 2021
7
6
6
5
5
4
4

2
1
1

0
0 2 3 4

Dr. Alex M. Pereda Medina Semana 02


Fuente: Datos hipotéticos
14
Interpretación:

5.Histogramas de frecuencias

Gráfico 05: Distribución de frecuencias absolutas del


número de horas de trabajo pendientes de pago en la
Empresa ABC en el mes de agosto de 2021
16 15

14 13
12
12

10

8 7
6
6 5

4
2
2

0
67 76 85 94 103 112 121
58 67 76 85 94 103 112

Fuente: Datos del archivo de la Empresa ABC


Interpretación:

6.Polígono de frecuencias absolutas y relativas.

Gráfico 06: Distribución de frecuencias absolutas del número


de horas de trabajo pendientes de pago en la Empresa ABC en
el mes de agosto de 2021
16
15
Número de trabajadores

14
13
12 12
10
8
7
6 6
5
4
2 2
0 0 0
53.5 62.5 71.5 80.5 89.5 98.5 107.5 116.5 125.5
Horas de trabajo

Dr. Alex M. Pereda Medina Semana 02


Fuente: Datos del archivo de la Empresa ABC
15
Interpretación:

7.Polígono de frecuencias acumuladas u ojivas.

Dr. Alex M. Pereda Medina Semana 02

También podría gustarte