Está en la página 1de 10

Semana 2: Distribución de Frecuencias y Figuras Curso: Estadística Aplicada

PRESENTACION DE DATOS

DISTRIBUCION DE FRECUENCIA
Una distribución de frecuencia es un método para organizar, clasificar y resumir datos.
También se conoce con el nombre de tabulación de datos en clases, intervalos de clase o
categoría; con la frecuencia correspondiente a cada una, a fin de realizar una especial
descripción y análisis.
Para elaborar los cuadros o tablas de la distribución de los datos se debe, antes que todo
Identificar las características que se investigaron, ya que esto permite una mejor clasificación
de lo observado, estas características se refieren a las Cualitativas y Cuantitativas.
Componentes de una Distribución de Frecuencias
Frecuencia absoluta simple, representa el número de veces que se repite la clase, intervalo
de clase o categoría en la base o matriz de datos. Se denota por f i .
Frecuencia absoluta acumulada, se obtiene sumando las frecuencias absolutas simples, y
siempre nos da un acumulado igual al tamaño de la muestra. Se denota por Fi .
Frecuencia relativa simple, representa la proporción de unidades de análisis en la clase,
intervalo de clase o categoría y resulta de dividir cada una de las frecuencias absoluta simples
fi
por el tamaño de la muestra. Es decir: hi  .
n
Frecuencia relativa acumulada, resulta de sumar las frecuencias relativas simples, esta
frecuencia siempre tiende a la unidad. Se denota por H i .
n : Tamaño de la muestra, es el número de observaciones.

xi : La variable, es cada uno de los diferentes valores que se han observado o también
puede ser la marca de clase.

DISTRIBUCIÓN DE FRECUENCIA POR INTERVALOS

Un conjunto de observaciones normalmente cuantitativas continuas o discretas con valores


grandes, puede hacerse más comprensible y lograrse una mayor síntesis, tabulando o
agrupando los datos. Para agrupar a un conjunto de datos, se selecciona un conjunto de
intervalos, contiguos, que no se traslapen, tales que cada valor de la base de datos puede

Docente: MSc. Luis Pajuelo Gonzáles


Semana 2: Distribución de Frecuencias y Figuras Curso: Estadística Aplicada

colocarse en uno, de los intervalos de clase. Los pasos a seguir para la construcción de
intervalos son los siguientes:

Paso I: Hallar el Rango o Recorrido de los Datos (R)


La diferencia entre el dato mayor y el dato menor se llama RECORRIDO o RANGO de los
datos. Esto es:
R = Dato mayor – Dato menor

Paso II: Hallar el número de Intervalos (m)


La pregunta es ¿cuántos intervalos van a incluirse? Demasiado o poco no es conveniente
debido a que hay pérdida de información. Por otra parte, si se usan demasiados intervalos,
no se logra objetivo de la síntesis.
Una de las formas para obtener el número de intervalos es aplicando la regla de STURGES,
con la cual se obtiene una aproximación aceptable sobre el número de intervalos necesarios
para agruparlos. Esto es:
m = 1 + 3,33*log(n)

Donde n nos representa el tamaño de muestra o número de datos considerados, esta regla de
STURGES no se considera como final, sino sólo como una guía. El número de intervalos
especificado por medio de esta regla debe aumentarse o disminuirse según convenga y el
beneficio de una presentación clara.

Paso III: Hallar la Amplitud del Intervalo (A)


Aunque a veces es imposible, por lo general, los intervalos deben tener amplitudes iguales.
Puede determinarse esta amplitud (A) dividiendo el recorrido (R) entre el número de
intervalo (m). Esto es:
A=R/m

Una vez más, debe aplicarse el buen juicio y seleccionar una amplitud (por lo común,
próxima a la dada por la ecuación) que sea más conveniente.

Presentación de figuras: En distribución de frecuencias por intervalos de clase las figuras a


presentar son: Histograma de frecuencias y Polígono de frecuencias

Docente: MSc. Luis Pajuelo Gonzáles


Semana 2: Distribución de Frecuencias y Figuras Curso: Estadística Aplicada

Ejemplo 1
Al evaluar el efecto de la temperatura y del tiempo en la cinética de rehidratación, sobre la
cantidad de agua absorbida por los granos de haba, se obtuvo datos sobre la diferencia o ganancia
de peso en gramos. Este experimento se realizó en el laboratorio de Ingeniería Agroindustrial de
la Universidad Nacional del Altiplano-Puno-2018.

Tiempo (min) Temperatura


T1 20°C T2 30°C T3 40°C
30 2,412 3,377 4,297
60 4,577 5,557 8,577
90 6,147 7,743 12,543
120 8,209 9,527 15,050
150 10,008 11,787 17,807
180 11,935 13,453 18,753
210 14,060 15,083 20,123
240 15,558 16,227 20,483
270 16,777 18,623 21,637
300 19,177 20,083 21,667
330 19,944 21,410 22,553
360 20,384 22,617 23,743
390 22,805 23,837 25,200
420 24,234 24,950 25,303
450 25,374 25,740 25,700
480 25,386 26,837 25,917
510 25,432 26,970 27,023
540 26,539 27,520 27,127
570 26,762 27,660 28,210
600 28,085 27,720 28,800
630 28,374 28,290 29,513
660 28,450 28,683 29,560
690 28,575 28,953 29,570
720 28,643 29,847 29,940
Solución:
a) Identificar la unidad de análisis, variable de estudio, clasificación de la variable, el lugar
y tiempo,
Unidad de análisis : Grano de haba
Variable de estudio : Ganancia de peso
Clasificación de la variable : Cuantitativa continúa
Lugar : Universidad nacional del Altiplano
Tiempo : 2018

b) Construir la distribución de frecuencias y sus respectivas figuras (gráficos), para la


ganancia de peso, indicando su código, título y fuente.

Rango : R = dato máximo – Dato mínimo


R = 29,94 – 2,41 = 27,53

Número de Intervalos : m = 1 + 3,33log(n)  m=1 + 3,33log (72)

Docente: MSc. Luis Pajuelo Gonzáles


Semana 2: Distribución de Frecuencias y Figuras Curso: Estadística Aplicada

m = 1 + 3,33*1,857  m = 7,18  7, (6 o 8)
R
Amplitud del Intervalo :A  A = 27,53 / 7 = 3,93  R = 27,51
m
A = 27,53 / 6 = 4,59  R = 27,54 óptimo
A = 27,53 / 8 = 3,44  R = 27,52

Construyendo la Tabla de frecuencias con datos agrupados en intervalos:

Tabla 1 (Código)
Ganancia de peso de los granos de habas en la planta agroindustrial, de la Universidad Nacional
del Altiplano Puno – 2018. (Título)
Ganancia de Marcas de Frecuencias Frecuencias Frecuencia
peso clase absolutas relativas porcentual
[ Li 1 - Li )
yi fi Fi hi Hi hi *100%
2,41 – 7,00 4,705 6 6 0,083 0,083 8,3%
7,00 – 11,59 9,295 5 11 0,069 0,152 6,9%
11,59 – 16,18 13,885 8 19 0,111 0,263 11,1%
16,18 – 20,77 18,475 11 30 0,153 0,416 15,3%
20,77 – 25,36 23,065 12 42 0,167 0,583 16,7%
25,36 – 29,95 27,655 30 72 0,417 1,000 41,7%
Total n=72 1,000 100,0%
Fuente: Planta agroindustrial UNA

Interpretación: En la Tabla 1, se ha identificado que 6 (8,3%) de los granos de haba tuvieron la


menor ganancia de peso por efecto de la hidratación y la temperatura, de 2,41 a menos de 7,00 gr. Sin
embargo, 30 (41,7%) de los granos de haba tuvieron con mayor frecuencia la mayor ganancia de peso,
de 25,36 a menos de 29,95 gr.

Docente: MSc. Luis Pajuelo Gonzáles


Semana 2: Distribución de Frecuencias y Figuras Curso: Estadística Aplicada

Figura 1: Ganancia de peso de los granos de habas en la planta agroindustrial, de la UNA –


2018.

45.0 41.7
40.0
35.0
30.0
Porcentaje

25.0
20.0 16.7
15.3
15.0 11.1
8.3
10.0 6.9

5.0
0.0 0.0
0.0
0.16 gr. 4.705 gr. 9.295 gr. 13.885 gr. 18.475 gr. 23.065 gr. 27.655 gr. 32.245 gr.

Marca de clase

Figura 2: Ganancia de peso de los granos de habas en la planta agroindustrial, de la UNA –


2018.

Docente: MSc. Luis Pajuelo Gonzáles


Semana 2: Distribución de Frecuencias y Figuras Curso: Estadística Aplicada

DISTRIBUCIÓN DE FRECUENCIA POR CLASES

Un conjunto de observaciones normalmente cuantitativas discretas con valores pequeños,


puede hacerse más comprensible, lograrse una mayor síntesis, tabulando los datos. Para
agrupar a un conjunto de datos, se selecciona las clases o valores numéricos contiguos, tales
que cada valor en la base de datos puede colocarse en uno, de las clases.

Presentación de la figura: En distribución de frecuencias por clases, la figura o gráfico a


presentar se denomina Bastones.

Ejemplo 2: Un experimento consistió en contar el número de flores por planta de una muestra
de 50 plantas. Estas observaciones se realizaron en el Fundo Santa Rosa-Santa-2016. Los
valores resultantes del conteo fueron los siguientes:
10 8 6 3 9 7 5 4 6 9 Solución
8 10 7 9 10 6 8 6 3 2 a) Identificar la unidad de análisis,
4 3 2 7 5 5 4 3 7 6 variable de estudio, clasificación de la
6 7 8 8 6 7 7 9 8 6 variable, el lugar y tiempo.
5 3 2 1 4 3 6 8 7 0
Unidad de análisis : La planta
Variable de estudio : Número de flores
Clasificación de la variable : Cuantitativa discreta
Lugar : Fundo Santa Rosa-Santa
Tiempo : 2016

b) Obtener la tabla de frecuencias y su figura, para el número de flores, indicando su código,


título y fuente.

Tabla 2
Número de flores por planta en el fundo Santa Rosa, Santa, 2016.

Nº de Flores… Frecuencias Frecuencias Frecuencia


yi absolutas relativas porcentual

fi Fi hi Hi hi *100%
0 1 1 0,02 0,02 2%
1 1 2 0,02 0,04 2%
2 3 5 0,06 0,10 6%
3 6 11 0,12 0,22 12%
4 4 15 0,08 0,30 8%
5 4 19 0,08 0,38 8%
6 9 28 0,18 0,56 18%
7 8 36 0,16 0,72 16%
8 7 43 0,14 0,86 14%
9 4 47 0,08 0,94 8%
10 3 50 0,06 1,00 6%
Total n=50 1,00 100%
Fuente: Fundo Santa Rosa, Santa

Docente: MSc. Luis Pajuelo Gonzáles


Semana 2: Distribución de Frecuencias y Figuras Curso: Estadística Aplicada

Interpretación: Visto la Tabla 2, se ha encontrado que el 2% de plantas muestran cero flores y una
flor. Así mismo se percibe que el 12% de plantas tienen 3 flores, el 18%, 16% y 14% de plantas tienen
6, 7 y 8 flores, respectivamente y el 6% de los mismos tienen 10 flores.

18.0
18.0
16.0
16.0
14.0
14.0
12.0
12.0
10.0
Porcentaje

8.0 8.0 8.0


8.0
6.0 6.0
6.0
4.0
2.0 2.0
2.0
0.0
0 1 2 3 4 5 6 7 8 9 10

Número de flores por planta

Figura 3: Número de flores por planta en el fundo Santa Rosa, Santa, 2016.

DISTRIBUCIÓN DE FRECUENCIA POR CATEGORIAS

Un conjunto de observaciones normalmente cualitativas con categorías nominales u


ordinales, puede hacerse más comprensible, lograrse una mayor síntesis, tabulando los datos.
Para agrupar a un conjunto de observaciones, se selecciona las categorías, tales que cada
valor en la base de datos puede colocarse en una, de las categorías.

Presentación de las figuras: En distribución de frecuencias por categorías, las figuras a


presentar se denominan Barras y Sector circular.

Ejemplo 3
En un experimento se ha determinado el efecto de los diferentes porcentajes de harina de
maca y grasa vegetal que afectan a la característica sensorial (sabor) en helados. Con el fin
de obtener un nuevo valor agregado, se medirán en una escala hedónica de 20 puntos, con la

Docente: MSc. Luis Pajuelo Gonzáles


Semana 2: Distribución de Frecuencias y Figuras Curso: Estadística Aplicada

degustación de 28 panelistas semientrenados y se clasifican en sabor: Excelente (17-20), Muy


bueno (13-16), Bueno (09-12), Aceptable (04-08) e Insuficiente (00-03). Este experimento
se ejecutó en la planta agroindustrial de la UNS-2019. Los datos se muestran a continuación:
MATRIZ DE DATOS: SABOR DEL HELADO
Niveles Tratamientos
Grasa vegetal % 8% 11% 14%
Harina de maca % 10% 17% 10% 17% 10% 17%
Repeticiones/Código A1 A2 A1 A2 A1 A2
1 0 16 16 4 16 4
2 3 15 12 8 8 16
3 13 3 16 10 16 10
4 1 10 1 1 5 1
5 9 2 5 7 9 10
6 4 12 13 9 13 0
7 2 9 9 8 9 13
8 9 12 17 13 13 9
9 8 17 14 12 16 8
10 9 13 9 8 15 9
11 4 15 3 4 3 9
12 11 12 12 12 13 11
13 10 13 12 10 13 11
14 12 13 13 12 13 8
15 12 12 13 12 13 12
16 14 10 8 5 9 5
17 9 14 10 2 10 7
18 7 12 9 9 8 9
19 10 9 2 6 4 8
20 5 4 14 12 15 12
21 2 15 10 9 15 16
22 9 12 15 13 14 10
23 8 16 8 6 13 9
24 12 10 2 5 15 8
25 14 14 4 10 13 8
26 8 17 15 14 12 12
27 6 11 12 11 16 10
28 9 9 16 12 11 10
Solución
a) Identificar la unidad de análisis, variable de estudio, clasificación de la variable, el lugar
y tiempo.

Unidad de análisis : Panelistas


Variable de estudio : Sabor
Clasificación de la variable : Cualitativa ordinal
Tamaño de muestra : 28
Lugar : Planta agroindustrial UNS
Tiempo : 2019

Docente: MSc. Luis Pajuelo Gonzáles


Semana 2: Distribución de Frecuencias y Figuras Curso: Estadística Aplicada

b) Construir la distribución de frecuencias y sus figuras o gráficos, para la característica


sensorial sabor de la primera columna de color celeste de la matriz de datos, que
corresponde al 8% de grasa vegetal y el 10% de harina de maca.

Tabla 3
Clasificación del sabor de helados con 8% de grasa vegetal y 10% de harina de maca, por
parte de los panelistas semientrenados, en la planta agroindustrial de la UNS - 2019.

Sabor Frecuencias Frecuencias Frecuencia


absolutas relativas porcentual
fi hi Hi*100%
Insuficiente [00 – 03] 5 0,179 17,9
Aceptable [04 – 08] 8 0,286 28,6
Bueno [09 – 12] 12 0,429 42,9
Muy bueno [13 – 16] 3 0,107 10,7
Excelente [17 – 20] 0 0,000 0,0
Total 28 1,000 100,0
Fuente: Planta agroindustrial UNS

Interpretación: En la Tabla 3 se aprecia que del total de panelistas, el 17,9% siente que el
sabor del helado con 8% de grasa vegetal y 10% de harina de maca es insuficiente, sin
embargo el 28,6% de panelistas consideran que el sabor del helado con las dosis indicada es
aceptable, pero mayormente el 42,9% de los panelistas indican que el helado es bueno y el
10,7% aseguran que es muy bueno.

Docente: MSc. Luis Pajuelo Gonzáles


Semana 2: Distribución de Frecuencias y Figuras Curso: Estadística Aplicada

Figura 4: Clasificación del sabor de helados con 8% de grasa vegetal y 10% de harina de
maca.

Figura 5: Clasificación del sabor de helados con 8% de grasa vegetal y 10% de harina de
maca.

Docente: MSc. Luis Pajuelo Gonzáles

También podría gustarte