Está en la página 1de 5

1

Histograma y tabla de frecuencia (calidad total y

productividad, pg. 154)


Para el anlisis de un conjunto de datos es clave conocer su tendencia
central y su dispersin. Ahora veremos que el histograma y la tabla de
frecuencias permiten visualizar estos dos aspectos de un conjunto de
datos, y adems muestran la forma en la que los datos se distribuyen
dentro de su rango de variacin. Especficamente, el histograma es una
representacin grfica, en forma de barras, de la distribucin de un
conjunto de datos o una variable, cuyos datos se clasifican por su
magnitud en cierto nmero de grupos o clases, y cada clase se
representa por una barra, cuya longitud es proporcional a la cantidad de
datos que pertenecen a dicha clase. Usualmente, el eje horizontal est
formado por una escala numrica para mostrar la magnitud de los datos
y en el eje vertical se representan las frecuencias.

Construccin de un histograma

A continuacin, con los datos del ejemplo 8.1 del peso de las bolsas de
azcar de la marca A, se ilustra la construccin de un histograma a fi n
de profundizar en la comprensin del mismo.
En un restaurante se tiene una frmula especfica para elaborar una
cantidad determinada de agua fresca, la cual contempla agregar 500
gramos de azcar. Es claro que resulta de suma importancia aadir
exactamente esa cantidad de azcar para la calidad del agua, ya que,
de lo contrario, sta queda muy dulce o desabrida. Aunque a los
cocineros se les ha insistido sobre lo anterior, es frecuente que no pesen
el azcar y la agreguen al tanteo. Al considerar la calidad del agua como
un aspecto clave, se decide disear un procedimiento a prueba de
olvidos: comprar bolsas que contengan 500 gramos de azcar. Suponga
dos marcas de azcar que cuentan con la presentacin de 500 gramos;
ahora es necesario decidir qu marca comprar. Con este propsito se
pesan 40 bolsas de ambas marcas. Al pesarse arrojan los resultados de
la tabla 8.1.

Paso 1. Determinar el rango de los datos. El rango es igual a la


diferencia entre el dato mximo y el mnimo: R = 515 - 484 = 31.
Paso 2. Obtener el nmero de clases (NC). En general se recomienda
que el nmero de intervalos o clases sea de 5 a 15. Para decidir un valor
entre este rango hay varios criterios. Uno de ellos dice que el nmero de
clases debe ser aproximadamente igual a la raz cuadrada del nmero
de datos. Otro criterio, conocido como la regla de Sturgess, seala que el
nmero de clases es igual a 1 + 3.3 Log (nmero de datos).
En el ejemplo, la raz cuadrada de 40 (nmero de bolsas pesadas de la
marca A) es mayor que seis, por lo que se eligen siete clases, NC = 7.
Aplicando la regla de Sturgess, tambin se obtiene un resultado similar,
ya que 1 + 3.3 Log (40) = 6.3. Otro mtodo podra ser el
procedimiento 2k > n.
Paso 3. Establecer la longitud de clase (LC). La longitud de clase se
establece de tal manera que el rango pueda cubrirse en su totalidad por
el nmero de clases determinado. As, una forma directa de obtener la
LC es dividiendo el rango entre el nmero de clases: LC = R/NC. Sin
embargo, en ocasiones resulta ms conveniente ampliar un poco el
rango para que el histograma tenga una cobertura ligeramente mayor
que la observada en la muestra. En el ejemplo, el mnimo es 484 y el
mximo es 515; de esta manera, al ampliar un poco, el histograma
podra ir de 480 a 520. As:
LC = (520 - 480)/7 = 5.7
Paso 4. Construir los intervalos de clase. Los intervalos de clase resultan
de dividir el rango (original o ampliado) entre el nmero de intervalos

3
determinados con la LC, como se muestra en la tabla 8.2. El punto inicial
para la primera clase debe ser el dato mnimo del rango ampliado. En el
ejemplo se inicia en 480. Para obtener la primera clase se le suma al
punto inicial la longitud de clase y as se obtiene el intervalo de la
primera clase (vea la tabla 8.2). Para obtener el intervalo de la segunda
clase, se toma el final de la primera clase como punto inicial y se le
suma la longitud de clase, y as se sigue hasta completar todos los
intervalos como se muestra en la tabla de frecuencias 8.2.

Paso 5. Obtener la frecuencia de cada clase. Para obtener la frecuencia


se cuentan los datos que caen en cada intervalo de clase (vea la tabla
8.2). Cuando un dato coincide con el final de una clase y principio de la
siguiente, entonces tal dato suele incluirse en la primera.

Paso 6. Graficar el histograma. Se hace una grfica de barras en la que


las bases de las barras sean los intervalos de clase y la altura sean las
frecuencias de las clases. El histograma de la fi gura 8.4 muestra este
paso, en el que se puede apreciar la variabilidad del peso de la muestra
de las bolsas de azcar de la marca A, que prcticamente va de 480 a
520 gramos.

La figura 8.5 muestra el histograma para los datos de la marca B, a


partir del cual se aprecia que tienen una variabilidad mucho menor que
las bolsas de la marca A. En ambos histogramas se observa que la
tendencia central en ambas muestras es similar (cercana a 500 gramos).
(Para ejercicio de tarea antes del examen).

As, con un vistazo y comparacin rpida de los histogramas se ve que la


muestra de las bolsas de la marca B cumple mejor los requerimientos
para elaborar el agua fresca en el restaurante. Por lo tanto, dado que la
muestra no es demasiado pequea, y dada la gran diferencia en
variabilidad, las bolsas de azcar de 500 gramos de la marca B son las
que aseguran una mejor calidad en el agua fresca.
Advierta que decidir con base en el histograma result ms intuitivo que
hacerlo con la aplicacin de los criterios previos. Por ello, el histograma
es fundamental para analizar un conjunto de datos y decidir con base en
su tendencia central, su variabilidad y comportamiento.