Documentos de Académico
Documentos de Profesional
Documentos de Cultura
estuvieron prácticamente todas las láminas de la muestra en cuanto a grosor, por lo que hay serios problemas pues
deberían haber estado, a lo más, entre 4.2 y 5.8.
De acuerdo con lo anterior, el proceso no es capaz de cumplir los requerimientos de calidad, porque se tiene
demasiada variación y hay una tendencia marcada a producir láminas más delgadas (4.73). Se debe trabajar primera-
mente en centrar el proceso y luego en reducir la variabilidad.
Como se vio en los ejemplos 8.1 y 8.2, con base en la relación entre la media y la desviación
estándar expresada por el teorema de Chebyshev y la regla empírica, es posible determinar si la
variabilidad es mucha. Se debe tener cuidado en la aplicación de la regla empírica cuando se tienen
muestras pequeñas (menores que 30) y no aleatorias, ya que las conclusiones serán poco confiables
respecto a toda la población.
www.xlibros.com
Histograma y tabla de frecuencia ❚ 155
Construcción de un histograma
Aun cuando la mayoría de los software estadísticos proporcionan de manera automática el histo-
grama, a continuación, con los datos del ejemplo 8.1 del peso de las bolsas de azúcar de la marca A,
se ilustra la construcción de un histograma a fin de profundizar en la comprensión del mismo.
Paso 1.
Determinar el rango de los datos. El rango es igual a la diferencia entre el dato máximo y el
mínimo: R 5 515 2 484 5 31.
Paso 2.
Obtener el número de clases (NC). En general se recomienda que el número de intervalos o
clases sea de 5 a 15. Para decidir un valor entre este rango hay varios criterios. Uno de ellos
dice que el número de clases debe ser aproximadamente igual a la raíz cuadrada del número de
datos. Otro criterio, conocido como la regla de Sturgess, señala que el número de clases es igual
a 1 1 3.3 Log10(número de datos).
En el ejemplo, la raíz cuadrada de 40 (número de bolsas pesadas de la marca A) es mayor que
seis, por lo que se eligen siete clases, NC 5 7. Aplicando la regla de Sturgess, también se obtie-
ne un resultado similar, ya que 1 1 3.3 Log10(40) 5 6.3. En ocasiones, al modificar el número
de clases se pueden apreciar aspectos que no se habían observado, por lo que, si se dispone de
un programa computacional, es recomendable experimentar con diferentes números de clases
que estén cercanos al valor propuesto inicialmente.
Paso 3.
Establecer la longitud de clase (LC). La longitud de clase se establece de tal manera que el rango
pueda cubrirse en su totalidad por el número de clases determinado. Así, una forma directa de
obtener la LC es dividiendo el rango entre el número de clases: LC 5 R/NC. Sin embargo,
en ocasiones resulta más conveniente ampliar un poco el rango para que el histograma tenga
una cobertura ligeramente mayor que la observada en la muestra. En el ejemplo, el mínimo es
484 y el máximo es 515; de esta manera, al ampliar un poco, el histograma podría ir de 480 a
520. Así:
LC 5 (520 2 480)/7 5 5.7
Paso 4.
Construir los intervalos de clase. Los intervalos de clase resultan de dividir el rango (original o
ampliado) entre el número de intervalos determinados con la LC, como se muestra en la tabla
8.2. El punto inicial para la primera clase debe ser el dato mínimo del rango ampliado. En el
ejemplo se inicia en 480. Para obtener la primera clase se le suma al punto inicial la longitud
de clase y así se obtiene el intervalo de la primera clase (vea la tabla 8.2). Para obtener el inter-
valo de la segunda clase, se toma el final de la primera clase como punto inicial y se le suma la
longitud de clase, y así se sigue hasta completar todos los intervalos como se muestra en la tabla
de frecuencias 8.2.
Paso 5.
Obtener la frecuencia de cada clase. Para obtener la frecuencia se cuentan los datos que caen en
cada intervalo de clase (vea la tabla 8.2). Cuando un dato coincide con el final de una clase y
principio de la siguiente, entonces tal dato suele incluirse en la primera.
Paso 6.
Graficar el histograma. Se hace una gráfica de barras en la que las bases de las barras sean los
intervalos de clase y la altura sean las frecuencias de las clases. El histograma de la figura 8.4
muestra este paso, en el que se puede apreciar la variabilidad del peso de la muestra de las bolsas
de azúcar de la marca A, que prácticamente va de 480 a 520 gramos.
La figura 8.5 muestra el histograma para los datos de la marca B, a partir del cual se aprecia
que tienen una variabilidad mucho menor que las bolsas de la marca A. En ambos histogra-
mas se observa que la tendencia central en ambas muestras es similar (cercana a 500 gramos).
www.xlibros.com
156 ❚ CAPÍTULO OCHO Estadística descriptiva: la calidad y la variabilidad
15
12
Frecuencia 9
0
480 490 500 510 520
Figura 8.4 Histograma
Peso (g)
para bolsas de azúcar de
la marca A.
Además, no hay situaciones especiales en cuanto al comportamiento, como datos raros, sesgos,
etcétera.
Así, con un vistazo y comparación rápida de los histogramas se ve que la muestra de las bolsas
de la marca B cumple mejor los requerimientos para elaborar el agua fresca en el restaurante. Por
lo tanto, dado que la muestra no es demasiado pequeña, y dada la gran diferencia en variabili-
dad, las bolsas de azúcar de 500 gramos de la marca B son las que aseguran una mejor calidad
en el agua fresca.
Advierta que decidir con base en el histograma resultó más intuitivo que hacerlo con la apli-
cación de los criterios previos. Por ello, el histograma es fundamental para analizar un conjunto
de datos y decidir con base en su tendencia central, su variabilidad y comportamiento.
15
12
9
Frecuencia
0
Figura 8.5 Histograma 480 490 500 510 520
para bolsas de azúcar de Peso (g)
la marca B.
www.xlibros.com