Está en la página 1de 3

154 ❚ CAPÍTULO OCHO Estadística descriptiva: la calidad y la variabilidad

Ejemplo 8.2 (continuación)

estuvieron prácticamente todas las láminas de la muestra en cuanto a grosor, por lo que hay serios problemas pues
deberían haber estado, a lo más, entre 4.2 y 5.8.
De acuerdo con lo anterior, el proceso no es capaz de cumplir los requerimientos de calidad, porque se tiene
demasiada variación y hay una tendencia marcada a producir láminas más delgadas (4.73). Se debe trabajar primera-
mente en centrar el proceso y luego en reducir la variabilidad.

Como se vio en los ejemplos 8.1 y 8.2, con base en la relación entre la media y la desviación
estándar expresada por el teorema de Chebyshev y la regla empírica, es posible determinar si la
variabilidad es mucha. Se debe tener cuidado en la aplicación de la regla empírica cuando se tienen
muestras pequeñas (menores que 30) y no aleatorias, ya que las conclusiones serán poco confiables
respecto a toda la población.

Límites reales o naturales


Debido a las propiedades de la distribución normal (vea el apéndice), expresada por la regla empírica,
límites naturales o lo que se ha estudiado da origen a lo que se conoce como límites naturales o reales de un proceso.
reales Sea m la media y s la desviación estándar del proceso, entonces los límites reales o naturales del
proceso están dados por:

Límite real inferior (LRI) 5 m 2 3s


Límite real superior (LRS) 5 m 1 3s

Dentro de estos límites se ubicarán los valores de la variable de salida correspondiente.

Histograma y tabla de frecuencia


En las secciones anteriores vimos que para el análisis de un conjunto de datos es clave conocer
histograma su tendencia central y su dispersión. Ahora veremos que el histograma y la tabla de frecuencias
permiten visualizar estos dos aspectos de un conjunto de datos, y además muestran la forma en
tabla de frecuencias la que los datos se distribuyen dentro de su rango de variación. Específicamente, el histograma es
una representación gráfica, en forma de barras, de la distribución de un conjunto de datos o una
variable, cuyos datos se clasifican por su magnitud en cierto número de grupos o clases, y cada clase
se representa por una barra, cuya longitud es proporcional a la cantidad de datos que pertenecen
a dicha clase. Usualmente, el eje horizontal está formado por una escala numérica para mostrar la
magnitud de los datos y en el eje vertical se representan las frecuencias.
Tabla 8.2 Tabla de frecuencia para el peso de las bolsas de azúcar de la marca A.

Clase Intervalo Marcas para conteo Frecuencia Frecuencia relativa


1 480.0 a 485.7 / 01 2.5%
2 485.7 a 491.4 // 02 5%
3 491.4 a 497.1 //// 04 10%
4 497.1 a 502.9 ///// ///// ///// 15 37.5%
5 502.9 a 508.6 ///// ///// / 11 27.5%
6 508.6 a 514.3 ///// 05 12.5%
7 514.3 a 520.0 // 02 5%

www.xlibros.com
Histograma y tabla de frecuencia ❚ 155

Construcción de un histograma
Aun cuando la mayoría de los software estadísticos proporcionan de manera automática el histo-
grama, a continuación, con los datos del ejemplo 8.1 del peso de las bolsas de azúcar de la marca A,
se ilustra la construcción de un histograma a fin de profundizar en la comprensión del mismo.
Paso 1.
Determinar el rango de los datos. El rango es igual a la diferencia entre el dato máximo y el
mínimo: R 5 515 2 484 5 31.
Paso 2.
Obtener el número de clases (NC). En general se recomienda que el número de intervalos o
clases sea de 5 a 15. Para decidir un valor entre este rango hay varios criterios. Uno de ellos
dice que el número de clases debe ser aproximadamente igual a la raíz cuadrada del número de
datos. Otro criterio, conocido como la regla de Sturgess, señala que el número de clases es igual
a 1 1 3.3 Log10(número de datos).
En el ejemplo, la raíz cuadrada de 40 (número de bolsas pesadas de la marca A) es mayor que
seis, por lo que se eligen siete clases, NC 5 7. Aplicando la regla de Sturgess, también se obtie-
ne un resultado similar, ya que 1 1 3.3 Log10(40) 5 6.3. En ocasiones, al modificar el número
de clases se pueden apreciar aspectos que no se habían observado, por lo que, si se dispone de
un programa computacional, es recomendable experimentar con diferentes números de clases
que estén cercanos al valor propuesto inicialmente.
Paso 3.
Establecer la longitud de clase (LC). La longitud de clase se establece de tal manera que el rango
pueda cubrirse en su totalidad por el número de clases determinado. Así, una forma directa de
obtener la LC es dividiendo el rango entre el número de clases: LC 5 R/NC. Sin embargo,
en ocasiones resulta más conveniente ampliar un poco el rango para que el histograma tenga
una cobertura ligeramente mayor que la observada en la muestra. En el ejemplo, el mínimo es
484 y el máximo es 515; de esta manera, al ampliar un poco, el histograma podría ir de 480 a
520. Así:
LC 5 (520 2 480)/7 5 5.7
Paso 4.
Construir los intervalos de clase. Los intervalos de clase resultan de dividir el rango (original o
ampliado) entre el número de intervalos determinados con la LC, como se muestra en la tabla
8.2. El punto inicial para la primera clase debe ser el dato mínimo del rango ampliado. En el
ejemplo se inicia en 480. Para obtener la primera clase se le suma al punto inicial la longitud
de clase y así se obtiene el intervalo de la primera clase (vea la tabla 8.2). Para obtener el inter-
valo de la segunda clase, se toma el final de la primera clase como punto inicial y se le suma la
longitud de clase, y así se sigue hasta completar todos los intervalos como se muestra en la tabla
de frecuencias 8.2.
Paso 5.
Obtener la frecuencia de cada clase. Para obtener la frecuencia se cuentan los datos que caen en
cada intervalo de clase (vea la tabla 8.2). Cuando un dato coincide con el final de una clase y
principio de la siguiente, entonces tal dato suele incluirse en la primera.
Paso 6.
Graficar el histograma. Se hace una gráfica de barras en la que las bases de las barras sean los
intervalos de clase y la altura sean las frecuencias de las clases. El histograma de la figura 8.4
muestra este paso, en el que se puede apreciar la variabilidad del peso de la muestra de las bolsas
de azúcar de la marca A, que prácticamente va de 480 a 520 gramos.
La figura 8.5 muestra el histograma para los datos de la marca B, a partir del cual se aprecia
que tienen una variabilidad mucho menor que las bolsas de la marca A. En ambos histogra-
mas se observa que la tendencia central en ambas muestras es similar (cercana a 500 gramos).

www.xlibros.com
156 ❚ CAPÍTULO OCHO Estadística descriptiva: la calidad y la variabilidad

15

12

Frecuencia 9

0
480 490 500 510 520
Figura 8.4 Histograma
Peso (g)
para bolsas de azúcar de
la marca A.

Además, no hay situaciones especiales en cuanto al comportamiento, como datos raros, sesgos,
etcétera.
Así, con un vistazo y comparación rápida de los histogramas se ve que la muestra de las bolsas
de la marca B cumple mejor los requerimientos para elaborar el agua fresca en el restaurante. Por
lo tanto, dado que la muestra no es demasiado pequeña, y dada la gran diferencia en variabili-
dad, las bolsas de azúcar de 500 gramos de la marca B son las que aseguran una mejor calidad
en el agua fresca.
Advierta que decidir con base en el histograma resultó más intuitivo que hacerlo con la apli-
cación de los criterios previos. Por ello, el histograma es fundamental para analizar un conjunto
de datos y decidir con base en su tendencia central, su variabilidad y comportamiento.

15

12

9
Frecuencia

0
Figura 8.5 Histograma 480 490 500 510 520
para bolsas de azúcar de Peso (g)
la marca B.

www.xlibros.com

También podría gustarte