Está en la página 1de 15

HISTOGRAMAS

Definición y aplicación

El histograma es una representación visual de los datos de una característica de calidad en


la que pueden observarse tres propiedades esenciales de una distribución como son:
Forma, tendencia central o acumulación, y dispersión o variabilidad.

El histograma es una herramienta muy útil en la fase Definir por la visión que ofrece a golpe
de ojo de la distribución de los datos de las características de calidad. Es una
representación gráfica de la distribución de un conjunto de datos o de una variable, donde
los datos se clasifican por su magnitud en cierto número de clases.

Para realizar el histograma, se marcan las clases Agrupaciones de los datos iniciales sobre
el eje de abscisas, y sobre cada clase se levanta un rectángulo de altura proporcional al
número de observaciones de la variable (frecuencia absoluta) que caen en la base. [1]

Entre las finalidades principales de los histogramas se encuentran las siguientes:

● Dejar bien visible la distribución de la característica de calidad estudiada e identificar


su forma.
● Analizar, controlar y mostrar las capacidades de los procesos de los que derivan sus
datos, tanto cualitativa como cuantitativamente.
● Ayudar a determinar el promedio, la desviación estándar, los coeficientes de
asimetría y curtosis, así como otras medidas de la distribución de la característica de
calidad en estudio.
● Probar a qué tipo de distribución matemática se puede acoplar estadísticamente la
distribución empírica de los datos relativos a la característica de calidad estudiada.
En control de calidad cobra gran valor la comprobación del ajuste de los datos de
una característica de calidad a la distribución normal. [1]

Construcción e interpretación

Cuando un histograma se construye de manera correcta, es resultado de un número


suficiente de datos (de preferencia más de 100), y estos son representativos del estado del
proceso durante el periodo de interés; entonces, se recomienda considerar los siguientes
puntos en la interpretación del histograma. [2]

Ejemplo 2.1:
Tabla1. Datos para el grosor de los discos, ejemplo 2.1

Figura1. Histograma para grosor de discos del ejemplo 2.1

1. Observar la tendencia central de los datos. Localizar en el eje horizontal o escala de


medición las barras con mayores frecuencias. En el histograma de la figura 1, una parte
sustancial de las mediciones se localiza entre 1.14 y 1.20 mm.
2. Estudiar el centrado del proceso. Para ello, es necesario apoyarse en el punto anterior
y observar la posición central del cuerpo del histograma con respecto a la calidad óptima y a
las especificaciones. Por ejemplo, en la figura 2 incisos a) y c) se muestran procesos
centrados, el primero presenta poca variabilidad, pero en el segundo ocurre lo contrario.
Mientras que en los incisos b) y d) se observan procesos descentrados, el primero con poca
variabilidad y el segundo con mucha. Aun cuando se cumplan las especificaciones, si el
proceso no está centrado, la calidad que se produce no es adecuada, ya que entre más se
aleje del óptimo peor calidad se tendrá. Por ello, en caso de tener un proceso descentrado
se procede a realizar los ajustes o cambios necesarios para centrar el proceso.
3. Examinar la variabilidad del proceso. Consiste en comparar la amplitud de las
especificaciones con el ancho del histograma. Para considerar que la dispersión no es
demasiada, el ancho del histograma debe caber de forma holgada en las especificaciones.
En la figura 2 incisos a) y b) hay poca variación, mientras que en los incisos c) y d) ocurre lo
contrario.
4. Analizar la forma del histograma. Al observar un histograma, considerar que la forma
de distribución de campana es la que más se da en salidas de proceso y tiene
características similares a la distribución normal. Es frecuente que cuando la distribución no
es de este tipo sea la señal de un hecho importante que está ocurriendo en el proceso y
que tiene un efecto negativo en la calidad. Por ello, es necesario revisar si la forma del
histograma es muy diferente a la de campana. Algunas de las formas típicas que no
coinciden con una distribución de campana, son las siguientes:

● Distribución sesgada. En la figura 2. e) se aprecia un histograma con una


distribución sesgada a la derecha, ya que la cola derecha es más grande que la
izquierda. En términos generales, un sesgo en una variable de salida refleja el
desplazamiento paulatino de un proceso debido a desgastes o desajustes;
asimismo, puede indicar procedimientos viciados en la forma de obtener las
mediciones o un desempeño especial del proceso, en el sentido que aparecen
algunos valores inusualmente altos de un solo lado de la distribución (izquierdo o
derecho). Cabe aclarar que existen características de calidad que, por su naturaleza,
tienen sesgo, como son tiempos de vida y resistencias a la fatiga. Una forma de
decidir si una distribución sesgada indica una situación especial a corregir, consiste
en comparar esta con la distribución de la misma característica o de variables
similares para datos obtenidos en otro periodo. La recomendación general es que
ante la sospecha de que hay algo especial atrás de una distribución con sesgo se
debe investigar si efectivamente es así.
● Distribución multimodal. En la figura 2. f) se aprecia un histograma en el que
claramente se notan dos modas o picos que muestran dos tendencias centrales
diferentes. Este tipo de distribuciones con dos o más modas reflejan la presencia de
dos o más realidades o condiciones diferentes. Algunas situaciones que originan una
distribución multimodal son:
a) Diferencias importantes de lote a lote en la materia prima que utiliza el
proceso, debido a que proceden de diferentes proveedores o al exceso de
variación de un mismo proveedor.
b) Cuando en el proceso intervienen varios operadores, con criterios o
métodos de trabajo diferentes.
c) Las mediciones de la variable de salida que están representadas en el
histograma fueron realizadas por personas o instrumentos diferentes; por lo
tanto, se utilizaron distintos criterios o instrumentos mal calibrados.
d) El proceso, cuando generó los resultados de la distribución multimodal, fue
operando en condiciones diferentes (una condición para cada moda).
e) En general, una distribución multimodal se debe a la presencia de fuentes
de variación bien definidas que deben ser identificadas y corregidas, a fin de
mejorar la capacidad del proceso correspondiente. Una forma de
identificarlas es analizar por separado los datos en función de diferentes lotes
de materia prima, operadores, instrumentos de medición, turnos o días de
producción, etc., para así comparar los resultados y ver si hay diferencias
significativas.
● Distribución muy plana. En la figura 2. g) se aprecia un histograma que muestra una
distribución muy chata o plana y que está lejos de tener forma de campana. Las
situaciones que pueden causar esto son las mismas que las de la distribución
multimodal, pero con la particularidad de que las diferencias son menos fuertes; sin
embargo, afectan de manera seria la capacidad de un proceso. Por lo tanto, también
deben ser identificadas y corregidas mediante la estrategia recomendada antes.
● Distribución con acantilados. En el histograma de la figura 2.h) se observa un
acantilado derecho, que es una suspensión o corte muy brusco en la caída de la
distribución. Algunas de las posibles causas que motivan la presencia de un
acantilado son: un lote de artículos previamente inspeccionados 100% donde se
excluyó a los artículos que no cumplen con alguna medida mínima o que exceden
una medida máxima, problemas con el equipo de medición, errores en la medición o
inspección (cuando el inspector está predispuesto a no rechazar un artículo y
observa que éste casi cumplía con los requisitos, registra la medida mínima
aceptable). En general, un acantilado es anormal y, por lo tanto, se debe buscar la
causa del mismo.

5. Datos raros o atípicos. Una pequeña cantidad de mediciones muy extremas o atípicas
son identificadas con facilidad mediante un histograma, debido a que aparecen una o más
barras pequeñas bastante separadas o aisladas del resto. Un dato raro refleja una situación
especial que se debe investigar, y entre las posibles causas están las siguientes:

● El dato es incorrecto, ya sea por error de medición, de registro o de “dedo” cuando


fue introducido a la computadora.
● La medición fue realizada sobre un artículo o individuo que no forma parte del
proceso o población a la que pertenece el resto.
● Si han sido descartadas las dos situaciones anteriores, entonces la medición se
debe a un evento raro o especial. Es decir, cuando se hizo la medición, en el
proceso estaba Distribución multimodal Forma de la distribución de unos datos en la
que se aprecian claramente dos o más modas (picos). Por lo general, cada moda
refleja una condición o realidad diferente. Dato raro o atípica Medición cuya
magnitud es muy diferente a la generalidad de las mediciones del conjunto de datos
correspondiente.
● Proceso con distribución sesgada, donde el histograma se generó con un tamaño de
muestra relativamente pequeño.

6. Estratificar. En ocasiones, en el histograma no se observa ninguna forma particular,


pero existe mucha variación y, en consecuencia, la capacidad del proceso es baja. Cuando
los datos proceden de distintas máquinas, proveedores, lotes, turnos u operadores, puede
encontrarse información valiosa si se hace un histograma por cada fuente (estratificar), con
lo que se podrá determinar cuál es la máquina o el proveedor más problemático. [2]
Figura2. Distribuciones típicas reflejadas por un histograma.

Excel y los histogramas

Para construir un histograma de frecuencias se selecciona la opción Análisis de datos en el


grupo Análisis de la ficha Datos (figura 3), con lo que se obtiene el cuadro Funciones para
análisis de la figura 4 en el que elegiremos la opción Histograma.
Figura3. Opción Análisis de datos en el grupo Análisis de la ficha Datos.

Figura4. Cuadro Funciones para análisis de datos.

Como ejemplo consideramos los valores de los pesos en miligramos de 80 hembrillas


producidas por una máquina que tienen los siguientes valores: [1]

Se trata de construir el histograma adecuado a los datos de esta característica de calidad.


Comenzamos introduciendo los datos como la variable de nombre PH (peso hembrillas) en
la primera columna de la hoja de cálculo. A continuación, seleccionamos la opción Análisis
de datos del grupo Análisis de la ficha Datos y en la pantalla Análisis de datos elegimos
Histograma (figura 4).
Rellenamos la pantalla Histograma tal y como se indica en la figura 5.

Figura5. Configuración histograma.

En el campo Rango de entrada se introduce el rango en el que se sitúan los datos de la


variable. En el campo Rango de clases se sitúa el rango que ocupa la columna de los
extremos superiores de los intervalos de clase, pero en nuestro caso lo dejamos en blanco
para que Excel divida los datos automáticamente en un número adecuado de clases de la
misma anchura. En el campo Rango de salida se sitúa el rango que ocupará la tabla de
frecuencias, pero en nuestro caso situaremos solo el extremo superior izquierdo de dicho
rango. Señalamos la opción Gráfico para obtener el histograma de frecuencias absolutas, y
la opción Porcentaje acumulado para obtener el polígono de frecuencias relativas
acumuladas. Al pulsar Aceptar se obtiene la figura 6.

Figura6. Histograma con datos PH (peso hembrillas).

Cuyo histograma se ajusta bien a una campana de Gauss, lo que indica normalidad y
simetría en los datos.[1]
GRÁFICA DE CORRELACIÓN

Definición y aplicación

El diagrama de correlación es una representación gráfica en un eje de coordenadas de los


datos que se recogen sobre dos variables para poder estudiar si existe relación de causa-
efecto entre ellas (Kume 1985b). [3]

Se utiliza para comprender si se encuentran vinculadas entre sí dos magnitudes y en qué


medida. Sirve para verificar causas reales, definir y medir relaciones existentes entre dos
variables. Se instrumentaliza en cuatro fases (Kume 1985b):

Las gráficas de correlación se pueden utilizar en una amplia variedad de aplicaciones, como
por ejemplo:

● Finanzas: para analizar la relación entre el precio de una acción y el volumen de


negociación.
● Marketing: para analizar la relación entre la cantidad de dinero gastada en publicidad
y las ventas.
● Ciencia: para analizar la relación entre la temperatura y el crecimiento de las plantas.

Construcción e interpretación

Para poder leer los diagramas de correlación se debe examinar primero si hay o no hay
puntos muy apartados en el diagrama. Puede generalmente suponerse que estos puntos
apartados del grupo principal (Ilustración1) son el resultado de errores de medición o de
registro de los datos, o fueron causados por algún cambio en las condiciones de operación.
Es necesario excluir estos puntos del análisis correlacional; sin embargo, en lugar de
despreciar completamente estos puntos, se debe dar debida atención a la causa de
irregularidad porque con frecuencia se obtiene información muy útil averiguando por qué
ocurren.
Ilustración1. Puntos lejanos

1. Dispersión en los puntos. Hay varios tipos de formas de dispersión, y algunas formas
típicas se dan en la figura hasta la 11. En las figuras 7 y 8, Y crece con X, esto es una
correlación positiva. También, como la figura 7 muestra esta tendencia de una manera muy
pronunciada, se dice que es una correlación positiva fuerte.
Las figuras 10 y 11 muestran lo opuesto a una correlación positiva, pues a medida que x
aumenta, y disminuye; esto se llama una correlación negativa. La figura 10 muestra una
correlación negativa fuerte. La figura 9 muestra el caso en el que X y Y no tienen ninguna
relación particular, y por eso decimos que no hay correlación.

Figura7. Correlación positiva Figura8. Puede haber correlación


positiva
Figura9. No hay correlación Figura10. Correlación negativa

Figura11. Puede haber correlación


negativa

2. Correlaciones falsas. De acuerdo con cierto estudio, existía una correlación positiva
fuerte entre el índice de precios al consumidor y el número de incendios. Si esto es así,
entonces ¿descenderá el número de incendios si desciende el índice de precios al
consumidor? Lo más probable es que no. Para reducir el número de incendios,
enfatizaríamos la importancia de limpiar los ceniceros y de no botar basura que pueda
incendiarse. Así, cuando se calcula un coeficiente de correlación entre dos variables, ocurre
a veces que, por casualidad, hay una alta correlación entre variables que no tienen o tienen
muy poca relación de causa-efecto. Este tipo de correlación se llama una falsa correlación.
Aun si el coeficiente de correlación es alto, no indica necesariamente una relación de causa-
efecto. Es necesario tener en cuenta este hecho, y pensar en su significado científico y
tecnológico.

3. Estratificación. Tanto en la figura 12 y 13 se muestran en gráficas de correlación la


relación entre la cantidad de impureza y la viscosidad de una sustancia manufacturada. En
la figura 12, cuando se combinan indiscriminadamente los datos de la compañía A con los
de la compañía B, parece no haber correlación (figura 12 a la izquierda); pero cuando se
distinguen como en la figura 12 a la derecha, se ve que hay una clara correlación. Por otra
parte, la figura 13 parece mostrar una correlación general, pero cuando se estratifica en A y
B (figura 13 a la derecha), la correlación desaparece. Cuando se ha estratificado un factor,
se puede obtener información vital distinguiendo los datos de los diversos estratos por
medio de colores o de símbolos. Con este fin, se debe tener cuidado siempre de registrar el
origen y contexto de la información, de tal forma que los datos sean información útil en el
análisis posterior. [3]
Figura12. La estratificación en los diagramas de dispersión.

Figura13. La estratificación en los diagramas de dispersión.

4. Dirección de la correlación. Los coeficientes de correlación son medidas que indican la


situación relativa de los mismos sucesos respecto a las dos variables, es decir, son la
expresión numérica que nos indica el grado de relación existente entre las 2 variables y en
qué medida se relacionan. Son números que varían entre los límites +1 y -1. Su magnitud
indica el grado de asociación entre las variables; el valor r = 0 indica que no existe relación
entre las variables; los valores ± 1 son indicadores de una correlación perfecta positiva (al
crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece
Y).

● Correlación positiva: La pendiente de la línea de tendencia es positiva, lo que indica


que a medida que una variable aumenta, la otra también aumenta.
Ilustración2. Correlación positiva

● Correlación negativa: La pendiente de la línea de tendencia es negativa, lo que


indica que a medida que una variable aumenta, la otra disminuye.

Ilustración3. Correlación negativa

● No hay correlación: La línea de tendencia es horizontal o casi horizontal, lo que


indica que no hay una relación significativa entre las dos variables.

Ilustración4. No hay correlación

5. Fuerza de la correlación. Coeficiente de correlación (R^2):

○ Un valor de R^2 cercano a 1 indica una fuerte correlación.


○ Un valor de R^2 cercano a 0 indica una débil correlación.
○ Un valor de R^2 de 0,5 indica una correlación moderada.
6. Linealidad

● Línea de tendencia ajustada: La relación entre las variables es lineal.


● Línea de tendencia no ajustada: La relación entre las variables no es lineal.

Excel y los histogramas

Para graficar el diagrama correlación en excel inicialmente se debe tener una base de datos
en donde tengamos un eje X y eje Y, como a continuación:

Ilustración5. Datos

1. Seleccione los datos que desea trazar en el gráfico de dispersión.


2. Haga clic en la pestaña Insertar y, a continuación, haga clic en Insertar, gráfico de
dispersión (X, Y) o gráfico de burbujas

3. Haga clic en Dispersión; Sugerencia: Puede colocar el mouse sobre cualquier tipo
de gráfico para ver su nombre.
4. Haga clic en el área del gráfico para mostrar las pestañas Diseño y Formato.
5. Haga clic en la pestaña Diseño y, a continuación, haga clic en el estilo de gráfico que
desee usar.

6. Haga clic en el título del gráfico y escriba el texto que desee.


7. Para cambiar el tamaño de fuente del título del gráfico, haga clic con el botón
derecho en el título, haga clic en Fuente y escriba el tamaño que desee en el cuadro
Tamaño. Haga clic en Aceptar.
8. Haga clic en el área del gráfico.
9. En la pestaña Diseño , haga clic en Agregar elemento de gráfico > Títulos de eje y, a
continuación, haga lo siguiente:

● Para agregar un título de eje horizontal, haga clic en Horizontal primario.

● Para agregar un título de eje vertical, haga clic en Vertical primaria.

● Haga clic en cada título, escriba el texto que quiera y, después, presione
Entrar.
● Para ver más opciones de formato de título, en la pestaña Formato , en el
cuadro Elementos de gráfico , seleccione el título de la lista y, a continuación,
haga clic en Aplicar formato a la selección. Aparecerá un panel Formato de
título. Haga clic en Tamaño & Propiedades, Tamaño y propiedades y, a
continuación, puede elegir Alineación vertical, Dirección del texto o Ángulo
personalizado.

10. Haga clic en el área de trazado del gráfico o, en la pestaña Formato , en el cuadro
Elementos de gráfico , seleccione Área de trazado en la lista de elementos del
gráfico.
11. En la pestaña Formato, en el grupo Estilos de forma, haga clic en el botón Más y, a
continuación, haga clic en el efecto que desee usar.
12. Haga clic en el área del gráfico o, en la pestaña Formato, en el cuadro Elementos de
gráfico, seleccione Área del gráfico en la lista de elementos del gráfico.
13. En la pestaña Formato, en el grupo Estilos de forma, haga clic en el botón Más y, a
continuación, haga clic en el efecto que desee usar.

[1] Pérez, M. (2010). Metodologís Seis Sigma a través de EXCEL. RC Libros.


[2] Snee, R. (2001), “Dealing with the achilles, heel of six sigma initiatives”, Quality
Progress, 34, núm. 3, pp. 66-72
[3] Kume, Hitoshi (1992).

También podría gustarte