P. 1
5_Histograma

5_Histograma

|Views: 26|Likes:
Publicado porricardoetoledo
Desarrollo de Histogramas con el Minitab.
Desarrollo de Histogramas con el Minitab.

More info:

Published by: ricardoetoledo on Aug 27, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

09/23/2013

pdf

text

original

UNIVERSIDAD NACIONAL “SANTIAGO ANTÚNEZ DE MAYOLO”

FACULTAD DE ADMINISTRACIÓN Y TURISMO

ADMINISTRACIÓN DE OPERACIONES

GUÍA DE PRÁCTICA
HISTOGRAMA
(Herramienta 5 / 7 para la calidad con el MINITAB)

SIETE

M. Sc. RICARDO TOLEDO QUIÑONES
HUARAZ – PERÚ – ENERO 2 011

UNASAM – FAT 

Administración de Operaciones

HISTOGRAMA 1. OBJETIVO

Los histogramas dividen los valores de las muestras en muchos intervalos denominados secciones. Las barras representan el número de observaciones que se ubican dentro de cada sección (su frecuencia). Permite ver tres propiedades de los datos numéricos: 2. Forma en la que se distribuyen las observaciones (asimetría y curtosis). Tendencia central (media, mediana, moda). Dispersión (desviación estándar). CARACTERÍSTICAS Y MEDIDAS

Cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos. La utilidad del histograma tiene que ver con la posibilidad de establecer de manera visual, ordenada y fácilmente comprensible todos los datos numéricos estadísticos que pueden tornarse difíciles de entender. Hay muchos tipos de histogramas y cada uno se ajusta a diferentes necesidades como también a diferentes tipos de información. Los datos que se representan generalmente están referidos una: Población: totalidad de valores posibles de una característica particular de un grupo especificado de objetos, los cuales constituyen un universo. Ejemplo: Universo: personas que se encuentran en el salón de clases. Características: edad Población: edades de dichas personas Muestra: parte de la población en estudio seleccionada según una regla o plan. Ejemplo: Muestra: edades de 10 personas elegidas al azar. ser los eje las

-

Para un histograma existen dos tipos de informaciones básicas (que pueden complementados o no de acuerdo a la complejidad del diseño): la frecuencia de valores y los valores en sí. Normalmente, las frecuencias son representadas en el vertical mientras que en el horizontal se representan los valores de cada una de variables (que aparecen en el histograma como barras bi o tridimensionales).

Existen diferentes tipos de histogramas. Los histogramas de barras simples son los más comunes y utilizados. También están los histogramas de barras compuestas que permiten introducir información sobre dos variables. Luego están los histogramas de barras agrupadas según información y por último el polígono de frecuencias y la ojiva porcentual, ambos sistemas utilizados normalmente por expertos. En la forma como se distribuyen pueden ser medidos a nivel de asimetría y curtosis, en el Anexo 1 se presentan gráficamente sus características y significado de sus medidas. Pueden existir otras formas de distribución tales como en forma de: J, de J invertida, de U, bimodal o multimodal o aquellas que no describen ninguna forma. Se pueden combinar ambos criterios, encontrando que una curva puede ser simétrica y leptocúrtica, simétrica platicúrtica, positivamente asimétrica y leptocúrtica, etc. R. Toledo  -1-

UNASAM – FAT 

Administración de Operaciones

Asimetría Es el grado en que un conjunto de datos no es simétrico. Como muchas otras estadísticas básicas, la asimetría puede ayudar a establecer un entendimiento inicial de los datos. Puede evaluar la asimetría mediante una gráfica (como un histograma) o a través de la estadística de la asimetría (ver Anexo 2). A medida que los datos son más simétricos, el valor de su asimetría se acerca a cero. Los datos normalmente distribuidos, por definición, exhiben asimetrías relativamente pequeñas. Al dividir en dos un histograma y observar que aproximadamente un lado es reflejo del otro se puede advertir que son datos normales. Pero puede suceder que los datos son también reflejos pero que salen a partir del medio, en este caso están lejos de ser datos normales. Distribuciones asimétricas a la derecha o positivas. Los datos con asimetría positiva o datos asimétricos a la derecha se denominan así debido a que la "cola" de la distribución apunta hacia la derecha y porque el valor de la asimetría será mayor que 0 (o positivo). Con frecuencia los datos sobre salarios presentan esta asimetría: muchos empleados en una compañía ganan relativamente poco, mientras que cada vez menos gente gana salarios muy elevados. Distribuciones asimétricas a la izquierda o negativas. En este caso, la cola de la distribución apunta hacia la izquierda y produce un valor de asimetría negativa. Los datos de tasa de fallas con frecuencia son asimétricos a la izquierda. Consideremos el caso de las bombillas: muy pocas se quemarán inmediatamente, la gran mayoría dura un tiempo considerablemente largo. Curtosis (o kurtosis) Es el grado en el cual un conjunto de datos alcanza su valor máximo. Como muchas otras estadísticas básicas, la curtosis puede ayudar a establecer un entendimiento inicial de los datos (ver Anexo 2). Línea base: la distribución normal. Los datos normalmente distribuidos establecen la línea base para la curtosis: con picos no demasiado bajos ni demasiado altos. Los datos que siguieron una distribución normal perfectamente tendrían un valor de curtosis de 0. Datos de picos altos. Una distribución con un pico más alto de lo normal tendrá un valor de curtosis positivo. Datos de picos bajos. Una distribución con un pico más bajo de lo normal tendrá un valor de curtosis negativo. Tendencia central Como medidas de ubicación se utilizan medidas para describirlas, generalmente se desea que el valor sea representativo de todo el grupo, llamadas medidas de tendencia central, utilizándose para esto principalmente la media (o promedio), la mediana y la moda (ver ubicación de acuerdo a forma que adopta la distribución en el Anexo 1). Media. Describe un conjunto entero de observaciones con un valor individual que representa el centro de los datos. Mediana. Representa el centro del rango de datos: la mitad de las observaciones es menor que o igual al valor y la mitad de las observaciones es mayor que o igual al valor. Moda. Es el valor que ocurre con más frecuencia en un conjunto de observaciones. R. Toledo  -2-

UNASAM – FAT 

Administración de Operaciones

Dispersión Las medidas de dispersión describen un grupo de valores, en función de la variación o dispersión de los ítems incluidos dentro de ese grupo. Existen varios indicadores como el rango, la desviación estándar y el coeficiente de variación. Dentro del análisis estadístico es gran utilidad la llamada distribución normal, característicamente representada por una curva que es a la vez simétrica y mesocúrtica en la que alrededor del 68.27% de los datos están situados dentro de una desviación estándar de la media, el 95.45% a dos unidades de desviaciones estándar de la media y el 99.73% a tres unidades. Normalidad Muchos procedimientos estadísticos parten del supuesto de que los datos siguen una distribución normal. Para verificar este supuesto, se puede realizar una prueba de normalidad en los datos, para ello se pueden utilizar varias pruebas, a partir de la formulación de las hipótesis siguientes: (Nota: H1: Indica: DIFERENCIAS). H0: los datos siguen una distribución normal. H1: los datos no siguen una distribución normal.

Las técnicas estadísticas más frecuentemente utilizadas por los analistas en todo tipo de áreas son denominados contrastes paramétricos o pruebas PARAMÉTRICAS fundamentadas por ejemplo en el hecho o supuesto que los datos siguen una distribución normal y que la varianza de los residuos sea constante. Pero de no cumplirse estos supuestos, que podría ser más común de lo que se piensa, se debe proceder a contrastes o pruebas NO PARAMÉTRICAS, en el cual se pueden englobar en este término genérico a los contrastes de distribución libre. El objetivo de la presente Guía es efectuar este contraste sólo para probar la aceptación o no de H0. Prueba de Anderson-Darling (AD) Esta prueba tiene un buen nivel de potencia y es especialmente efectiva para la detección de alejamiento de la normalidad en los valores altos y bajos de una distribución. Para el valor del estadístico AD o lo que es lo mismo para A-cuadrado, tiene como valores críticos más utilizados, los siguientes: Si el estadístico supera 1.029 entonces se acepta H1 para un nivel de prueba de 1% (99% de confianza). Si el estadístico supera 0.870 entonces se acepta H1 para un nivel de prueba de 2.5% (97.5% de confianza). Si el estadístico supera 0.751 entonces se acepta H1 para un nivel de prueba de 5% (95% de confianza). Si el estadístico supera 0.632 entonces se acepta H1 para un nivel de prueba de 10% (90% de confianza).

Si el valor probabilístico calculado (p-valor), es mayor o igual al Nivel de Significancia α (α = 1 – Nivel de Confianza) seleccionado, generalmente 0.01, 0.05 ó 0.10 que indican niveles de confianza del 99%, 95% y 90% respectivamente, se concluye que los datos siguen la distribución normal. No siempre se muestra un p-valor para la prueba de Anderson-Darling, porque ésta no existe matemáticamente para ciertos casos), En resumen: Si la probabilidad de p-valor es mayor a α, se considera que los datos son normales. R. Toledo  -3-

UNASAM – FAT 

Administración de Operaciones

Prueba de normalidad de Ryan-Joiner (RJ) Esta prueba tiene un buen nivel de potencia. Evalúa la normalidad calculando la correlación entre sus datos y las puntuaciones normales de sus datos. Su regla es: Si la probabilidad de p-valor es mayor a 0.05, los datos son normales. Una señal de lo anterior es que el coeficiente de correlación es cercano a 1. Prueba de Kolmogorov-Smirnov (KS) Es una prueba muy conocida y utilizada, pero tiende a ser menos potente que las otras dos pruebas. Su interpretación a partir del p-valor, es similar a la de Anderson-Darling: Si p-valor calculado ≥ α, se acepta H0 (los datos siguen una distribución normal) Si p-valor calculado < α, se acepta H1 (los datos NO siguen una distribución normal) 3. IMPORTANCIA

a) Representa los datos gráficamente permitiendo establecer sus características generales. Datos dispersos son agrupados de acuerdo a las veces que se presentan, permitiendo que el análisis se facilite. b) Permite establecer la importancia de algunos datos en relación a otros. 4. PROBLEMA RESUELTO

Se seleccionan 50 cables terminales para analizar la variabilidad de su longitud (en cm), los resultados son los que figuran a continuación. Se solicita con el MINITAB: a) Elaborar el Histograma. b) Fijar si los datos siguen una distribución normal a un 1% de significación. c) De probarse H0 en b), describir sus estadísticas según el análisis paramétrico (basado en la Distribución Normal) y efectuar lo mismo en el Excel, activando el complemento “Herramientas para análisis”. d) Establecer cómo se comportan en relación a las especificaciones si como intervalos de tolerancia se tiene que el Limite Inferior de Especificaciones (LIE) = 49.80 y Límite Superior de Especificaciones (LSE) = 50.20 al 99%.
CABLE 1 2 3 4 5 6 7 8 9 10 11 12 13 LONGITUD 49.63 50.26 49.98 50.15 49.50 50.48 49.90 50.00 49.96 49.69 50.32 50.36 49.54 CABLE 14 15 16 17 18 19 20 21 22 23 24 25 26 DATOS (Longitud en cm) LONGITUD CABLE LONGITUD 49.91 27 49.75 49.92 28 49.66 49.77 29 49.79 49.88 30 49.94 49.85 31 49.91 50.12 32 49.80 50.00 33 49.94 49.68 34 49.99 49.72 35 50.28 50.12 36 49.82 49.97 37 50.10 49.98 38 49.95 50.10 39 50.36 CABLE 40 41 42 43 44 45 46 47 48 49 50 LONGITUD 49.78 50.10 49.70 50.25 49.74 49.79 49.98 50.25 49.96 49.97 49.94

R. Toledo  -4-

UNASAM – FAT 

Administración de Operaciones

a) Histograma: i) ii) Abrir el MINITAB. Escribir o copiar del Excel, como variables en el MINITAB los datos de Cable y Longitud.

iii) Ir a Gráfica / Histograma, seleccione Con ajuste, Aceptar, en la ventana que aparezca, seleccionar: LONGITUD y “Aceptar”. El resultado será:
Histograma de LONGITUD
Normal 12 10 8 Frecuencia 6 4 2 0
Media Desv.Est. N 49.95 0.2206 50

49.6

49.8

50.0 LONGITUD

50.2

50.4

iv) Edite los colores con un clic derecho del mouse sobre la región de figuras (aparecerá: Editar la región de figuras) y luego sobre la región de datos (aparecerá: Editar la región de datos), luego sobre esta misma región ingresar a Agregar / Líneas de referencia y para X agregar 49.8 (dejar un espacio) y 50.2 y “Aceptar”. El resultado será similar a la Gráfica antes mostrada pero ésta vez con dos líneas verticales que fija los límites de tolerancia especificadas por el problema. Se podría interpretar así a partir del Anexo 2 – Figura 5, que existe una dispersión con una amplitud mayor que la permitida por las especificaciones. Pero ésta sería una conclusión apresurada, primero se debe comprobar si los datos se distribuyen normalmente (ver resultado b) para el problema) y luego considerando que se está analizando UNA MUESTRA, el análisis correcto es por Intervalos de Tolerancia (ver resultado d) para el problema planteado). b) Prueba de normalidad: i) Para probar si los datos siguen una Distribución Normal, se tienen las siguientes alternativas: (1) (2) ii) Ir a Estadísticas / Estadística básica / Prueba de normalidad. Ir a Estadísticas / Estadística básica / Resumen gráfico.

La alternativa (1), le permite elegir entre las pruebas de Anderson-Darling, RyanJoiner o Kolmogorov-Smirnov.

iii) La alternativa (2) es más directa y su resultado es el que se muestra a continuación, donde se puede establecer que Supera la prueba de normalidad a un 99% de R. Toledo  -5-

UNASAM – FAT 

Administración de Operaciones

confianza, al ser el p-valor > 0.01 (0.258 > 0.01), aceptando que los datos siguen una distribución normal, siendo el límite inferior 49.500 y el Superior de 50.480. Se llega a la misma conclusión si se compara el valor del estadístico A-cuadrado con su valor crítico al 99% de confianza (0.46 < 1.029), lo que permite deducir que los datos responden a una distribución normal.

Resumen para LONGITUD
P rueba de normalidad de A nderson-Darling A -cuadrado V alor P M edia Desv .E st. V arianza A simetría Kurtosis N M ínimo 1er cuartil M ediana 3er cuartil M áximo 49.888 49.893
Intervalos de confianza de 95%
Media

0.46 0.258 49.951 0.221 0.049 0.304976 -0.206066 50 49.500 49.788 49.945 50.100 50.480 50.014 49.980 0.275

49.6

49.8

50.0

50.2

50.4

Interv alo de confianza de 95% para la media Interv alo de confianza de 95% para la mediana Interv alo de confianza de 95% para la desv iación estándar 0.184

Mediana 49.900 49.925 49.950 49.975 50.000

c) Estadísticas según el análisis paramétrico: i) Comprobada la normalidad de los datos, es posible efectuar el análisis paramétrico, para lo cual, si bien parte de sus estadísticas se muestran en el Histograma (media, desviación estándar y número de datos), lo más adecuado es obtener una relación más completa en el MINITAB: Ir a Estadísticas / Estadística básica / Mostrar estadísticas descriptivas.

ii)

iii) Seleccionar la variable LONGITUD, ingresar al botón: Estadísticas, allí seleccionar las que anteriormente se han descrito: Media, Desviación Estándar, Mínimo, Máximo, N valores presentes, Mediana, Moda, Asimetría, Curtosis y “Aceptar”. El resultado del MINITAB será: (Nota: se editó resultados en el Excel):
Variable LONGITUD N 50 Media 49.951 Desv.Est. 0.221 Mínimo 49.5 Mediana 49.945 Máximo 50.48 Rango 0.98 Moda 49.98 Asimetría 0.3 Curtosis -0.21

Por facilidad para su exportación, las estadísticas también se generan en el Excel, el resultado es el de la Tabla que se presenta a continuación y que fija que la media (49.95 cm), mediana (49.95 cm) y la moda (49.98 cm), casi coinciden en valor, una señal también de la normalidad de los datos. R. Toledo  -6-

UNASAM – FAT 

Administración de Operaciones

La curtosis indica que es ligeramente achatada y el coeficiente de asimetría fija que es un poco sesgada a la derecha (indica posibilidad de no tener normalidad). Un 68% de los datos aproximadamente están entre 49.73 cm y 50.17 cm (Media ± Desviación estándar). LONGITUD Media Error típico Mediana Moda Desviación estándar Varianza de la muestra Curtosis Coeficiente de asimetría Rango Mínimo Máximo Suma Cuenta Nivel de confianza (95.0%) d) Intervalos de tolerancia: i) Para resolver lo planteado es preferible utilizar un Histograma que fije los límites de tolerancia, que los fabricantes frecuentemente utilizan para detectar una variación excesiva, al comparar los requisitos del cliente con los límites de tolerancia que cubren una proporción aceptable de la población. Para ello, teniendo el archivo de datos, aperturado en el MINITAB: Ir a Estadísticas / Herramientas de calidad / Intervalos de tolerancia, en el botón: Opciones ..., considerar el 99% de confianza, cambiar también % población: 99.0. 49.9508 0.031202878 49.945 49.98 0.220637666 0.04868098 -0.206066286 0.304975967 0.98 49.5 50.48 2497.54 50 0.06270453

ii)

iii) Comentario: Lo que interesa es saber en qué rangos está operando, a un 99% de confianza, para luego compararlo con las especificaciones. Por defecto el análisis es Bilateral, dejarlo así. Si interesara conocer por ejemplo: A un 95% de confianza cuántas horas durarán focos fabricados, se debe seleccionar: Límite inferior. iv) En la ventana que aparecerá, seleccionar LONGITUD, y aceptar. v) Resultado: Tres gráficas. Se agregó líneas de referencia para X 49.8 y 50.2. IMPORTANTE: Con la tecla F3 se restablece las opciones originales en una ventana de ingreso de datos. vi) Respecto al comportamiento del proceso en relación a las especificaciones se puede decir lo siguiente: La media de la longitud de los cables es 49.95, a un 99% de confianza la longitud de los cables están entre 49.203 y 50.699 cm. Si el Límite Inferior de Especificación es (LIE) es 49.8 y el Límite Superior de Especificación (LSE) es 50.2, se puede establecer que la dispersión es mayor en ambos extremos del histograma, que la permitida por las especificaciones. Es necesario reducir la dispersión. vii) La prueba del "Lápiz Grueso" se aplica en la última gráfica, si uno se imagina un lápiz grueso y éste cubre a todos los puntos que están juntos a la línea diagonal, se acepta que los datos se acondicionan a una curva normal. R. Toledo  -7-

UNASAM – FAT 

Administración de Operaciones

Gráfica de intervalos de tolerancia para LONGITUD
Intervalo de tolerancia de 99% Al menos 99% de la población cubierto
49.8 50.2

Estadísticas N Media Desv.Est. Normal 50 49.951 0.221 49.203 50.699 49.500 50.480 0.455 0.258

49.2 N ormal N o paramétrico 49.0

49.5

49.8

50.1

50.4

50.7

Inferior Superior Inferior Superior

No paramétrico

49.5

50.0

50.5

Prueba de normalidad AD Valor P

Gráfica de probabilidad normal
99 P or centaje 90 50 10 1 49.50 49.75 50.00 50.25 50.50

5.

PROBLEMA PROPUESTO

Después de recolectar los datos de la presión de inflado (Psi) de llantas de una flota de camiones mineros se pudo obtener los siguientes resultados 95 95 94 93 102 103 98 94 100 99 94 95 102 98 93 92 95 96 97 98 95 95 97 98 99 93 95 94 98 97 96 94 93 94 95 96 96 98 99 101 100 100 95 95 95 99 100 98

Se solicita a un 99% y luego al 95% de confianza: a) Efectuar el análisis de normalidad. b) Efectuar el análisis de intervalos de tolerancia, considerando que de acuerdo a las especificaciones técnicas la Presión (Psi) debiera estar entre 91 y 104. RESPUESTA: A un 99% de confianza los datos se distribuyen normalmente. A un 95% de confianza los datos NO se distribuyen normalmente. b) A un 99% de confianza se está dentro de los intervalos de tolerancia. A un 95% no, la dispersión es mayor a la permitida por las especificaciones (para ésta evaluación, no se considera el análisis paramétrico, sino el no paramétrico que señala que los límites para la Presión son de 92 y 103). BIBLIOGRAFÍA GUTIÉRREZ Mario MINITAB Inc. (2004) Administrar para la calidad. México, Editorial Limusa S.A. 297 pág. (2007) Minitab 15. Estados Unidos, Companion by Minitab, 146 pág.

R. Toledo  -8-

UNASAM – FAT 

Administración de Operaciones

ANEXO 1

MEDIDAS DE UBICACIÓN Y DISPERSIÓN
Co eficiente de asimetría = Negativo
Moda Mediana Media

Co eficiente de asimetría = 0

Co eficiente de asimetría = P o sitivo
Moda Mediana Media

Moda Mediana Media

Negativamente asimétrica
Co eficiente de curto sis = Negativo

Simétrica
Co eficiente de curto sis = 0

Positivamente asimétrica
Co eficiente de curto sis = P o sitivo

Platicúrtica

Mesocúrtica

Leptocúrtica

R. Toledo  -9-

UNASAM – FAT 

Administración de Operaciones

ANEXO 2
FORMAS QUE PUEDE TOMAR EL HISTOGRAMA DE UN PROCESO EN RELACIÓN CON LAS ESPECIFICACIONES (*) 1 2 3

LIE

LSE

LIE

LSE

LIE

LSE

Comportamiento dentro de las especificaciones.

Comportamiento dentro de las especificaciones, pero muy cercano a las tolerancias. Es necesario reducir la dispersión.

Proceso descentrado. Es necesario centrarlo con respecto a las especificaciones.

4

5

6

LIE

LSE

LIE

LSE

LIE

LSE

Proceso descentrado. Es necesario centrarlo con respecto a las especificaciones.

Dispersión con una amplitud mayor que la permitida por las especificaciones. Es necesario reducir la dispersión.

Proceso descentrado y con una dispersión cuya amplitud es mayor que la permitida por las especificaciones, es necesario centrar el proceso y reducir la dispersión.

(*) También un comportamiento no deseado sería el que el proceso no obedezca a una distribución previsible, por ejemplo se espera que se acondicione a una distribución normal y no ocurre esto.

R. Toledo  - 10 -

FAT – UNASAM RTQ / 2011

   

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->