Está en la página 1de 38

5

ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

5-1 Introducción y Objetivos del capítulo 5-2 de


distribución de parcelas empíricos 5-3 aleatoriedad de una
secuencia de 5-4 Validación de supuestos de distribución 5-5
transformaciones para lograr la normalidad 5-6 Análisis de los
datos de recuento

5-7 Análisis de cliente los datos de satisfacción 5-8


conceptos en el muestreo
Resumen

símbolos

X promedio de la muestra

s desviación estándar de la muestra

norte Tamaño de la muestra

X yo yo ésima observación en una muestra

s metro desviación estándar de la mediana de la muestra

F (x) Función de distribución acumulativa


METRO Mediana
Q1 En primer cuartil

Q3 En tercer cuartil
RIC Rango intercuartil

5-1 INTRODUCCIÓN Y OBJETIVOS DEL CAPÍTULO

En este capítulo continuamos expandiendo en los diversos procedimientos de estadística descriptiva e inferencial que se
describen en el capítulo 4. Nuestro objetivo es analizar los datos empíricos gráficamente desde theyprovide herramienta
aviable informationandare integral para analysisof de datos de productos y procesos. La información que proporcionan las
características del producto o de proceso existentes nos ayuda a determinar si estas características están cerca de la norma
deseada. Un segundo objetivo es poner a prueba para la hipótesis de distribución. Recordemos que en el capítulo 4, para la
prueba de hipótesis de varios parámetros tales como la populationmean o la varianza, se hizo la suposición de normalidad.
Se presenta un método para probar la validez de esta suposición.

Fundamentos de Control de Calidad y mejora, Cuarta edición. Amitava Mitra


• 2016 John Wiley & Sons, Inc. Publicado 2016 por John Wiley & Sons, Inc. página web
Companion: www.wiley.com \ ir \ mitra \ QualityControl4e

229
230 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

Además, se discuten algunas transformaciones para lograr la normalidad de las variables que son no normal. Un tercer objetivo
implica el análisis de datos cualitativos. Tal información es típicamente datos de tipo de frecuencia obtenidos a partir de
encuestas de productos. Un cuarto adjetivas es visualizar la información de las encuestas y llevar a cabo los análisis apropiados.
Finalmente, incluimos una discusión de las diversas técnicas de muestreo. El problema de la determinación del tamaño de la
muestra es de suma importancia en la calidad. Basándose en el grado de riesgos aceptables, expresiones se presentan para el
tamaño de la muestra requerida.

5-2 PARCELAS distribución empírica

histogramas

gráficas de distribución son aplicables a los datos cuantitativos. En tales casos, la calidad Char valores carac- se
obtienen en una escala medible. Rara vez una idea de las características del proceso con sólo mirar a los valores de
datos individuales recogidos en el proceso. Tales datos son a menudo voluminoso. Las distribuciones de frecuencia e
histogramas resumen tales infor mación y la presentan en un formato que nos permite sacar conclusiones sobre el
estado del proceso.

UNA distribución de frecuencias es un reordenamiento de RAWDATA en orden ascendente o descendente de


magnitud tal que la característica de calidad se subdivide en clases y se presenta el número de ocurrencias de cada clase.

Tabla 5-1 muestra el diámetro interior (en milímetros) de manguitos metálicos producidos en un taller de máquinas para 100
partes seleccionadas al azar. Veinte muestras, cada una de tamaño 5, se tomaron. Basta con mirar los datos de la Tabla 5-1
proporciona poca información sobre el proceso. A pesar de que sabemos que existe una gran variabilidad en los diámetros de la
manga, difícilmente podemos identificar una

TABLA 5-1 Diámetro interior (en mm) de la camisa de chapa

Muestra observaciones X ( Cinco por muestra)

1 50.05 50.03 50.02 50.00 49.94


2 49.96 49.99 50.03 50,01 49.98
3 50,01 50,01 50,01 50.00 49.92
4 49.95 49.97 50.02 50.10 50.02
5 50.00 50,01 50.00 50.00 50.09
6 50.02 50.05 49.97 50.02 50.09
7 50,01 49.99 49.96 49.99 50.00
8 50.02 50.00 50.04 50.02 50.00
9 50.06 49.93 49.99 49.99 49.95
10 49.96 49.93 50.08 49.92 50.03
11 50,01 49.96 49.98 50.00 50.02
12 50.04 49.94 50.00 50.03 49.92
13 49.97 49.90 49.98 50,01 49.95
14 50.00 50,01 49.95 49.97 49.94
15 49.97 49.98 50.03 50.08 49.96
dieciséis 49.98 50.00 49.97 49.96 49.97
17 50.03 50.04 50.03 50,01 50,01
18 49.98 49.98 49.99 50.05 50.00
19 50.07 50.00 50.02 49.99 49.93
20 49.99 50.06 49.95 49.99 50.02
PARCELAS distribución empírica 231

FIGURA 5-1 Frecuencia histograma de diámetros de manga usando Minitab.

patrón en thedata (lo que es thedegree de la variabilidad?) o comentario acerca de la central de tendencyof el proceso (de la que
el valor son la mayoría de las observaciones se concentran?).
UNA histograma es una representación gráfica de datos tales que la característica se subdivide en clases, o células. en
un histograma de frecuencias, el eje vertical representa normalmente el número de observaciones en cada clase. Una
representación alternativa de la eje vertical podría ser el porcentaje.

ejemplo 5-1 Para los datos de la Tabla 5-1, vamos useMinitab para construir un histograma. Escoger
Gráfico> Histograma> simple. Hacer clic DE ACUERDO. Debajo variables de gráficas, de entrada el número de columna o el nombre de la variable,

en este caso Diámetro. Hacer clic DE ACUERDO.

Minitab produce el histograma de frecuencias se muestra en la Figura 5-1. El histograma nos proporciona un sentido de la
distribución de los 100 valores, donde se han creado clases de igual anchura. Los puntos medios de las clases son 49.00, 49.92,
y así sucesivamente. La mayoría de los valores se agrupan entre 49.96 y 50.04. La forma de la distribución se asemeja a una
distribución en forma de campana. Nosotros, sin embargo, demuestran una prueba de normalidad más adelante en el capítulo.

Parcelas y hojas del tallo

diagramas de tallo y hojas son otro enfoque gráfico para el trazado de las observaciones y la interpretación de las características del

proceso. Con histogramas de frecuencia, las identidades de los OBSERVA ciones individuales se pierden en el proceso de trazado. En el

diagrama de tallo y hojas, sin embargo, se conservan los valores numéricos individuales. Dejar ' s construir un diagrama de tallo y hojas a

partir de datos de las mangas themetal de la Tabla 5-1.

Ejemplo 5-2 El uso de Minitab, haga clic en Gráfico> tallo y hoja. Debajo variables de gráficas,
entrar en el ColumnNumber o el nombre de la variable, en este caso Diámetro. Hacer clic DE ACUERDO. La salida de Minitab se muestra

en la Figura 5-2.

Cada valor de datos se divide en dos partes, el tallo y la hoja. Por ejemplo, el valor de datos
49.90 es displayedwith la stempart como 499 y la parte de la hoja como 0. Obsérvese que el punto decimal es implícita a la izquierda
del dígito más a la derecha en el vástago. El dígito en la porción de hoja representa centésimas. La columna más a la izquierda en la
Figura 5-2 representa la frecuencia acumulada, de la
232 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

FIGURA 5-2 diagrama de tallo y hojas para el diámetro interior de manguitos metálicos.

extremo correspondiente, dependiendo de la ubicación del vástago con respecto a la mediana. Así, el valor “ 7 ” en el
segundo rowof el vástago “ 499 ” nos dice que hay sevenvalues 49,93, mientras que el valor “ 5 ” en la penúltima fila de la
madre “ 500 ” indica que hay fi cinco valores 50.08. Los inparentheses valor, “( 25) ”, indica la clase themedian, andonly para
esta clase el número
“ 25 ” indica que hay 25 valores de esta clase mediana (es decir, entre 50,00 y 50,01).

Los diagramas de caja

diagramas de cajas representan gráficamente los datos y también muestran las medidas de resumen (Chambers 1977;. Chambers et al,

1983). UNA diagrama de cajas muestra la tendencia central y dispersión de un conjunto de datos e indica la asimetría ( desviación de

simetría) y curtosis ( medida de la longitud de la cola). La trama también muestra valores atípicos.

Hay varias características de un diagrama de caja. La caja es boundedbyQ 1 andQ 3, la fi primer y tercer cuartil,
respectivamente, con una línea trazada a themedian.Hence, la longitudde la caja representa el rango intercuartílico (IQR).
Dependiendo de la ubicación de themedian respecto a los bordes de la caja, inferencias se dibujan en la simetría de la
distribución. Para una distribución simétrica, la mediana se encuentra a medio camino entre los bordes de la caja: es decir, a un
valor (Q 1 + Q 3) / 2. Si es themedian TOQ más cerca 3, la distribución de los datos es sesgada negativamente. Por el contrario, si el
medio está más cerca de Q 1, la distribución es sesgada positivamente. Dos líneas, conocido como bigotes, son atraídos hacia el
exterior de la caja. Una línea se extiende desde el borde superior de la caja en Q 3 a themaximumdata valor que es menor o igual
Toq 3 + 1.5 (IQR). Del mismo modo, una línea desde el borde inferior de la caja en Q 1 se extiende hacia abajo al valor mínimo que
es mayor que o igual Toq 1 1.5 (IQR). Los puntos finales de los bigotes son conocidos como el superior y valores adyacentes
inferiores. La longitud de las patillas indica la longitudes de cola. Los valores que caen fuera de los valores adyacentes son
candidatos para la consideración como valores atípicos. Ellos se representan como asteriscos ( *).

Ejemplo 5-3 Una empresa privada con el nombre de QuickDock opera una instalación de descarga de superpetroleros en el
puerto de Singapur. Se recogió una muestra aleatoria de tamaño 30 que muestra los tiempos de descarga (en horas). Para
mejorar la EF fi ciencia de descarga, se llevó a cabo un estudio de proceso. El uso de los cambios recomendados, el proceso se
modificó fi Se recogieron ed y una muestra aleatoria posterior de tamaño 30. Ambos conjuntos de observaciones se muestran en
la Tabla 5-2.
PARCELAS distribución empírica 233

TABLA 5-2 Los tiempos de descarga (horas) de superpetroleros

antes de Cambios después de Cambios

Ejemplo de un Número Tiempo Número Muestra de Tiempo Número Tiempo Número de Muestra

1 9.4 dieciséis 1.2 1 2.7 dieciséis 4.6


2 1.5 17 2.6 2 14.4 17 0.9
3 14.6 18 7.5 3 3.2 18 2.5
4 10.8 19 19.2 4 17.0 19 1.2
5 18.2 20 1.8 5 1.0 20 14.9
6 19.8 21 34.2 6 12.7 21 1.4
7 23.5 22 18.1 7 4.6 22 7.3
8 5.2 23 7.5 8 6.8 23 4.6
9 9.3 24 3.4 9 22.7 24 6.6
10 9.1 25 12.4 10 2.3 25 4.9
11 13.3 26 30.8 11 8.3 26 2.0
12 26.1 27 5.3 12 2.6 27 4.9
13 2.3 28 39.5 13 7.7 28 9.6
14 30.7 29 4.2 14 21.4 29 1.1
15 22.5 30 2.5 15 1.7 30 1.2

( una) Construye un diagrama de caja para la descarga de veces antes de procesar los cambios y comentan el

proceso.

Solución El uso de Minitab, fi en primer lugar crear una hoja de trabajo con dos variables, los tiempos de descarga antes y después de los

cambios del proceso. Haga clic en Gráfico> Diagrama de caja. Seleccionar Y uno - Sencillo. En

variables, introducir el número de columna o nombre de la variable, Antes de la descarga, en este caso. Hacer clic

DE ACUERDO. Figura 5-3 muestra el diagrama de caja.

Varios se puede derivar conclusiones del diagrama de caja. La caja en sí, que se extiende desde 4,0 a
20.475, contiene 50% de las observaciones. Themedian, indicado por el linewithin la caja, que está en 10.1 y está
más cerca del borde inferior (Q 1) De la caja. Así, la distribución es positiva

FIGURA 5-3 Diagrama de cajas de veces antes de descargar los cambios del proceso.
234 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

FIGURA 5-4 Diagrama de cajas de veces la descarga antes y después de los cambios del proceso.

sesgada. La longitud de la barba superior es mucho más largo que el de la parte inferior de la barba, lo que indica una cola mucho
más larga derecha. No hay valores atípicos.

( segundo) Construir lado-a-lado diagramas de caja para los tiempos de descarga de antes y después del proceso de

cambios. Opina sobre mejoras en los procesos.

Solución Haga clic en Gráfico> Diagrama de caja. Seleccionar MultipleY ' s - Sencillo. En variables, introducir los números de columna o nombres

de variables de ambos, Antes de la descarga, y Después de la descarga-, en este caso. Hacer clic DE ACUERDO. La figura 5-4 muestra este

diagrama de caja.

El diagrama de caja de los tiempos de descarga, después de cambios en el proceso, es bastante diferente de la de los tiempos de descarga

antes de que los cambios en el proceso. Observe que el cuadro se extiende desde 1.925 a

8,625, una caja mucho más compacto que antes, que contiene 50% de las observaciones. La nueva mediana es de 4,6, un poco por
debajo de la media anterior. La nueva distribución del tiempo de descarga también está sesgada positivamente, sin embargo, la
mediana y la variabilidad son mucho más bajos. Una cola más larga derecha está indicado, como antes, pero con una longitud de la
cola más corta. Hay dos valores extremos o valores extremos en la cola derecha marcados con un asterisco. Estos podrían
representar a los tiempos de descarga inusualmente largos, para los que, tal vez, las causas especiales podrían ser identificados fi ed
para mejorar aún más el proceso.

Las variaciones del Diagrama de caja básico

Una variación de la forma básica del diagrama de caja es la diagrama de caja dentada. Una muesca, la anchura de whichcorresponds
a la longitudde el aire fi intervalo de confianza para themedian, es constructedon la caja alrededor de la mediana. Suponiendo que los
valores de los datos se distribuyen normalmente, la desviación estándar de la media está dada por Kendall et al. (1998) como

01:25 ?? RIC ??
s metro ?? pag ?? 5-1 ??
01:35 norte

La muesca alrededor de la mediana METRO debe comenzar a valores de

M Cs metro ?? 5-2 ??
RANDOMNESS de una secuencia 235

dónde do es una constante que representa el nivel de Con fi dencia. Para un nivel de con fi confianza del 95%,

C = 1,96 se puede utilizar. Para más detalles, consultar McGill et al. (1978). diagramas de caja con muescas se utilizan para
determinar si hay signi fi diferencias signifi entre themedians de thequalitycharacteristic de twoplots. Si hay nooverlapbetween
las muescas de dos diagramas de caja, se puede concluir que existe una signi fi diferencia signifi entre las dos medianas.
Esto puede indicar que las medidas adoptadas han cambiado las condiciones de parámetros de proceso significante fi cativamente.

5-3 RANDOMNESS de una secuencia

En este sectionwe presentar una técnica para determinar si la secuencia de observaciones recogidas en una muestra, por lo
general como una función del tiempo, es al azar en la naturaleza. Si la secuencia no es aleatoria, puede indicar la existencia de
causas especiales. Un análisis de causa y efecto puede entonces indicar posibles cambios en el proceso para llevar a cabo. Por
otro lado, si la secuencia se considera que es aleatoria, puede implicar la presencia de causas comunes, que conducen a la
variabilidad en la característica observada. En este caso, los cambios sistémicos son necesarios para crear la mejora de
procesos.

Tabla de ejecutar

UNA tabla de ejecutar es un gráfico de la característica de calidad como una función de la orden (o por lo general el tiempo) en el que se

recogen las observaciones. Ellos proporcionan una idea de la agrupación de los datos o si los datos son fromamixture de, por ejemplo,

twopopulations. Estas deducciones son BasedOn el número de carreras alrededor de la mediana.

Arun (alrededor themedian) es de fi define como uno omás consecutivos puntos de datos en el mismo lado (de themedian) .Cuando
contando carreras, puntos que caen exactlyon la línea de referencia (mediana) se ignoran. Si el patrón es aleatorio, el número real de
carreras debe estar cerca del número de carreras esperados, basándose en el supuesto de aleatoriedad del patrón. Por lo tanto,
cuando el número de carreras observadas es mucho mayor que el número de carreras que se espera, que implica la posibilidad de que
los datos sean de un patrón de mezcla (por ejemplo, dos poblaciones), causando frecuentes Florida fluctuaciones sobre themedian. Del
mismo modo, cuando el número de carreras observadas es mucho menor que el número de carreras de esperar, esto puede indicar la
posibilidad de agrupación de los datos (un comportamiento no aleatorio). Probamos estas situaciones a través del procedimiento de
prueba de hipótesis y el uso de la

p-valor enfoque, descrito en el Capítulo 4.


Otro par de situaciones implica ensayar la presencia de una tendencia o de oscilación, los dos ejemplos de no aleatoriedad. Estas

pruebas se realizan utilizando el número de carreras arriba o hacia abajo. Una curva es un inusualmente larga serie de aumentos

consecutivos o disminuciones en los datos. Al contar la longitud de ejecución, ignoramos puntos que repiten el valor precedente. Un

patrón de oscilación se indica si el número de carreras arriba o hacia abajo observadas es mucho mayor que el número de carreras

esperados. Del mismo modo, una tendencia en la que los datos se inferredwhen el número de carreras arriba o hacia abajo observadas

es mucho menor que el número de carreras esperados. Una longitud de largo plazo sobre la mediana también puede indicar un cambio

en los datos.

Ejemplo 5-4 El valor hemoglobinA1C es una medida del nivel de glucosa en la sangre durante un período de aproximadamente tres meses.

Tabla 5-3 muestra los valores de hemoglobina A1C para un paciente diabético tomado cada tres meses. Construir un diagrama de

comportamiento y hacer comentarios sobre si el proceso muestra causas comunes o especiales de variación. ¿Ha habido un significante fi tendencia

no puede? Prueba al nivel del 5% de significación fi cance.


236 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

Los valores de A1C de hemoglobina TABLA 5-3 para un paciente diabético

Observación A1C Observación A1C Observación A1C

1 8.3 11 7.9 21 6.7


2 6.5 12 8.4 22 6.6
3 7.2 13 8.2 23 7.6
4 7.0 14 8.6 24 7.4
5 8.1 15 8.8 25 7.8
6 6.8 dieciséis 7.8 26 8.0
7 7.1 17 7.4 27 7.7
8 6.6 18 7.2 28 7.6
9 7.3 19 7.1 29 7.8
10 7.5 20 6.8 30 7.5

Solución El uso de Minitab, fi en primer lugar crear una hoja de cálculo con la variable Los valores de A1C con sisting de 30 observaciones.

Haga clic en Estadísticas> Herramientas de calidad> diagrama de comportamiento. Dado que se introducen los valores de A1C como una sola

columna en la hoja de cálculo, seleccione Una sola columna, e introduzca el número de columna o nombre. Debajo tamaño de subgrupo, introduzca

el valor 1. Haga clic DE ACUERDO.

Figura 5-5 muestra el diagrama de comportamiento de los valores de hemoglobina A1C. Tenga en cuenta que el número de carreras sobre

themedian es de 10, mientras que el número de carreras de esperar, si los datos son la distribución del froma de una secuencia aleatoria, es 15.933.

También, el número de carreras arriba o hacia abajo observadas es 17, mientras que el número de carreras esperado bajo la hipótesis nula de una

secuencia aleatoria, es 19.667. Vamos ahora a probar la presencia de la agrupación o mezclas. Tenga en cuenta que la pag- valor para el

agrupamiento es

0.01338 < α = 0.05. Por lo tanto, se rechaza la hipótesis nula de una secuencia aleatoria y concluir que hay signi fi la
agrupación no puede. El número de carreras alrededor de la mediana observada es sig ni fi cativamente menor que la
esperada bajo el supuesto de un sequence.We al azar fi nd que la
pag- valor para probar la presencia de una mezcla es 0,98662 (el complemento de 0,01338), indicando, obviamente, que no
podemos concluir la presencia de un patrón de mezcla. Por lo tanto, existe debido a la conglomeración de las observaciones una
causa especial de variación. Como continuación de upmeasure, se podría investigar si había ciertos rasgos o hábitos de pacientes
que dieron lugar a la agrupación.

FIGURA 5-5 Correr tabla de los valores de hemoglobina A1C.


VALIDANDO hipótesis de distribución 237

En las pruebas de la presencia de signi fi tendencia no puede u oscilación, consideramos theMinitab resultado de la figura 5-5. los pag- valor

para las tendencias de prueba es 0,11678> α = 0,05, y de manera similar, la pag- valor de las oscilaciones de prueba es 0,88322 (el

complemento de 0,116678). Por lo tanto, no signi fi tendencia no puede o oscilaciones pueden concluirse. A partir del gráfico, observar que la

pista más larga abajo tiene una longitud de

7, lo que podría parecer indicar que se había producido un significante fi peralte tendencia a la baja. Sin embargo, en realidad probar una

hipótesis sobre la presencia de una tendencia, no se encontró a ser signi fi hipocresía.

5-4 VALIDACIÓN hipótesis de distribución

Inmany técnicas estadísticas, la población fromwhich se dibuja se supone los datos de muestra para tener una cierta
especificidad fi distribución ed de modo que las inferencias adecuadas se pueden hacer sobre la característica de calidad. Los
procedimientos estadísticos conocidos como la bondad-de- fi pruebas t se utilizan para el ensayo de la información de la función
empírica de distribución acumulativa (cdf) obtenido de la muestra frente a la función de distribución acumulada teórica basada
en la distribución de la hipótesis. Por otra parte, los parámetros de la distribución de la hipótesis pueden especificarse fi ed o
estimarse a partir de los datos. La estadística de prueba podría ser una función de la diferencia entre la frecuencia observada y
la esperada, tal como se determina sobre la base de la distribución que se planteó la hipótesis. Bondad-de- fi pruebas t pueden
incluir pruebas de ji cuadrado (Duncan 1986), Kolmogor ov - Smirnov (Massey 1951), o el Anderson - prueba de Darling (Stephens
1974), entre otros. Los métodos gráficos tales como trazado probabilidad se puede utilizar junto con dichas pruebas.

trazado de probabilidad

Inprobabilityplotting, las observaciones de la muestra se clasifican en fromsmallest ascendingorder a mayor. Así, las observaciones X

1, X 2, . . . , X norte están clasificadas como X( 1), X( 2), . . . , X( norte), dónde X( 1)


denota la observación más pequeña y así sucesivamente. los cdf empírica del yo º clasificado observación,

X( yo), es dado por

yo 0: 5
F yo ?? ?? 5-3 ??
norte

los cdf teórico, basado en la distribución hipotética, en X( yo), es dado por G (x ( yo)),
dónde SOL( ) se calcula usando especí fi parámetros ed o estimaciones de la muestra. Un gráfico de probabilidad
muestra la trama de X( yo), en el eje horizontal, frente F yo y G (x ( yo)) en el eje vertical. El eje vertical se escala de tal
manera que si los datos son de la distribución hipotética, la trama de X( yo) versus G (x ( yo)) será una línea recta. Así, las
salidas de F( ) desde
SOL( ) son visualmente fácil de detectar. Cuanto más cerca del valores trazados de F( ) son a la fi línea TTED, SOL( ),

más fuerte es el apoyo a la hipótesis nula. Una prueba estadística se calcula que grandes desviaciones entre F( ) y SOL( ) conducir a
grandes valores de la estadística de prueba o, alternativamente, pequeña pag- valores. Por lo tanto, si el observado pag- valor es
menor que α, el nivel deseado de significación fi cación, la hipótesis nula que representa la distribución de la hipótesis es rechazada.

en un gráfico de probabilidad normal, Supongamos que estamos probando la hipótesis nula de que los datos provienen de una

distribución normal, con media y desviación estándar no especí fi ed. Entonces G (x ( yo))

estarán Φ (( X( yo) � x) / s), dónde Φ ( ) representa la cdf de una distributionand standardnormal � X y


s son estimaciones de la muestra de la media y la desviación estándar, respectivamente.
Minitab permite trazado probabilidad basada en una variedad de distribuciones, como normal, lognormal, exponencial,
gamma, Weibull, logística, o loglogistic. Una estadística de prueba común que se utiliza para tales pruebas es la Anderson -
Estadística querido, que mide el área entre la
238 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

FIGURA 5-6 gráfico de probabilidad normal de resistencia de la bobina.

fi línea TTED (basado en la distribución de la hipótesis) y la cdf empírica. Esta estadística es una squareddistance que
isweightedmoreheavily en las colas de la distribución. Los valores más bajos de esta ventaja estadística para el no
rechazo de la hipótesis nula y con fi rm validez de las observaciones que son propensos a la hipótesis de la distribución.

Ejemplo 5-5 Amuestra de 50 bobinas Tobe utiliza en un circuito eléctrico se selecciona al azar y sus resistencias mide en ohmios ( Ω). Los

valores de datos se muestran en la Tabla 4-2. Un gráfico de probabilidad normal se construye usingMinitab. En primer lugar, se crea una hoja

de cálculo que consiste en los valores de los datos sobre la resistencia de la bobina. Escoger Gráfico> Probabilidad Terreno. Seleccionar Soltero

y haga clic DE ACUERDO.

En variable de tipo gráfico, introducir el nombre de la variable, por ejemplo Resistencia, y haga clic DE ACUERDO. Haga clic en

Distribución y en el menú desplegable, seleccione Normal. Hacer clic DE ACUERDO. El probabilityplot normales resultante
se muestra inFigure5-6, donde una línea recta es fi TTED través thepoints trazado. Observe que amajorityof los puntos están
en las proximidades de la línea recta. Afewpoints en los extremos se desvían de la línea.

Minitab también muestra 95% con fi intervalos de confianza para el fi tted distribución (como la hipótesis de la hipótesis nula) de
forma puntual. Por lo general, los puntos pueden caer fuera de la estafa fi intervalos de confianza cerca de las colas. En la mitad
inferior de la trama, los puntos a la derecha de la estafa fi banda de confianza indican que hay menos datos en la cola de la
izquierda con relación a lo que se espera basado en la distribución hipotética. Por el contrario, en la mitad superior, apunta a la
derecha de la estafa fi banda de confianza indican que hay más datos en la cola derecha en relación con lo que se espera. Aquí, los
puntos trazados parecen bastante cerca de la fi línea TTED, apoyando la hipótesis nula de que los datos son de una distribución
normal. Además, la Anderson - estadística de prueba Darling, se demuestra que es 0,310, con una pag- valor de 0,543. Con esta
gran pag- valor, para cualquier nivel razonable de significación fi cado ( α), no se rechaza la hipótesis nula de normalidad.

Con la validación de la hipótesis de normalidad, podemos hacer varias inferencias a partir de la Figura 5-6. En primer
lugar, se puede estimar la populationmeanby leer el valordel la 50thpercentile de la fi línea recta TTED; parece ser
aproximadamente 30,0 Ω. En segundo lugar, se puede estimar la desviación estándar de la población como la diferencia entre
los valores de los datos and50thpercentile 84ª. Esto es porque el percentil 84a de una distribución normal es de
aproximadamente una norma
VALIDANDO hipótesis de distribución 239

desviación de distancia de la media (50 ° percentil). De la Figura 5-6, la desviación estándar de la población se estima que es
(34,5 30.0) Ω = 4.5 Ω. En tercer lugar, se puede estimar la proporción de una salida de proceso que no cumple con cierta
especificidad fi límites de cationes. Por ejemplo, si la especificación inferior fi límite de catión de la resistencia de los cables es 25 Ω, desde
el fi figura calculamos que aproximadamente 10% de la salida es menor que el límite especificado fi ed.

Ejemplo 5-6 Tenga en cuenta los datos de la Tabla 5-2 en los tiempos de descarga de superpetroleros después de los
cambios se han hecho en la mejora del proceso. Se puede concluir que la distribución de los tiempos de descarga es normal?
Utilizar α = 0.05. Si la distribución no es considerada normal, se puede concluir si es exponencial? Estimar el parámetro de la
distribución exponencial.

Solución El uso de Minitab, seleccione Estadísticas> Herramientas de calidad> Distribución individual TI Iden fi catión. Seleccionar Una

sola columna, y de entrada el número de columna o el nombre de la variable,

Después de la descarga,. Minitab proporciona la opción de comprobar contra ciones distribui hipotéticos tales como normal, exponencial,

logarítmica normal, gamma, Weibull, logística, o valores extremos (el más pequeño o más grande). Aquí, en lugar de validar con todas las

distribuciones, seleccionamos dos distribui ciones: Normal y Exponencial. Hacer clic DE ACUERDO.

Figure5-7 muestra theMinitaboutputwithprobabilityplots de veces la descarga después de cambios en el proceso utilizando


el normal y el exponencial como distribuciones hipótesis. Tenga en cuenta que la probabilidad normal trazan los valores
trazados son sistemáticamente fuera de la fi tted línea recta. El valor de theAnderson - Querida estadística es una 1.822with pag-
valor <0,005. Por lo tanto, se rechaza la hipótesis nula de normalidad de la distribución de los tiempos de descarga. Al
considerar la gráfica de probabilidad exponencial, themajorityof las observaciones arewithin una banda estrecha alrededor de
la fi tted línea, con la excepción de tres observaciones que son inusualmente pequeña. el Anderson - Estadística de Darling es
0,456 con una pag- valor de 0,535. Así, por α = 0,05, no se rechaza la hipótesis nula de la distribución de los tiempos de
descarga siendo exponencial. Además, una parte separada de la salida de Minitab proporciona una estimación del parámetro
de escala para la distribución exponencial para ser 6,56, que es también la estimación de la media.

FIGURA 5-7 gráficos de probabilidad normal y exponencial de tiempos de descarga.


240 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

5-5 transformaciones para lograr la normalidad

Inferencias sobre los parámetros de población general requieren supuestos de distribución de la característica de calidad.
Recall fromChapter 4 que con fi intervalos de confianza y pruebas de hipótesis en parámetros tales como la populationmean
(con desviación estándar desconocido), diferencia en themeans de twopopulations (withunknownstandarddeviations),
populationvariance, o la relación de dos varianzas poblacionales requieren el supuesto de normalidad de la característica
de calidad. Por lo tanto, para el uso correcto de estos métodos de inferencia, si la característica está inherentemente no
distribuye normalmente, investigamos procedimientos para transformar la variable original de tal manera que la satis
variable transformada fi es el supuesto de normalidad.

Algunas transformaciones comunes

Sobre la base de la forma de la distribución y las características asociadas con los datos, directrices sobre algunas
transformaciones comúnmente utilizadas se muestran en la Tabla 5-4, donde Y representa la variable original y Y T la variable
transformada.

Transformaciones de potencia

Estas transformaciones son del tipo

?? Y q ??; q> 0
Y T ?? ?? Y q ??; q < 0 ?? 5-4 ??

En ?? Y ??; q ?? 0

El impacto de tales transformaciones es en el cambio de la forma de distribución. Los valores de la potencia de coef fi ciente,
q> 1, el cambio de peso a la cola superior de la distribución y reducen sesgo negativo. Cuanto mayor sea la potencia, mayor
será el efecto. Figura 5-8 demuestra el efecto de
q en una variable sesgada negativamente. Del mismo modo, los valores de q < 1 tirar de la cola superior y reducir asimetría positiva.
Cuanto menor sea la potencia, mayor será el efecto. Para preservar el orden de los valores de los datos, se añade Aminus señal para la

variable transformada después de elevar a potencias menor que cero. Figura 5-9 muestra el efecto de q en una variable positivamente

sesgada.

Directrices 5-4 TABLA sobre el Common Transformaciones

Características de los datos Tipo de Transformación

Datos derecho asimétricos; varianza no constante en diferentes valores; 1


Y T ??
desviación estándar proporcional al cuadrado de la media Y
1
Datos derecho asimétricos; muy concentrada Y T ?? pag
Y
Datos derecho asimétricos con valores no negativos; Y T ?? En ?? Y ??

desviación estándar proporcional a la media


pag
datos Poisson; datos de recuento discreta; desviación estándar Y T ?? Y
proporcional a la raíz cuadrada de la media
pag
datos binomiales, que consta de proporción de éxitos ( pag)
Y T ?? arcoseno pag

o pag

Y T ?? En 1 pag
Transformaciones para lograr la normalidad 241

FIGURA 5-8 Impacto de q en una variable sesgada negativamente.

Johnson Transformación

Johnson 1949 desarrolló tres familias de distribuciones de una variable, Y, que se transforman fácilmente a una distribución
normal estándar. Estos están etiquetados S SEGUNDO, S L, y S T, donde los subíndices SEGUNDO, L, y T referirse a la variable que se
está delimitada, delimitada lognormal frombelowor, y sin límites, respectivamente. Tabla 5-5 muestra la familia Johnson de
distribuciones alongwith la función de transformación y de las condiciones de los parámetros.

FIGURA 5-9 Impacto de q en una variable positivamente sesgada.


242 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

TABLA 5-5 Transformación para el sistema de Johnson de Distribuciones

Familia Johnson Función de transformación Condiciones de parámetros

S segundo ε λ ?? ε η, λ 0, 1 < γ < 1 1 < ε < 1, ε < Y < ε + λ


z ?? γ ?? η En Y
Y

SL z ?? γ ?? η En ?? Y ε ?? η> 0, 1 < γ < 1, 1 < ε < 1, Y> ε η, λ 0, 1


< γ < 1 1 < ε < 1, 1 < Y < 1
ST ε
z ?? γ ?? η senh 1 Y ;
λ
pag

donde senh 1 ?? Y ?? ?? En ?? Y ?? 1 ?? Y 2 ??

A fi datos de AT no normal establecidos utilizando una distribución de Johnson, se han desarrollado algoritmos que consideran
casi todas las funciones posibles de transformación desde el sistema de Johnson, con los parámetros que se estiman a partir del
conjunto de datos (Chou et al. 1998). Un método utiliza un conjunto de cuatro percentiles de muestra para elegir la familia y estimar
los parámetros desconocidos. Para alguna constante s> 1, dejó cuatro standardnormal simétrica desvía ser denotedby SZ, z, z, y SZ para
cualquier constante z> 0. Que las funciones de distribución acumulativa (CDF) en estos puntos se indican mediante q 1, q 2, q 3, y q 4, donde,
por ejemplo, q 1 = Φ ( sz), dónde Φ ( ) representa la cdf de una variable aleatoria normal estándar. Además, dejar Y yo denotar la q yo ésimo
cuantil de la distribución de Y, i = 1, 2, 3, 4. La relación cuantil es fi ne como

?? Y 4 Y 3 ???? Y 2 Y 1 ??
QR ?? ?? 5-5 ??
?? Y 3 Y 2 ?? 2

En la práctica, se estima QR byQR basa en estimaciones Y ^ yo, i = 1, 2, 3, 4. Slifker y Shapiro


(1980) han demostrado que, para s = 3, QR se puede utilizar para discriminar entre las tres familias de distribuciones Johnson
como sigue:

• Y tiene una S segundo distribución, produce QR <1.

• Y tiene una S L distribución, produce QR = 1.

• Y tiene una S T distribución, produce QR> 1.


Minitab considera todas las transformaciones posibles, siendo estimaron los parámetros, para un valor dado de z. Transforma
los datos y controles para la normalidad utilizando el Anderson - prueba Darling y la correspondiente pag- valor. La rutina
selecciona la función de transformación que produce la mayor pag- valor que es mayor que un valor predeterminado (0.10).
Selección del transformationwith la mayor pag- valor asegura que la transformación seleccionada proporciona el “ la mayoría
conformidad ”
a la normalidad. Si el pag- no se encuentra valor que sea mayor que el valor predeterminado, ninguna transformación es apropiado.

Ejemplo 5-7 Tenga en cuenta los datos sobre el tiempo de descarga de superpetroleros, antes de cambios en el proceso, en la tabla
5-2. Seleccionar una transformación adecuada en caso de que la distribución no pasa la prueba de normalidad utilizando una α = 0.05.
Comprobar la normalidad de la variable transformada. Explorar el uso de la transformación Johnson y comentario.

Solución El uso de Minitab, nos fi primero mostrará un resumen gráfico de los tiempos de descarga antes de cambios en el proceso.

Seleccionar Estadísticas> Estadísticas básicas> Resumen gráfico. En thewindow de variables, entrada de la thevariable

columnnumberornameof, Antes de la descarga,. Hacer clic DE ACUERDO.

Figura 5-10 muestra el resumen gráfico. La distribución de los tiempos de descarga es algo
Transformaciones para lograr la normalidad 243

Figura 5-10 Resumen gráfico de tiempos de la descarga antes de cambios en el proceso.

sesgada hacia la derecha (coef asimetría fi ciente 0,802). Uso de la Anderson - Querida prueba de normalidad, se rechaza la
hipótesis nula de normalidad ( pag- value = 0,023 < α = 0,05). Con la distribución de ser sesgada de derecha y que consiste en
valores no negativos, consideramos transformar el logaritmo natural. Utilizar Calc> Calculadora. indicar una número de
columna para almacenar la variable transformada. Debajo Expresión, escribir Loge (UnloadingBefore). Alternativamente, se
puede utilizar el menú desplegable de las funciones almacenadas que están disponibles. Hacer clic DE ACUERDO. Ahora,
construir un gráfico de probabilidad normal de la variable transformada, usando comandos descritos anteriormente. Figura 5-11
muestra la gráfica de probabilidad normal de

ln (Descarga-Antes). Tenga en cuenta que la pag- valor asociado con la Anderson - prueba de Darling

FIGURA 5-11 gráfico de probabilidad normal del logaritmo natural de veces antes de la descarga de cambios en el proceso.
244 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

FIGURA 5-12 transformación Johnson de veces antes de la descarga de cambios en el proceso.

normalidad es 0,175> α = 0.05. Así que no se rechaza la hipótesis nula de normalidad para esta variable transformada.

Veamos ahora utilizamos la transformación Johnson en los tiempos de descarga originales antes de cambios en el proceso y

explorar. Haga clic en Estadísticas> Herramientas de calidad> JohnsonTransformation.

Con los datos estando dispuestos como una Una sola columna, seleccione este, e introduzca el número de columna o nombre de la
variable, Antes de la descarga,. por Tienda transforma los datos en, de entrada el número de columna. Hacer clic DE ACUERDO. Figura
5-12 muestra la salida de la utilización de la transformación Johnson. Los datos transformados pasa el Anderson - prueba de
normalidad querida con Florida (colores ying pag- value = 0,991). la identi fi distribución ed es de tipo S SEGUNDO, delimitada, con la
ecuación de la función de transformación se muestra. La salida muestra gráficos de probabilidad normal para la las variables
transformadas original y.

5-6 ANÁLISIS DE DATOS COUNT

Inmany proyectos de mejora de calidad, el tipo de datos disponibles es de recuento o la frecuencia tipo en lugar de una medida
física de una variable. Un ejemplo podría ser el número de accidentes menores, mayores o mortales en una empresa química.
Aquí, podríamos estar interesados ​en probar una hipótesis sobre la proporción de accidentes de cada tipo. Una segunda
aplicación implica la categorización de los datos de conteo de dos o más categorías. Por ejemplo, podríamos tener datos sobre el
número de accidentes menores, mayores o mortales clasificados por el tamaño de la empresa: decir, pequeña, mediana o grande.
El objetivo es poner a prueba si la clasificación fi variables de cationes, tipo de accidente y tamaño de la empresa, son
independientes. Tal procedimiento es conocido como tablas de contingencia

análisis.

Prueba de hipótesis de probabilidades de las celdas

Considere una extensión del experimento binomial, donde cada ensayo independiente puede resultar en una de k clases o
células. Cuando k = 2, tenemos la situación binomial. Dejar pag yo, i = 1, 2,. . . , k,
denota la probabilidad de la hipótesis del resultado ser en la celda yo. Si el número de resultados
ANÁLISIS DE DATOS COUNT 245

observado en células yo se denota por norte yo, i = 1, 2,. . . , k, tenemos

norte 1 ?? norte 2 ?? ∙ ∙ ∙ ?? norte k ?? norte y pag 1 ?? pag 2 ?? ∙ ∙ ∙ ?? pag k ?? 1

dónde norte representa el número total de ensayos. Esto se conoce como una experimento multinomial.
La frecuencia esperada en la celda yo es dado por

mi ?? norte yo ?? ?? notario público yo ?? 5-6 ??

estadística Atest es una función de la squareddifference entre las frecuencias observadas y esperadas para cada
célula y se expresa como

k k
?? norte yo mi ?? norte yo ???? 2 ?? norte yo notario
??público
2 yo
X 2 ?? ?? ?? 5-7 ??
mi ?? norte yo ?? notario público yo
yo ?? 1 yo ?? 1

Se sabe que cuando norte es largo, X 2 tiene una distribución chi-cuadrado con k 1 grados de libertad. Por lo tanto, los valores
críticos se pueden encontrar del Apéndice A-5 para un nivel elegido de signi fi cado ( α). Los grandes valores de X 2 dará lugar al
rechazo de la hipótesis nula, whichmakes una afirmación acerca de los valores de las probabilidades de las celdas. Como regla
general, para la aproximación chi-cuadrado para sostener, la frecuencia esperada para cada celda debe ser de al menos 5.

Ejemplo 5-8 Una empresa de marketing está tratando de determinar la preferencia de los consumidores entre tres
marcas de un producto. Se pide a cada cliente para indicar su preferencia fromamong las tres marcas presentados (A,
B, y c). A continuación se resume la respuesta de frecuencia de 300 consumidores:

¿Hay una preferencia de marca? prueba usando α = 0.05.

Marca UNA segundo do

Frecuencia 70 140 90

Solución Las hipótesis son:

H 0: pag UNA ?? pag segundo ?? pag do ?? 1 = 3 ?? es decir:; sin preferencia de marca ??

H una : Al menos uno pag yo es diferente de 1 = 3

La estadística de prueba se calcula como

?? 70 100 ?? 2 ?? 140 100 ?? 2 ?? 90 100 ?? 2


X 2 ?? ?? ?? ?? 26
100 100 100

Fromthe tablas de chi-cuadrado, χ 2 0: 05; 2


?? 5:99. Dado que la estadística de prueba es superior a 5,99, se rechaza la

hipótesis nula y concluir que los consumidores tienen una preferencia de marca para el producto.

Tablas de contingencia

En tablas de contingencia análisis, comprobamos si la clasificación fi variables de cationes son independientes entre sí, sobre la base de

datos de recuento para cada celda. Además, para las variables categóricas, medidas de asociación pueden también ser encontrados. Por

simplicidad, se presenta la discusión de las tablas de doble, a pesar de que los conceptos se extienden a la situación más general.
246 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

Vamos us de fi ne la siguiente notación:

yo: numero de fila, i = 1, 2,. . ., RJ: número de columna, j = 1, 2,. . ., cn ij:


frecuencia observada en la celda ( yo, j) E (n ij): frecuencia esperada
en la celda ( yo, j) r yo: total de la fila para la fila i, i = 1, 2,. . ., rc j: total de
la columna para la columna j, j = 1, 2,. . ., do

r do
norte: número total de observaciones = i ?? 1 j ?? 1 norte ij

Bajo la hipótesis nula de independencia de la clasificación fi las variables de cationes, las frecuencias esperadas están dadas
por

r yo do j
mi ?? norte ij ?? ?? ?? 5-8 ??
norte

La estadística de prueba se deriva como una función de la diferencia al cuadrado entre las frecuencias observadas y
esperadas para cada célula y está dada por

r do ?? norte ij
mi ?? norte ij ???? 2
X 2 ?? ?? 5-9 ??
mi ?? norte ij ??
yo ?? 1 j ?? 1

La estadística de prueba, dada por la ecuación. (5-9), tiene aproximadamente una distribución chi-cuadrado con grados de
freedomof ( r 1) ( do 1). Como regla general, para la aproximación chi-cuadrado para sostener, la frecuencia esperada debe ser de al
menos 5 para cada celda.

Ejemplo 5-9 Una empresa de la industria de la hospitalidad es propietaria de hoteles en seis ubicaciones geográficamente dispersas.
Normalmente, al término de una estancia, se le pide al cliente para completar una encuesta de satisfacción, donde las respuestas son
en una escala ordinal (por ejemplo, 1 - 5) con las siguientes consecuencias: 1, pobres; 2, por debajo de la media; 3, encima de la
media; 4, buena; 5, excelente. La Tabla 5-6 muestra los resultados porcentuales para cada celda. Podemos concluir que el grado de
satisfacción del cliente es independiente de la ubicación de la instalación? Utilizar α = 0.05.

Solución El uso de Minitab, fi en primer lugar crear una hoja de trabajo con las siguientes variables: Clasificación

(Siglas de las etiquetas de puntuación de calificación), Ubicación ( que representa los seis lugares), y
frecuencia ( indicando el número de la observada para la celda correspondiente). Haga clic en Estadísticas> Tablas> tablas
cruzadas y Chi-cuadrado. Seleccionar la opción Los datos en bruto (variables categóricas). En la ventana de filas, entrada Clasificación;
para columnas, entrada Ubicación; para
frecuencias, entrada Frecuencia. Haga clic en Chi-cuadrado botón, cheque Chi-cuadrado prueba. Debajo Estadísticas para mostrar para

cada celda, seleccionar la salida deseada, por ejemplo, recuentos de células esperados. Hacer clic DE ACUERDO. La salida de Minitab se

muestra en la figura 5-13. Tenga en cuenta que para

TABLA datos de satisfacción del cliente 5-6 en la industria hotelera

Ubicación
Grado de
satisfacción Clasificación 1 2 3 4 5 6

1 20 15 20 15 10 30
2 30 25 30 10 25 20
3 40 40 25 25 40 25
4 30 60 40 35 30 20
5 40 30 50 45 25 30
ANÁLISIS DE DATOS COUNT 247

FIGURA 5-13 análisis de tabla de contingencia de datos de clientes en el sector de la hostelería.

cada celda se muestran los recuentos observados y esperados. El valor estadístico de prueba es 61.515 con 20 grados de libertad
y una pag- valor de 0,000. Por lo tanto, se rechaza la hipótesis nula de independencia de la ubicación frente al grado de
satisfacción de los clientes. Del análisis se concluye que el grado de satisfacción de los clientes está en Florida influenciada por la
ubicación de la instalación. Un análisis de seguimiento puede implicar la determinación de las instalaciones que no cumplan con
las expectativas del cliente y la identificación de medidas correctivas.

Medidas de asociación

En las tablas de contingencia, medidas de asociación entre las variables categóricas se basan en los valores de la
estadística de prueba, X 2, dada por la ecuación. (5-9). Cuando X 2 = 0, no está de acuerdo ment exacta entre las frecuencias
de células observadas y esperadas bajo la hipótesis nula de independencia. Como los valores de X 2 aumento, implican
dependencia entre las variables categóricas.

Una de las medidas es la cuadrático medio de contingencia, dada por

X2
Φ 2 ?? ?? 5-10 ??
norte

pag El valor máximo de X 2 es n (q 1), donde q = min ( r, do). Por lo que el valor máximo de Φ es
q 1. Para un 2 × 2 mesa, Φ se encuentra entre 0 y 1. Otra medida
es Cramer ' s V, dada por

X2
V ?? ?? 5-11 ??
norte ?? q 1 ??

Esta medida se encuentra entre 0 y 1. Si el estadístico de prueba calculado, X 2, es signi fi no puede, según lo determinado por la

prueba de chi-cuadrado, cada una de las medidas Φ y V será considerado como significante fi cativamente diferente de cero.
248 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

5-7 Los análisis de los datos de satisfacción CLIENTE

La información sobre productos y servicios desde la perspectiva del cliente a menudo se obtiene a través de cuestionarios y encuestas de

clientes relevantes. Como se discutió en capítulos anteriores, uno de nuestros principales objetivos es mejorar la satisfacción del cliente,

que a su vez tiene la capacidad de aumentar la cuota de mercado. En esta sección nos centramos en los diversos tipos de análisis que

pueden llevarse a cabo en los datos obtenidos del cuestionario fromcustomers.While los principios generales de este tipo de análisis

puede aplicarse al sector de fabricación y servicio, destacamos nuestra discusión de aplica ciones en el fi campo de la asistencia sanitaria

para una variedad de razones. En primer lugar, en los Estados Unidos y en otros países, los costos del cuidado de la salud constituyen un

segmento importante del producto interno bruto, lo que exige una cuidadosa investigación de la calidad del cuidado de la salud. En

segundo lugar, en el vigésimo fi siglo primero, junto con el envejecimiento de la población, que seguirá siendo un sector dominante de la

economía. En tercer lugar, en theUnited Unidos, los crecientes costos en este sector de la demanda de atención crítica a las medidas que

reducirá los costos, pero no sacrificar fi ce la calidad de la asistencia sanitaria.

Las necesidades del cliente y su nivel de satisfacción

los fi campo de la asistencia sanitaria es único en el sentido de que existe una gran variedad de clientes. El cliente principal es el
paciente, cuyas preocupaciones involucrar a los resultados dealingwith associatedwith el tratamiento que el paciente ha sido
sometido. Una segunda categoría de necesidades puede tratar con la entrega del servicio, por ejemplo, el nivel de satisfacción en
las diversas etapas operativas que el paciente ha encontrado. Estos podrían, por ejemplo, el nivel de satisfacción en la interacción
con los empleados médicos y hospitalarios. Los médicos también podría ser otra categoría de clientes del centro de atención
médica con sus necesidades consistentes en la disponibilidad de instalaciones adecuadas y personal de apoyo, un horario
razonable, y una compensación adecuada. El personal de apoyo, tales como enfermeras, constituyen una tercera categoría de
clientes. Sus necesidades pueden abarcar un horario de trabajo deseable que no les obligan a horarios extendidos por la noche o
los fines de semana. Por lo tanto, cuando los datos de satisfacción del cliente son buscados por el centro de atención médica, que
puede abarcar los pacientes, médicos, enfermeras, personal de apoyo y técnicos de laboratorio. En esta sección, nos centramos
en el cliente principal - el paciente.

Como hemos visto en un capítulo anterior, las necesidades del cliente no son todos del mismo grado de importancia. El cliente

categorizado modelo Kano necesita en las necesidades básicas, las necesidades de rendimiento y las necesidades de excitación. Mientras

que la satisfacción de las necesidades básicas no puede mejorar la satisfacción del cliente, que no satisfagan los aumenta la insatisfacción del

cliente. La excitación necesita, por lo general no identificado fi ed de encuestas a los clientes, deleitar al cliente si satis fi ed. La mayoría de las

encuestas a los clientes habitan en las necesidades de rendimiento ya que cuanto mayor sea el grado de satisfacción de estas necesidades,

cuanto mayor sea el nivel de satisfacción del cliente.

Típicamente, las formas de la encuesta de satisfacción del paciente se basan en una fi ve- o la escala ordinal de siete puntos, se
hace referencia como una Escala Likert ( Likert 1932). Los elementos de la questionnairemay se relacionan con diversas categorías
asociadas a la exposición del paciente a diferentes entidades durante el período de tratamiento en un centro de atención médica.
por lo general se le pide al paciente que califique la nivel de satisfacción en el artículo en particular en una escala ordinal que pueden
ser representados como sigue: 1 muy insatisfecho fi ed; 2 insatisfecho fi ed; 3 neutral; 4 satis fi ed; y 5 Muy satisfecho fi ed. A escala Likert
de siete puntos se formula de acuerdo con siete niveles ordinales. Tabla 5-7 enumera algunas posibles preguntas sobre una
asistencia sanitaria form.While encuesta de satisfacción del paciente facilitiesmay diseñar sus propios cuestionarios, en función de
su especificidad fi c artículos de interés, varios organismos como el Comité Nacional para la Garantía de Calidad (NCQA 2015) y el
Centro de Servicios de Medicare y Medicaid (CMS 2015) recomiendan el uso de pre-desarrollados
Los análisis de los datos de satisfacción CLIENTE 249

TABLA 5-7 Elementos de las encuestas de satisfacción del paciente

Clasificación

Artículos 1 2 3 4 5

entidad allegada

1. Limpieza de la habitación

2. cama y otros muebles


3. Climatizador
4. Nivel de ruido durante la noche

5. Ropa de servicio

6. Facilidad de ver TV
7. El sabor y la temperatura de las comidas

Puntualidad de las operaciones

8. El tiempo de espera en el registro

9. Tiempo para ocupar cama

10. Tiempo de espera antes de ser visto por un médico

11. Plazo de presentación de las visitas de enfermería

12. El tiempo de espera para ser prestados

conformidades de servicios
13. Los errores en los estados de cuenta

14. medicación incorrecta


15. medicamentos a destiempo

16. Dolor gestión

características de comportamiento

17. La capacidad de respuesta de los médicos

18. Empatía del médico


19. Physician claridad comunicación
20. La amabilidad del personal

21. La paciencia del personal

22. La alegría del personal

cuestionarios en función del tipo de paciente (categoría relacionados con el diagnóstico) y el tipo de subunidad (como el
servicio de urgencias) en el centro de atención médica enla que la información se va a recoger. Una de tales fuentes de
cuestionarios es la Prensa Ganey-Encuesta formulario disponible a través Press-Ganey Associates, Inc. (2015).

La encuesta de satisfacción de los pacientes muestra formshown la Tabla 5-7 o las formas de satisfacción del paciente

estandarizadas desarrolladas por Press-Ganey Associates o el Grupo de Myers (2015) o la Corporación Nacional de Investigación (2015)

generalmente se administran a los pacientes sólo para obtener alguna información sobre su nivel de satisfacción durante su estancia en el

centro de atención médica. Creemos que, mientras que la retroalimentación sobre la satisfacción del paciente es importante, un

componente crítico en la retroalimentación de los pacientes no se encuentra con el fin de ayudar a la administración en la toma de

decisiones estratégicas y operativas. Esto está relacionado con el importancia que el paciente asigna a los diversos
250 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

elementos de la encuesta. Obviamente, no todos los elementos son de igual importancia para el paciente. Siguiendo el concepto de
theKanomodel, dealingwith los artículos que son de gran importancia para el paciente dará lugar a mayores niveles alcanzados de
satisfacción. Para la gestión de andmiddle senior de la organización de atención de la salud, la información combinada artículos enla
que son de gran importancia, así como los elementos que se perciben como de alto nivel de satisfacción será de gran valor en la
creación de un plan estratégico. Esto, creemos, actualmente se carece.

Con el fin de obtener dicha articulación información sobre el importancia así como la percibida nivel de satisfacción para cada
punto de la encuesta, utilizando, por ejemplo, los mismos elementos que se muestran en la Tabla 5-7, el siguiente es deseable: Para
cada elemento, se le puede pedir al paciente para clasificar, en una escala ordinal, la importancia de cada elemento . UNA fi escala
Likert de cinco puntos, como antes, se podría utilizar con el followingnomenclature: 1 no es importante en absoluto; 2 no es importante;
3 neutral; 4 muy importante; y 5 muy importante. De las encuestas realizadas, por cada artículo o pregunta, ahora pueden obtenerse
dos resultados: la puntuación media en el nivel de percepción de la satisfacción de ese elemento y la puntuación media en la
importancia de ese elemento. Ahora, en base a la puntuación overallmedian de todos los artículos, wemaypartition la percepción del
nivel de satisfacción de los artículos en dos grupos, basados ​puntuación lowand alta, onwhether themedian del artículo en particular
cae belowor encima de la puntuación media global de todos los elementos, respectivamente. Un schememaybe particionado similar
adoptada por la importancia percibida de los artículos. Para cada elemento, su importancia percibida se clasifica en dos grupos, de
baja y alta, dependiendo de si la puntuación media está por debajo o por encima de la puntuación global media en la importancia de
todos los elementos, respectivamente. Tal clasificación de dos vías fi cación de cada artículo, en función de su importancia percibida y su
nivel de satisfacción percibido, será ayudar a la administración en la determinación de las áreas para centrarse en su esfuerzo por
mejorar la satisfacción del cliente.

La figura 5-14 muestra un esquema de categorización de los ítems del cuestionario de una encuesta sobre la base de la
importancia y la percepción del nivel de satisfacción. Cada elemento, utilizando datos de resumen, caerá en uno de los cuatro
cuadrantes representados. En función de este resultado, la gestión tendrá que decidewhere para dirigir su enfoque e identificar
posibles áreas de asignación de recursos. Los elementos que están en el cuadrante etiquetado como vulnerabilidad clave son de gran
importancia para los clientes, pero la corriente percibida nivel de satisfacción es bajo. Se necesita una atención inmediata para mejorar

Figura 5-14 análisis agregado de elementos de la encuesta.


Los análisis de los datos de satisfacción CLIENTE 251

el nivel de satisfacción en estas áreas. Si no se tratan, puede resultar en una pérdida de cuota de mercado. Para los elementos que
están en el la vulnerabilidad potencial cuadrante, tanto la importancia como la percepción del nivel de satisfacción son bajos. La
administración debe esforzarse por identificar las causas asociadas con bajos niveles de rendimiento operativo y por lo tanto
adoptar algunos planes de acción correctores. Los artículos que se colocan en el ventaja estratégica cuadrante son a la vez de gran
importancia y de alto nivel de satisfacción percibido. Por lo tanto, el enfoque actual del centro de atención de la salud está en la
dirección correcta y niveles superiores de rendimiento puede aumentar la cuota de mercado. La administración debe seguir
vigilando la retroalimentación del cliente con el fin de determinar los cambios en las preferencias del cliente y tomar las medidas
adecuadas con prontitud, si es necesario. Los productos en el cuadrante etiquetado como ventaja potencial son considerados por los
clientes como de baja importancia, pero la percepción del nivel de satisfacción es alto. El centro de atención médica es doingwell en
el mantenimiento de un alto nivel de satisfacción en artículos, que pueden contribuir a una ventaja potencial. Continua
retroalimentación de los clientes es necesario determinar los cambios en las preferencias del cliente.

Ejemplo 5-10 Considere los 22 elementos que se enumeran en una encuesta de satisfacción de los pacientes se muestran en la Tabla 5-7. Se

pidió a los pacientes que calificaran su nivel de satisfacción, en cada artículo, en una fi escala Likert de cinco puntos como se muestra. Además,

también se les pidió a los pacientes evaluar la importancia de cada elemento en una fi escala Likert de cinco puntos, que varía de 1 a 5, usando el

previamente De fi nomenclatura Ned: 1 no es importante en absoluto a 5 muy importante. La mediana de la calificación para cada uno de los 22

artículos, tanto para la satisfacción percibida e importancia, se muestran en la Tabla 5-8. Llevar a cabo un análisis global de la administración

para decidir sobre los planes estratégicos para mejorar la calidad.

Solución Utilizando las puntuaciones reportedmedian en el índice de satisfacción de los 22 artículos, la mediana global de estas mediana de las

puntuaciones es de 3.75. Del mismo modo, el uso de las puntuaciones medianas informaron sobre la calificación de importancia para los 22 artículos,

la mediana global de estas mediana de las puntuaciones es de 4,0. Estos dos valores algo dE fi ne nuestros límites para la categorización de las

puntuaciones de satisfacción en los dos niveles de baja y alta, así como las puntuaciones de importancia en los dos niveles, alto y bajo. Figura 5-15

muestra una clasificación fi cación de los elementos de la encuesta sobre la base de la satisfacción percibida e importancia.

En primer lugar, vamos a considerar los elementos que crean una ventaja estratégica para la organización. Artículos,

1, 14, 15, 16, 17, 18, y 19 caída en este cuadrante. Tenga en cuenta que la mayoría de los artículos son de las categorías de no

conformidades de servicios y características de comportamiento. Los pacientes creen que es muy importante no administrar

medicamentos incorrectos y / o administrar en forma extemporánea. El manejo del dolor es muy importante también. Actualmente, los

pacientes están muy satisfechos fi ed con el médico y las enfermeras en el cumplimiento de estas necesidades. rasgos de

comportamiento, tales como la capacidad de respuesta, la empatía, la comunicación y la claridad del médico se consideran muy

importantes y los pacientes están muy satisfechos fi ed con el médico en sus experiencias. El único elemento de instalaciones, que es

muy importante es la limpieza de la habitación y el centro de atención médica está haciendo actualmente un excelente trabajo en el

cumplimiento de las necesidades del paciente. Todas estas son las fortalezas actuales de la organización. Patientwordofmouthon estos

artículos couldhelp en attractingnewcustomers y aumentar la cuota de mercado.

TABLA 5-8 Mediana de la satisfacción y la Importancia de los pacientes puntuaciones de evaluación para elementos de las encuestas

Número de artículo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

La mediana de satisfacción 4 2 4 5 3 2 3 4,5 4,5 2 1,5 2 2 5 4,5 4 4,5 4 4,5 3,5 3 3 Puntuación

La mediana de importancia 5 3 3 3 2 2 5 3 3 4,5 4,5 4 4 5 5 4,5 5 5 4,5 4 44


clasificación
252 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

FIGURA 5-15 clasificación fi cación de los elementos de la encuesta sobre la base de la satisfacción e importancia.

A continuación, vamos a ver áreas de vulnerabilidad clave. Artículos 7, 10, 11, 12, 13, 20, 21 y 22 caída en este
quadrant.Manyof estos se fromthe categorías de puntualidad de características de operaciones andbehavioral. El sabor y la
temperatura de las comidas de la categoría de instalaciones-así como los errores de facturación fromthe categoría de servicio no
conformidad son consideredvery importante también. El centro de salud está fallando tomeet las expectativas del paciente para
estos artículos. Ya que tres de los artículos dealwith la puntualidad de las operaciones relativas a los tiempos longwaiting tobeing
antes visto por un médico, enfermera visita a destiempo, y largos tiempos de espera para ser desprotegido, couldperhaps gestión
considerways de la racionalización de estos procesos. Si los tiempos longwaiting para couldbe aphysician resueltos
throughabetter sistema de programación, que couldbe anoption. Por otra parte, si esto es debido a una escasez de médicos de
guardia, tendría que ser perseguido un enfoque diferente que incrementa el número de médicos disponibles. Es importante para
la gestión de abordar estas cuestiones críticas con urgencia, ya que, si no se tratan, insatisfecho fi ed pacientes podrían ir en otro
lugar, lo que lleva a una pérdida de cuota de mercado.

Ahora, consideremos las áreas de ventaja potencial. Los artículos 3, 4, 8 y 9 caída en este cuadrante. Sobre el climatizador y el nivel

de ruido durante la noche, a pesar de que no se considera muy importante por parte del paciente, la instalación está proporcionando un

alto nivel de satisfacción. Del mismo modo, para los elementos de tiempo de espera en el registro y la hora de ocupar cama, el servicio

proporcionado por la instalación es muy satisfactorio para el paciente, incluso aunque no se considera muy importante. El mantenimiento

de los niveles de rendimiento actuales de estos elementos podría ser una vía que proporciona una ventaja potencial en relación con los

competidores. Tenga en cuenta que mientras que los pacientes no consideran largo tiempo de espera en el registro o para ser colocado en

una cama muy importante, un área en la que la instalación está haciendo bastante bien, lo hacen considerar el tiempo de espera antes de

ser visto por un médico, enfermera visita oportunas, y el tiempo de procesamiento para ver como algo muy importante. La instalación

actualmente no está haciendo un gran trabajo en las últimas zonas.

Por último, vamos a explorar las áreas de vulnerabilidad potencial. Los artículos 2, 5, y 6 caída en este cuadrante. Todos estos
elementos son de la categoría relacionada instalación. Cama, servicio de ropa blanca, y la facilidad de ver la televisión no son
consideredvery importante, en términos relativos, y la instalación es
Los análisis de los datos de satisfacción CLIENTE 253

no está en ofrecer un servicio excelente en estas áreas. Puesto que son todas las instalaciones relacionadas en lugar de en relación con los

rasgos de comportamiento del médico, enfermera o personal de apoyo, puede ser que sea más fácil para la administración a elaborar planes

de acción correctiva. Proporcionar un mejor soporte del colchón o una más rápida / conveniente programa de cambio de ropa de cama y el

ajuste de la locationof la televisión son temas para los cuales las soluciones factibles son más fácilmente identificados fi poder.

Visualización de los resultados de la encuesta

La visualización es un medio eficaz para mostrar un resumen de los resultados de una encuesta (Robbins y Heiberger 2011). Esto
se refiere a la percepción del nivel de satisfacción de un artículo o la importancia percibida de ese elemento. Para cada punto del
cuestionario, supongamos que la satisfacción del paciente se mide en una fi ve-punto escala Likert ordinal con la siguiente ture
nomencla: 1 muy insatisfecho fi ed; 2 insatisfecho fi ed; 3 neutral; 4 satis fi ed; y 5 Muy satisfecho fi ed. Una forma de resumen podría
ser la de fi encontrar la mediana de la puntuación de cada elemento. Una muestra de las puntuaciones medianas indicaría el grado
relativo de satisfacción con el artículo particular por lo que se plantea en la pregunta. Los valores más altos de la mediana de la
puntuación representarían un mayor nivel de satisfacción. Del mismo modo, por la importancia percibida del artículo, una
puntuación mediana se pudo encontrar partir de las respuestas, cuando una fi ve-punto escala Likert ordinal podría haber sido
utilizado con la siguiente nomenclatura: 1 no es importante en absoluto; 2 no es importante; 3 neutral; 4 muy importante; y 5 muy
importante. Los valores más altos de la mediana de la puntuación representarían un mayor nivel de importancia para ese caso
particular.

Gráficos de barras apiladas A veces, un poco más allá de la información de notificación de sólo el medianassociatedwith un
itemis de interest.A gráfico stackedbar tiene la capacidad todisplay la proporción de respuestas en cada categoría, por ejemplo,
“ muy satisfecho fi ed, ”“ satis fi ed, ” y así sucesivamente, para cada ítem en el cuestionario. Tal representación visual transmite los
niveles relativos de satisfacción, ya sea fuerte o débil, para cada elemento. También se puede utilizar para mostrar los niveles
relativos de importancia como se resume por las distintas categorías para cada elemento, así.

Ejemplo 5-11 Considera el fi rst siete artículos relacionados con las instalaciones en un cuestionario, como se muestra en la Tabla 5-7. Un

resumen de las respuestas para cada ítem, por la categoría de calificación, se muestra en la Tabla 5-9 basado en un total de 100 respuestas.

Crear un gráfico de barras apiladas y discutir la satisfacción del paciente en los artículos relacionados.

Solución Los datos en la Tabla 5-9 se introduce en una hoja de trabajo de Minitab mediante el uso de dos variables categóricas, dicen Artículos

y categorías de calificación. Debajo Artículos, formade abreviada las preguntas

TABLA 5-9 Satisfacción datos del paciente en Elementos de las Instalaciones relacionados

Clasificación

Artículos 1 2 3 4 5

entidad allegada

1. Limpieza de la habitación 5 5 10 70 10

2. cama y otros muebles 0 5 5 60 30

3. Climatizador 10 10 20 50 10

4. Nivel de ruido durante la noche 10 20 10 60 0

5. Ropa de servicio 0 10 10 60 20

6. Facilidad de ver TV 0 10 20 40 30

7. El sabor y la temperatura de las comidas 15 20 15 40 10


254 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

FIGURA 5-16 Stacked gráfico de barras de los datos de satisfacción del paciente sobre los temas relacionados con las instalaciones.

se enumeran, mientras que bajo categorías de calificación, sellos como “ 1. Muy insatisfecho fi ed ” y “ 2. insatisfecho fi ed ” son de entrada. Para cada

combinación de estas dos variables categóricas, el porcentaje de respuestas se introduce como una variable cuantitativa llamada Porcentaje. Haga

clic en Gráfico> Gráfico de barras. En la ventana, debajo de las opciones Las barras representan, seleccionar Los valores de una tabla y luego

seleccione Apilar y haga clic DE ACUERDO. En la ventana, debajo variables de gráficas entrada Porcentaje, y bajo variables categóricas, la lista

de la más externa fi en primer lugar, en este caso Artículos, y luego una lista categorías de calificación. Esto se debe a que estamos categorizando

cada elemento en el fi cinco categorías de calificación y que muestra el porcentaje de cada uno. Hacer clic DE ACUERDO. Figura 5-16 muestra el

gráfico de barras apiladas en los datos de satisfacción del paciente. Para cada elemento, el porcentaje de respuestas en las distintas categorías de

calificación se representan. Si tuviéramos que agregar los dos niveles superiores de calificación de satisfacción, es decir, los niveles de calificación 4

and5, como ameasure de la satis proportionof relativa fi edpatients, el nivel de satisfacción del artículo

“ Cama y otros muebles ” es el más alto, seguido de los artículos “ Limpieza de la habitación ” y “ Servicio de ropa blanca. ” Estos dos últimos

conceptos están ligados a un nivel de satisfacción global de 80% cada uno. Dado que los elementos de una encuesta de satisfacción de los

pacientes suelen ser del tipo que se clasifican fi ed como satisfacer las necesidades de rendimiento, como basado en el modelo de Kano, la

reducción de los niveles de los malos resultados se suelen hacer que los niveles de satisfacción para aumentar. En este ejemplo, si tenemos

en cuenta la suma de las dos categorías de la insatisfacción, es decir, los niveles de calificación 1 y 2, como una medida general de

insatisfacción, los artículos que se indican como “ El sabor y la temperatura de las comidas ” seguido por “ duringnight nivel de ruido ” woulddemand

attention.Management debe identificar remedialmeasures de estos elementos con el fin de mejorar la satisfacción general del paciente.

Diagrama de comportamiento de Datos de serie datos de satisfacción del paciente se recogen a menudo a partir de cuestionarios que se

administran en el tiempo. En esta situación, el centro de atención médica puede estar interesado en la identificación de tendencias, en su

caso, en los niveles de rendimiento de los distintos puntos en el tiempo. Por ejemplo, sobre una base anual, datamay ser agregados en cada

itemdealingwith la puntualidad de las operaciones, como artículos 8 indicatedby - 12 la Tabla 5-7. Por lo tanto, para los artículos de “ Esperando
Los análisis de los datos de satisfacción CLIENTE 255

tiempo en el registro, ” la agregación de los datos a lo largo del año usando las escalas de calificación, la calificación media se obtendría. dicha

calificación mediana para que itemwould continuación, se trazará la utilización de los datos anuales utilizando un diagrama de comportamiento en el

tiempo. Trazado del diagrama de comportamiento se ha descrito anteriormente en este capítulo. Este diagrama de comportamiento podría ser

utilizado para identificar especí fi c tendencias o patrones que hubiere. En la búsqueda de la mejora de la calidad, el diagrama de comportamiento

proporciona un medio visual de comparar el rendimiento de un producto durante un período de tiempo.

Análisis de los Resultados de la Encuesta

El tipo deseado de inquirywill en Florida influir en la selecciónde la técnica estadística apropiada. Puesto que los datos encuesta mediante

cuestionarios es una forma de datos de recuento, se pueden aplicar los métodos de análisis de datos de recuento descritos anteriormente

en el capítulo. Durante un período determinado, en este recuento casemay se refiere al número de personas que respondieron a una

categoría dada.

Comparación de las proporciones de Calificación para un artículo Supongamos que para los elementos de una encuesta de una

fi cinco puntos de Likert ordinal sistema de calificación en escala se utiliza con la nomenclatura de fi definido previamente. Puede ser de
interés para poner a prueba las creencias, basado en observaciones o estudios previos, en la proporción de clientes que se suscriben
a cada categoría de calificación, es decir, que están “ muy satisfecho fi ed ” o “ satis fi ed ” o “ neutral ” o “ insatisfecho fi ed ” o “ muy insatisfecho fi
ed ” sobre la cuestión relativa a dicho tema. UNA la bondad de chi-cuadrado fi t prueba puede ser apropiado en esta situación.

Ejemplo 5-12 Considere item7, relacionada con “ gustativas y temperatura, ofmeals ” la Tabla 5-7 y la respuesta se resume
asociado en la Tabla 5-9. Asumir la calificación categorías están etiquetados 1 -
5, con el mismo de fi definición tal como se presenta anteriormente: 1 muy insatisfecho fi ed a 5 Muy satis fi ed. Dejar pag yo representar la

proporción de clientes que asignar una calificación de yo, de acuerdo para gestionar ción ' s creencia previa. Si la administración considera

que todos los clientes tienen la misma probabilidad de elegir cualquiera de las categorías de calificación, la hipótesis nula y alternativa sería

1
H 0: pag 1 ?? pag 2 ?? pag 3 ?? pag 4 ?? pag 5 ?? 5

1
H una : Al menos uno pag yo es diferente de 5

En lugar de asignar probabilidades iguales para cada categoría, la administración puede tener un conjunto diferente de
creencias. En base a la calidad de su servicio de comida, theymay creen que sólo el 5% de la customerswill ser verydissatis fi ed
y otro 5% estarán insatisfechos fi ed. Por otra parte, theymay creen que el 10% será “ neutral, ” 60% será “ satis fi ed, ” y 20% será
“ muy satisfecho fi ed. ”
La hipótesis nula y alternativa en este contexto son

H 0: pag 1 ?? 0:05; pag 2 ?? 0:05; pag 3 ?? doce y diez; pag 4 ?? 0:60; pag 5 ?? doce y veinte

H una : Al menos uno pag yo es diferente del valor especificado

Las frecuencias observadas de los clientes que respondieron en cada categoría se muestran en la Tabla 5-9. Las
frecuencias esperadas, bajo el supuesto de la hipótesis nula de ser cierto, están dadas por eq. 5-6 y son como sigue:

mi 1 ?? 100 ?? 0:05 ?? ?? 5; mi 2 ?? 100 ?? 0:05 ?? ?? 5; mi 3 ?? 100 ?? doce y diez ?? ?? 10

mi 4 ?? 100 ?? 0: 6 ?? ?? 60; mi 5 ?? 100 ?? 0: 2 ?? ?? 20

La estadística de prueba de ji cuadrado, dada por la ecuación. 5-7, se obtiene como

2 2 2 2 2
?? 15 5 ?? ?? 20 5 ?? ?? 15 10 ?? ?? 40 60 ?? ?? 10 20 ??
χ 2 ?? ?? ?? ?? ?? ?? 79:17
5 5 10 60 20
256 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

El valor crítico de χ 2 con cuatro grados de libertad y un nivel de significación elegido fi cado de
0,05, por ejemplo, es χ 2 ?? 09:49. Dado que la estadística de prueba es superior a 9.49, se rechaza la hipótesis nula
0: 05; 4

y concluyen que esta evidencia no admite la administración ' s creencia en la proporción de clientes en su grado
relativo de satisfacción con las comidas.

Comparación de las proporciones de Calificación en dos categorías o líneas de tiempo A veces, en lugar de comparar las
proporciones de calificación en todas las categorías, como en el ejemplo anterior, uno puede estar interesado en comparar las
proporciones en dos categorías elegidas. Por ejemplo, para el punto relativo al sabor y la temperatura de las comidas, es posible
que se desea determinar si hay un significante fi diferencia signifi entre las proporciones de los clientes que están satisfechos fi ed
y los que son muy satis fi ed. Las hipótesis nula y alternativa son

H 0: pag 4 ?? pag 5; H una : pag 4 ≠ pag 5

Para muestras de gran tamaño, la Z- prueba para la comparación de dos proporciones como se describe en el Capítulo 4 puede ser

utilizado. La estadística de prueba está dada por eq. (4-79). Alternativamente, es posible que queremos saber si hay un significante fi diferencia

signifi entre la proporción de customerswho se satisfacen fi edwith el servicio de comidas en dos años consecutivos. Esto permitirá a la

administración para medir el impacto de las medidas correctivas que tomaron para mejorar la calidad de servicio de comidas.

Ejemplo 5-13 Se refiere a artículos relacionados con las instalaciones thepatient-satisfactiondata inTable5-9on, que
summarizedthedatafor thepastyear.Focusingonitem7, dealingwiththe comidas tasteandtemperatureof, con el fin de mejorar la
satisfacción de los pacientes, la administración ha decidido tomar algunas medidas correctivas. Theyhave contrató a un andhave
newchef también takenmeasures a speedup el plazo de entrega en gettingmeals fromthekitchen a thevariouswards. Summarydata
para el año en curso arrojó los siguientes números en cada categoría de clasificación, basado en un total de 200 respuestas: rating 1 - 10;
2 de propiedad - 10; rating3 - 5; rating4 - 150; Rating5 - therehasbeenasigni 25.Determineif fi proporción increaseinthe canto de los pacientes
que son satis fi la D desde el año pasado para el año en curso.

Solución Denotemos pag 41 y pag 42 siendo la proporción de pacientes en el “ satis fi ed ” categoría de calificación en el año 1 (el
año pasado) y el año 2 (año en curso), respectivamente. La hipótesis nula y alternativa son las

H 0: pag 41 pag 42; H una : pag 41 < pag 42

Tenemos ^ ?? pag
40 =41100 ?? 0: 4; ^ ?? 150 = 200 pag
?? 0:75.
42 La estimación combinada está dada por

100 ?? 0: 4 ?? ?? 200 ?? 0:75 ??


^ pag ?? ?? 0: 633
100 ?? 200

La estadística de prueba se calcula como

Doce y cuarenta 0:75 0: 367 ???? 1 = 100 ?? 1 = 200 ??


z 0 ?? ??pag
0: 633 ???? ?? 5: 929

Con un nivel de significación elegido fi cado ( α) de 0,05, el valor crítico de la tabla de distribución normal estándar es de z 0,05
= 1.645, se rechaza la hipótesis nula y concluimos que, basándose en la evidencia, un significante fi la mejora no puede ha
tenido lugar.

Análisis de Asociación entre las calificaciones en satisfacción del cliente y la importancia Eso

puede ser deseable, a veces, para determinar el grado de asociación entre las calificaciones asignadas a la satisfacción del
cliente para un elegido itemand las calificaciones asignadas a la importancia del elemento. Por lo tanto, tenemos clasificación
de datos fi ed según dos variables categóricas. La hipótesis nula supone que las calificaciones asignadas a cada categoría son
independientes entre sí.
CONCEPTOS En el muestreo 257

TABLA 5-10 de satisfacción del paciente y la importancia Clasificación de comidas

importancia Clasificación

satisfacción Clasificación 1 2 3 4 5

1 5 10 5 14 6
2 6 8 6 30 10
3 4 7 5 dieciséis 8
4 8 8 10 64 30
5 6 5 8 55 6

El análisis utiliza el enfoque previamente demostrado para una De dos vías tabla de contingencia.
Bajo la hipótesis nula de independencia de las variables categóricas de la calificación de la satisfacción y la calificación de
importancia, las frecuencias esperadas son eq givenby. (5-8) y la estadística de prueba está dada por eq. (5-9). El valor crítico del
estadístico chi-cuadrado se encuentra a un nivel de significación elegido fi cance y grados de freedomgiven por ( r 1) ( do 1), donde r representa
el número de categorías de una de las variables categóricas y do representa el número de categorías para el segundo valor
categórico. Para la situación en la que la satisfacción del cliente y la importancia de cada elemento se clasificaron en una fi cinco
puntos de escala, tenemos r = 5 y c = 5.

Ejemplo 5-14 La Tabla 5-10 muestra los datos resumidos sobre la satisfacción del paciente percibida y la importancia del tema
cuestionario “ gustativas y temperatura ofmeals. ” índices de satisfacción percibidos estaban en una escala de Likert de 1 a 5, mientras

que la importancia del tema también fue evaluado en una escala de Likert de 1 a 5. Estas escalas de calificación se ajustan a la

nomenclatura anterior. Determinar si las variables categóricas “ satisfacción Clasificación ” y “ importancia Clasificación ” son

independientes utilizando un nivel de significación fi cance de 5%.

Solución Los datos de resumen se introducen en aMinitabworksheet donde las columnas, con las cuentas totales numéricos, se
etiquetan como Importancia-1 a Importancia-5, respectivamente. Las etiquetas de las filas están en una columna aparece como Clasificación

de satisfacción. Los niveles correspondientes para

satisfacción Clasificación se enumeran como Clasificación-1 a Clasificación-5. El uso de los comandos de Minitab

Estadísticas> Tablas> tabulación cruzada y Chi-Cuadrado, en la ventana que aparece, seleccionamos


datos que se resumen en una tabla de doble entrada. En la ventana de columnas que contienen la tabla, enumeramos Importancia-1 a Importancia-5.

En la ventana en las etiquetas de la tabla, por filas, especificamos Clasificación de satisfacción. Se selecciona la prueba de chi-cuadrado.

El valor de la estadística de prueba, givenbyeq. (5-9), es Tobe reportedbyMinitab 31.128with16 grados de libertad y una pag-
value = 0,013. Tenga en cuenta que hay seis células que han esperados conteos de frecuencia de menos than5,
theminimumthat se prefiere para esta prueba. El valor crítico de
χ 2 es obtainedas χ 2 0: 05; 16
?? 26:30. Dado que la prueba statisticexceeds el valor crítico, se rechaza la
hipótesis nula y concluir que la evidencia sugiere que las calificaciones asignadas a la categoría de satisfacción no son
necesariamente independientes de las calificaciones asignadas a la categoría de importancia y viceversa.

CONCEPTOS 5-8 en el muestreo

En el control de calidad a menudo no es factible, debido a la falta de tiempo y recursos, para obtener datos con respecto a una

determinada característica de calidad para cada elemento de una población. Además, los datos de muestra proporcionan información

adecuada acerca de un producto o característica proceso a una fracción del costo. Por tanto, es importante saber cómo se seleccionan las

muestras y las propiedades de diversos procedimientos de muestreo.


258 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

UNA diseño de muestreo es una descripción del procedimiento bywhich las observaciones en una muestra son para ser
elegido. No necesariamente tratar con el instrumento de medición a utilizar. Por ejemplo, un diseño de muestreo podría especificar
la elección de cada décimo punto producido.
En el contexto de muestreo, una elemento es un objeto (o grupo de objetos) para los que se recogieron datos o información. UNA unidad

de muestreo es un elemento individual o una colección de población nonoverlapping elementos froma. UNA marco de muestreo es una

lista de todas las unidades de muestreo. Por ejemplo, si nuestro interés es con fi conjunto toa Ned de las piezas producidas en themonthof

julio (elemento de toma de muestras), la unidad de muestreo podría ser una parte individual, mientras que el marco de muestreo sería una

lista de los números de parte de todos los artículos producidos.

Muestreo Los diseños y Esquemas

Importante motivo objetivo de cualquier diseño de muestreo o esquema es para seleccionar la muestra de tal distancia como para representar

con precisión la población fromwhich se dibuja. Después de todo, una muestra se supone que es representativa de la población.

El muestreo en general tiene ciertas ventajas. Si la medición requiere destruir el objeto que se está midiendo (ensayos no
destructivos), no nos podemos permitir obtener datos de cada elemento de la población. Además, en las mediciones que implican
métodos manuales o altas velocidades de producción, la fatiga inspector puede dar como resultado, lo cual produciría datos
inexactos.

Los errores en el muestreo Hay tres fuentes de error en las encuestas por muestreo. los fi fuente RST se
variación aleatoria. La naturaleza inherente de la variabilidad de la muestra hace que este tipo de errores que se produzca. Cuanto más

sofisticado sea el instrumento de medición, menor es la variación aleatoria.

Misspeci fi catión de la población es una segunda fuente de error. Este tipo de error se produce en encuestas de opinión pública, en la

obtención de respuestas con respecto a la satisfacción del consumidor con un producto, en el listado de un marco de muestreo de forma

incorrecta, y así sucesivamente.

Thethirdsourceoferrordealswith (no respuestas usuallyinsamplesurveys) .Thiscategory también incluye situaciones


en las que una medida no es factible debido a un instrumento de medición inoperante, un pueblo shortageof
responsables de tomar themeasurement, u otras razones.

Muestra aleatoria simple Uno de los diseños de muestreo más utilizados en el control de calidad es el simple randomsample.
Supongamos que tenemos una fi finito de la población norte artículos fromwhich una muestra de norte artículos se va a seleccionar. Si las

muestras se eligen de manera que cada posible muestra de tamaño norte tiene la misma probabilidad de ser seleccionado, se dice que el

samplingprocess Tobe azar, y la muestra obtenida se conoce como una muestra aleatoria simple.

tablas de números al azar (o números aleatorios uniformes generados por ordenador) se pueden utilizar para obtener una
muestra aleatoria simple. Por ejemplo, si hay 1000 elementos de la población, los números de tres dígitos 000 - 999 se utilizan
para identificar cada elemento. Para empezar, se selecciona un número aleatorio; un elemento corresponde a este número.
Esta selección continúa hasta que la muestra deseada de tamaño norte esta elegido. Si un número aleatorio que ya ha sido
utilizado aparece, se ignora y se elige otro.

�las conclusiones del teorema del límite


En la estimación de la media poblacional ( μ) por la media de la muestra ?? X ??,
central, que se analizan en el Capítulo 4, se utilizan para describir la precisión del estimador. La precisión es la inversa
de la varianza del muestreo y se estima

2
2
sNn
σ ^ � X ?? ?? 5-12 ??
norte norte

dónde s 2 representa la varianza de la muestra. El termino ( norte n) / N se conoce como el fi población infinita
2 2
factor de corrección. Si norte es muy grande en comparación con norte, la expresión para σ ^ es s / n. �X
CONCEPTOS En el muestreo 259

Estratos fi Muestra ed Random A veces la población fromwhich se seleccionan muestras es heterogénea. Por ejemplo,
considere la salida de dos operadores que se sabe que difieren mucho en su rendimiento. En lugar de seleccionar al azar una
muestra de su salida combinada, una muestra aleatoria se selecciona entre la salida de cada operador. De esta manera, tanto los
operadores estén debidamente representados, sowe puede determinewhether hay signi fi diferencias signifi entre ellos. Otro
acuerdo applicationmay con la estimación del tiempo medio de respuesta de los servicios de emergencia, como ambulancias en
una ciudad. Teniendo en cuenta el tráfico fi densidad c partes indiferentes de la ciudad, locationof los centros de ambulancia, y / o
hospitales locationof, se couldbemeaningful a dividir la ciudad en ciertos segmentos o estratos. Entonces, las muestras aleatorias
podrían elegirse de cada estrato para el propósito de estimación. Por lo tanto, una estratos fi muestra aleatoria ed se obtiene
mediante la separación de los elementos de la población en grupos distintos que no se superponen (llamado Estratos)

y luego seleccionando una muestra aleatoria simple de cada estrato.


Cuando la varianza de las observaciones en un estrato es menor que la varianza total de la población, estratificación fi muestreo
ed puede producir una varianza del estimador que es más pequeña que la que se encuentra froma sencilla randomsample del mismo
tamaño. Otra ventaja de la estratificación fi muestreo ed es que el costo de couldbe collectingdata reduce. Throughproper selecciónde
estratos de tal manera que elementswithin un stratumare homogénea, muestras más pequeñas couldbe seleccionados de estratos
donde los costos unitarios de muestreo son más altos. Por último, a través de la estratificación fi muestreo ed, es posible obtener
estimaciones de los parámetros para cada estrato, que es de importancia en las poblaciones neos heteroge.

Consideramos un esquema común de asignación proporcional donde el tamaño de la muestra se somete a reparto entre los
estratos en la misma proporción que el tamaño de los estratos de la población. Dejar norte yo, i = 1, 2,. . ., k, representar el tamaño de la k estratos
en la población de tamaño NORTE, dónde
k
norte ?? norte yo. Si el tamaño de la muestra está representada por norte, el tamaño de cada estrato utilizando
yo ?? 1

asignación proporcional está dada por

norte yo
norte yo ?? norte; yo ?? 1; 2; . . .; k ?? 5-13 ??
norte

Las estimaciones de la media y la varianza de cada estrato son

norte yo

X ij j ??
1
X yo ?? norte yo
?? 5-14 ??
norte yo
2
?? X ij � X yo ??

j ?? 1 2
s yo
?? ; yo ?? 1; 2; . . .; k
norte yo 1

Además, la estimación de la media poblacional y la varianza del estimador, para una estratificación fi ed muestra
proporcional, están dadas por

1k
� X S t ?? norte yo � X yo
norte yo ?? 1
?? 5-15 ??
k 2
1 norte yo norte yo s yo
var ?? � X S t ?? ?? norte 2 ; yo ?? 1; 2; . . .; k
yo
norte 2 norte yo norte yo
yo ?? 1
260 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

Muestra de conglomerados En el caso de que un marco de muestreo no está disponible o si la obtención de muestras

de todos los segmentos de la población no es factible por razones geográficas, una muestra de conglomerados

puede ser usado. Aquí, la población es fi primero divididos en grupos de elementos, o clusters. Clusters son seleccionados al azar, y se

obtiene un censo de datos (es decir, todos los elementos dentro de los grupos seleccionados se examinan). Si una empresa tiene

plantas en todo el sureste de Estados Unidos, puede que no sea factible muestra de cada planta. Los clusters son continuación de fi Ned

(por ejemplo, uno para cada planta), y algunos de los grupos son entonces elegido al azar (por ejemplo, tres de las fi cinco grupos). Se

obtiene entonces un censo de datos para cada grupo seleccionado. El muestreo por conglomerados es menos costosa, con respecto a

una simple o estratificación fi ed randomsampling, si el coste de la obtención de un framewith un listado de todos los elementos de la

población es alta. Además, si el coste de obtener observaciones aumenta con la distancia que separa los elementos (es decir, costos de

viaje), samplingmay ser preferible clúster.

El error de muestreo puede ser reducida por la elección de muchos pequeños grupos en lugar de unos pocos grupos grandes, sincewe

reducir la probabilidad de exclusión de ciertos grupos de elementos. Dejar METRO y metro

denotar el número de grupos en la población y el número de grupos en la muestra, respectivamente, con norte yo que
representa el tamaño de la yo º clúster. Dejar t yo representar el total de las mediciones en clúster yo, ( es decir, t yo ??

j X ij). La estimación de la media poblacional y la


varianza del estimador, utilizando muestreo de conglomerados, está dada por

metro

t yo

� X cl ?? yo ?? 1
metro

norte yo
yo ?? 1
?? 5-16 ??
metro
2
?? t yo � X cl norte yo ??
m m yo ?? 1
var ?? � X cl ?? ?? MMN � 2
metro 1

metro
dónde � norte ??
1 norte i =
yo ?? metro.

Determinación de la muestra Tamaño

El tamaño de la muestra tiene un impacto directo sobre la confiabilidad de la información proporcionada por los datos. Cuanto mayor sea el

tamaño de la muestra, themore valiosa los datos. Por lo general es de interés para conocer el tamaño mínimo de la muestra que se puede

utilizar para estimar un producto desconocido o de parámetros de proceso con precisión bajo ciertas niveles aceptables de tolerancia. Aquí,

nos centramos en muestras aleatorias simples.

Límite en el error de estimación y Asociadas Con fi Nivel de confianza

La estimación de la media poblacional Supongamos que la media de una característica del producto o proceso es de interés (por
ejemplo, el tiempo medio para procesar una transacción en una comercialización

fi rm). Hay una (1 α) probabilidad de que la diferencia entre el valor estimado y el valor real no será superior a un
número SEGUNDO. Figura 5-17 muestra el principio detrás de la selección de un tamaño de muestra adecuado
para estimar el populationmean. La cantidad
SEGUNDO, a veces referido como el error tolerable unido, es dado por

σ
segundo ?? z α = 2 σ � X ?? z α = 2 pag ?? 5-17 ??
norte
CONCEPTOS En el muestreo 261

FIGURA 5-17 la determinación del tamaño de la muestra para la estimación de la media de la población μ.

o
2σ2
z
α =2 2
norte
?? 5-18 ??
??
segundo

Ejemplo 5-15 Un analista desea estimar el tamaño medio de diámetro de un gran casting. Basado
en datos históricos, se estima que la desviación estándar del tamaño del agujero es de 4,2 mm. Si se desea estimar con
una probabilidad de 0.95 el tamaño medio de taladro dentro de 0,8 mm, nd la fi
tamaño de la muestra apropiada.

Solución Tenemos ^ = 4.2, B = 0,8, y z 0,025 = 1.96. Así,


σ

?? 1:96 ?? 2 ?? 4: 2 ?? 2
tamaño de la muestra norte ?? ?? 105: 88 '106
?? 0: 8 ?? 2

La estimación de la proporción de la población Considere una población binomial donde el objetivo es estimar la
proporción de “ éxitos ”( pag). Los ejemplos pueden incluir la estimación de la proporción de piezas estampadas no
conformes en una tienda de prensa o la proporción de insatisfecha fi ed clientes en un restaurante. Aquí, de nuevo, hay que
seleccionar un error tolerable límite segundo de tal manera que esa estimación tendrá una probabilidad de (1 α) de estar
dentro de segundo unidades de valor del parámetro. Utilizamos el concepto de la distribución muestral de los éxitos
sampleproportionof (
^ pag), que es approximatelynormal para tamaños.El largesample
ecuación para determinar el tamaño de la muestra norte es dado por

pag ?? 1 pag ??
segundo ?? z α = pag
^2 σ ?? z α = 2 ?? 5-19 ??
norte

o
2
zp ?? 1 pag ??
norte ?? α = 2 ?? 5-20 ??
segundo 2
262 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

Dado que el valor verdadero del parámetro pag No se sabe, hay un par de ofways inwhich eq. (5-20) puede bemodi fi ed. En primer lugar, si una

estimación histórica de pag está disponible (por ejemplo, ^ pag), se puede utilizar en lugar de

pag. En segundo lugar, si la información está disponible noprior, una estimación conservadora de norte Canbe secalculará usando p = 0.5.

Utilizando p = 0.5 maximiza el valor de pag( 1 pag) y por lo tanto produce una estimación conserva tiva.

Ejemplo 5-16 En la producción de tubos de goma, el stock de tubo fi primero tiene que ser cortado en una pieza de un especí fi longitud
ed. Esta pieza se forma luego en una forma circular y se unió mediante presión y la temperatura correcta. La formación del
operador y tales parámetros del proceso como ture tempera, presión, y morir tamaño en Florida influir en la producción de conformar
tubes.Wewant para estimar con una probabilidad de 0,90 la proporción de tubos no conformes a dentro del 4%. ¿Qué tan grande
una muestra debe ser elegido si no hay información previa está disponible en el proceso?

Solución Usando la notación anterior, B = 0.04. Del Apéndice A-3, z 0,05 = 1.645.
Dado que no hay información sobre pag, la proporción de los tubos no conformes, está disponible, el uso p = 0.5. Por lo tanto,

?? 1: 645 ?? 2 ?? 0: 5 ???? 0: 5 ??
norte ?? ?? 422: 8 '423
?? 0:04 ?? 2

Si una estimación previa de pag había estado disponible, habría reducido el tamaño de la muestra requerida.

La estimación de la diferencia de dos medias poblacionales

Supongamos que nuestro interés es estimar la diferencia en el tiempo de finalización del proyecto themean en una consultoría fi rm
antes ( μ 1) y después ( μ 2) algunos cambios de mejora de procesos. El estimador es la diferencia en las medias de la muestra, � X 1 � X 2.
Tenemos

σ2
1 ?? 2
σ2
segundo ?? z α = 2 norte 1
norte 2

dónde σ 2 y σ1 2 representan
2
las varianzas poblacionales, respectivamente, antes y después de los cambios,

y norte 1 y norte 2 representar el correspondingsample sizes.Under los tamaños assumptionof igual de muestra ( norte 1 = norte 2 = norte), tenemos

z 2 ?? σ 2 ?? σ 2 ?? 2
α=21
norte ?? ?? 5-21 ??
segundo 2

La estimación de la diferencia de dos proporciones poblacionales

Acompanywishes para estimar la diferencia en la proporción de satis fi clientes ed entre sus dos rama de fi ces. Si la
proporción de éxitos en cada población se de fi ne como pag 1 y pag 2,
respectivamente, a continuación, para muestras grandes, tenemos

pag 1 ?? 1 pag 1 ?? pag 2 ?? 1 pag 2 ??


segundo ?? z α = 2 ??
norte 1 norte 2
CONCEPTOS En el muestreo 263

dónde norte 1 y norte 2 representar los tamaños de las muestras correspondientes de cada población. Bajo el supuesto de tamaños de muestra

iguales ( norte 1 = norte 2 = norte), tenemos

2
z ?? pag 1 ?? 1 pag 1 ?? ?? pag 2 ?? 1 pag 2 ????
norte ?? α = 2 ?? 5-22 ??
segundo 2

Cuando las estimaciones históricas de pag 1 y pag 2 están disponibles, esas estimaciones, ^ pag 1 y ^ pag 2, se utilizan en eq. (5-22).

Alternativamente, sin información previa, usando pag 1 = 0.5 y pag 2 = 0.5will proporcionar una estimación conservadora.

Controlar el error de tipo I, tipo II error, y Shift Asociado de parámetros

En la discusión anterior sobre el cálculo de los tamaños de muestra, estábamos interesados ​en el control de la cota de error ( SEGUNDO)
y el aire asociado fi nivel de confianza (1 α). Recordemos que en el contexto hypothesistesting, la tipo I error ( rechazar una nula de
que es cierto) está representado por α. Nowsuppose que también estamos interesados ​en el control de la probabilidad de una error
tipo II ( no rechazar la hipótesis nula cuando es falsa), β, asociado con un cambio ( δ) en el valor del parámetro. ¿Qué tan grande
puede elegir un samplemust tomeet estas condiciones tolerables? A veces, en lugar de β, la potencia de la prueba (1 β) puede ser
indicada.

Vamos a demostrar el concepto de derivación en el contexto de la estimación de la populationmean ( μ): decir, el tiempo de
entrega promedio de los paquetes por una empresa. Debido a un aumento previsto en el volumen, nos gustaría para determinar
si el tiempo de entrega promedio supera un valor hipotético ( μ 0). Si la media se incrementa en una cantidad δ, nos gustaría para
detectar este tipo con una potencia dada por (1 β). Las hipótesis siendo probados son: H 0: μ μ 0; H una: μ> μ 0. El valor crítico y el tipo I
asociado y los errores II, teniendo en cuenta la distribución de muestreo de X cuando σ se conoce, se muestran en la figura
5-18.

Uso de la distribución bajo H 0, cuando μ = μ 0, el valor crítico (CV) se obtiene como

σ
CV ?? μ 0 ?? z 1 α pag ?? 5-23 ??
norte

FIGURA 5-18 distribución de muestreo de X debajo H 0 y H a.


264 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

dónde z 1 α es la (1 α) ésimo cuantil de la distribución normal estándar. Debajo H una, cuando


μ = μ 1 = μ 0 + δ, el valor crítico viene dada por

σ
CV ?? μ 1 z 1 β pag ?? 5-24 ??
norte

Igualando las ecuaciones. (5-23) y (5-24), se obtiene el tamaño de la muestra como

?? z 1 α ?? z 1 β ?? 2 σ 2
norte ?? ?? 5-25 ??
δ2

Cuando tenemos una hipótesis de dos colas de ensayo del tipo H 0: μ = μ 0 versus H una: μ 6 ?? μ 0, un slightmodi fi eq cationof. (5-23)
es necesario. En este caso, la región de rechazo es onboth colas de la distribución nula, con la zona en cada cola siendo α / 2. Por
lo tanto, en el cálculo del tamaño de la muestra necesario, reemplace z 1 α con z 1 α / 2 en eq. (5-25).

Un enfoque similar puede llevarse a cabo para determinar el tamaño de la muestra cuando el parámetro de interés es
la diferencia en las medias de dos poblaciones, la proporción de éxitos en una población bino mial, o diferencia en la
proporción de éxitos de dos poblaciones binomiales.
Minitab tiene una característica atractiva en la determinación del tamaño de la muestra bajo una variedad de situaciones de
pruebas de parámetros en su Potencia y tamaño de la muestra opción. La información se introduce en el nivel dado del error tipo I
( α), especí fi cación de la forma de H una ( no es igual a, menor que, o mayor que), y una estimación de la desviación estándar de la
población ( σ). Minitab continuación, emite el tamaño de la muestra, el poder, o el grado de diferencia que se desea detectar ( δ) cuando
dos de las tres cantidades son especí fi ed.

Ejemplo 5-17 Una empresa está interesada en determinar si una campaña de publicidad del producto que se ha
utilizado en una región geográfica ha tenido un impacto positivo. Se desea detectar un aumento en las ventas
promedio por cliente de $ 50 con una probabilidad de
0.98. El nivel tolerable de un error de tipo I es 0,05. Suponiendo que la estimación de la desviación estándar de ventas
por cliente es de $ 70, tanto en la región donde se utilizó la campaña y en otros lugares, lo grande que una muestra debe
ser elegido de cada región? Asumir tamaños de muestra iguales.

Solución Las hipótesis son H 0: μ 1 μ 2 0; H una: μ 1 μ 2> 0, donde μ 1 y μ 2 representan las ventas promedio por cliente en el
regionwhere los campaignwas publicitarios utilizados y no utilizados, respectively.Also, σ ^ 1 ?? σ ^ 2 ?? 70, con α = 0,05 andpower
= 0.98when δ ( diferencia inmean ventas) = ​50. El uso de Minitab, haga clic en Stat> Potencia y tamaño de la muestra> 2-
Sample t. Debajo
Diferencia, de entrada 50; debajo Los valores de potencia, de entrada 0,98; debajo desviación estándar, 70. Haga clic en la entrada Opciones. por

Hipótesis alternativa, seleccionar mayor que y de entrada signi fi nivel de signi como 0,05. Hacer clic DE ACUERDO. La salida fromMinitab

indica que el tamaño de la muestra para cada grupo debe ser 55.

RESUMEN

En este capítulo presentamos algunas herramientas analíticas y gráficas para describir las poblaciones y hacer inferencias sobre sus
parámetros. Usando valores observados de la característica de calidad, las parcelas de distribución empíricos tales como histogramas
de frecuencia, tramas de tallo y hoja, y diagramas de caja son métodos para mostrar características de distribución. Tales gráficos
indican la ubicación y la forma
TÉRMINOS CLAVE 265

de la distribución empírica, si están sesgados, y el grado de variabilidad. También pueden ser utilizados para identificar los
valores atípicos.
Una prueba para indicar la aleatoriedad de una secuencia de observaciones, por lo general en el tiempo, se discute a través
de un gráfico de ejecución. Dado que muchas pruebas paramétricas requieren supuestos sobre la distribución de la
característica de calidad, típicamente normalidad, se presentan métodos para probar estas suposiciones. Para justificar el uso de
ciertos procedimientos de inferencia estadística cuando la distribución de la característica es no normales ciertas
transformaciones, que son útiles en el logro de la normalidad se exhiben. Se discute la utilización de transformaciones de
energía y una familia de transformaciones conocidas como la familia Johnson.

Inmany análisis de mejora de la calidad, los datos que no son collectedmay ser cuantitativos. Por ejemplo, en las encuestas de consumo,

producto preferencemay puede observar en términos de datos de frecuencia o de recuento. ordinales de calificación también scalesmay ser

utilizado para los datos de la encuesta. El uso de gráficos de barras apiladas como se presenta una visualización formade. diagramas de

comportamiento también podría ser utilizado para visualizar el rendimiento de un elemento seleccionado durante un período de tiempo.

Determinar el grado de asociación entre dos variables categóricas, según el índice de satisfacción y la importancia de calificación, también se

discute. Se presenta una metodología, utilizando dicha información, para la gestión para seleccionar plans.Methods estratégicos y operativos

de análisis de datos de recuento son alsopresented.When clasificación fi cationof las observaciones es a través de dos o más variables

categóricas, análisis de tabla de contingencia se utiliza para probar la independencia de la clasificación fi las variables de cationes.

Una cuestión importante en el análisis de producto / proceso consiste en determinar cómo se va a realizar el procedimiento de
muestreo. En este contexto, los métodos tales como muestreo aleatorio simple, estratificación fi muestreo ed, y de muestreo por
conglomerados se abordan. Una cuestión de seguimiento es el tamaño de la muestra para seleccionar, en base a ciertos niveles
tolerables de riesgo. Para el caso de muestras aleatorias simples, expresiones arederived para el tamaño apropiado de la muestra
invarious contextos inferencial. Así, el capítulo proporciona una buena exposición a la cantidad de datos se deben recoger, cómo
recolectar, y cómo analizar para hacer inferencias sobre las características del producto y del proceso.

TÉRMINOS CLAVE

Anderson - prueba de darling distribución


medidas de asociación histograma
diagrama de cajas rango intercuartil
mellado curtosis
prueba de chi-cuadrado escala Likert
clustering contingencia significa cuadrado
tablas de contingencia misspeci fi catión
los datos de conteo patrón de mezcla
Cramer ' s V experimento multinomial
función de distribución acumulativa la falta de respuesta

empírico gráfico de probabilidad normal

teórico atípico
oscilación
distribución
pag- valor
empírico
poder
cota de error
precisión
gráfico de probabilidad exponencial
trazado probabilidad
frecuencia
266 ANÁLISIS DE DATOS Y TOMA DE MUESTRAS

asignación proporcional cuadro


relación cuantil unidad

cuartilla tamaño de la muestra

variación aleatoria determinación de


escala de valoración oblicuidad
importancia de calificación gráfico de barras apiladas

índice de satisfacción análisis de datos de encuestas

diagrama de tallo y hojas


tabla de ejecutar
longitud de la cola
muestra
tendencia
racimo
transformaciones
aleatorio simple
Johnson
estratos fi ed azar
poder
muestreo
Error de tipo I
diseños
error de tipo II
distribución
bigote
errores en los

elementos

CEREMONIAS

Preguntas de discusión

5-1 explicar algunas especi fi pruebas c paramétricos que requieren el supuesto de distribución de
normalidad. ¿Qué se hace si el supuesto de que no se satisface fi ed?

5-2 Un condado desea estimar el ingreso promedio de las personas, donde se sabe que
los niveles de ingresos varían debe utilizar un poco entre los residentes en las secciones del tipo county.What del
esquema de muestreo?

5-3 Los datos de una encuesta de los clientes están en una escala ordinal (1 - 7) con respecto a la satisfacción con los servicios
prestados en un banco de tres escrutadores. Si se desea determinar si el grado de satisfacción del cliente es
independiente de la caja, lo que prueba estadística se debe usar?

Un 5-4 fi institución financiera está contemplando la oferta de tres diferentes tipos de ahorro
cuentas. Se selecciona al azar a 100 clientes y obtiene una respuesta enla que cuenta cada persona
seleccionaría. Lo que prueba estadística usaría para determinar si los clientes tienen una preferencia por
cualquier cuenta?

5-5 explicar la relación entre un error de tipo I, la energía, el grado de diferencia que uno
deseos de detectar en un valor de parámetro, y el tamaño de la muestra. ¿Cómo se puede reducir un error de tipo I y se
aumentará la potencia para una diferencia dada en el parámetro?

5-6 Explicar tipo I y tipo II errores en el contexto de la toma de muestras de los clientes '
cuentas para identificar los errores de facturación en una gran tienda al por menor. ¿Cuáles son los costos asociados de estos dos

tipos de errores?

5-7 AFAST-comida del restaurante en una zona urbana experimenta un mayor tráfico fi tasa c durante la temprana

mañana y el almuerzo horas. Con el fin de realizar una encuesta de satisfacción del cliente, analizar posibles procedimientos

de muestreo.

5-8 Explicar por qué es importante para obtener retroalimentación de los clientes tanto en la percepción
la satisfacción y la importancia de la especificidad fi elementos de la encuesta ed.

También podría gustarte