Está en la página 1de 120

Estadstica

Jos M. Lavn

Intervalos de Confianza

INTERVALOS DE CONFIANZA PARA LA MEDIA


En el contexto de estimar un parmetro poblacional, un intervalo de
confianza es un rango de valores (calculado en una muestra) en el cual se
encuentra el verdadero valor del parmetro, con una probabilidad
determinada.
La probabilidad de que el verdadero valor del parmetro se encuentre en
el intervalo construido se denomina nivel de confianza, y se denota 1- .
La probabilidad de equivocarnos se llama nivel de significancia y se
simboliza .
Generalmente se construyen intervalos con confianza 1- =95% (o
significancia =5%).

INTERVALOS DE CONFIANZA PARA LA MEDIA


Generalmente, cuando se quiere construir un intervalo de confianza para la media
poblacional , la varianza poblacional es desconocida, as que reemplazamos la
desviacin estndar poblacional por la desviacin estndar muestral s, el intervalo de
confianza toma la forma:

La cual es una buena aproximacin para el intervalo de confianza de 95% para con 2
desconocido. Esta aproximacin es mejor en la medida que el tamao muestral sea
grande.
Cuando el tamao muestral es pequeo, el intervalo de confianza requiere utilizar la
distribucin t de Student (con n-1 grados de libertad, siendo n el tamao de la
muestra), en vez de la distribucin normal (por ejemplo, para un intervalo de 95% de
confianza, los lmites del intervalo ya no sern construidos usando el valor 1,96).

INTERVALOS DE CONFIANZA PARA LA MEDIA


Ejemplo:
Los siguientes datos son los puntajes
obtenidos para 45 personas de una escala
de depresin (mayor puntaje significa
mayor depresin).
Para construir un intervalo de confianza, asumamos que los datos tienen distribucin
normal, con varianza poblacional desconocida.
Como es desconocida, lo estimamos por s2 =18,7. Luego, un intervalo de confianza
aproximado es:

Luego, el intervalo de confianza para es (13,2 , 15,8). Es decir, el puntaje promedio


poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.

INTERVALOS DE CONFIANZA PARA LA MEDIA


Ejercicio:
La lectura de una muestra aleatoria de 50 estudiantes mostraron una media de 174.5
cm y una desviacin estndar de 6.9 cm.
Determine un intervalo de confianza del 98% para la altura promedio de todos los
estudiantes.

INTERVALOS DE CONFIANZA PARA LA MEDIA

CONCEPTOS GENERALES DE CONTRASTE


Una hiptesis estadstica es una afirmacin que se hace acerca de una o
varias caractersticas de una poblacin.
Las caractersticas pueden ser los parmetros de una distribucin de
probabilidad predeterminada, seleccionada para la poblacin.
En este caso hablaremos de hiptesis paramtricas. En algunas
situaciones las caractersticas a estudiar no son parmetros de una
distribucin concreta y decimos que las hiptesis son no paramtricas
Un contraste de hiptesis es un procedimiento para decidir si una
hiptesis se acepta como vlida o se rechaza.

CONCEPTOS GENERALES DE CONTRASTE


Dos son las hiptesis que generalmente se contrastan, la que denominamos
hiptesis nula (H0) que es la hiptesis en la que se basa el procedimiento de
contraste, y la que denominamos hiptesis alternativa (Ha) que es la hiptesis que
se acepta cuando se rechaza la nula y viceversa.
Obviamente, la nica forma de estar seguros de cual es la hiptesis correcta sera
investigar toda la poblacin, cosa que no es posible ya que, en general, estamos
trabajando con poblaciones infinitas.

CONCEPTOS GENERALES DE CONTRASTE


Como disponemos de la informacin limitada que nos proporciona la muestra
podemos realizar decisiones errneas. Dos son los tipos de errores que podemos
cometer:
Error de tipo I: Rechazar H0 cuando es verdadera.
Error de tipo II: Aceptar H0 cuando es falsa.
A la probabilidad de cometer un error de tipo I la denominaremos nivel de
significacin y la denotaremos con .
A la probabilidad de cometer un error de tipo II la denotaremos con a su
complemento 1- lo denominamos potencia del contraste, y se define como la
probabilidad de rechazar cuando es falsa.

CONCEPTOS GENERALES DE CONTRASTE


Determinar las hiptesis nula y alternativa, traduciendo hiptesis bsicas
de trabajo en hiptesis acerca de parmetros (o caractersticas) de una
distribucin de probabilidad asignada a la poblacin.
Fijar un nivel de significacin: Generalmente el 0.05 (5%) y 0.01 (1%).
Determinar cual es el estadgrafo de contraste y su distribucin muestral.
Determinar la regin crtica y la regin de aceptacin.
Seleccionar una muestra y calcular el valor experimental del estadgrafo de
contraste.
Tomar la decisin estadstica de acuerdo con el valor experimental
obtenido.

CONTRASTE PARA LA MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA CONOCIDA
Supongamos que pertenecemos al consejo regulador de la denominacin
de origen de los vinos de Ribera de Duero. Sabemos que los vinos jvenes
de aos anteriores tienen un grado alcohlico medio de 12.5 grados, tal y
como aparece en la etiqueta.
Para el ao actual, el consejo, ha decidido cambiar algunos de los pasos
del proceso de fabricacin. El primer problema que se plantea es: Se ha
modificado el grado alcohlico al modificar el proceso de fabricacin?
El paso siguiente consiste en suponer un modelo de comportamiento
terico para la poblacin (a priori). Suponemos que la variable que
estamos midiendo en la poblacin a estudiar sigue una distribucin
normal.

CONTRASTE PARA LA MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA CONOCIDA

Junto con la hiptesis nula planteamos la que denominamos hiptesis alternativa (Ha o
H1) que ser aceptada cuando se rechace la nula y viceversa. Por el momento tomaremos
la ms sencilla, la hiptesis de que la media es diferente de 12 que resultar en un
contraste bilateral.

Supongamos que la muestra ha sido seleccionada al azar de la poblacin y que se han


obtenido los resultados siguientes

CONTRASTE PARA LA MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA CONOCIDA

Trabajaremos con la media muestral como estimador de la media poblacional


desconocida. En el ejemplo la media muestral es de 12,529, que como ya
sabemos no coincide con la media poblacional.
Intuitivamente, aceptaremos la hiptesis nula cuando la media muestral sea
prxima a 0 y la rechazaremos (aceptando la alternativa) cuando la media
muestral sea muy diferente de 0, es decir, utilizamos la media muestral como
estadstico, o estadgrafo, de contraste.
Nos queda por determinar cul es el criterio para decidir si la media muestral
est prxima o no al valor terico propuesto utilizando el concepto de riesgo
tipo I definido previamente. Fijamos el riesgo en 0.05.
Supondremos una varianza conocida. Para este caso, ser 0,52

CONTRASTE PARA LA MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA CONOCIDA

CONTRASTE PARA LA MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA CONOCIDA
Una vez que hemos determinado la forma general del contraste pasamos a
aplicarlo a los datos del problema inicial que nos ocupa.

CONTRASTE PARA LA MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA CONOCIDA

Una vez que hemos tomado la decisin final, no sabemos si es correcta o


no, simplemente esperamos que sea del 95% de las muestras en las que
aceptamos la hiptesis correctamente.
Si aceptamos la hiptesis nula no quiere decir que sea cierta y el grado
medio sea exactamente de 12.5 grados (probablemente no lo es), sera
ms correcto interpretar que, con la informacin de la que disponemos
no hemos encontrado evidencia suficiente de que la media sea distinta
de 12.5.

CONTRASTE PARA LA MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA CONOCIDA
Los contrastes unilaterales
En algunas situaciones concretas no estamos interesados en todos los posibles
valores de la hiptesis alternativa propuesta en un contraste bilateral.
Supongamos, por ejemplo, que en el caso prctico anterior sospechamos a priori
que la modificacin en el procedimiento de fabricacin produce un incremento
en el contenido alcohlico. En este caso sera conveniente modificar la hiptesis
alternativa.
El procedimiento de contraste es muy similar al anterior y se muestra en el
cuadro siguiente.

CONTRASTE PARA LA MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA CONOCIDA

CONTRASTE PARA LA MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA CONOCIDA

CONTRASTE DE MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA DESCONOCIDA

En la mayor parte de las aplicaciones prcticas la varianza de la


distribucin es tambin desconocida y ha de ser estimada a partir de los
datos.
El problema es que ya no es posible seguir utilizando la distribucin
normal para el procedimiento de contraste.
El procedimiento de contraste en este caso es anlogo al anterior pero
sustituyendo la distribucin normal por la distribucin t.
Lo utilizaremos para muestras pequeas

CONTRASTE DE MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA DESCONOCIDA

CONTRASTE DE MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA DESCONOCIDA

En la prctica, la sustitucin de la distribucin normal por la


distribucin t de Student implica un aumento de la dispersin por lo
que es ms difcil detectar diferencias. Utilizaremos las correcciones
de Gosset a la Tabla Normal.
Para el ejemplo del grado alcohlico de los vinos de la
denominacin de origen de Ribera de Duero los resultados del
contraste bilateral se muestran:

CONTRASTE DE MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA DESCONOCIDA

CONTRASTE DE MEDIA DE UNA


POBLACIN NORMAL CON VARIANZA DESCONOCIDA
Pero el problema es que no podemos trabajar con t de Student con muestras
grandes, as que debemos volver a estimar la media a travs de la Normal

DIFERENCIA DE MEDIAS DE DOS POBLACIONES


NORMALES CON DATOS INDEPENDIENTES
Pongmonos en el mismo supuesto que en el ejemplo que sirvi para
ilustrar el contraste para una poblacin, y supongamos que lo que
deseamos es conocer si los vinos de nuestra denominacin de origen
tienen el mismo contenido alcohlico que los de otra denominacin de
origen, por ejemplo la de Toro.
Formulamos a continuacin las hiptesis de trabajo en trminos de los
parmetros de los modelos. Las hiptesis nula y alternativa son ahora:

Vemos como el contraste de que las medias son iguales es equivalente al


contraste de que la diferencia de medias vale 0.

DIFERENCIA DE MEDIAS DE DOS POBLACIONES


NORMALES CON DATOS INDEPENDIENTES

Supongamos que los datos obtenidos son:

Supongamos, para simplificar que las desviaciones tpicas son conocidas, por
ejemplo 1 = 0.5 y 2 = 0.6 para las denominaciones de Ribera de Duero y Toro
respectivamente.
Desarrollaremos el procedimiento general para despus aplicarlo a los datos de
los que disponemos.

DIFERENCIA DE MEDIAS DE DOS POBLACIONES


NORMALES CON DATOS INDEPENDIENTES

DIFERENCIA DE MEDIAS DE DOS POBLACIONES


NORMALES CON DATOS INDEPENDIENTES

DIFERENCIA DE MEDIAS DE DOS POBLACIONES


NORMALES CON DATOS INDEPENDIENTES

DIFERENCIA DE MEDIAS DE DOS POBLACIONES


NORMALES CON DATOS INDEPENDIENTES
Para el caso de varianzas desconocidas pero IGUALES:

DIFERENCIA DE MEDIAS DE DOS POBLACIONES


NORMALES CON DATOS INDEPENDIENTES
Lo que da en nuestro ejemplo:

DIFERENCIA DE MEDIAS DE DOS POBLACIONES


NORMALES CON DATOS INDEPENDIENTES

De nuevo, si tenemos muestras GRANDES, sustituiremos las tablas de


Student por las de la normal.
Para el caso de varianzas desconocidas pero DESIGUALES utilizamos la
aproximacin de Welch.
No la incluiremos por razones de tiempo pero es muy similar a las
anteriores.

CONTRASTE PARA LA DIFERENCIA DE


MEDIAS DE DOS POBLACIONES NORMALES
CON DATOS LIGADOS

En el caso de datos independientes, se dispone de dos conjuntos


distintos de individuos para cada una de las situaciones
experimentales que se quiere compara.
Una forma de controlar la variabilidad debida a los propios sujetos
consiste en aplicar todos los tratamientos en estudio a todos los
individuos de la muestra en dos ocasiones diferentes.
A este tipo de datos lo denominaremos datos apareados,
relacionados, o ligados y consisten en dos mediadas tomadas sobre el
mismo conjunto de individuos en dos ocasiones diferentes.

CONTRASTE PARA LA DIFERENCIA DE


MEDIAS DE DOS POBLACIONES NORMALES
CON DATOS LIGADOS

Supongamos que deseamos saber si la presin sistlica de


personas alcohlicas se modifica cuando dejan el hbito de
beber, para ello se toma una muestra de 10 personas que
ingresan en el hospital para tratar su alcoholismo y se toma una
medida de la presin sistlica antes y despus de dos meses de
haber dejado de beber.
El experimento fue diseado de esta manera ya que aunque se
espera una reduccin en la presin sangunea, esta depende del
valor inicial en cada individuo.

CONTRASTE PARA LA DIFERENCIA DE


MEDIAS DE DOS POBLACIONES NORMALES
CON DATOS LIGADOS

Los resultados obtenidos para la presin sistlica mediada en


milmetros de mercurio fueron los siguientes:

Como las variables estn relacionadas, todos los clculos que


realizamos en el caso de datos independientes ya no son vlidos.
Para evitar este problema nos centraremos en una sola variable
aleatoria que es la diferencia entre los dos valores obtenidos para
cada uno de los individuos estudiados que mide el efecto del
tratamiento aplicado.

CONTRASTE PARA LA DIFERENCIA DE


MEDIAS DE DOS POBLACIONES NORMALES
CON DATOS LIGADOS

Tenemos ahora una nueva variable D que suponemos que tiene una
distribucin normal de media d desviacin tpica d.
La hiptesis de inters es ahora que, en promedio, el tratamiento
aplicado a los individuos es 0, es decir, d = 0. El contraste es ahora
exactamente igual que el descrito para la media de una poblacin
normal (ahora la poblacin de las diferencias.
Describimos a continuacin el contraste para muestras pequeas y
varianza desconocida para datos apareados. Llamaremos d, a la media
muestral de las diferencias y S d a la cuasi desviacin pica.

CONTRASTE PARA LA DIFERENCIA DE


MEDIAS DE DOS POBLACIONES NORMALES
CON DATOS LIGADOS

CONTRASTE PARA LA DIFERENCIA DE


MEDIAS DE DOS POBLACIONES NORMALES
CON DATOS LIGADOS
El resto de los contrastes se construye de la misma manera que en el caso
de una sola poblacin.

PROPORCIONES: ESTIMACIN Y CONTRASTE DE HIPTESIS


Una vez vistas algunas estimaciones sobre la media,
pasaremos a estudiar los contrastes sobre proporciones.
Comenzaremos recordando conceptos ya vistos como Tamao
de muestra e Intervalos de Confianza

PROPORCIONES: ESTIMACIN Y CONTRASTE DE HIPTESIS


Tamao de muestra

PROPORCIONES: ESTIMACIN Y CONTRASTE DE HIPTESIS


Intervalo de confianza para proporciones

PROPORCIONES: ESTIMACIN Y CONTRASTE DE HIPTESIS


Intervalo de confianza para proporciones

PROPORCIONES: ESTIMACIN Y CONTRASTE DE HIPTESIS

Contraste de
hiptesis para
proporciones
Ejemplo de
unilateral

PROPORCIONES: ESTIMACIN Y CONTRASTE DE HIPTESIS

Contraste de
hiptesis para
proporciones
Se plantea de
modo similar al
contraste de
medias, utilizando
la proporcin a
contrastar como
hacamos con la
media muestral.
Aqu tenemos una
bilateral

EJERCICIOS (1)
Se comparan dos tipos de rosca de tornillo para ver su resistencia a la
tensin. Se prueban 50 piezas de cada tipo de cuerda bajo condiciones
similares, la marca A tuvo una resistencia promedio a la tensin de 78.3 Kg,
mientras que la marca B tuvo una resistencia promedio de 87.2 Kg.
Se sabe de antemano que las desviaciones poblacionales son de 6.5 Kg para
la marca A y 6.3 Kg para la B.
Determine el intervalo de confianza del 95% para la diferencia de las dos
medias poblacionales.

EJERCICIOS (2)
Una mquina produce piezas metlicas de forma cilndrica. Se toma una
muestra de piezas cuyos dimetros son: 1.01-0.97-1.03-1.04-0.99-0.98-0.991.01-1.03.
Encuentre un intervalo de confianza del 99% para el dimetro promedio de
piezas de esta mquina si se supone una distribucin aproximadamente
normal.

CONTROL DE CALIDAD
QUE ES UN PROCESO 6 SIGMA?

48

1) Introduccin a Calidad
Concepto de Control de Calidad:
"Tcnicas estadsticas para aumentar la calidad de los productos y
servicios que se consumen.
Generalmente estas tcnicas se han aplicado a procesos industriales,
pero pueden generalizarse a cualquier tipo de organizacin y dentro de
esta a todos sus mbitos.
Entendemos Calidad como: Propiedades deseables de un
determinado producto o servicio

49

1) Introduccin a Calidad
A partir de ah podemos ver que la Calidad puede tener diferentes enfoques:
- Fiabilidad
- Funcionalidad
- Duracin
- Esttica
- Imagen
-
No obstante con estos enfoques el analizar la calidad es un proceso muy complejo
(infinidad de variables)
Frente a ello, surge el enfoque moderno de calidad:
LA CALIDAD DE UN PROCESO ES INVERSAMENTE PROPORCIONAL A LA
VARIABILIDAD DEL MISMO
50

1) Introduccin a Calidad
Porqu la Calidad es tan importante?:
CALIDAD COMO OBJETIVO ES LA TOTAL SATISFACCION DEL CLIENTE
(CLIENTE
ES
TODO
AQUEL
QUE
COMPRA
NUESTROS
PRODUCTOS/SERVICIOS. PUDIENDO SER INTERNO O EXTERNO)
SATISFACCION ES LA PERCEPCION DEL CUMPLIMIENTO DE LOS
REQUISITOS DE FIABILIDAD, FUNCIONAMIENTO, PLAZOS Y COSTE DEL
PRODUCTO O SERVICIO.

51

1) Introduccin a Calidad
En 1988 Motorola alcanz el prestigioso premio americano a la excelencia Malcom
Baldrige National Quality Award.
Una de las bases fundamentales de su estrategia de calidad fue el Programa Seis
Sigma. Este programa lo dise y dirigi Bill Smith con el pleno apoyo del CEO Bob
Galvin.
El objetivo de este programa fue reducir la variacin de los procesos hasta alcanzar
una fraccin defectuosa media de 3.4 ppm (partes por milln, s ha ledo bien, 3.4
defectos por cada milln de oportunidades).

52

1) Introduccin a Calidad
Se define Seis Sigma como:
un proceso de negocio que permite a las empresas mejorar tremendamente su
cuenta de resultados mediante el diseo y seguimiento diario de las actividades
cotidianas de manera que se minimice el desperdicio a la vez que se maximiza la
satisfaccin del cliente.
Esta definicin liga la finalidad del beneficio financiero, propio de una organizacin
empresarial, con el medio para conseguirla (reduccin del desperdicio y aumento de
la satisfaccin del cliente).

53

1) Introduccin a Calidad
Si el proceso sigue una funcin de distribucin de probabilidad normal
(nuestra vieja amiga la campana de Gauss) y el intervalo de tolerancia
fuera igual a 12s (seis desviaciones tpicas a cada lado del valor
nominal), entonces la fraccin defectuosa de un proceso centrado
sera 0.002 ppm. En esta caso, se dira que el proceso tiene un nivel de
calidad 6s.
Si la amplitud fuera de cinco desviaciones tpicas, el nivel de calidad
sera de 5s, y as sucesivamente.

54

1) Introduccin a Calidad
Pero cunto significa el nivel sigma en trminos prcticos? Veamos algunos
ejemplos:

55

1) Introduccin a Calidad

56

1) Introduccin a Calidad

57

1) Introduccin a Calidad
CAUSAS DE VARIABILIDAD:
Parece razonable entonces estudiar cuales son esas causas de variabilidad. As
podemos distinguir entres dos tipos de causas de variabilidad:
- Causas no Asignables: Todo proceso de produccin es una v.a. y por lo tanto
tiene una variabilidad, resultado de la accin conjunta de muchos factores, por lo
que no se le puede asignar una causa nica. Esta variabilidad es aparentemente
estable y homogneaPor ejemplo: variabilidad del estado de nimo de un
operario en una cadena, precisin de mquinas,... En este caso es muy difcil
reducir los efectos..
- Causas Asignables: Provocan cambios o efectos previsibles. En este caso el
efecto sobre el producto es previsible y provoca una variabilidad grande. Por
ejemplo: avera de la mquina que impermeabiliza un determinado material,
materia prima defectuosa, etc. En este caso los defectos desaparecen al
desaparecer la causa
58

1) Introduccin a Calidad
PROCESO BAJO CONTROL:
El proceso estar bajo control cuando se han eliminado todas las causas
asignables, de forma que la variabilidad slo obedece a causas no asignables
(variabilidad estable y homognea). Cuando el proceso productivo est bajo
control, la variabilidad ser constante a lo largo del tiempo, producindose
entonces una tasa de defectuosos tambin constante a lo largo del tiempo.
Sin embargo la tasa de defectuosos se vuelve impredecible. Si hay alguna
causa asignable:
- Aumenta la variabilidad (ya no est controlada)
- Puede cambiar la media de errores observada anteriormente

59

1) Introduccin a Calidad
Luego para realizar control de calidad en un proceso debo:
1) Identificar aquellas variables clave en el proceso a analizar
2) Estudiar estas variables identificando causas asignables de variabilidad
3) Controlar el proceso analizando la variabilidad y observar que el proceso
est bajo control.
4) Analizar las causas no asignables con el fin de reducir la variabilidad del
proceso.

60

2) Capacidad de un proceso. Proceso 6


Sigma
Clave de 6 Sigma:
Se deja de actuar sobre los artculos defectuosos para pasar a actuar
sobre los procesos defectuosos (Jack Welch)
La sigma es una unidad de medida estadstica que mide la
capacidad del proceso.
La escala de sigma se correlaciona perfectamente con
caractersticas tales como defectos_por_unidad, partes_por_milln
defectuosas o probabilidad de error.

61

Un ejemplo
Cuando el proceso de formacin de una cadena de autoescuelas se
encuentra bajo control, el 15% de los alumnos aprueban el carnet en
menos de un ao, pero si el proceso se encuentra fuera de control,
La tasa de fracaso asciende al 30%.
La probabilidad de que el proceso se encuentre bajo control es 0.92.
Si se escoge aleatoriamente un alumno y ste resulta no aprobar en
el primer ao, cul es la probabilidad de que el proceso de
formacin se encuentre bajo control?

62

Un ejemplo

63

2) Capacidad de un proceso. Proceso 6 Sigma


Si la variable sobre la que se analiza la calidad se distribuye como una normal,
entonces:

capacidad del
proceso

2
3
4
5
6

defectos por milln


de oportunidades
308.538
66.807
6.210
233
3,4

PPM
PPM
PPM
PPM
PPM
64

2) Capacidad de un proceso. Proceso 6 Sigma


Hay dos factores clave para poder realizar el QC:
1) Comprobar que mi variable se distribuye de manera
Normal o en su defecto puedo aproximar.
2) La variabilidad permanece constante en todo el proceso, es decir,
NO EXISTEN CAUSAS ASIGNABLES.

65

2) Capacidad de un proceso. Proceso 6 Sigma


LIMITES DE TOLERANCIA:
Ms all de la capacidad del proceso habr unos valores lmites de mi
variable entre los cuales mi cliente aceptar el producto/servicio y
fuera de los cuales estos no sern aceptados, a esto los llamaremos
Lmites de Tolerancia. As tendremos dos lmites de tolerancia:
LTS: Lmite de Tolerancia Superior, mi cliente no aceptar el
producto/servicio si el valor est por encima
LTI: Lmite de Tolerancia Inferior, mi cliente no aceptar el
producto/servicio si el valor est por debajo

66

2) Capacidad de un proceso. Proceso 6 Sigma


LIMITES DE TOLERANCIA Y 6SIGMA:
Dados los lmites tolerancia que establece mi cliente
(arbitrariamente) y un proceso bajo control que se
caracteriza por una variabilidad 6 SIGMA. Podemos
comparar;

LTS-LTI
arbitrario

Vs

6
Caract. del
proceso
67

2) Capacidad de un proceso. Proceso 6 Sigma


INDICE DE TOLERANCIA Y 6SIGMA:
A partir de ambos valores podemos calcular el ndice de capacidad de un
proceso:

Pudiendo Resultar:
IC>1
IC1
IC<1

68

2) Capacidad de un proceso. Proceso 6 Sigma


INDICE DE TOLERANCIA Y 6 SIGMA:
IC<1, luego: LTS-LTI< 6

El proceso fabricar ms defectuosos cuanto menor sea su IC, si esto


se da en muchos casos el producto no satisfar las especificaciones
requeridas. Entonces habr que actuar sobre el proceso para intentar
bajar su variabilidad no asignable (cambios en el proceso de
produccin).

69

2) Capacidad de un proceso. Proceso 6 Sigma


INDICE DE TOLERANCIA Y 6 SIGMA:
IC1, luego: LTS-LTI 6

En este caso el proceso fabricar aproximadamente un 0,3% de


defectuosos. Depender de que sea lo que se produce para que este
valor sea aceptable (p.ej: no es igual ese IC en tornillera para muebles,
como en la produccin de frenos de Seat Ibiza).

70

2) Capacidad de un proceso. Proceso 6 Sigma


INDICE DE TOLERANCIA Y 6 SIGMA:
IC>1, luego: LTS-LTI > 6

En este caso el proceso es ptimo apenas produce


elementos defectuosos.

71

Ejercicios: Ejemplo
La capacidad del proceso para la correccin automatizada de exmenes tipo test
en una Universidad es de 4 segundos. As el tiempo medio para esta
correccin es de 200 segundos. La unidad de gestin acadmica considera
como aceptables aquellos que no se alejen de la media en ms/menos dos
segundos.
Calcular e interpretar el ndice de Capacidad
Qu porcentaje de trmites esperamos que sean defectuosos si el proceso
est bajo control?

72

2) Capacidad de un proceso. Proceso 6 Sigma


DETERMINACIN DE LA CAPACIDAD DE UN PROCESO:
Determinar la capacidad de un proceso, va a equivaler a determinar 6s o s , pero
para que dicha determinacin sea correcta ser necesario que existan condiciones
normales, es decir que el proceso est bajo control (no existen causas asignables).
Para determinar la capacidad de un proceso en primer lugar habr de tomar k
muestras, toda ellas de tamao igual, siendo tomadas las muestras a intervalos
regulares (cada 8 horas, cada da, cada mes,)

X1
S12 R1

X2
2
2

S R2

Xk
S k2 Rk
73

2) Capacidad de un proceso. Proceso 6 Sigma


DETERMINACIN DE LA CAPACIDAD DE UN PROCESO:
Adems sobre esta muestras calcularemos, la Gran media y la Gran
Varianza o el Gran Rango

1
X
n*k

i 1

j 1

X ij

n
1
s

( n * k ) 1 i 1
2

j 1

( X ij X ) 2

En principio las medias y las varianzas (o rangos) de cada muestra, habrn de


ser parejas entre si, s efectivamente el proceso est bajo control. Para
comprobarlo utilizaremos procedimientos grficos de control.

74

2) Capacidad de un proceso. Proceso 6 Sigma


CONTROL DE VARIABLES Y CONTROL DE ATRIBUTOS:
Segn sea la variable objeto de anlisis y para la cual quiero estudiar su
variabilidad, as ser el tipo de control (elementos que debamos vigilar), o de
grficos de control que se realizarn. As las variables que vamos a analizar
en este curso pueden ser:
- Cuantitativas Contnuas: Estudio de la variable como caracterstica medible:
Control de Variables
- Cualitativas: Se analiza si se da o no un determinado atributo (Proporcin
de elementos con atributo): Control por atributos
El control por variables ser ms preciso lento y caro, mientras que el control
por atributos ser ms rpido, barato, pero con prdida de informacin.

75

3) Control por Variables


GRFICOS DE CONTROL:
Para comprobar la estabilidad de mi variable, ya sea control por variables o control por
atributos, voy a dotarme de unas herramientas grficas que me permitan observar si mi
variable est bajo control.
A travs de estos grficos, voy a estudiar las caractersticas de calidad de mi
producto o servicio, que han sido observadas a partir de nuestras recogidas a lo
largo del tiempo. Estos grficos se van a componer de:
a) Lnea Central, que representa el valor medio de la medida de calidad,
cuando el proceso est bajo control
b) Dos lneas paralelas a la central elegidas de manera, que si el proceso
est bajo control, casi todas las observaciones estarn entre ambos
lmites
c) Los puntos observados en el tiempo, que los unir mediante una lnea
para observar la secuencia temporal

76

3) Control por Variables


EJEMPLO GRFICO DE CONTROL:

En principio, las observaciones estarn entre ambos lmites, en este caso el proceso estar bajo
control y no deber hacer nada. Si un punto se sale de los lmites, (o bien si aun estando
dentro de los lmites veo que existe algo no aleatorio en el grfico: comportamiento
sistemtico, cclico,...), lo interpretar como que el proceso est fuera de control (existen
causas asignables), por lo que tendr que investigar las causas y corregir el proceso

77

3) Control por Variables


GRFICOS DE CONTROL PARA VARIABLES:
En el caso de Control de variables cuantitativas, voy a necesitar dos grficos,
- GRAFICO DE MEDIAS: para comprobar que mi variable es homognea en media
- GRFICO DE DISPERSIN: Para estudiar si la variable permanece estable en cuanto a
su dispersin. Para analizar la dispersin podremos fijarnos:
- En la desviacin tpica del proceso: Grfico de Desv. Tpicas

- En el rango: Grfico de Rangos

78

3) Control por Variables


TABLAS DE CONTROL DE CALIDAD

79

3) Control por Variables


GRFICOS DE CONTROL PARA MEDIAS:
tamao muestral n:

Se toman k muestras a intervalos regulares de idntico

80

3) Control por Variables


GRFICOS DE CONTROL PARA MEDIAS:
Grfico X-bar para GROSOR

X-bar

(X 0,001)
70

UCL = 0,07

67

CTR = 0,06

64

LCL = 0,05

61
58
55
52
0

12

16

20

Subgrupo

81

3) Control por Variables


GRFICOS DE CONTROL PARA VARIABILIDAD:

Una vez comprobado que el proceso est bajo control en media, hay que comprobar
que la dispersin permanece constante. Esto lo podremos analizar o bien en los grficos
de desviaciones tpicas o grficos de rangos. En cualquier caso debemos calcular los
lmites de control para estas dispersiones.
Lmites de control para desviaciones:

82

3) Control por Variables


GRFICOS DE CONTROL PARA VARIABILIDAD:
Lmites de control para rangos:

Como lo habitual ser no conocer , lo estimaremos por


Obraremos de igual manera que en medias y si en los grficos de rangos o de dispersiones
encontramos observaciones fuera de los lmites, sacaremos esa muestra y RECALCULAREMOS
TODO!!

83

3) Control por Variables


EJEMPLO GRFICOS DE CONTROL PARA VARIABILIDAD: Grafico de Desviaciones:

Grfico S para GROSOR


(X 0,001)
15

UCL = 0,01
CTR = 0,01

12

LCL = 0,00

9
6
3
0
0

12

16

20

Subgrupo

84

3) Control por Variables


EJEMPLO GRFICOS DE CONTROL PARA VARIABILIDAD: Grafico de
Rangos

Grfico de Rango para GROSOR

Rango

0,03

UCL = 0,03

0,025

CTR = 0,01

0,02

LCL = 0,00

0,015
0,01
0,005
0
0

12

16

20

Subgrupo
85

Ejercicios Control de Calidad. Clase


Una fbrica elabora
planchas de madera para
tapas de mesas, las cuales
deben cumplir ciertas
especificaciones de
tamao.
Para garantizar que se
cumplan estos estndares
de calidad, se recolecta K=
24 muestras (subgrupos)
de tamao n = 6, y mide
su largo. Los resultados
aparecen en la siguiente
tabla:

N de muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

14,5
15,4
16,5
14,8
15,7
15,9
15,2
14,5
15,6
16,5
14,5
17,1
18,5
17,2
19,2
18,4
14,2
16,2
17,2
16,8
15,9
15,0
16,8
18,9

15,9
15,2
15,9
16,8
14,5
15,4
14,2
14,8
15,7
16,8
15,8
15,8
15,9
15,7
15,7
16,8
16,9
17,2
17,6
14,5
17,9
18,0
18,9
17,9

Medias muestrales
15,7
16,3
15,9
15,2
14,8
16,2
15,5
15,2
16,9
14,2
17,1
14,8
18,5
15,8
17,2
16,2
19,2
16,1
18,4
14,8
14,2
14,5
16,2
15,4
17,2
14,2
16,8
14,8
15,9
15,7
15,0
16,8
16,8
15,8
18,9
15,8
18,7
15,9
19,8
15,7
18,7
15,7
18,2
16,8
20,0
16,9
17,4
17,5

14,5
14,5
16,5
15,2
14,5
16,8
15,9
15,0
16,8
18,9
18,7
15,7
15,9
14,8
15,5
16,9
17,1
18,5
17,2
18,2
18,4
14,2
16,2
17,2

16,2
14,5
16,2
14,2
15,2
14,8
15,7
16,8
15,9
16,1
16,3
16,2
14,7
14,9
14,8
14,7
15,4
18,9
16,0
18,7
17,5
17,8
18,5
16,5

86

Ejercicios Control de Calidad. Clase


a) Calcular el rango promedio
b) Calcular el lmite superior de control para el rango
c) Calcular el lmite inferior de control para el rango
d) Elaborar la grfica R.
e) Calcular X
f) Calcular el lmite superior de control para las medias
g) Calcular el lmite inferior de control para las medias
h) Elaborar la grfica X.

87

Ejercicios Control de Calidad. Clase

88

Ejercicios Control de Calidad. Clase


Para calcular Lmites de rangos
Lmite superior de control para el rango
LSCR=D4R
Lmite inferior de control para el rango
LICR=D3R
Los D4 y D3 se toman de la tabla de factores crticos de las grficas de
control de acuerdo al tamao n de la muestra y el rango promedio de
los rangos muestrales

89

Ejercicios Control de Calidad. Clase


Para calcular Lmites de Medias
Se tiene entonces:
Lmite superior de control para las medias
LSCX=X+A2R
Lmite inferior de control para las medias
LICX=X-A2R

Donde:
Siendo k = nmero de muestras

90

Ejercicios Control de Calidad. Clase


Solucin:
a) Calculando el rango promedio se tiene:
b) lmite superior de control para el rango
tabla para n = 6 se obtiene D4=2,004
Calculando el lmite superior se obtiene:
LSCR=D4R=2,0043,146=6,3
c) Calcular el lmite inferior de control para el rango
tabla para n = 6 se obtiene D3=0
Calculando el lmite inferior se obtiene:
LICR=D3R=03,146=0
91

Ejercicios Control de Calidad. Clase


Solucin:
d)

92

Ejercicios Control de Calidad. Clase


Solucin:
e) Calculando x se obtiene:

f) Con lectura en la tabla para n = 6 se obtiene A2=0,483


Calculando el lmite superior se obtiene:
LSCX=X+A2R=16,314+0,4833,146=17,83

g) Calculando el lmite inferior se obtiene:


LICX=X-A2R=16,314-0,4833,146=14,79

93

Ejercicios Control de Calidad. Clase

94

3) Control por Variables


ESTIMACIN DE LA CAPACIDAD DEL PROCESO
Una vez que el proceso est bajo control, y comprobamos que todas las muestras estn
dentro de los lmites, tanto en media como en dispersin. Pasamos a estimar la capacidad
del proceso que es 6s . Y como no conoceremos s, tendremos que estimarlo por doble va,
segn tenga datos de rango o de desviaciones tpicas.

Si conociramos los lmites de tolerancia de nuestro cliente podramos calcular tambin el


IC
95

4) Control por Atributos


GRFICOS DE CONTROL PARA ATRIBUTOS:
En muchas ocasiones no se dispone de recursos suficientes, ya sean temporales o
econmicos para hacer un estudio detallado de la variable atendiendo a su valor.
Mientras que si realiza el estudio atendiendo solamente a que cumpla unas
caractersticas determinadas, el esfuerzo y por consiguiente el coste baja
notoriamente. El control de calidad por atributos, se basa en clasificar la variable
como aceptable o no.
Por consiguiente el control por atributos es:
- Ms rpido - Ms simple (usa un solo grfico de control)
- Ms econmico - Menos eficiente (menor precisin)
Al igual que en el control por variables, vaya tomar k muestras de tamao n. En
este caso, al estudiar tan solo la clasificacin como aceptable o no aceptable, mis
muestras habrn de ser de mayor tamao para que el estudio sea robusto.

96

4) Control por Atributos


GRFICOS DE CONTROL PARA ATRIBUTOS:
En este caso, la capacidad del proceso va a venir dada por la proporcin de
elementos no defectuoso (l- p) cuando el proceso est bajo control.
As un proceso estar bajo control, es decir no existirn causas asignables,
cuando la proporcin de defectuosos sea estable a largo plazo. Si aparecieran
causas asignables en mi proceso, la tasa de defectuosos dejara de comportarse
de manera estable y empezara a 'bailar',
Sea X una variable aleatoria que representa el nmero de elementos
defectuosos al tomar una muestra de tamao n.
En este caso mi variable X se distribuye como una Binomial (n,p).

97

4) Control por Atributos


GRFICOS DE CONTROL PARA ATRIBUTOS:
Para observar si el proceso est bajo control habremos de usar el grafico de control y seguir los
siguientes pasos:
1) Tomamos k muestras a intervalos regulares de tamao n idntico. Por lo general k>25 y n>50. Y
calculamos la prop de defectuosos en cada muestra:
r1,r2,,,rk
2) Estimamos la prop. de defectuosos global a partir de los datos muestrales

3) Comprobamos que las k muestras son homogeneas respecto a ese valor de p, es decir estn
contenidas en el intervalo

98

4) Control por Atributos


EJEMPLO GRFICOS DE CONTROL PARA ATRIBUTOS:

99

4) Control por Atributos


ESTIMACIN DE LA CAPACIDAD:
Una vez que el proceso esta bajo control, determinaremos la capacidad del proceso,
de igual forma que lo hicimos en el control por variables.

Capacidad

6 6

pq
n

100

Ejemplo
Un proceso de emisin de nminas de una empresa de 1.000
empleados. En cada nmina se pueden cometer errores en la
introduccin de los siguientes datos:
Nmero de das de baja
Nmero de horas extras.
Importe de la prima.
Es decir, hay tres oportunidades de error por cada nmina. Si los
trabajadores perciben 14 pagas al ao, el nmero de nminas emitidas
en un ao es:
Nminas emitidas (unidades inspeccionadas) = 14x1.000 = 14.000

101

Ejemplo
Si en el ao se detectaron 30 reclamaciones de los trabajadores:
dpu = 30/14.000 = 0.002143 errores /nmina = 2.143 errores / milln de
nminas
las oportunidades de error por cada nmina son 3, luego las oportunidades
totales son:
Oportunidades de error = 3x14x1.000 = 42.000 oportunidades
luego:
dpo = 30/42.000 = 0,000714 errores /oportunidad
dpmo =106 dpo = 714 errores / milln oportunidades
Como el nmero de errores contabilizado corresponde a un periodo amplio de
tiempo en el que han podido estar presentes mltiples causas de fallo, se asume
largo plazo, se obtiene un nivel sigma de 4.7.
102

Ejemplo
Pero qu ocurre si se cambia de criterio en cuanto al nmero de oportunidades
de defecto por nmina incluyendo hipotticos errores que no se han dado
nunca?
Supongamos que se consideran ahora 30 errores por nmina. El clculo queda:
Oportunidades de error = 30x14x1.000 = 420.000 oportunidades
dpo = 30/420.000 = 0,0000714 errores /oportunidad
dpmo =106 dpo = 71,4 errores / milln oportunidades

103

Ejercicio
Un proceso de una fbrica de juguetes produce tornillos de madera. Para
que dicho tornillo pueda ser insertado e la correspondiente pieza es
necesario controlar su dimetro. Para realizar los grficos de control
necesarios se toman 20 muestras de 4 elementos.
La siguiente tabla muestra los dimetros de cada tornillo as como la
media de cada muestra y su rango. Se sabe que el dimetro de los
tornillos se distribuye como una normal.
a) Calcular los lmites de control para la media y el rango
b) Si los lmites de tolerancia son 20 y 30. Calcular e interpretar el ndice de
capacidad.

104

Ejercicio

105

Pruebas NO Paramtricas

Chi Cuadrado
Como ya se ha visto varias veces, los resultados obtenidos de muestras no siempre
concuerdan exactamente con los resultados tericos esperados, segn las reglas de
probabilidad. Por ejemplo, aunque consideraciones tericas conduzcan a esperar 50
caras y 50 cruces cuando se lanza 100 veces una moneda bien hecha, es raro que se
obtengan exactamente estos resultados.
Supngase que en una determinada muestra se observan una serie de posibles sucesos
E1, E2, E3, . . . , EK, que ocurren con frecuencias o1, o2, o3, . . ., oK, llamadas frecuencias
observadas y que, segn las reglas de probabilidad, se espera que ocurran con
frecuencias e1, e2, e3, . . . ,eK llamadas frecuencias tericas o esperadas.
A menudo se desea saber si las frecuencias observadas difieren significativamente de
las frecuencias esperadas. Para el caso en que solamente son posibles dos sucesos E1 y
E2 como, por ejemplo, caras o cruces, defectuoso, etc., el problema queda resuelto
satisfactoriamente con los mtodos de las unidades anteriores.

Chi Cuadrado
Puede usarse para probar la existencia de una diferencia significativa
entre un nmero observado de objetos o respuesta de cada categora
y un nmero esperado, basado en la hiptesis de nulidad.
Importante, esta prueba nos indica si existe o no relacin entre las
variables, pero no indica el grado o el tipo de relacin: es decir, no
indica el porcentaje de influencia de una variable sobre la otra o la
variable que causa la influencia

Chi Cuadrado
Como ya se ha visto varias veces, los resultados obtenidos de muestras no siempre
concuerdan exactamente con los resultados tericos esperados, segn las reglas de
probabilidad. Por ejemplo, aunque consideraciones tericas conduzcan a esperar 50 caras y
50 cruces cuando se lanza 100 veces una moneda bien hecha, es raro que se obtengan
exactamente estos resultados.

Supngase que en una determinada muestra se observan una serie de posibles sucesos E1,
E2, E3, . . . , EK, que ocurren con frecuencias o1, o2, o3, . . ., oK, llamadas frecuencias
observadas y que, segn las reglas de probabilidad, se espera que ocurran con frecuencias
e1, e2, e3, . . . ,eK llamadas frecuencias tericas o esperadas.

A menudo se desea saber si las frecuencias observadas difieren significativamente de las


frecuencias esperadas. Para el caso en que solamente son posibles dos sucesos E1 y E2 como,
por ejemplo, caras o cruces, defectuoso, etc., el problema queda resuelto satisfactoriamente
con los mtodos de las unidades anteriores.

Chi Cuadrado
Puede usarse para probar la existencia de una diferencia
significativa entre un nmero observado de objetos o respuesta
de cada categora y un nmero esperado, basado en la hiptesis
de nulidad.
Importante, esta prueba nos indica si existe o no relacin entre
las variables, pero no indica el grado o el tipo de relacin: es
decir, no indica el porcentaje de influencia de una variable sobre
la otra o la variable que causa la influencia.

Chi Cuadrado
Cuanto mayor sea el valor de chi cuadrado, menos verosmil es que la
hiptesis propuesta sea correcta. De la misma forma, cuanto ms se
aproxima a cero el valor de chi-cuadrado, ms ajustadas estn ambas
distribuciones.
Si la tabla creada para estudiar las distribuciones tiene ms de dos
columnas, hay que aadir un factor de correccin al que llamaremos
grado de libertad, que viene dado por la expresin:
Grado de libertad = (r-1) (k-1), donde r es el nmero de filas y k el de
columnas.

Chi Cuadrado
Una medida de la discrepancia existente entre las frecuencias observadas y
esperadas es suministrada por el estadstico X2, dado por:

donde si el total de frecuencias es


N,

Chi Cuadrado
La siguiente tabla muestra las frecuencias observadas al
lanzar un dado 120 veces. Ensayar la hiptesis de que el
dado est bien hecho al nivel de significacin del 0.05.

Ensayo de Hiptesis:

Cara

Frecuencia
Observada

25

17

15

23

24

16

Ho; Las frecuencias observadas y esperadas son significativamente iguales


(dado bien hecho)
H1; Las frecuencias observadas y esperadas son diferentes (dado cargado).

Chi Cuadrado
Primero se procede a calcular los valores esperados. Como es bien
sabido por todos la probabilidad de que caiga cualquier nmero en
un dado no cargado es de 1/6. Como la suma de los valores
observados es de 120, se multiplica este valor por 1/6 dando un
resultado de 20 para cada clasificacin.
1

Tota
l

Frecuencia
Observada

25

17

15

23

24

16

120

Frecuencia
esperada

20

20

20

20

20

20

Cara

Grados de libertad = 5

Chi Cuadrado
Probabilidad conforme H0 de que x > chi cuadrado

Grados
libertad

0,1

0,05

0,025

0,01

0,005

1
2
3
4
5
6
7
8
9
10

2,71
4,61
6,25
7,78
9,24
10,64
12,02
13,36
14,68
15,99

3,84
5,99
7,81
9,49
11,07
12,59
14,07
15,51
16,92
18,31

5,02
7,38
9,35
11,14
12,83
14,45
16,01
17,53
19,02
20,48

6,63
9,21
11,34
13,28
15,09
16,81
18,48
20,09
21,67
23,21

7,88
10,60
12,84
14,86
16,75
18,55
20,28
21,95
23,59
25,19
115

Chi Cuadrado
Regla de decisin:
Si X2R 11.1 no se rechaza Ho.
Si X2R >11.1 se rechaza Ho

Justificacin y decisin:
Como 5 es menor a 11.1 no se rechaza Ho y se concluye con una significacin de
0.05 que el dado est bien hecho.

Chi Cuadrado
Correccin de Yates
La correccin de Yates se aplica cuando al menos el valor de una frecuencia esperada
es menor que 5.
En general, se aplica la correccin de Yates cuando aproximamos una variable discreta
a una distribucin continua. La correccin consiste en aadir y substraer 0,5 a la
variable en cuestin.
Por ejemplo, obtener 3 caras al lanzar una moneda es una medida discreta (nominal)
que se ajusta a la distribucin binomial. Mientras que si la aproximramos a la
distribucin normal, su valor oscilar entre 2,5 y 3,5.

Chi Cuadrado (1)


En los experimentos de Mendel con guisantes, observ 315 lisos y amarillos, 108
lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes.
De acuerdo con su teora, estos nmeros deberan presentarse en la proporcin
9:3:3:1. Hay alguna evidencia que permita dudar de su teora al nivel de
significacin del 0.01?
Ensayo de Hiptesis:
Ho; La teora de Mendel es acertada.
H1; La teora de Mendel no es correcta.

Chi Cuadrado (2)


Una encuesta sobre 320 familias con 5 nios dio la distribucin que aparece en la
siguiente tabla. Es el resultado consistente con la hiptesis de que el nacimiento
de varn y hembra son igualmente posibles?
Use = 0.05.

Chi Cuadrado (2)


Solucin:
Ensayo de hiptesis:
H0; El nacimiento de nios y nias es igualmente probable.
H1; El nacimiento de nios y nias no es igualmente probable.
Este experimento tiene un comportamiento binomial, puesto que se tienen dos
posibles resultados y la probabilidad de xito se mantiene constante en todo el
experimento.
Se le llamar xito al nacimiento de un varn o nio. Por lo que la variable
aleatoria "x" tomar valores desde 0 hasta 5.
Como se quiere ver si es igualmente probable el nacimiento de nios y nias, la
probabilidad de xito ser de 0.5.

También podría gustarte