Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lean Sigma BB Analisis B
Lean Sigma BB Analisis B
Programa de certificacin
de Black Belts
1
VI.F Mtodos de anlisis
adicionales
2
Mtodos adicionales de
anlisis
1. Anlisis de brecha
3
VI.F.1 Anlisis de brecha
4
El anlisis de brecha (Gap Analysis) es una
herramienta de evaluacin para comparar el
desempeo actual de la organizacin, a un
desempeo potencial deseado.
5
Anlisis de brecha
Se pueden redirigir los esfuerzos a objetivos
como:
Permanecer en el negocio
Mantener o incrementar la participacin del
mercado
Mejorar el clima laboral
Igualar o exceder a Benchmarks
Igualar o exceder a la competencia
Reducir tiempos de ciclo
Lograr certificaciones
Mejorar la productividad
Mejorar los niveles de calidad 6
Anlisis de brecha
Se requieren tres categoras de informacin
Dnde estamos?
Dnde queremos ir?
Cmo vamos a medir los resultados?
7
Planeacin de escenarios
Al elaborar planes estratgicos, los directivos
pueden confiarse o ser orgullosos de aceptar
cambios. Por lo que se sugiere considerar
escenarios del mejor y del peor caso, para
evitar errores en la toma de decisiones
9
Planeacin de escenarios
El proceso de planeacin es como sigue:
Desarrollar un escenario grueso del futuro
basado en estas prioridades
Determinar como afectan los escenarios a la
organizacin
Determinar los cursos de accin potenciales a
tomar
Monitorear, evaluar, y revisar los escenarios
10
Planeacin de escenarios
Por lo comn se perciben de 6 10 amenazas
u oportunidades en 2 o 3 escenarios
desarrollados. Evitar las siguientes trampas:
13
Planeacin Hoshin
Tiene seis objetivos:
Alinear las metas organizacionales
Anlisis FODA
Anlisis PEST
15
Evaluacin organizacional
Anlisis funcional con datos de coleccin:
Entrevistas cara a cara
Seleccin de muestra apropiada
Entradas de grupo de enfoque
Observaciones de visitas a la planta
Datos colectados de fuentes de la industria
17
Mtricas organizacionales
Se establecen metas de desempeo
organizacional y sus mtricas en las reas de:
Utilidades
Tiempos de ciclo
Recursos
Respuestas del mercado
18
Mtricas organizacionales
Para los anteriores, las mtricas pueden ser:
Utilidades a corto y largo plazo
Tiempos de ciclo
Tiempos de ciclo actuales
Benchmarks internos
Benchmarks externos
Reduccin en tiempos de ciclo
19
Mtricas organizacionales
Recursos
No. De proyectos de mejora, ROI de proyectos,
Anlisis de devoluciones
Retencin de clientes
22
Anlisis de causa raz
23
Anlisis de causa raz
24 de
tcnicas de consenso, seis sombreros
Anlisis de causa raz
26
Los 5 Por qus
Se hace la pregunta Por qu? Cinco veces
Por qu? Nos faltaron partes por mquina
daada
Por qu? La mquina no ha tenido
mantenimiento en los ltimos 3 meses
Por qu? El departamento de mantenimiento se
ha reducido a 6 personas de 8
Por qu? Se pas del presupuesto, les quitaron
el tiempo extra y dos personas
Por qu? La empresa no ha tenido los
resultados esperados y el director ha hecho
recortes para salvar la situacin, teme por su
puesto 27
5Ws y 1H
El mtodo de las 5Ws y 1H se resume al
preguntar quin?, qu?, cundo?, dnde?,
por qu? Y cmo?.
28
Diagrama de causa efecto
Rompe el problema en partes ms pequeas
Muestra muchas causas potenciales
grficamente
Muestra como interactan las causas
Sigue las reglas de la tormenta de ideas
Las sesiones tienen tres partes:
Tormenta de ideas
Dar prioridades (identificar las tres causas
principales)
Desarrollo de un plan de accin
29
Diagrama de Pareto
Sirve para identificar problemas u
oportunidades prioritarias o mayores
30
Mtodo de las 8 disciplinas -
Ford
El mtodo de Ford para el anlisis de causa
raz es:
D1. Establecer el equipo
D2. Describir el problema
D3. Desarrollar una accin de contencin
D4. Identificar la causa raz
D5. Desarrollar alternativas de solucin
D6. Implementar una accin correctiva
permanente
D7. Prevenir la recurrencia
D8. Reconocer al equipo y las contribuciones
individuales 31
Anlisis de rbol de falla -
FTA
FTA es un mtodo sistemtico deductivo, para
definir un evento singular especfico e
indeseable, y determinar todas las posibles
razones (fallas) que pueden hacer que ocurra
el evento
32
Anlisis de rbol de falla -
FTA
Otras reas de su aplicacin son:
Anlisis funcional de sistemas complejos
Evaluacin de requerimientos de seguridad,
confiabilidad,
defectos de diseo,
riesgos de peligro,
acciones correctivas,
simplificacin de mantenimiento y deteccin de
falla,
eliminacin lgica de causas de falla
33
Anlisis de rbol de falla -
FTA
Se prefiere el FTA en vez del FMEA cuando:
La seguridad el personal es importante
Se pueden identificar un nmero pequeo de
eventos superiores
Hay alto potencial de falla
El problema es cuantificar la evaluacin del
riesgo
La funcionalidad del producto es altamente
compleja
El producto no es reaprables
34
Anlisis de rbol de falla -
FTA
Se prefiere el FMEA en vez del FTA cuando:
Los eventos superiores no se pueden definir
explcitamente
Son factibles mltiples perfiles potencialmente
exitosos
La identificacin de todos los modos de falla es
importante
La funcionalidad del producto tiene poca
intervencin externa
35
Anlisis de rbol de falla -
FTA
Smbolos de compuertas lgicas para
determinar la confiabilidad del sistema. Hay
smbolos de eventos y smbolos de
compuertas
Smbolos de eventos
37
Anlisis de rbol de falla -
FTA
Ejemplo: se asume que falla el sistema
superior
38
Anlisis de rbol de falla -
FTA
La probabilidad de falla del sistema es 5.02%.
Se indica que el teclado es prioritario (0.20),
despus la CPU (0.015) y el monitor (0.015)
39
VI.F.3 Anlisis del Muda
40
Anlisis de Muda
Las actividades que no agregan valor se
clasifican como Muda, de acuerdo a Imai son:
Sobreproduccin
Inventarios
Reparaciones / rechazos
Movimientos
Transportes
Re Procesos
Esperas
41
Sobreproduccin
Se produce ms en cierto momento, por:
Producir ms de lo necesario por el siguiente
proceso
Producir antes de lo requerido por el siguiente
proceso
Producir ms rpido de lo requerido por el
siguiente proceso
Sus consecuencias son:
Espacio extra en las instalaciones del cliente
Materias primas adicionales en uso
Utilizacin de energticos y transportes
adicionales
42
Inventario en exceso
Las partes, materias primas, inventario en
proceso, refacciones y productos terminados
forman el inventario, el inventario es Muda ya
que requiere:
Espacio en piso, Transporte, Montacargas
Sistemas de transportadores
Inters sobre el costo de los materiales
45
Movimientos
Los movimientos adicionales del personal son
Muda. Caminar mucho, cargar pesado,
agacharse, estirarse mucho, repetir
movimientos, etc.
47
Reprocesos
Consiste de pasos adicionales en el proceso de
manufactura, por ejemplo:
Remocin de rebabas
Maquinado de partes mal moldeadas
Agregar procesos de manejo adicionales
Realizar procesos de inspeccin
Repetir cambios al producto innecesarios
Mantener copias adicionales de informacin
48
Transportes
Todo transporte es Muda excepto la entrega al
cliente. Incluye:
Uso de montacargas
Uso de transportadores
Uso de movedores de pallets y camiones
49
Esperas
Ocurre cuando un operador est listo para
realizar su operacin, pero permanece ocioso,
por falla de mquina, falta de partes, paros de
lnea, etc. El Muda de espera puede ser por:
Operadores ociosos
Fallas de maquinaria
Tiempos de ajuste y preparacin largos
Tareas no programadas a tiempo
Flujo de materiales en lotes
Juntas largas e innecesarias
50
Mudas adicionales
Otros mudas adicionales a los 7 desperdicios
son:
Recursos mal utilizados
Recursos poco utilizados
Actividades de conteo
Bsqueda de herramientas o partes
Sistemas mltiples
Manos mltiples
Aprobaciones innecesarias
Fallas de mquinas
Envo de producto defectivo al cliente o mal
servicio 51
VI.B.3 Regresin lineal
mltiple
52
Regresin mltiple
Cuando se usa ms de una variable independiente para
predecir los valores de una variable dependiente, el
proceso se llama anlisis de regresin mltiple, incluye
el uso de ecuaciones lineales.
Yu 0 1 X u1 2 X u 2 ....... k X uk u
53
Regresin mltiple
Estimacin de los parmetros del modelo
Se trata de minimizar los errores cuadrticos en:
N
R ( 0 , 1 ,..., k ) (Yu 0 1 X u1 2 X u 2 ..... uk ) 2
u 1
b = (XX)-1 XY
El vector de valores ajustados
Y Xb se puede expresar
como:
Y Xb X ( X ' X ) 1 X ' Y Hy
SSE (Y Xb)' (Y Xb) Y ' Y b' X ' Y Y ' Xb b' X ' Xb Y ' Y 2b' X ' Y b' X ' Xb
SSE
SSE Y ' Y b' X ' Y s 2 MSE
N 55
p
Tamao de muestra
Tomar 5 observaciones para cada una de las
variables independientes, si esta razn es
menor de5 a 1, se tiene el riesgo de
sobreajustar el modelo
56
Ejemplo de regresin
mltiple
Un embotellador est analizando las rutas de servicio de
mquinas dispensadoras, est interesado en predecir la
cantidad de tiempo requerida por el chofer para surtir
las mquinas en el local (Y).
57
Ejemplo de regresin
mltiple
58
Ejemplo de regresin mltiple
Solucin matricial
59
Ejemplo de regresin mltiple
Solucin matricial
60
Ejemplo de regresin mltiple
Solucin matricial
61
Ejemplo de regresin mltiple
Solucin matricial
Intervalo de confianza para Beta 1
62
Ejemplo de regresin mltiple
Solucin matricial
El embotellador desea construir un intervalo de
confianza sobre el tiempo medio de entrega para un
local requiriendo:
63
Ejemplo de regresin mltiple
Solucin matricial
El intervalo de confianza sobre el tiempo medio de
entrega para un local requiriendo es para 95% de nivel
de confianza:
19.22 2.074 0.56794 Y0 19.22 2.074 0.56794
64
Ejemplo de regresin mltiple
Solucin matricial
El anlisis de varianza es:
65
Ejemplo de regresin mltiple
Solucin matricial
El comportamiento de los residuos es como sigue:
66
Multicolinealidad
La multicolinealidad implica una dependencia cercana
entre regresores (columnas de la matriz X ), de tal
forma que si hay una dependencia lineal exacta har
que la matriz XX sea singular.
67
Multicolinealidad
Una prueba fcil de probar si hay multicolinealidad
entre dos variables es que su coeficiente de correlacin
sea mayor a 0.7
Y 5 X 1 1000 X 2
70
Escalamiento de residuos
Residuos estandarizados
Se obtienen dividiendo cada residuo entre la
desviacin estndar de los residuos
ei
di ,
MSE
H = X (XX)-1X es
e la matriz sombrero o hat matriz.
ri i
,
MSE (1 hii ) 72
Escalamiento de residuos
El estadstico PRESS (Prediction Error Sum of Squares)
es una medida similar a la R2 en la regresin. Difiere en
que se estiman n-1 modelos de regresin.
i 1 SYY 73
Grficas parciales de
regresin
Para mostrar el impacto de casos individuales es ms
efectiva la grfica de regresin parcial. Un caso outlier
impacta en la pendiente de la ecuacin de regresin (y
su coeficiente).
75
Matriz sombrero
Los valores en la diagonal de la matriz sombrero miden
dos aspectos:
Para cada observacin miden la distancia de la
76
Distancia de Mahalanobis
D2 es una medida comparable a los valores sombrero
(hat values) que considera slo la distancia de una
observacin del valor medio de las variables
independientes.
77
Influencia en coeficientes
individuales
El impacto de eliminar una observacin simple en
cada uno de los coeficientes de la regresin
mltiple se muestra con la DFBETA y su versin
estandarizada SDFBETA.
80
Ejemplo de Regresin Mltiple
Cat. (US News) GMAT Salario Inicial ($) % Aceptacin
Stanford 1 711 82000 7.4
Harvard 2 670 80000 12.8
Penn (Wharton) 3 662 79000 14.7
MIT (Sloan) 4 650 78000 15.1
Chicago 5 680 65000 25.0
Northwestern 6 660 70000 16.0
Columbia 7 660 83000 14.8
Dartmouth 8 670 70000 12.6
Duke 9 646 67500 20.5
Berkeley 10 653 70000 13.3
Virginia 11 660 66000 18.9
Michigan 12 645 65000 28.0
NYU 13 646 70583 20.9
Carnegie Mellon 14 640 67200 30.8
Yale 15 675 65000 23.5
U.N.C. 16 630 60000 19.8
UCLA 17 651 65000 17.5
Texas-Austin 18 630 60000 27.3
Indiana 19 630 61500 44.7
Cornell 20 637 64000 25.4
Rochester 21 630 58500 36.0
Ohio State 22 611 61000 23.2
Emory 23 626 60000 33.0
Purdue 24 603 63700 20.7
Maryland 25 640 53000 18.9
81
nterpretacin de Resultados de Excel- Regresin Multiple
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.8749313 R Square 0.76550478
Adjusted R Square 0.732005463 Standard Error 4050.855918 Observations
25
ANOVA
df SS MS F Significance F
Regression 3 1.12E+09 374977790.1 22.851355 8.17E-07
Residual 21 3.45E+08 16409433.67
Total 24 1.47E+09
Regression Statistics
Multiple R 0.855974
R Square 0.732691
Adjusted R Square 0.721069
Standard Error 4132.688
Observations 25
ANOVA
df SS MS F Significance F
Regression 1 1.08E+09 1.08E+09 63.04264 4.88E-08
Residual 23 3.93E+08 17079107
Total 24 1.47E+09
Con
Conslo
sloX1,
X1,el
el Modelo
Modelosesesimplifica
simplificaenormemente
enormemente
poca
pocaimportancia
importanciaprctica
prcticase
se pierde
pierdeen
enRR2 (ajustada)
2
(ajustada)
Reduccin del Modelo
Vuelva a correr la regresin usando la categora
US News, como el nico agente de prediccin (predictor)
Anlisis de Variancia
Fuente DF SS MS F p
Regresin 1 1076712008 1076712008 63.04 0.000
Error 23 392819470 17079107
Total 24 1469531477
El
El Modelo
Modelo se
se simplifica
simplifica enormemente..poca
enormemente..poca
importancia
importancia prctica se pierde en R (ajustada)
prctica se pierde en R 22
(ajustada)
Corrida en Minitab
Se introducen los datos en varias columnas C1
a C5 incluyendo la respuesta Y (heatflux) y las
variables predictoras Xs (North, South, East)
HeatFlux Insolation East South North
271.8 783.35 33.53 40.55 16.66
264.0 748.45 36.50 36.19 16.46
238.8 684.45 34.66 37.31 17.66
230.7 827.80 33.13 32.52 17.50
251.6 860.45 35.75 33.71 16.40
257.9 875.15 34.46 34.14 16.28
85
Corrida en Minitab
Utilzar el archivo de ejemplo Exh_regr.mtw
Opcin: Stat > Regression > Regression
Para regresin lineal indicar la columna de
respuesta Y (Score2) y X (Score1)
3.5
Score2
2.5
Regression
1.5 95% CI
95% PI
2 3 4 5 6 7 8 9
Score1
88
Resultados de la regresin
Mltiple
The regression equation is
HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East
Predictor Coef SE Coef T P
Constant 389.17 66.09 5.89 0.000
North -24.132 1.869 -12.92 0.000
South 5.3185 0.9629 5.52 0.000
East 2.125 1.214 1.75 0.092
S = 8.598 R-Sq = 87.4% R-Sq(adj) = 85.9%
Analysis of Variance
Source DF SS MS F P
Regression 3 12833.9 4278.0 57.87 0.000
Residual Error 25 1848.1 73.9
Total 28 14681.9
Source DF Seq SS
North 1 10578.7
South 1 2028.9
East 1 226.3
89
Resumen de la Regresin
La regresin slo puede utilizarse con informacin de variables
continuas.
90
VI.B.4 Herramientas
multivariadas
91
Herramientas multivariadas
1. Introduccin
3. Anlisis factorial
4. Anlisis discriminante
5. MANOVA
92
Introduccin
En el anlisis multivariado se incluyen dos o
ms variables dependientes Y1, Y2, etc.
Consideradas simultneamente para las
variables independientes X1, X2, ., Xn
95
Ejemplo: Alimentos en
Europa
96
Corrida en Minitab
2Stat > Multivariate > Principal components
3En Variables, X1, X2, X3, X4, X6, X7, X8, X9
97
Ejemplo: Alimentos en
Europa
98
Ejemplo: Alimentos en
Europa
99
Ejemplo: factores principales para
crecimiento tecnolgico en la
comunidad
Factores independientes
Miles de trabajadores en alta tecnologa
Cultura emprendedora (inicios por ao)
Interacciones con la universidad (proyectos por
ao)
Clases de creatividad (porcentaje de
profesionales)
Cantidad de capital de aventura (millones de
dlares)
100
Matriz de correlacin del
ejemplo
101
Resultados
La suma de los eigenvalores es aprox. cinco
102
Anlisis factorial
Es una tcnica de reduccin de variables para
identificar factores que expliquen la variacin,
aunque se reiere un juicio subjetivo.
103
Anlisis factorial
Se especifican un cierto nmero de factores
comunes
104
Corrida con Minitab
2Stat > Multivariate > Factor Analysis.
3En Variables, X1, X2, X3, X4, X6, X7, X8, X9
4En Number of factors to extract, 4.
En Method of Extraction, seleccionar Principal
components
6En Type of Rotation, seleccionar Varimax.
7Click Graphs y seleccionar Loading plot for first 2
factors y Scree Plot.
Click Results y seleccionar Sort loadings.
Seleccionar Storage e indicar columnas para
ponderaciones, coeficientes, Zs, eigenvalores, etc.
Click OK en cada uno de los cuadros de d
105
Ejemplo
106
Ejemplo:
107
Anlisis discriminante
Si se tiene una muestra con grupos conocidos,
el anlisis discriminante clasifica las
observaciones o atributos en dos o ms grupos
108
pases
109
Corrida con Minitab
2Stat > Multivariate > Discriminant
Analysis.
110
Corrida con Minitab
111
Anlisis de conglomerados
112
Anlisis de conglomerados
Se usa para determinar agrupaciones o
clasificaciones de un conjunto de datos
113
Ejemplo
Suponer que un estudio Variables V1 V2
de mercado trata de
determinar segmentos A 3 2
de mercado en base a los B 4 5
patrones de lealtad de
marcas (V1) y tiendas C 4 7
(V2), medidas del 0 al 10
en 7 personas (A-G). D 2 7
E 6 6
F 7 7
G 6 4
114
Corrida en Minitab
Stat > Multivariate Anlisis > Cluster
Observations
Distance Measured Euclidean Seleccionar
Show Dendogram OK
115
Anlisis de correlacin
cannico
Prueba la hiptesis de que los efectos pueden
tener causas mltiples y de que las causas
pueden tener efectos mltiples (Hotelling
1935)
118
coches
119
coches
120
coches
121
Ejemplo: Statgraphics -
coches
123
MANOVA
(Anlisis de varianza mltiple)
124
Diferencias de ANOVA y MANOVA
125
Ejemplo:
Extrusin de pelcula plstica
Se realiza un estudio para determinar las
condiciones ptimas para extruir pelcula
plstica.
127
Ejemplo:
Extrusin de pelcula plstica
1Abrir el archivo EXH_MVAR.MTW.
2Seleccionar Stat > ANOVA > Balanced
MANOVA.
3En Responses, poner Tear Gloss Opacity.
4En Model, poner Extrusion | Additive.
5Click Results. En Display of Results,
seleccionar Matrices (hypothesis, error,
partial correlations) y Eigen analysis.
6 Click OK en cada cuadro de dilogo.
128
Ejemplo
129
Ejemplo:
Extrusin de pelcula plstica
Las matrices SSCP evalan la contribucin a la
variabilidad de manera similar a la suma de
cuadrados en la ANOVA univariada.
130
VI.B.5 Anlisis de datos
por atributos
131
Anlisis de datos por
atributos
Si los CTQs son variables continuas, se usa la
regresin, dependiendo de la naturaleza de la
caracterstica crtica para el cliente (CTSs)
como ste la expresa:
CTS HERRAMIENTA
Nominal (Verde, Rojo, azul) Regresin Logstica
Nominal
Atributo (Pasa/No pasa) Regresin Logstica
Binaria
Ordinal (1, 2, 3, 4, 5) Regresin Logstica
Ordinal
132
Anlisis de datos por
atributos
El anlisis de datos por atributos se organiza
en valores, categoras o grupos dicotmicos
133
Anlisis de datos por
atributos
Regresin logstica
Relaciona variables independientes categricas
a una variable dependiente (Y). Minitab incluye
los modelos binario, ordinal y nominal
Regresin logit
Es subconjunto del modelo log-lineal. Tiene solo
una variable dependiente, usa determinaciones
de probabilidad o tasa de probabilidad
134
Anlisis de datos por
atributos
Regresin probit
Es similar a la prueba de vida acelerada, la
unidad se somete a esfuerzo con la respuesta
pasa/falla, bueno o malo. Es una respuesta
binaria en un tiempo de falla futuro
135
Regresin logstica o binaria
En caso de informacin cualitativa es
necesario traducir las preferencias del cliente
expresadas como atributos a un intervalo de
valores aceptables de variables
(Especificaciones).
136
Regresin logstica o binaria
Es similar a la regresin mltiple excepto que
la respuesta es binaria (si/no, bueno/malo,
etc.) Sus coeficientes se determinan por el
mtodo de mxima verosimilitud
Yi = 0, 1
137
Regresin logstica o binaria
La probabilidad de que el resultado est en
cierta categora es:
138
Regresin logstica
Condiciones:
Hay solo dos resultados posibles
Hay solo un resultado por evento
Los resultados son independientes
estadsticamente
Todos los predictores relevantes estn en el
modelo
Es mutuamente exclusivo y colectivamente
exhaustivo
Los tamaos de muestra son mayores que para
la regresin mltiple
140
Regresin logstica -
Procedimiento
Definir el atributo a traducir (y)
Definir la variable apropiada para el atributo
(x)
Definir el modelo matemtico a probar
Determinar los defectos que est dispuesto a
aceptar
Recolecte informacin de x vs y. Asigne 1
si falla y 0 si es aceptable.
Analice la informacin mediante Regresin
Logstica Binaria
141
Regresin logstica-
Procedimiento
142
Regresin logstica -
Procedimiento
P-Value de Deviance
P(Falla) =
e
b +b x +....
0 1 1
Donde :
1 +e
b +b x +....
0
b , b , ... = Coeficientes del modelo
1 1
0 1
144
Ejemplo de riesgo de paro
cardiaco
146
Regresin logstica ordinal -
Procedimiento
Defina la variable de respuesta a traducir
(y CTS)
Defina el CTQ (x) variable a relacionar con
el CTS
Defina el modelo matemtico a probar
Determine los defectos que est dispuesto a
aceptar en la categora de inters
Recolecte informacin de x vs y
Analice la informacin mediante Regresin
Logstica Ordinal
147
Regresin logstica ordinal -
Procedimiento
Stat > Regression > Ordinal Logistic
Regression
Seleccione la respuesta (y)
Seleccione los trminos que estima tiene el
modelo [3]
Constantes y
Coeficientes
del modelo
148
Regresin logstica ordinal -
Procedimiento
Observe el P-Value de Deviance en la
Sesin, debe de ser grande (P >0.10)
149
Regresin logstica ordinal -
Procedimiento
P =
e Ki+b1x1+ b2x2.... Donde :
Ki = Constante de la categora i
acumulada hasta
categora i 1+ e Ki+b1x1+ b2x2.... b1, b2, ... = Coeficientes del modelo
Constantes y
Coeficientes
del modelo
Expectativas
de Diseo
Matriz de
Importan.
CTQs
Diseo
Producto
(CTSs)
(DPs)
Tipo
(General) Especificaciones Clientes
LIE LSE Otra
Usuarios
Finales
Producto
(Especfico)
151
Anlisis Logit
Usa razones para determinar que tanta
posibilidad tiene una observacin de pernecer
a un grupo que a otro.
Una posibilidad de 0.8 de estar en el grupo A
se puede expresar como una tasa de
posibilidades de 4:1 ( que es p/(1-p)), cuyo
logaritmo es el logit.
152
Anlisis Logit - ejemplo
50 estudiantes tomaron un examen, donde solo 27
pasaron. Cules son las posibilidades de pasar?
Posibilidades = P/(1-P) = 0.54/0.46 = 1.17 o 1.71:1
153
Anlisis Probit
Es similar a las pruebas de vida acelerada y
anlisis de sobrevivencia. Un artculo sujeto a
esfuerzo puede fallar o sobrevivir. El modelo
probit tiene un valor esperado de 0 y una
varianza de 1.
155
i
(OE
)
Bondad de ajuste
PRUEBAS DE BONDAD DE AJUSTE
Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma
2iK
2
de distribucin particular planteada como hiptesis
Si el ajuste es razonablemente cercano, puede concluirse que s exite la forma de distribucin
1
planteada como hiptesis
Por ejemplo:
El estadstico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se acepta
la hiptesis nula
PRUEBA.CHI.INV 157
Prueba de Bondad de ajuste
para la distribucin de Poisson
1. Plantear la hiptesis nula y alterna
Ho: La poblacin tiene una distribucin de prob. De
Poisson
Ha: Caso contrario
2. Tomar una muestra aleatoria, anotar la frecuencia
observada fi y calcular la media de ocurrencias
3. Calcular la frecuencia esperada de ocurrencias ei.
Multiplicar el tamao de muestra con la prob. de Poisson
para cada valor de la variable aleatoria.
n Si hay menos
( f i ei ) 2
de 5 combinar las categoras
2
i 1 i e
4. Calcular el estadstico
2 2 de prueba
i 1 ei
2 2
Ho se rechaza si o si p es mayor que alfa.
162
Prueba de Bondad de ajuste
para la distribucin Normal
4. Calcular el nmero de ocurrencias esperado ei, para
cada intervalo de valores. Multiplicar el tamao de
muestra por la probabilidad de que una variable
aleatoria est en el intervalo.
n
( f i ei ) 2
2
i 1 ei
5. Calcular el estadstico de prueba
2 2
6. Rechazar Ho si o si p < alfa. Con gl=k-p-1 y alfa
nivel de significancia
163
Prueba de Bondad de ajuste
para la distribucin Normal
Ejemplo: datos de calificaciones: Media = 68.42; S =
10.41
Calificaciones
71 66 61 65 54 93
60 86 70 70 73 73
55 63 56 62 76 54
82 79 76 68 53 58
85 80 56 61 61 64
65 62 90 69 76 79
77 54 64 74 65 65
61 56 63 80 56 71
79 84 164
Prueba de Bondad de ajuste
para la distribucin Normal
Ho: la poblacin tiene una distribucin normal con media
68.42 y S=10.41 Ha: Caso contrario
165
Prueba de Bondad de ajuste
para la distribucin Normal
Intervalo Frecuencia Frecuencia Se registran las
observada esperada
frecuencias de
(fi) (ei)
los datos
Menos de 5 5 tomados de las
55.10
calificaciones
55.10 a 5 5
59.68
59.68 a 9 5
63.01
63.01 a 6 5
65.82
65.82 a 2 5
68.42
68.42 a 5 5
71.02
166
71.02 a 2 5
Prueba de Bondad de ajuste
para la distribucin Normal
Se determina el estadstico Chi Cuadrado = 7.2
( f i ei ) 2
n
2
i 1 ei
167
Prueba de Bondad de ajuste
para la distribucin Multinomial
1. Enunciar la hiptesis nula y alternativa
Ho: La poblacin sigue una distribucin de probabilidad
multinomial con probabilidades especificadas para cada
una de las K categoras Ha: Caso contrario
168
Prueba de Bondad de ajuste
para la distribucin Multinomial
4. Se determina el estadstico Chi Cuadrado de prueba
( f i ei ) 2
n
2
i 1 ei
5. Regla de rechazo:
Si 2
2
no se puede rechazar la hiptesis nula
Empresa A 0.3 48 60
Empresa C 0.2 54 40
171
Prueba de Bondad de ajuste
para la distribucin Multinomial
Chi Cuadrado calculado = 7.34
174
Prueba de Bondad
de ajuste en Excel
Ejemplo: investigacin de mercado
175
VI.C.8 Tablas de contingencia
176
Para qu se utiliza?
2
177
Ejemplo 1: Chi Cuadrada(
2
)
Se lanza una moneda al aire 100 veces y
que obtenemos 63 guilas y 37 soles.
Aguilas 63 50 3.38
Soles 37 50 3.38
2 = 3.38 + 3.38
2 = 6.76
179
Ejemplo 1: Chi cuadrada
Funcin de Distribucin Acumulada Chi2 con 1 grado de
libertad (d.f)
2c P(2c > x)
6.7600 p = 1 - 0.9907 = 0.0093
181
Tabla de Valores Crticos Seleccionados de Chi2
df .250 .100 .050 .025 .010 .005 .001
1 1.323 2.706 3.841 5.024 6.635 7.879 10.828
2 2.773 4.605 5.991 7.378 9.210 10.597 13.816
3 4.108 6.251 7.815 9.348 11.345 12.838 16.266
4 5.385 7.779 9.488 11.143 13.277 14.860 18.467
5 6.626 9.236 11.070 12.832 15.086 16.750 20.515
182
100 109.141 118.498 124.342 129.561 135.807 140.169 149.449
Tabla de contingencia
Una tabla de clasificacin de dos vas (filas y columnas)
que contiene frecuencias originales, se puede analizar
para determinar si las dos variables (clasificaciones) son
independientes o tienen una asociacin significativa.
183
Tabla de contingencia
Para esta prueba se usa la prueba Chi Cuadrada donde:
184
Tabla de contingencia
Ejemplo: Cada una de las 15 celdas hace una
contribucin al estadstico Chi Cuadrado (una celda)
185
Ejemplo 2: Chi2 Para comparacin de
dos grupos; son las mismas
proporciones?)
Ho: No existen diferencias en los ndices de defectos de las dos mquinas.
Ha: Existen diferencias en los ndices de defectos de las dos mquinas.
186
Ejemplo 2: Chi2 Para comparacin de
dos grupos; son las mismas
proporciones?)
Clculo de los valores esperados
2 232 3 235
233.47 1.53
Total 764 5 769
Nota: Chi cuadrada no podr aplicarse en los casos donde los conteos seas menores a 5 en 20%
de celdas.
Si cualquiera de los conteos esperados en las celdas es menor a uno, no deber usarse Chi 2.
Si algunas celdas tienen un conteo menor a los esperados, ya sea combinando u omitiendo
renglones y/o columnas, las categoras pueden ser de utilidad.
188
Tabla de Chi2
Tabla de valores crticos seleccionados para Chi2
189
Problema: Fugas
Beneficios Potenciales: $10,000 de ahorro en retrabajos, y en la
reduccin de tiempo de ciclo.
Mquina a mquina
Ho: No existe diferencia en los ndices de defecto de las diferentes
mquinas
Ha: Existe diferencia en los ndices de defecto de las diferentes
mquinas
Tamao de la muestra:
5000 + total de oportunidades (172 piezas) 190
Prueba de chi2 (mquina a mquina)
Los conteos esperados estn colocados debajo de los conteos observados
Con fugas Sin fugas Total
1 30 610 640
32.11 607.89
3 3 253 256
12.84 243.16
4 18 334 352
17.66 334.34
2 1 127 128
6.61 121.39
4 54 202 256
13.23 242.77
5 5 699 704
36.38 667.62
6 12 116 128
6.61 121.39
Total 278 5102 5380
Chi2 = 0.057 + 0.003 + 4.765 + 0.260 + 0.351 + 0.019 +125.666 + 6.847 + 27.065 + 1.475
+ 4.386 + 0.239 = 171.132
DF= 5; valor P = 0.000 192
Qu sucede si los grupos mltiples de variacin son estadsticamente significativos?
(en este caso, operador a operador y mquina a mquina)
6 12 116 128
6.61 121.39
(Estos mismos operadores fueron quienes
tuvieron los nmeros ms grandes de chi2)
194
Operador a operador: = 0.000
Rechace
Ho y acepte Ha
(Existe una diferencia significativa entre los operadores)
Cul es el prximo paso? Hable con todos los operadores para averiguar qu diferencias
pueden existen en sus tcnicas.
El operador 5 encontr un modo de mejor de hacer el ensamble, con lo cual consigui mejorar
el trabajo de soldadura, aunque esto mostraba un grado de dificultad ergonmica. Se aadi
un colocador para ensamblar la parte en forma segura. (Esto tambin redujo el tiempo que
requeran los operadores para acostumbrarse a trabajar en esta forma)
195
Ejercicios
Radios detectados 27 25 22
Radios no detectados 3 5 8
Hora del da
Carril 1:00 3:00 5:00
Izquierdo 44 37 18
Central 28 50 72
Derecho 8 13 30
197
Coeficiente de Contingencia
Coeficiente de contingencia es el grado de relacin o
dependencia de las clasificaciones en la tabla de
contingencias es:
X2
C2
X2 N
198
Coeficiente de Contingencia
Para los datos del ejemplo anterior se tiene:
X2 66. 22 2
C2 2 0.38
X N
2
66.22 393
2
k 2 82
Max C 0.866
k 8
199
Correlacin de atributos
Para tablas de orden k * k, el coeficiente de correlacin,
r, es :
2
X
r
N (k 1)
Donde 0<= r <= 1
200
VI.C.9 Pruebas de
Hiptesis no paramtricas
201
Pruebas no paramtricas
Las pruebas paramtricas asumen una distribucin para
la poblacin, tal como la Normal
202
Prueba de Hiptesis
Variable Atributo
No Normal Tablas de
Contingencia de
Varianza Medianas
Correlacin
Correlacin
Homogeneidad
Prueba de signos
de la Variacin
de Levene Wilcoxon
Normal
Mann-
Whitney Variancia Medias
Kurskal-
Pruebas de t
Wallis
Prueba-F Muestra-1
Residuos
Prueba de Mood Muestra-2
Homogeneidad distribuidos
Friedman de la Variacin ANOVA
de Bartlett Una va normalmente
Dos vas
Correlacin
Regresin 203
Resumen de pruebas de Hiptesis
Datos Normales Datos No Normales
Pruebas de Variancias
Pruebas de Varianzas
X2 : Compara la variancia de una Homogeneidad de la varianza de
muestra con una variancia de un Levene : Compara dos o ms
universo conocido. varianzas de muestras de la misma
poblacin.
Prueba F : Compara dos varianzas
de muestras.
Homogeneidad de la variancia de
Bartlett: Compara dos o ms
varianzas muestras de la misma
poblacin.
204
Resumen de pruebas de Hiptesis
Datos Normales Datos No Normales
Pruebas de los Promedios Pruebas de la Mediana
Mediana: Valor del punto medio de los datos, cuando se ordenan en forma
ascendente (en caso de datos pares, obtener promedio).
Promedio
Mediana
208
Pruebas Alternativas comnmente
usadas
Pruebas para datos No normales Analoga con datos normales
500 Promedio
Primera 400
"corrida"
300
200
100
Segunda racha"
Prueba de Rachas
Promedio K = 184.4483 Promedio
Z = (G - MediaG) / DesvStG
Runs Test: C1
Runs test for C1
Runs above and below K = 184.448
The observed number of runs = 12
The expected number of runs = 14.6552
11 observations above K, 18 below
P-value = 0.285
P > 0.05
No rechazar
Ho 213
Prueba de Signos de la Mediana
115 144
Despus de todo, tal vez
esto SEA lo correcto.
217
Corrida en Minitab
Stat > Nonparametrics > 1-Sample sign Variable C1
Confidence interval 95% Test Median 115 Alternative
Not equal
SignTestforMedian:Signos
Signtestofmedian=115.0versusnot
=115.0
NBelowEqualAbove
PMedian
Signos2912017
0.4583144.0
Como P > 0.05 no se rechaza Ho y la mediana es 115
218
Prueba de Signos de la Mediana
Para observaciones pareadas
222 T = 44
Prueba rango con signo de
Wilconox
T 0 T
n(n 1)(2n 1)
6
En este caso n = pares eliminando las que son iguales con dif. =
0 para el trabajador 8.
224
Prueba de Mann-
Whitney
Se llev a cabo un estudio que analiza la frecuencia del pulso en dos
grupos de personas de edades diferentes, despus de diez minutos de
ejercicios aerbicos.
n1 = 10 n2 = 9
Ta = 130.5 Tb = 55.5
226
Prueba de Mann-
Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
Ha: Las distribuciones de frecuencias relativas poblacionales no son idnticas
Ho: 1 = 2 Ha: 1 2 1, 2 = Medianas de las poblaciones
Ordenando los datos y asignndoles su posicin relativa se tiene:
Ua = n1*n2 + (n1) * (n1 + 1) /2 - Ta
Ub = n1*n2 + (n2) * (n2 + 1) /2 - Tb
Ua + Ub = n1 * n2
Ua = 14.5 Ub = 79.5
Utilizando el estadstico Z y la distribucin normal se tiene:
45 12.24
Z = [ (U - (n1* n2 / 2 ) / Raiz (n1 * n2 * (n1 + n2 + 1) / 12)
Con Ua y Ub se tiene:
Za = (14.5 - 45) / 12.24 = - 2.49 P(Z) = 0.0064 similar a la anterior
Zb = (79.5 -45) / 12.24 = 2.81 P(total) = 2 * 0.0064 = 0.0128 menor = 0.05
El valor crtico de Z para alfa 0.025 por ser prueba de dos colas, es 1.96.
Como Za > Zcrtico se rechaza la Hiptesis Ho de que las medianas son iguales.
135 5 -31 7 9 -5 -1 3 7 11
150 20 -16 22 24 10 14 18 22 26
140 10 -26 12 14 0 4 8 12 16
144 14 -22 16 18 4 8 12 16 20
154 24 -12 26 28 14 18 22 26 30
160 30 -6 32 34 20 24 28 32 36
edad
144 14 -22 16 18 4 8 12 16 20
136 6 -30 8 10 -4 0 4 8 12
148 18 -18 20 22 8 12 16 20 24
Una vez ajustados los "enlaces" (eventos de un mismo valor en ambos grupos de
informacin), Minitab usa este punto estimado para calcular el valor p.
Corrida en Minitab
Stat > Nonparametrics > Mann Whitney
First Sample C1 Second Sample C2 Conf. Level 95%
Alternative Not equal
n1 = 8 n2 = 10 n3 = 7 N = n1 + n2 + n3 = 25
Ta = 118 Tb = 111.5 Tc = 95.5
231
Prueba de Kruskal
Wallis
232
Corrida en Minitab
Stat > Nonparametrics > Kruskal Wallis
Response C1 Factor C2 OK
234
Prueba de Medianas de Mood
Se determina el estadstico Chi Cuadrada con:
(O E ) 2
2
E
Probar Ho: Todas las medianas son iguales
Ha: Al menos una mediana es diferente
235
Corrida con Minitab
Se les da a 179 participantes una conferencia
con dibujos para ilustrar el tema. Despus se
les da la prueba OTIS que mide la habilidad
intelectual. Los participantes se clasificaron
por nivel educativo 0-No prof., 1-Prof., 2-Prepa
236
Corrida con Minitab
Mood Median Test: Otis versus ED
Mood median test for Otis P>0.05
Chi-Square = 49.08 DF = 2 P = 0.0005 Se
rechaza Ho
Individual 95.0% CIs
ED N<= N> Median Q3-Q1 ----+---------+---------
+---------+--
0 47 9 97.5 17.3 (-----*-----)
1 29 24 106.0 21.5 (------*------)
2 15 55 116.5 16.3 (----*----)
----+---------+---------+---------+--
96.0 104.0 112.0 120.0
Overall median = 107.0 237
Diseos factoriales aleatorias
bloqueados de Friedman
Esta prueba es una alternativa al ANOVA de dos
vas, es una generalizacin de las pruebas
pareadas con signo. La aditividad es requerida
para para estimar los efectos de los
tratamientos
238
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados de salida:
Se muestra el estadstico de prueba con
240
Diseos factoriales aleatorias
bloqueados de Friedman
Datos: EnzymeActivity Therapy Litter
0.15 1 1
0.26 1 2
0.23 1 3
0.99 1 4
0.55 2 1
0.26 2 2
-0.22 2 3
0.99 2 4
0.55 3 1
0.66 3 2
0.77 3 3
0.99 3 4241
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
Friedman Test: EnzymeActivity versus
Therapy blocked by Litter
S = 2.38 DF = 2 P = 0.305 No
rechazar Ho
S = 3.80 DF = 2 P = 0.150 (adjusted for
ties)
Sum
of
Therapy N Est Median Ranks
1 4 0.2450 6.5
2 4 0.3117 7.0
3 4 0.5783 10.5
Grand median = 0.3783 242
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
El estadstico de prueba S tiene un valor P de 0.305 sin
243
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
244
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
245
Diseos factoriales aleatorias
bloqueados de Friedman
Resultados:
246
Prueba de igualdad de
varianzas de Levene
Se usa para probar la hiptesis nula de que las
varianzas de k mltiples poblacionales son iguales
247
Prueba de igualdad de
varianzas de Levene
Para dos muestras el procedimiento es como sigue:
Determinar la media
de Varianzas-Minitab10
3 10
10
2
6
4 10 6
Se estudian tamaos de 7 10 6
papa inyectando con
15 10 10
bacterias y sujetas a
2 10 10
diferentes temperaturas.
7 10 10
Antes del ANOVA se
verifica la igualdad de 26 16 2
varianzas 19 16 2
24 16 2
Stat > ANOVA > Test for 15 16 6
equal variances 22 16 6
Response Rot 18 16 6
20 16 10
Factors Temp Oxigen
24 16 10
Confidence level 95%
8 16 10
249
Resultados
250
Resultados
Test for Equal Variances: Rot versus Temp, Oxygen
95% Bonferroni confidence intervals for standard
deviations
Temp Oxygen N Lower StDev Upper
10 2 3 2.26029 5.29150 81.890
10 6 3 1.28146 3.00000 46.427
10 10 3 2.80104 6.55744 101.481
16 2 3 1.54013 3.60555 55.799
16 6 3 1.50012 3.51188 54.349
16 10 3 3.55677 8.32666 128.862
Bartlett's Test (normal distribution)
Test statistic = 2.71, p-value = 0.744 P>0.05 no
rechazar Ho
Levene's Test (any continuous distribution)
Test statistic = 0.37, p-value = 0.858 251
Prueba de la concordancia del
Coeficiente de Kendall
El coeficiente expresa el grado de asociacin entre las
calificaciones mltiples realizadas por un evaluador
253
El coeficiente de correlacin de
rangos de Spearman (rs)
El coeficiente de correlacin es una medida de la
asociacin que requiere que ambas variables sean
medidas en al menos una escala ordinal de manera que
las muestras u observaciones a ser analizadas pueden
6 d
ser clasificadas en rangos en dos series ordenadas 2
6(5.5)
rs 1 1 0.03 0.97
990
254
Coeficiente de correlacin
de rangos para monotona
de preferencias
Una persona interesada en adquirir un TV asigna
rangos a modelos de cada uno de 8
fabricantes
Preferencia Precio Rang
Fab.
(rango) o Di
cuadrada
Di
1 7 449.50 (1)
6 36
2 4 525.00 (5)
3 2 479.95 (3) -1 1
4 6 499.95 (4) -1 1
5 1 580.00 (8) 2 4
6 3 549.95 (7) -7 49
7 8 469.95 (2)
-4 16
8 5 532.50 (6) 255
Coeficiente de correlacin
de rangos para monotona
de preferencias
Rt = 0.686
260
Resumen de pruebas
no paramtricas
261
262
263
Salidas de la Fase de Anlisis
Causas raz validadas
264