Está en la página 1de 15

RESPUESTAS A LA GUÍA EN LA FASE DE ANÁLISIS

LÓPEZ CUEVAS HILDA

VII. Metodología de mejora Seis Sigma y herramientas de la Fase de Análisis


¿Cuáles son los objetivos de la fase de Análisis?
Evalua y reduce las variables con anális gráficos y contráste de hipotesis e identifica
pocos factores vitales para el proceso de mejora.

• Análisis exploratorio de datos Carta Multivari


¿Para que sirve y como se construye una carta Multivari?
nLa carta multivari permite analizar la variación dentro de la pieza, de pieza a pieza o de tiempo en tiempo

nPermite investigar la estabilidad de un proceso consiste de líneas verticales u otro esquema en función
del tiempo. La longitud de la línea o del esquema representa el rango de valores
encontrados en cada conjunto de muestras

¿A que se refiere la variación Posicional, Cíclica y Temporal en las cartas multivari?

¿En que partes se puede dividir la variación posicional?

¿Cómo se interpreta la Carta Multivari siguiente?

Multi-Vari Chart for Strength by SinterTime - MetalType


24 SinterTime
0.5
1.0
23
2.0

22
Strength

21

20

19

18

17
15 18 21
MetalType

¿Cómo se interpreta la siguiente carta


Multivari?
8 AM 9 AM 10 AM 11 AM 12
. AM
0.2510”

0.2500”

0.2490”

1
0.2500”

0.2490”

Izquierda
Máximo
Derecha
Mínimo

• Diagrama sistemático

¿Cómo se construye el diagrama sistemático representando el mapa de variabilidad


total?

Variación total observada


Diámetro =0.150 +- 0.02

Variación
Variación de
de
sist. medición
proceso

Pieza a Dentro de Máquina a Turno a Tiempo a


Lote a lote
pieza la pieza máquina turno tiempo

Programa Máquina AccesoriosOperadores

• Lluvia de ideas y diagrama de causa efecto y diagrama de relaciones


¿Cómo se identifican las causas potenciales de un problema el diagrama de causa efecto?
¿Cómo se identifican las causas potenciales de un problema el diagrama de relaciones?
¿Cuál es el proceso para comprobar las causas raíz de un problema?
¿Cuándo se dice que Si es causa raíz y cuando no es causa raíz?

• Análisis de regresión lineal, cuadrática y múltiple


¿Para que sirve el análisis de regresión lineal?
¿Por qué se le denomina método de mínimos cuadrados?
¿cómo se prueba la significancia de la regresión?

2
¿cómo se estima la varianza de la variable dependiente?
¿cómo se determina el coeficiente de correlación y que significa?
¿Cómo se intepreta el coeficiente de determinación?

Ejercicio: Hacer un análisis de regresión simple completo Ejercicio: ¿Existe relación entre los niveles de
completo con los datos siguientes: Consumo (Y) y el ingreso de consumindores (X)?
Publicidad Pasajeros Y a) Establecer la ecuación de regresión
10 15 a) Ecuación b) Hacer la gráfica de la regresión
12 17 b) r c) ¿Qué consumo se pronostica para alguien
8 13 c) r cuadrada que gane $27,000?
17 23 d) ¿Existe reg? Datos:
10 16 e) Intervalo de X=Ingreso Y=Consumo
15 21 confianza para 24.3 16.2
10 14 X = 14 12.5 8.5
14 20 f) Intervalo de 31.2 15
19 24 predicción 28 17
10 17 para X = 14 35.1 24.2
11 16 g) Gráfica de 10.5 11.2
13 18 regresión 23.2 15
16 23 h) Analizar 10 7.1
10 15 los residuos 8.5 3.5
12 16 15.9 11.5
14.7 10.7
Ejercicio: Interpretar los resultados de la regresión lineal siguiente: 15 9.2
Regression Analysis: Calif Y versus Tiempo X
The regression equation is
Calif Y = 31.21 + 0.6955 Tiempo X
S = 4.47182 R-Sq = 77.0% R-Sq(adj) = 74.2%
Analysis of Variance
Source DF SS MS F P
Regression 1 536.923 536.923 26.85 0.001
Error 8 159.977 19.997 a) ¿Existe la regresión?
Total 9 696.900
b) ¿Cómo se predice Y
para una cierta X?
Fitted Line Plot
Calif Y = 31.21 + 0.6955 Tiempo X
90 Regression
95% C I
c) ¿Qué significan los
95% PI
intervalos CI y PI?
80 S 4.47182
R-Sq 77.0%
R-Sq(adj) 74.2%
70 c) ¿Cuál es el valor del
Calif Y

coeficiente de correlación?
60

d) ¿Qué significa la R2?


50

40

30 40 50 60 70
Tiempo X

¿Qué modelo de regresión ajustaría a los datos en la siguiente figura y porqué?

Fitted Line Plot


EnergyConsumption = 128.8 - 13.11 MachineSetting
+ 0.3289 MachineSetting**2
50 Regression

40
95% CI
95% PI 3
S 6.00002
nsumption

30 R-Sq 79.3%
R-Sq(adj) 73.4%

20
Fitted Line Plot
EnergyConsumption = 128.8 - 13.11 MachineSetting
+ 0.3289 MachineSetting**2
50 Regression
95% CI
40 95% PI

S 6.00002
EnergyConsumption
30 R-Sq 79.3%
R-Sq(adj) 73.4%

20

10

-10

-20
10 15 20 25 30
MachineSetting

Fitted Line Plot


EnergyConsumption = 1.25 + 0.3218 MachineSetting
50 Regression
95% C I
40 95% PI

S 12.1825
30 R-Sq 2.3%
EnergyConsumption

R-Sq(adj) 0.0%
20

10

-10

-20

-30
10 15 20 25 30
MachineSetting

Ejercicio: Con los datos siguientes hacer un análisis de regresión simple


ALTURA 68 64 62 65 66
PESO 132 108 102 115 128

a) Diagrama de dispersión
b) Coeficiente de correlación
c) Recta gráfica
d) Ecuación de regresión
e) si Altura es 63 cual es el peso estimado
f) Coeficiente de determinación
g) Prueba de significancia para el parámetro Beta1
h) Intervalo de confianza para un 90% en Beta 1
i) Prueba de la significancia de la regresión
j) Intervalo de confianza para la media de Yest en altura = 65
k) Intervalo de predicción para los valores individuales de Yest en altura = 65
l) Determinación de residuales (3 valores)
n) Gráfica de distribución normal de los residuales

4
Ejercicio: Un experimento para determinar el efecto del tiempo en horas (X) a una cierta
temperatura a un cambio en la viscocidad del aceite (Y) da los resultados siguientes:

X Y a) Encontrar un polinomio de segundo orden que ajuste a


0.25 -4.42 a los datos
0.5 -1.39 b) Probar la significancia de la regresión para alfa = 0.05
0.75 -1.55
1 -1.89 c) Encontrar el coeficiente de determinación
1.25 -2.43
1.5 -3.15 d) Calcular los residuos y evaluar la adecuación del
1.75 -4.05 modelo
2 -5.15
2.25 -6.43
2.5 -7.89

¿Qué es la regresión múltiple?


¿Por qué se debe utilizar el coeficiente de correlación ajustado en lugar del normal?
¿Qué es multicolinealidad y cual es su efecto en la regresión múltiple?

Ejercicio: Hacer un análisis de regresión múltiple con los datos siguientes

Publicidad Pasajeros YPIB (%) X2 a) Ecuación de regresión


10 15 2.4 b) ¿cuáles variables son significativas?
12 17 2.72 c) Coeficiente de determinación ajustado y
8 13 2.08 su significado
17 23 3.68 d) Predecir el valor de los pasajeros con
10 16 2.56 una publicidad de 14 y un PIB de 2.0.
15 21 3.36 e) Analizar los residuos para validar
10 14 2.24 el modelo
14 20 3.2 f) Analizar las gráficas de Y vs X1 y
19 24 3.84 Y vs X2 y sacar conclusiones
10 17 2.72
11 16 2.07
13 18 2.33
16 23 2.98
10 15 1.94
12 16 2.17

Ejercicio: La fuerza de sujeción de un alambre de conexión de semiconductor (Y3) está en función de la


altura del dado (X5), altura del poste (X6), altura del loop (X7) y longitud del alambre (X8),
los resultados de un experimento con varios valores de X5, X6, X7 y X8 se muestran a continuación:

Y3 X5 X6 X7 X8 a) Encontrar un modelo de
9 5.8 18.6 28.6 86.5 regresión múltiple para los datos
9.3 5.2 18.8 30.6 84.5 Regression > Regression > Normal Plot of Res.
9.3 5.6 19 32.4 88.8 b) Predecir la fuerza de sujeción
9.5 6 20.8 32.6 85.7 Y3 cuando X5 = 6, X6 = 20
9.8 5.2 19.9 32.2 93.6 X7 = 30, X8 = 90
10 5.8 18 31.8 86 Considerar un intervalo de
10.3 6.4 20.6 32.6 87.1 confianza y de predicción del 95%

5
10.5 6 20.2 33.4 93.6 Regression > Regression > Options > Pred. Intervals for
10.8 6.2 20.2 31.8 86 new observations / X6 X6 X7 X8 / 95%
11 6.2 19.2 32.4 87.1 c) Identificar por medio de las
11.3 6.2 17 31.4 93.1 correlaciones entre las X's
11.5 5.6 19.8 33.2 83.4 cuales presentan colinealidad
11.8 6 18.8 35.4 94.5 y por tanto como se debe adecuar
12.3 5.8 19.8 34 83.4 la ecuación de regresión múltiple
12.5 5.6 18.8 34.2 85.2 Basic statistics > Correlation (display P values)
En cada comparación aparece R2 y su P value (sign..05)

• Estimación puntual y por intervalos para una y dos poblaciones

¿Qué es una estimación puntual de parámetros?


¿Qué es una estimación por intervalos de parámetros y que ventajas tiene?
¿Qué es nivel de confianza, nivel de significancia y error estándar de estimación?
¿Cómo se determina el intervalo de confianza para la media?
¿cuándo se utiliza el estadístico Z y cuando el estadístico t?
¿Cómo se determina el intervalo de confianza para las varianzas?
¿Cómo se calcula el valor del tamaño de muestra con un error máximo y un nivel de confianza?

Ejercicio. Una muestra de 50 bultos de productos pesa en promedio Xmedia = 652.58 Kgs., con S = 217.43 Kgs.
Determinar el intervalo de confianza al NC del 95% y al 99% donde se encuentra la media del proceso (poblacional).
Alfa = 1 - NC

Ejercicio. Un intervalo de confianza del 90% para estimar la ganancia promedio del peso de ratones de laboratorio es
de 0.93 a 1.73 onzas. ¿Cuál es el valor de Z?.

Ejercicio. 100 latas de 16 onzas de salsa de tomate tienen una media de Xmedia = 15.2 onzas y una S = 0.96 onzas.
¿A un nivel de confianza del 95%, las latas parecen estar llenas con 6 onzas?.

Ejercicio. Una muestra de 16 soluciones tienen un peso promedio de 16.6 onzas con S = 3.63. Se rechaza la
solución si el peso promedio del lote no excede las 18 onzas. ¿Cuál es la decisión a un 90% de nivel de
confianza?
Ejercicio.. 20 cajas de producto pesaron 102 grs.Con S = 8.5 grs¿Cuál es el intervalo donde se encuentra
la media del lote para un 90% de nivel de confianza?. Grados de libertad = gl = 20 - 1 = 19

Ejercicio. Una muestra de 25 productos tienen un peso promedio de 23.87 grs. Con una S = 9.56. ¿Cuál
es la estimación del intervalo de confianza para un nivel de confianza del 98% del peso de productos del
lote completo?
2. Con los datos del problema anterior, determinar el Intevalo de confianza para un 95% de nivel de con

Ejemplo: Se toman los siguientes datos de calificaciones:


3 4 8 7 7 6 3 4
6 9 5 4 8 10
a) Determinar el intervalo de confianza para la media con un 95% de nivel de confianza
a) Determinar el intervalo de confianza para la varianza con un 95% de nivel de confianza

Ejemplo: Los pesos de 25 paquetes enviados a través de UPS tuvieron una media de 3.7 lib

6
y una desviación estándar de 1.2 libras. Hallar el intervalo de confianza del 95% para
estimar el peso promedio de todos los paquetes. Los pesos de los paquetes se distribuyen
normalmente
¿Cómo se determina el intervalo de confianza para una proporción?

Ejemplo: De 814 encuestados 562 contestaron en forma afirmativa


a) ¿Cuál es el intervalo de confianza para un 90% de nivel de confianza?

Ejemplo: En una encuesta a 673 tiendas, 521 reportaron problemas de robo por los
empleados
¿Se puede concluir con un 99% de nivel de confianza que el 78% se encuentra en el
intervalo de confianza. ?

• Pruebas de hipótesis para una y dos poblaciones

¿Qué es una prueba de hipótesis?


¿Cómo se puede saber si se inicia con el planteamiento de Ho o de Ha?
¿Cómo se sabe de cuantas colas o de que tipo de cola es la prueba?
¿Cuáles son los pasos para realizar una prueba de hipótesis?
¿Cómo se determina el valor P del estadístico de prueba?
¿Cómo se selecciona el estadístico de prueba a usar (Z, t, Chi cuadrada, F)?

Ejercicio: Las ganancias promedio por acción en 2001 fueron de 3 dolares, muestra de 10
empresas mostraron las siguientes ganancias para 2002:
1.92 2.16 3.63 3.16 4.02 3.14 2.20 2.34
3.05 2.38
a) Para un alfa de 0.05 probar la afirmación de que estas ganancias difieren de los 3 dolares
del 2001
b) ¿Cuál es el valor p de la prueba?

Ejercicio: Un trabajo supuestamente toma 15 minutos. El supervisor está preocupado porque


piensa que con trabajadores no entrenados, este tiempo es mayor. Al tomar una
muestra de 20 trabajadores se halla una media de 17.3 minutos y s=1.9 minutos
¿A un 1% de alfa, tiene razón el supervisor de que el tiiempo ha aumentado?.

Ejercicio: Antes de publicar un libro, BANTAM, hace una prueba a un nivel alfa = 2% de que el precio
promedio es de $35.¿Se sustenta la afirmación si en una muestra de n = 50 tiendas, se observa
?
X̄ =32. 97 , S=12. 87 .
Ejercicio: Se planea en un restaurante eliminar del menú el pollo frito. Se afirma que las ventas habían
descendido por debajo de la media histórica de $4,500. ¿parece una decisión adecuada si en una
muestra de n = 144 observaciones se observa
con alfa = 2%?.
X̄ =4, 477, S=1, 128

Ejercicio: Se publica que el costo de alojamiento es menor a $3,500. ¿se confirma esta cifra a un nivel
del 5%, si en una muestra n = 60, ?
X̄=$ 3,200, S=$ 950.
Ejercicio: Un distribuidor piensa que el promedio de sus ventas son de $12,000 al mes. Selecciona 10
meses y encuentra: A un alfa del 5% ¿qué se puede concluir?.
X̄ =$ 11, 277 , S=3, 772

7
Ejercicio: La vida útil de un foco es de 5,000 horas. Un nuevo diseño se piensa incremente esta
vida. Se prueban n = 25 focos con fusión a Concluir para un nivel alf 5%.
X̄=5,117, S=1,886.
Ejercicio: DHL afirma que entrega paquetes en menos de 2.5 días que es la media histórica. Se
hacen n = 17 observaciones y se encuentra que días. Probar con alfa = 0.01.
X̄ =2.2, S=0.9

¿Cómo se realiza una prueba de hipótesis de varianzas?

Ejercicio: Probar la afirmación de que la varianza es menor a 15, si se toma una muestra de 8 partes y se
obtiene una desviación estándar de 8 para un 95% de nivel de confianza.

¿Cómo se realiza una prueba de hipótesis para prueba de parámetros de dos poblaciones?
¿por qué es necesario hacer una prueba de igualdad de varianzas antes de la prueba t?
¿Cómo se realiza una prueba de hipótesis para varianzas de dos poblaciones?

Ejercicio: Se desea probar si las varianzas de dos poblaciones son iguales Ho: σ 21 =σ 22
a un nivel alfa del 5% con los datos siguientes:

n1 =n2 =10 S21 =237 . 16 S22 =148 . 84


.
Ejercicio: Probar a un nivel de significancia del 5% si las varianzas o variabilidad de dos diferentes
métodos de producción son iguales o no. 15 CDs producidos con el primer método reportan una desv.
estn S = 5.4 minutos y 17 reproductores con el segundo método reportan una S = 4.8 minutos.

Ejercicio: Un laboratorio de materiales está analizando el efecto del añejamiento de un producto, quieren
saber si hay mejora en la consistencia de resistencia después de un año (asumir un 95% de nivel de con
Los resultados obtenidos son: Al inicio Un año después
Número de pruebas 9 7
Desv. Estándar PSI 900 300

Ejercicio: Dos muestras consistentes de 10 y 8 mediciones respectivamente tuvieron varianzas de 7.14


y 3.21respectivamente. ¿Hay suficiente evidencia para afirmar que las varianzas no son iguales?.
usar un alfa de 0.10
¿Cómo se hace una prueba de hipótesis para dos medias, cuando usar Z y cuando usar t?

Ejercicio: Se toman muestras de tamaño n1 = 50 y n2 = 60, revelan medias y desviaciones estándar


X̄ 1 =512 S 1 =125 X̄ 2 =587 S 2 =145
respectivamente. A un nivel del 2% pruebe la hipótesis Ho: μ1 =μ 2 o μ1 −μ2 =0
de que las medias de ambas poblaciones son iguales

Ejercicio: Se toman muestras de tamaño n1 = 64 y n2 = 81, revelan medias y desviaciones estándar


X̄ 1 =65 . 2 S1 =21 . 2 X̄ 2 =58 . 6 S2 =25 . 3
respectivamente. A un nivel del 5% pruebe la
hipótesis de que las medias de ambas poblaciones son iguales Ho : μ1 =μ 2 o μ1 −μ2 =0
.

8
Ejercicio: Se toman muestras de tamaño n1 = 10 y n2 = 8, revelan medias y desviaciones estándar
X̄ 1 =36 S1 =12 X̄ 2= 49 S2 =18
respectivamente. A un nivel del 1% pruebe la hipótesis de
que las medias de ambas poblaciones son iguales Ho: μ1 =μ 2 o μ1 −μ2 =0
Se asume que las varianzas son iguales

Ejercicio: Repetir el problema anterior asumiendo que las varianzas son iguales.

Ejercicio: Probar si un nuevo programa da mejores resultados en las horas promedio de terminación de
un proyecto para un nivel de confianza del 95%:
Programa
actual nuevo a) Probar la hipótesis de igualdad de varianzas (Ho:s12=s22)
300 276
280 222 b) Probar la hipótesis ( t) de si la media del nuevo programa
344 310 es menor que la del actual (Ha: Miu nuevo < Miu actual)
385 338
372 200
360 302
288 317
321 260
376 320
290 312
301 334
283 265

¿Cómo se realiza una prueba de hipótesis para muestras pareadas, cuando usar Z ycuando usar t?

Ejercicio: Muestras pareadas de tamaño n = 81 dan una media de las diferencias de 36.5 y una des
estándar de las diferencias de 29.1. Probar la igualdad de las medias a un alfa de 0.01.

Ejercicio: Muestras pareadas de tamaño n = 25 dan una media de las diferencias de 45.2 y una
desviación estándar de las diferencias de 21.6. Probar la igualdad de las medias a un alfa del 5%.

¿Cómo se realiza una prueba de hipótesis para proporciones de dos poblaciones?

29. Muestras de tamaño n1 = 120 y n2 = 150 produjeron proporciones de p1= 0.69 y p2 = 0.73.
Pruebe la igualdad de las proporciones de las poblaciones a un nivel del 5%.
Ho: π 1 =π 2
Ejercicio: Los errores de facturación Oficina 2
Oficina 1 250 n2 = 300 Nivel de confianza = 95%
n1 = 30 errores = 25
errores =
a) Probar la afirmación de que las proporciones de errores en ambas oficinas son iguales
Ho: π 1 ≤π 2
Ejercicio: Dos muestras de tamaño n1 = n2 = 500 se utilizan para probar la hipótesis de que .
Las proporciones muestrales son p1 = 14% y p2 = 11%. A un nivel del 10%. ¿Cuál es la conclusión?.
Ho: π 1≥π 2
Ejercicio: Dos muestras de tamaño n1 = 200 y n2 = 250 se utilizan para probar la hipótesis de que .

9
Las proporciones muestrales son p1 = 22% y p2 = 26%. A un nivel del 1%. ¿Cuál es la conclusión?.

• Tablas de contingencia
¿Qué es una tabla de contingencia?
¿Cómo se calculan las probabilidades para cada celda de la tabla de contingencia?
¿Cómo se prueba la hipótesis de independencia en la tablas de contingencia?

Ejemplos:

Ejemplo: Probar la hipótesis si no hay diferencia significativa entre los 3 inspectores con los datos siguientes:
Inspectores
Resultados 1 2 3 Total
Radios detectados 27 25 22
Radios no detectados 3 5 8

Ejemplo: Probar si los resultados en el trato de una enfermedad depende del hospital
Hospital
Resultados A B D E
Sin cambio 15 6 8 44
Ligera mejora 20 11 39 30
Mejora significativa 18 19 38 9

• Análisis de varianza

¿Para que sirve el análisis de varianza (ANOVA)?


¿Qué condiciones se deben cumplir para que sea válido este análisis?
¿A que se le llama factor y que son los niveles o tratamientos?
¿Cómo se determinan e interpretan los siguientes términos en el ANOVA?
- Suma de cuadrados total; Suma de cuadrados de los tratamientos; Suma de
cuadrados del error
- Grados de libertad totales, de los tratamientos y del error
- Cuadrados medios totales, de los tratamientos y del error
- Estadístico de prueba F
¿qué criterio se sigue para tomar decisiones en relación a la igualdad de medias?
¿En caso de rechazo de la hipótesis nula, cómo se identifican las medias que no son
iguales?
Ejercicio: Se tienen 14 empleados seleccionados al azar que se someten a
3 diferentes cursos de entrenamiento: Programa 1, Programa 2 y Prog. 3.
Probar a un 5% de significancia si los programas tienen el mismo efecto o cual es mejor

Programa 1 Programa 2 Programa 3


85 80 82
72 84 80
83 81 85
80 78 90
** 82 88

Ejercicio: La resistencia a la tensión observada en función del peso porcentual del algodón
en una fibra sintética es:

10
Probar a un 5% de significancia si los porcentajes de algodón tienen el mismo efecto o cual
es mejor

Peso porcentual del algodón


15% 20% 25% 30% 35%
7 12 14 19 7
7 17 18 25 10
15 12 18 22 11
11 18 19 19 15
9 18 19 23 11

Ejercicio: ¿Parecería que hay diferencia en los salarios que ganan los nuevos graduados en
diferentes campos?
Probar esta hipótesis al 5%

Finanzas Mercadotec,Sist. Inform. Matematicas


23.2 22.1 23.3 22.2
24.7 19.2 22.1 22.1
24.2 21.3 23.4 23.2
22.9 19.8 24.2 21.7
25.2 17.2 23.1 20.2
23.7 18.3 22.7 22.7
24.2 17.2 22.8 21.8

Ejercicio: Interpretar los resultados del problema


siguiente

Normal Probability Plot of the Residuals


(responses are MUESTRA 1, MUESTRA 2, MUESTRA 3)
MUESTRA 1MUESTRA 2MUESTRA 3
99
93 77 88
95
90
98 87 75
80 107 84 73
70

102 95 84
Percent

60
50
40
30 85 75
20

10 82
5

1
-15 -10 -5 0 5 10
Residual
Preguntas:

a) ¿Es adecuado el modelo?

One-way ANOVA: MUESTRA 1, MUESTRA 2, MUESTRA 3 b) ¿Son iguales las medias?


Source DF SS MS F P
Factor 2 1020.0 510.0 13.36 0.001 c) ¿Cuál media es mayor?
Error 12 458.0 38.2
Total 14 1478.0

11
S = 6.178 R-Sq = 69.01% R-Sq(adj) = 63.85%

Individual 95% CIs For Mean Based on


Pooled StDev
Level N Mean StDev -------+---------+---------+---------+--
MUESTRA 1 4 100.00 5.94 (------*------)
MUESTRA 2 6 85.00 5.97 (----*----)
MUESTRA 3 5 79.00 6.60 (-----*-----)
-------+---------+---------+---------+--
80 90 100 110

¿Qué es el analisis de varianza de dos vias o direcciones?


¿Qué significa el término bloqueo del experimento?
¿Qué término se agrega a la tabla ANOVA normal cuando se usan dos vías?

Ejercicio: Interpretar los resultados de un experimento de un factor con dos direcciones:

Suponiendo que se quiere investigar si la producción de tres diferentes máquinas


es igual, tomando en cuenta la experiencia de los operadores a un nivel de significancia del
5%
Experiencia
en años de los Máquinas
operadores Maq 1 Maq 2 Maq 3
1 27 21 25
2 31 33 35
3 42 39 39
4 38 41 37
5 45 46 45

Normal Probability Plot of the Residuals


(response is Respuesta) a) ¿Es adecuado el modelo?
99

95

90
b) A un 95% de nivel de confianza que se
80 puede concluir en relación con la experiencia
70
de los operadores
Percent

60
50
40
30
20
b) A un 95% de nivel de confianza que se
10

5 puede concluir en relación con la máquina


1
una vez que se toma en cuenta la
-4 -3 -2 -1 0 1 2 3 4 5
Residual experiencia del operador

Two-way ANOVA: Respuesta versus Renglon, Columna


Source DF SS MS F P
Renglon 4 764.933 191.233 37.25 0.000
Columna 2 0.933 0.467 0.09 0.914
Error 8 41.067 5.133
Total 14 806.933

S = 2.266 R-Sq = 94.91% R-Sq(adj) = 91.09%

12
Individual 95% CIs For Mean Based on Pooled Individual 95% CIs For Mean Based on
StDev Pooled StDev
Renglon Mean +---------+---------+---------+--------- Columna Mean ------+---------+---------+---------+-
1 24.3333 (----*---) 1 36.6 (---------------*---------------)
2 33.0000 (---*---) 2 36.0 (---------------*---------------)
3 40.0000 (---*---) 3 36.2 (--------------*---------------)
4 38.6667 (---*----) ------+---------+---------+---------+---
5 45.3333 (----*---) 34.5 36.0 37.5 39.0
+---------+---------+---------+---------
21.0 28.0 35.0 42.0

• Pruebas de hipótesis no paramétricas

¿Cuándo es mejora aplicar una prueba de hipótesis no paramétrica?


¿Qué desventajas tiene vs las pruebas paramétricas?
¿Para que sirve y cómo se utiliza la prueba de Signos?

Price index values for 29 homes in a suburban area in the Northeast were determined. Real estate records
indicate the population median for similar homes the previous year was 115. This test will determine if there is
sufficiente evidence for judging if the median price index for the homes

Sign Test for Median: PriceIndex a) ¿qué podemos concluir con estos resultados?

Sign test of median = 115.0 versus > 115.0

N Below Equal Above P Median


PriceIndex 29 12 0 17 0.2291 144.0

¿Para que sirve y cómo se utiliza la prueba de Coeficientes de Concordancia de Kendall?


¿Para que sirve y cómo utilizar la prueba de Coeficientes de Correlación de Rangos de Spearman?
¿Para que sirve y cómo se utiliza la prueba de ANOVA de una vía de Kruskal Wallis?

Measurements in growth were made on samples that were each given one of three treatments
you decide to select the Kruskal-Wallis procedure to test H0: h1 = h2 = h3, versus H1: not all h's
are equal, where the h's are the population medians

Growth 15.1 13 16.2 14.9 13.2 13.8 13.1 13


12.9 11.9 17 12.8 14.7 12 15 16.5
Treatment 1 1 3 1 1 3 2 2
2 1 3 2 3 2 3 3

Kruskal-Wallis Test on Growth


Treatment N Median Ave Rank Z

13
1 5 13.20 7.7 -0.45 a) ¿Qué se puede concluir de esta prueba?
2 5 12.90 4.3 -2.38
3 6 15.60 12.7 2.71

Overall 16 8.5
H = 8.63 DF = 2 P = 0.013
H = 8.64 DF = 2 P = 0.013 (adjusted for ties)

¿Para que sirve y como se utiliza la prueba de Mann Whitney?


Samples were drawn from two populations and diastolic blood pressure was measured.
You will want to determine if there is evidence of a difference in the population locations without assuming
a parametric model for the distributions. Therefore, you choose to test the equality of population medians
using the Mann-Whitney test with a = 0.05 rather than using a two-sample t-test, which tests the equality of population
means

DBP1 90 72 61 66 81 69 59 70
DBP2 62 85 78 66 80 91 69 77

Mann-Whitney Test and CI: DBP1, DBP2


N Median 84
DBP1 8 69.50 a) ¿qué se puede concluir de la prueba?
DBP2 9 78.00
Point estimate for ETA1-ETA2 is -7.50
95.1 Percent CI for ETA1-ETA2 is (-18.00,4.00)
W = 60.0
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.2685
The test is significant at 0.2679 (adjusted for ties)

¿Para que sirve y cómo se utiliza la prueba Suma de Rangos de Wilconox - Mann Whitney?

Achievement test scores in science were recorded for 9 students. This test enables you to judge if there is sufficient
evidence for the population median being different than 77 using a = 0.05.

Achieveme 77 88 85 74 75 62 80 70
83
Wilcoxon Signed Rank Test: Achievement
Test of median = 77.00 versus median not = 77.00 a) ¿Que se puede concluir de la
N de la prueba?
for Wilcoxon Estimated
N Test Statistic P Median
Achievement 9 8 19.5 0.889 77.50

¿Para que sirve y cómo se utiliza la prueba de varianzas de Levene?


¿Para que sirve y cómo se utiliza la prueba de Coeficientes de Medianas de Mood?

Results for: Cartoon.MTW a) ¿Qué se puede concluir de la


Mood Median Test: Otis versus ED prueba?
Mood median test for Otis
Chi-Square = 49.08 DF = 2 P = 0.000

14
Individual 95.0% CIs
ED N<= N> Median Q3-Q1 ----+---------+---------+---------+--
0 47 9 97.5 17.3 (-----*-----)
1 29 24 106.0 21.5 (------*------)
2 15 55 116.5 16.3 (----*----)
----+---------+---------+---------+--
96.0 104.0 112.0 120.0
Overall median = 107.0

¿Qué pruebas utilizan el estadístico de prueba Chi cuadrada?

¿Qué salidas proporciona la fase de análisis?

15

También podría gustarte