Documentos de Académico
Documentos de Profesional
Documentos de Cultura
nPermite investigar la estabilidad de un proceso consiste de líneas verticales u otro esquema en función
del tiempo. La longitud de la línea o del esquema representa el rango de valores
encontrados en cada conjunto de muestras
22
Strength
21
20
19
18
17
15 18 21
MetalType
0.2500”
0.2490”
1
0.2500”
0.2490”
Izquierda
Máximo
Derecha
Mínimo
• Diagrama sistemático
Variación
Variación de
de
sist. medición
proceso
2
¿cómo se estima la varianza de la variable dependiente?
¿cómo se determina el coeficiente de correlación y que significa?
¿Cómo se intepreta el coeficiente de determinación?
Ejercicio: Hacer un análisis de regresión simple completo Ejercicio: ¿Existe relación entre los niveles de
completo con los datos siguientes: Consumo (Y) y el ingreso de consumindores (X)?
Publicidad Pasajeros Y a) Establecer la ecuación de regresión
10 15 a) Ecuación b) Hacer la gráfica de la regresión
12 17 b) r c) ¿Qué consumo se pronostica para alguien
8 13 c) r cuadrada que gane $27,000?
17 23 d) ¿Existe reg? Datos:
10 16 e) Intervalo de X=Ingreso Y=Consumo
15 21 confianza para 24.3 16.2
10 14 X = 14 12.5 8.5
14 20 f) Intervalo de 31.2 15
19 24 predicción 28 17
10 17 para X = 14 35.1 24.2
11 16 g) Gráfica de 10.5 11.2
13 18 regresión 23.2 15
16 23 h) Analizar 10 7.1
10 15 los residuos 8.5 3.5
12 16 15.9 11.5
14.7 10.7
Ejercicio: Interpretar los resultados de la regresión lineal siguiente: 15 9.2
Regression Analysis: Calif Y versus Tiempo X
The regression equation is
Calif Y = 31.21 + 0.6955 Tiempo X
S = 4.47182 R-Sq = 77.0% R-Sq(adj) = 74.2%
Analysis of Variance
Source DF SS MS F P
Regression 1 536.923 536.923 26.85 0.001
Error 8 159.977 19.997 a) ¿Existe la regresión?
Total 9 696.900
b) ¿Cómo se predice Y
para una cierta X?
Fitted Line Plot
Calif Y = 31.21 + 0.6955 Tiempo X
90 Regression
95% C I
c) ¿Qué significan los
95% PI
intervalos CI y PI?
80 S 4.47182
R-Sq 77.0%
R-Sq(adj) 74.2%
70 c) ¿Cuál es el valor del
Calif Y
coeficiente de correlación?
60
40
30 40 50 60 70
Tiempo X
40
95% CI
95% PI 3
S 6.00002
nsumption
30 R-Sq 79.3%
R-Sq(adj) 73.4%
20
Fitted Line Plot
EnergyConsumption = 128.8 - 13.11 MachineSetting
+ 0.3289 MachineSetting**2
50 Regression
95% CI
40 95% PI
S 6.00002
EnergyConsumption
30 R-Sq 79.3%
R-Sq(adj) 73.4%
20
10
-10
-20
10 15 20 25 30
MachineSetting
S 12.1825
30 R-Sq 2.3%
EnergyConsumption
R-Sq(adj) 0.0%
20
10
-10
-20
-30
10 15 20 25 30
MachineSetting
a) Diagrama de dispersión
b) Coeficiente de correlación
c) Recta gráfica
d) Ecuación de regresión
e) si Altura es 63 cual es el peso estimado
f) Coeficiente de determinación
g) Prueba de significancia para el parámetro Beta1
h) Intervalo de confianza para un 90% en Beta 1
i) Prueba de la significancia de la regresión
j) Intervalo de confianza para la media de Yest en altura = 65
k) Intervalo de predicción para los valores individuales de Yest en altura = 65
l) Determinación de residuales (3 valores)
n) Gráfica de distribución normal de los residuales
4
Ejercicio: Un experimento para determinar el efecto del tiempo en horas (X) a una cierta
temperatura a un cambio en la viscocidad del aceite (Y) da los resultados siguientes:
Y3 X5 X6 X7 X8 a) Encontrar un modelo de
9 5.8 18.6 28.6 86.5 regresión múltiple para los datos
9.3 5.2 18.8 30.6 84.5 Regression > Regression > Normal Plot of Res.
9.3 5.6 19 32.4 88.8 b) Predecir la fuerza de sujeción
9.5 6 20.8 32.6 85.7 Y3 cuando X5 = 6, X6 = 20
9.8 5.2 19.9 32.2 93.6 X7 = 30, X8 = 90
10 5.8 18 31.8 86 Considerar un intervalo de
10.3 6.4 20.6 32.6 87.1 confianza y de predicción del 95%
5
10.5 6 20.2 33.4 93.6 Regression > Regression > Options > Pred. Intervals for
10.8 6.2 20.2 31.8 86 new observations / X6 X6 X7 X8 / 95%
11 6.2 19.2 32.4 87.1 c) Identificar por medio de las
11.3 6.2 17 31.4 93.1 correlaciones entre las X's
11.5 5.6 19.8 33.2 83.4 cuales presentan colinealidad
11.8 6 18.8 35.4 94.5 y por tanto como se debe adecuar
12.3 5.8 19.8 34 83.4 la ecuación de regresión múltiple
12.5 5.6 18.8 34.2 85.2 Basic statistics > Correlation (display P values)
En cada comparación aparece R2 y su P value (sign..05)
Ejercicio. Una muestra de 50 bultos de productos pesa en promedio Xmedia = 652.58 Kgs., con S = 217.43 Kgs.
Determinar el intervalo de confianza al NC del 95% y al 99% donde se encuentra la media del proceso (poblacional).
Alfa = 1 - NC
Ejercicio. Un intervalo de confianza del 90% para estimar la ganancia promedio del peso de ratones de laboratorio es
de 0.93 a 1.73 onzas. ¿Cuál es el valor de Z?.
Ejercicio. 100 latas de 16 onzas de salsa de tomate tienen una media de Xmedia = 15.2 onzas y una S = 0.96 onzas.
¿A un nivel de confianza del 95%, las latas parecen estar llenas con 6 onzas?.
Ejercicio. Una muestra de 16 soluciones tienen un peso promedio de 16.6 onzas con S = 3.63. Se rechaza la
solución si el peso promedio del lote no excede las 18 onzas. ¿Cuál es la decisión a un 90% de nivel de
confianza?
Ejercicio.. 20 cajas de producto pesaron 102 grs.Con S = 8.5 grs¿Cuál es el intervalo donde se encuentra
la media del lote para un 90% de nivel de confianza?. Grados de libertad = gl = 20 - 1 = 19
Ejercicio. Una muestra de 25 productos tienen un peso promedio de 23.87 grs. Con una S = 9.56. ¿Cuál
es la estimación del intervalo de confianza para un nivel de confianza del 98% del peso de productos del
lote completo?
2. Con los datos del problema anterior, determinar el Intevalo de confianza para un 95% de nivel de con
Ejemplo: Los pesos de 25 paquetes enviados a través de UPS tuvieron una media de 3.7 lib
6
y una desviación estándar de 1.2 libras. Hallar el intervalo de confianza del 95% para
estimar el peso promedio de todos los paquetes. Los pesos de los paquetes se distribuyen
normalmente
¿Cómo se determina el intervalo de confianza para una proporción?
Ejemplo: En una encuesta a 673 tiendas, 521 reportaron problemas de robo por los
empleados
¿Se puede concluir con un 99% de nivel de confianza que el 78% se encuentra en el
intervalo de confianza. ?
Ejercicio: Las ganancias promedio por acción en 2001 fueron de 3 dolares, muestra de 10
empresas mostraron las siguientes ganancias para 2002:
1.92 2.16 3.63 3.16 4.02 3.14 2.20 2.34
3.05 2.38
a) Para un alfa de 0.05 probar la afirmación de que estas ganancias difieren de los 3 dolares
del 2001
b) ¿Cuál es el valor p de la prueba?
Ejercicio: Antes de publicar un libro, BANTAM, hace una prueba a un nivel alfa = 2% de que el precio
promedio es de $35.¿Se sustenta la afirmación si en una muestra de n = 50 tiendas, se observa
?
X̄ =32. 97 , S=12. 87 .
Ejercicio: Se planea en un restaurante eliminar del menú el pollo frito. Se afirma que las ventas habían
descendido por debajo de la media histórica de $4,500. ¿parece una decisión adecuada si en una
muestra de n = 144 observaciones se observa
con alfa = 2%?.
X̄ =4, 477, S=1, 128
Ejercicio: Se publica que el costo de alojamiento es menor a $3,500. ¿se confirma esta cifra a un nivel
del 5%, si en una muestra n = 60, ?
X̄=$ 3,200, S=$ 950.
Ejercicio: Un distribuidor piensa que el promedio de sus ventas son de $12,000 al mes. Selecciona 10
meses y encuentra: A un alfa del 5% ¿qué se puede concluir?.
X̄ =$ 11, 277 , S=3, 772
7
Ejercicio: La vida útil de un foco es de 5,000 horas. Un nuevo diseño se piensa incremente esta
vida. Se prueban n = 25 focos con fusión a Concluir para un nivel alf 5%.
X̄=5,117, S=1,886.
Ejercicio: DHL afirma que entrega paquetes en menos de 2.5 días que es la media histórica. Se
hacen n = 17 observaciones y se encuentra que días. Probar con alfa = 0.01.
X̄ =2.2, S=0.9
Ejercicio: Probar la afirmación de que la varianza es menor a 15, si se toma una muestra de 8 partes y se
obtiene una desviación estándar de 8 para un 95% de nivel de confianza.
¿Cómo se realiza una prueba de hipótesis para prueba de parámetros de dos poblaciones?
¿por qué es necesario hacer una prueba de igualdad de varianzas antes de la prueba t?
¿Cómo se realiza una prueba de hipótesis para varianzas de dos poblaciones?
Ejercicio: Se desea probar si las varianzas de dos poblaciones son iguales Ho: σ 21 =σ 22
a un nivel alfa del 5% con los datos siguientes:
Ejercicio: Un laboratorio de materiales está analizando el efecto del añejamiento de un producto, quieren
saber si hay mejora en la consistencia de resistencia después de un año (asumir un 95% de nivel de con
Los resultados obtenidos son: Al inicio Un año después
Número de pruebas 9 7
Desv. Estándar PSI 900 300
8
Ejercicio: Se toman muestras de tamaño n1 = 10 y n2 = 8, revelan medias y desviaciones estándar
X̄ 1 =36 S1 =12 X̄ 2= 49 S2 =18
respectivamente. A un nivel del 1% pruebe la hipótesis de
que las medias de ambas poblaciones son iguales Ho: μ1 =μ 2 o μ1 −μ2 =0
Se asume que las varianzas son iguales
Ejercicio: Repetir el problema anterior asumiendo que las varianzas son iguales.
Ejercicio: Probar si un nuevo programa da mejores resultados en las horas promedio de terminación de
un proyecto para un nivel de confianza del 95%:
Programa
actual nuevo a) Probar la hipótesis de igualdad de varianzas (Ho:s12=s22)
300 276
280 222 b) Probar la hipótesis ( t) de si la media del nuevo programa
344 310 es menor que la del actual (Ha: Miu nuevo < Miu actual)
385 338
372 200
360 302
288 317
321 260
376 320
290 312
301 334
283 265
¿Cómo se realiza una prueba de hipótesis para muestras pareadas, cuando usar Z ycuando usar t?
Ejercicio: Muestras pareadas de tamaño n = 81 dan una media de las diferencias de 36.5 y una des
estándar de las diferencias de 29.1. Probar la igualdad de las medias a un alfa de 0.01.
Ejercicio: Muestras pareadas de tamaño n = 25 dan una media de las diferencias de 45.2 y una
desviación estándar de las diferencias de 21.6. Probar la igualdad de las medias a un alfa del 5%.
29. Muestras de tamaño n1 = 120 y n2 = 150 produjeron proporciones de p1= 0.69 y p2 = 0.73.
Pruebe la igualdad de las proporciones de las poblaciones a un nivel del 5%.
Ho: π 1 =π 2
Ejercicio: Los errores de facturación Oficina 2
Oficina 1 250 n2 = 300 Nivel de confianza = 95%
n1 = 30 errores = 25
errores =
a) Probar la afirmación de que las proporciones de errores en ambas oficinas son iguales
Ho: π 1 ≤π 2
Ejercicio: Dos muestras de tamaño n1 = n2 = 500 se utilizan para probar la hipótesis de que .
Las proporciones muestrales son p1 = 14% y p2 = 11%. A un nivel del 10%. ¿Cuál es la conclusión?.
Ho: π 1≥π 2
Ejercicio: Dos muestras de tamaño n1 = 200 y n2 = 250 se utilizan para probar la hipótesis de que .
9
Las proporciones muestrales son p1 = 22% y p2 = 26%. A un nivel del 1%. ¿Cuál es la conclusión?.
• Tablas de contingencia
¿Qué es una tabla de contingencia?
¿Cómo se calculan las probabilidades para cada celda de la tabla de contingencia?
¿Cómo se prueba la hipótesis de independencia en la tablas de contingencia?
Ejemplos:
Ejemplo: Probar la hipótesis si no hay diferencia significativa entre los 3 inspectores con los datos siguientes:
Inspectores
Resultados 1 2 3 Total
Radios detectados 27 25 22
Radios no detectados 3 5 8
Ejemplo: Probar si los resultados en el trato de una enfermedad depende del hospital
Hospital
Resultados A B D E
Sin cambio 15 6 8 44
Ligera mejora 20 11 39 30
Mejora significativa 18 19 38 9
• Análisis de varianza
Ejercicio: La resistencia a la tensión observada en función del peso porcentual del algodón
en una fibra sintética es:
10
Probar a un 5% de significancia si los porcentajes de algodón tienen el mismo efecto o cual
es mejor
Ejercicio: ¿Parecería que hay diferencia en los salarios que ganan los nuevos graduados en
diferentes campos?
Probar esta hipótesis al 5%
102 95 84
Percent
60
50
40
30 85 75
20
10 82
5
1
-15 -10 -5 0 5 10
Residual
Preguntas:
11
S = 6.178 R-Sq = 69.01% R-Sq(adj) = 63.85%
95
90
b) A un 95% de nivel de confianza que se
80 puede concluir en relación con la experiencia
70
de los operadores
Percent
60
50
40
30
20
b) A un 95% de nivel de confianza que se
10
12
Individual 95% CIs For Mean Based on Pooled Individual 95% CIs For Mean Based on
StDev Pooled StDev
Renglon Mean +---------+---------+---------+--------- Columna Mean ------+---------+---------+---------+-
1 24.3333 (----*---) 1 36.6 (---------------*---------------)
2 33.0000 (---*---) 2 36.0 (---------------*---------------)
3 40.0000 (---*---) 3 36.2 (--------------*---------------)
4 38.6667 (---*----) ------+---------+---------+---------+---
5 45.3333 (----*---) 34.5 36.0 37.5 39.0
+---------+---------+---------+---------
21.0 28.0 35.0 42.0
Price index values for 29 homes in a suburban area in the Northeast were determined. Real estate records
indicate the population median for similar homes the previous year was 115. This test will determine if there is
sufficiente evidence for judging if the median price index for the homes
Sign Test for Median: PriceIndex a) ¿qué podemos concluir con estos resultados?
Measurements in growth were made on samples that were each given one of three treatments
you decide to select the Kruskal-Wallis procedure to test H0: h1 = h2 = h3, versus H1: not all h's
are equal, where the h's are the population medians
13
1 5 13.20 7.7 -0.45 a) ¿Qué se puede concluir de esta prueba?
2 5 12.90 4.3 -2.38
3 6 15.60 12.7 2.71
Overall 16 8.5
H = 8.63 DF = 2 P = 0.013
H = 8.64 DF = 2 P = 0.013 (adjusted for ties)
DBP1 90 72 61 66 81 69 59 70
DBP2 62 85 78 66 80 91 69 77
¿Para que sirve y cómo se utiliza la prueba Suma de Rangos de Wilconox - Mann Whitney?
Achievement test scores in science were recorded for 9 students. This test enables you to judge if there is sufficient
evidence for the population median being different than 77 using a = 0.05.
Achieveme 77 88 85 74 75 62 80 70
83
Wilcoxon Signed Rank Test: Achievement
Test of median = 77.00 versus median not = 77.00 a) ¿Que se puede concluir de la
N de la prueba?
for Wilcoxon Estimated
N Test Statistic P Median
Achievement 9 8 19.5 0.889 77.50
14
Individual 95.0% CIs
ED N<= N> Median Q3-Q1 ----+---------+---------+---------+--
0 47 9 97.5 17.3 (-----*-----)
1 29 24 106.0 21.5 (------*------)
2 15 55 116.5 16.3 (----*----)
----+---------+---------+---------+--
96.0 104.0 112.0 120.0
Overall median = 107.0
15