Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE INGENIERÍA
ANÁLISIS DE VARIANZA
CURSO:
ESTADÍSTICA APLICADA
DOCENTE:
1
UNIVERSIDAD NACIONAL DE CAJAMARCA
DEDICATORIA
El presente trabajo es dedicado en primer lugar a Dios, luego a mis padres por el sustento
que me dan día a día para alcanzar mis objetivos, también al docente del curso por
impartir los conocimientos necesarios para tener una buena preparación académica y
profesional.
2
UNIVERSIDAD NACIONAL DE CAJAMARCA
INDICE
INTRODUCCIÓN ............................................................................................... 4
OBJETIVOS ....................................................................................................... 5
MARCO TEÓRICO............................................................................................. 6
1. COMPARACIÓN DE MEDIAS .................................................................... 6
2. FUNDAMENTOS DEL ANÁLISIS DE LA VARIANZA ................................. 8
2.1. Modelo .................................................................................................. 8
2.2. Hipótesis requeridas.............................................................................. 8
2.3. Contraste ANOVA ................................................................................. 9
3. TABLA ANOVA ......................................................................................... 10
4. ANÁLISIS DE LA DIFERENCIA ENTRE LAS MEDIAS ................................ 13
5. PROCEDIMIENTO DE APLICACIÓN .......................................................... 13
Representación de los datos ........................................................................ 13
Construcción de la tabla ANOVA y realización del contraste........................ 14
Validación de las hipótesis............................................................................ 14
APLICACIÓN MINITAB................................................................................. 16
Construcción de la tabla ANOVA y realización del contraste........................ 17
APLICACIÓN MINITAB................................................................................. 17
Validación de las hipótesis............................................................................ 20
Independencia de los datos ...................................................................... 20
Normalidad de las perturbaciones ............................................................. 20
Heterocedasticidad ................................................................................... 20
RESOLUCIÓN DE EJERCICIOS ..................................................................... 22
3
UNIVERSIDAD NACIONAL DE CAJAMARCA
INTRODUCCIÓN
4
UNIVERSIDAD NACIONAL DE CAJAMARCA
OBJETIVOS
5
UNIVERSIDAD NACIONAL DE CAJAMARCA
MARCO TEÓRICO
1. COMPARACIÓN DE MEDIAS
Supongamos que se están evaluando las características de calidad de los
productos de tres proveedores. Para ello se han realizado los ensayos cuyos
resultados se recogen en la Tabla 1. Si la escala de medida de la calidad es
tal que cuanto mayor sea su valor, mejor es su calidad ¿qué proveedor
suministra productos con mayor calidad?
6
UNIVERSIDAD NACIONAL DE CAJAMARCA
7
UNIVERSIDAD NACIONAL DE CAJAMARCA
8
UNIVERSIDAD NACIONAL DE CAJAMARCA
• Los datos han de ser independientes. Para asegurar esto, las muestras
cuyas medias se desea comparar han de extraerse de manera aleatoria.
• Las poblaciones base de donde proceden las muestras han de ser
normales.
• Las poblaciones base de donde proceden las muestras han de tener la
misma varianza.
Estas hipótesis implican que las perturbaciones se distribuyan según una
N(0, σ2).
2.3. Contraste ANOVA
Podremos estimar la varianza de la población σ2 a través de los siguientes
estimadores:
• Estimar la varianza de la población σ^2 a través de la varianza de cada
una de las muestras. Esta estimación se hace ponderando las varianzas
muéstrales. Si k es el número de muestras (en adelante denominaremos a
cada “muestra” “tratamiento”, ni es el tamaño de la muestra correspondiente
a tratamiento i-ésimo y N es el número total de datos disponible en las
distintas muestras, el estimador denominado “varianza residual” se define:
9
UNIVERSIDAD NACIONAL DE CAJAMARCA
3. TABLA ANOVA
Denominando S a la suma de los cuadrados, se tiene:
10
UNIVERSIDAD NACIONAL DE CAJAMARCA
11
UNIVERSIDAD NACIONAL DE CAJAMARCA
Como 19,16 > 3,88 se rechaza la hipótesis de que todos los proveedores
son iguales. No obstante, para poder dar por bueno el resultado es preciso
comprobar que se satisfacen las hipótesis de partida. Para ello se realiza un
análisis de los residuos (ver Figura 2) sin que se aprecie en él ningún aspecto
que haga dudar de la normalidad de sus distribución.
12
UNIVERSIDAD NACIONAL DE CAJAMARCA
5. PROCEDIMIENTO DE APLICACIÓN
En general, el procedimiento de aplicación del análisis de la varianza consta
de los siguientes pasos (ver esquema en Figura 3).
Representación de los datos
Como en la mayor parte de los procedimientos estadísticos debe
comenzarse por representar gráficamente los datos. Si el número de datos
por grupo es menor que 10, se recomienda emplear el diagrama de puntos;
si es superior a 10 se recomiendan histogramas o diagramas de caja. En
esta representación deben buscarse valores atípicos. Si estos valores
atípicos no se deben a un error o una causa subsanable (por ejemplo, error
de transcripción de datos) debe pensarse en la necesidad de transformar los
datos para que cumplan las hipótesis de normalidad. En la Tabla 5 se dan
algunas indicaciones de transformaciones recomendadas. De manera
general se pueden emplear las transformaciones de Box Cox.
13
UNIVERSIDAD NACIONAL DE CAJAMARCA
14
UNIVERSIDAD NACIONAL DE CAJAMARCA
15
UNIVERSIDAD NACIONAL DE CAJAMARCA
16
UNIVERSIDAD NACIONAL DE CAJAMARCA
17
UNIVERSIDAD NACIONAL DE CAJAMARCA
18
UNIVERSIDAD NACIONAL DE CAJAMARCA
19
UNIVERSIDAD NACIONAL DE CAJAMARCA
Heterocedasticidad
En la Figura 7 se aprecia que en los termómetros C Y D los datos están algo
más dispersos. No obstante solo son tres datos y además al tener el mismo
número de datos por termómetro, no se considera importante esta indicación.
20
UNIVERSIDAD NACIONAL DE CAJAMARCA
21
UNIVERSIDAD NACIONAL DE CAJAMARCA
RESOLUCIÓN DE EJERCICIOS
1. Tres lotes pilotos de 5 cerdos cada uno escogió un ingeniero para realizar
durante tres meses de prueba de alimentación. El lote 1 recibió el método
de alimentación A, el lote 2 el B y el lote 3 el C. los rendimientos de los
métodos de alimentación medidos como el peso final (en kilogramos) de
los cerdos se resumen en la siguiente tabla de análisis de varianza
a) Describa la variable dependiente y el modelo de este ANOVA
b) ¿existe evidencia de una diferencia significativa entre los tres tipos de
alimentación? Plantee las hipótesis nula y alternativa, describa la
estadística y la región de rechazo de la hipótesis nula al nivel de
significación α=0.05 y finalmente tome la decisión completando
previamente la tabla ANOVA
SOLUCIÓN:
a) La viable dependiente es el rendimiento pues esta depende del
método de alimentación que les sea aplicado
b)
H₀: µ₁=µ₂=µ₃
H₁: Una µₓ es diferente
Fuente de
SC GL MC 𝐹𝑐𝑎𝑙
Varianzas
Tipos de
377.733 2 188.8665
Alimentación 10.4346133
Error 217.2 12 18.1
Total 594.933 14 206.9665
Métodos de Alimentación: 3
N° de Cerdos por métodos: 5
N° de Cerdos totales: 15
Sabemos que:
α=0.05
Al calcular el Ft obtenemos:
𝐹𝑡 = 3.89
22
UNIVERSIDAD NACIONAL DE CAJAMARCA
23
UNIVERSIDAD NACIONAL DE CAJAMARCA
𝑋∗∗ = 80
𝑋1∗= 80
𝑋2∗ = 85
𝑋3∗ = 75
𝑋∗∗
=
2 𝑋𝑖∗ 2
= ∑∑𝑋 =∑ SCE = ECT - SCA
RC = {F(2,12)>3.89}
FCAL= 3.35
P=P[F(3,12)>3.35]
F(3,12)(5%)=3.89>3.35
RPTA: Al ver que cumple que el F de la tabla es mayor que F(cal) podemos
aceptar la hipótesis nula
Por lo tanto
𝐻𝑜: µ1 = µ2 = µ3
Se cumple
24
UNIVERSIDAD NACIONAL DE CAJAMARCA
SCA = 250
SCE = 448
SCT = 698
P = P[F>3.35] = 0.07
X: Rendimiento en kilogramos
25
UNIVERSIDAD NACIONAL DE CAJAMARCA
SOLUCIÓN
a)
1. Planteamos:
Ho: = 2= 3
1
H1: Son diferentes
26
UNIVERSIDAD NACIONAL DE CAJAMARCA
Donde:
SCT 1400.00
SCI 1000
SCE 400.00
J 3
J-1 2
N 15
N-J 12
Donde:
5. Estadístico de contraste:
F = 14.999
6. Regla de Decisión
7. Decisión:
Puesto que el estadístico F cae en la zona critica, se rechaza Ho con
un nivel de confianza del 95%. Podemos concluir que las medias del
rendimiento no son iguales.
27
UNIVERSIDAD NACIONAL DE CAJAMARCA
1. Planteamos:
Ho: = 2= 3
1
H1: Son diferentes
28
UNIVERSIDAD NACIONAL DE CAJAMARCA
Tamaño
Marca de Suma de
de Total Media
componentes Cuadrados
muestras
A 5 454 90.8 41223.2
B 5 397 79.4 31521.8
C 5 506 101.2 51207.2
D 5 450 90 40500
total 20 1807 361.4 164452.2
Donde:
SCT 1298.55
SCI 1189.75
SCE 108.80
J 4
J-1 3
N 20
N-J 16
Donde:
SCI /( J-
MCI = 1) 396.58
SCE / (N-
MCE = J) 6.80
29
UNIVERSIDAD NACIONAL DE CAJAMARCA
5. Estadístico de contraste:
F = 58.322
6. Regla de Decisión
7. Decisión:
Puesto que el estadístico F cae en la zona critica, se rechaza Ho con
un nivel de confianza del 95%. Podemos concluir que las medias del
rendimiento no son iguales.
30
UNIVERSIDAD NACIONAL DE CAJAMARCA
𝑯𝟎 : 2 = 3
𝑯𝟏 : 2 ≠ 3
2) Estadígrafo de prueba
∝= 0.05 ˄ 𝐺 𝑎𝑑𝑜 𝑑𝑒 𝐿𝑖𝑏𝑒 𝑡𝑎𝑑 = 0 1 1 = 18
2
𝑥𝑐𝑎𝑙 = 𝐼𝑁𝑉. 𝐻𝐼 𝑈 𝐷. 𝐷 0.05,18
2
𝑥𝑐𝑎𝑙 = 8.869
3) Toma de decisión:
𝑯𝟎 : 𝑎𝑖 = 0 𝑖 = 1, ,3
𝑯𝟏 : ∃ 𝑎 𝑖 ≠ 0
∑ 𝒙𝒊 = 𝑿 ∗ 𝒏
∑ 𝑥1 = 56.5 ∗ 10 = 565
∑ 𝑥2 = 45.6 ∗ 10 = 456
∑ 𝑥3 = 60.3 ∗ 10 = 603
∑ 𝑥𝑖 2 = [𝛿 2 + 𝑋 2 ] ∗ 𝒏
31
UNIVERSIDAD NACIONAL DE CAJAMARCA
∑ 𝑥1 2 = [ 1.780 2
+ 56.5 2 ] ∗ 10 = 31954.184
∑ 𝑥2 2 = [ 1.897 2
+ 45.6 2 ] ∗ 10 = 08 9.586
∑ 𝑥3 2 = [ 1.947 2
+ 60.3 2 ] ∗ 10 = 36398.808
3) Resultados:
16 4
= = 8791 .533
30
= 8918 .578 8791 .533 = 1 59.4667
= 10 ∗ 116.447 = 1164.4667
𝐸 = 1 59.4667 1164.4667 = 95
2
1 59.4667
𝑇 = = 43.4 99
30 1
𝑘=3
= 30
4) Tabla ANOVA:
Fuentes de Suma de Grado de Medias Razón F
Varianzas Cuadrados Libertad Cuadráticas calculada
Tratamiento 1164.467 2 582.233 165.47678
Error 95 27 3.519
Total 1259.467 29
5) Nivel de significancia:
∝= 0.05 ˄ 𝐹𝑜 = 165.4767
𝐹 = 𝐼𝑁𝑉. 𝐹. 𝐷 0.05, , 7
𝑭 = 𝟑. 𝟑𝟓𝟒𝟏
𝑃 𝐹𝑜 > 165.4767 = 𝐷𝐼 . 𝐹. 𝐷 165.4767,3,16
𝑷 𝑭𝒐 > 165.4767 = 𝟕. 𝟎𝟐𝟔𝟔𝟖𝑬 𝟏𝟔
6) Región Critica:
R.C= [F (2,27)>3.35]
7) Toma de decisión:
Se rechaza Ho.
32
UNIVERSIDAD NACIONAL DE CAJAMARCA
2 < 1 < 3
Solución
1) Formulación de Hipótesis:
𝑯𝟎 : 1 = 2 = 3 = 4 =
𝑯𝟏 : ∃ 1 ≠
33
UNIVERSIDAD NACIONAL DE CAJAMARCA
3) Nivel de Significancia:
∝= 0.05 ˄ 𝐹𝑜 = 1.55
𝐹 = 𝐼𝑁𝑉. 𝐹. 𝐷 0.05,3,16
𝑭 = 𝟑. 𝟐𝟒
𝑃 𝐹𝑜 > 1.55 = 𝐷𝐼 . 𝐹. 𝐷 1.55,3,16
𝑷 𝑭𝒐 > 𝟏. 𝟓𝟓 = 𝟎. 𝟐𝟒
8) Región Critica:
R.C= [F (3,16)>3.35]
9) Toma de decisión:
Se acepta Ho.
34
UNIVERSIDAD NACIONAL DE CAJAMARCA
P1 P2 P3
13.45 22.81 18.92
19.1 20.69 21.32
20.73 24.4 25.93
23.6 26.86 19.07
13.45 22.37 20.98
23.29 19.98 26.4
14.93 20.98 28.04
17.07 24.08 23.44
13.65 18.35 18.47
18.79 17.22 25.42
Además, la desviación estándar de la variable dependiente es igual a 4.0072
a) Describa la variable dependiente, el factor y sus niveles. El modelo del
diseño y sus supuestos. Además, describa si hay indicios de diferencias
significativas entre los tres procedimientos.
b) ¿Existe diferencia significativa entre los promedios de tiempos empleados
por los procedimientos 2 y 3? Utilice el nivel de confianza 0.95.
c) Realice una prueba de hipótesis global de los promedios de los tres
procedimientos, al nivel se significación α = 0.05.
d) ¿Cuál de los procedimientos empleados es óptimo? Aplique el método de
intervalos de pares de medias de Bonferroni con nivel de confianza al
menos 96% y el método de rangos de Duncan con nivel se significación
0.05.
SOLUCIÓN:
a)
- Variable independiente: X = Tiempo, en segundos, para realizar
una tarea específica.
- Variable dependiente o factor: A = Procedimientos
- Niveles o Tratamientos: Son los procedimientos P1, P2 y P3.
- El modelo de este ANOVA está dado por:
𝑋𝑖𝑗 = + 𝛼𝑖 + 𝜀𝑖𝑗 , i = 1,2,3 j = 1, 2, …,10.
- Supuestos:
𝛼𝑖 = 𝑖
35
UNIVERSIDAD NACIONAL DE CAJAMARCA
Entonces: 𝑢2 = 𝑢3
c)
A = Procedimientos
P1 P2 P3
13.45 22.81 18.92
19.1 20.69 21.32
20.73 24.4 25.93
23.6 26.86 19.07
13.45 22.37 20.98
23.29 19.98 26.4
14.93 20.98 28.04
17.07 24.08 23.44
13.65 18.35 18.47
18.79 17.22 25.42
TOTALES 𝑋𝑖∙ 𝑋∙∙ =623.79
178.06 217.74 227.99
= 30
ni = r 10 10 10
MEDIAS̅𝑋 ∙ 𝑋∙∙ =62.379
17.806 21.774 22.799
36
UNIVERSIDAD NACIONAL DE CAJAMARCA
- 𝐹 . 5;2;27 = 0.05139
DECISIÓN:
Dado que 𝐹𝑐𝑎𝑙 = 5.75 > 0.05139, se debería rechazar 𝐻 con probabilidad de
error tipo I igual a 0.05, por lo tanto, el factor procedimiento tiene efecto
significativo sobre el tiempo necesario para realizar una tarea específica.
d)
Utilizando el método de intervalos de pares de medias de Bonferroni
con nivel de confianza al menos 96%:
Entonces: 𝑢1 < 𝑢2 = 𝑢3
Utilizando el método de rangos de Duncan con un nivel de
significación 0.05:
- Ordenamos las medias de menor a mayor:
𝑋1 < 𝑋2 < 𝑋3
37
UNIVERSIDAD NACIONAL DE CAJAMARCA
- Para p=2
𝑋3 𝑋1 = 1.774 17.806 = 3.968 Son significativamente
diferentes.
Entonces: 𝑢1 < 𝑢2 = 𝑢3
N1 N2 N3 N4
55 63 48 59
53 67 50 68
50 55 59 57
60 62 50 66
55 70 47 71
65 75 61 73
Al nivel de significación del 5%
¿Indican estos datos que las marcas de los neumáticos producen efectos
significativos en el rendimiento?
SOLUCIÓN:
38
UNIVERSIDAD NACIONAL DE CAJAMARCA
HIPOTESIS:
- 𝐻 : 𝑢1 = 𝑢2 = 𝑢3
Contra:
- 𝐻1 : ∃ 𝑢𝑖 ≠ 𝑢𝑗
- 𝐹 . 5;3;2 = 3.10
DECISIÓN:
Dado que 𝐹𝑐𝑎𝑙 = 316068 > 3.10, se debería rechazar 𝐻 con probabilidad de
error tipo I igual a 0.05, por lo tanto, el factor procedimiento tiene efecto
significativo sobre el tiempo necesario para realizar una tarea específica.
X:Ingresos mensuales
Arequipa Iquitos Piura Trujillo
610 710 560 500
560 730 610 400
490 660 470 500
550 610 510 500
460 580 500
620 400
650
39
UNIVERSIDAD NACIONAL DE CAJAMARCA
600
500
400
300
200
100
0
1 2 3 4
SOLUCION:
1 1
ES=√𝑀 𝐸 ∗ +𝑛 tₒ=t1-α/2, n-k
𝑛𝑖 𝑗
X1 552.5
ES 44.67 X2 634
tₒ 2.101 X3 571.4
ni=4 nj=7 X4 466.7
40
UNIVERSIDAD NACIONAL DE CAJAMARCA
De donde:
SOLUCION:
ANÁLISIS DE VARIANZA
Origen de Promedio
Suma de Grados Valor
las de los Probabilida
cuadrado de F crítico
variacione cuadrado d
s libertad para F
s s
Entre
79895.04 3 26631.68 5.24 0.009 3.160
grupos
Dentro de
91414.05 18 5078.56
los grupos
171309.0
Total 21
9
De donde:
SCA=79895.04 SCT=171309.09 Fcal= 5.24
SCE=91414.05 MCE=5078.56
41
UNIVERSIDAD NACIONAL DE CAJAMARCA
APLICANDO DUNCAN:
α=0.05 k=4 f=18
𝑛
n= 1 =5.266
∑𝑘
𝑖=1 𝑛𝑖
𝑀𝐶𝐸 5 78.5
√ =√ =31.0548
𝑛 5.2
Muestras
Muestra Muestra Muestra Muestra
1 2 3 4
15 10 20 16
12 12 18 18
14 14 20 16
14 13 22 15
15 18 21
14 20 18
12 19
17 20
14
42
UNIVERSIDAD NACIONAL DE CAJAMARCA
Hₒ=µ1=µ2=µ3=µ4
𝐻1 = ⁆µ𝑖≠µ𝑗
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 6 84 14 1.2
Columna 2 9 130 14.44 10.53
Columna 3 8 158 19.75 1.93
Columna 4 4 65 16.25 1.58
ANÁLISIS DE VARIANZA
Origen de Promedio
Suma de Grados Valor
las de los Probabilida
cuadrado de F crítico
variacione cuadrado d
s libertad para F
s s
Entre
157.60 3 52.53 11.14 0.00 3.03
grupos
Dentro de
108.47 23 4.72
los grupos
Total 266.07 26
De donde:
SCA=157.60 SCT=266.07
SCE=108.47 MCE= 4.72
MCE=4.72
𝑀𝐶𝐸 4.72
√ =√ =0.8776
𝑛 .128
43
UNIVERSIDAD NACIONAL DE CAJAMARCA
Entonces:
µ1=µ2 <µ4<µ3
Por lo tanto se debe hacer mantenimiento a la línea 3.
c) Cree usted que se viola el supuesto de homecedasticidad? Utilice un
paquete de cómputo para resolver este inciso.
SOLUCION:
11. El Decano del FACI desea estudiar el número de horas que los alumnos
que los alumnos de los ciclos: 5,6,7 y 8, utilizan los terminales de computo
de la universidad. Una muestra de usos por ciclo ha dado los siguientes
tiempos en hora mensuales:
CICLOS
C5 C6 C7 C8
35 43 28 39
33 47 30 48
30 35 39 37
40 30 46
35 27
42
a) Defina la variable dependiente y estime el efecto que produce el séptimo
ciclo.
b) Describa la regla de decisión para probar globalmente la hipótesis nula
de igualdad de las cuatro media. ¿Cuál es la decisión estadística? Use
𝛼 = 0.05. ¿Cuánto es la probabilidad P de la prueba?
c) Si es adecuado, determine que ciclos difieren significativamente en el
uso promedio de horas por ciclo de los terminales por cómputo. Use
Duncan con 𝛼 = 0.05.
SOLUCIÓN
a)
i. LA VARIABLE DEPENDIENTE ES: X= número de horas
que los alumnos utilizan los terminales de computo.
∑𝑘
𝑖=1 𝜇𝑖
ii. = 𝑘
35 + 33 + 30 + 40 + 35 + 4 15
1 = = = 35.83
6 6
43 + 37 + 35 1 5
2 = = = 41.68
3 3
8 + 30 + 39 + 30 + 7 154
3 = = = 30.8
5 5
44
UNIVERSIDAD NACIONAL DE CAJAMARCA
39 + 48 + 37 + 46 170
4 = = = 4 .5
4 4
𝛼𝑖 = 𝑖
𝛼3 = 3 = 30.8 37.70 5
b)
i. Hipótesis:
𝐻: 1= 2= 3= 4=
𝐻 :∃ 𝑖 ≠
ii. Nivel de significancia:
𝛼 = 0.05.
De los datos se obtienen:
𝑋1. = 15 1 = 6
𝑋2. = 1 5 2 = 3
𝑋3∙ = 154 3 = 5
𝑋4. = 170 4 = 4
𝑋.. = 664 = 18
2 2
𝑋.. 664
= = = 4494.
18
2 2 2 2 2 2
.∑ ∑ 𝑋𝑖𝑗 = 35 + 33 + 30 + ⋯ + 37 + 46 = 5 30
2
SCT=∑ ∑(𝑋𝑖𝑗 ) = 5 30 4494. = 735.8
𝑆𝐶𝐴 38 .3
MCA= 𝐾 = = 1 8.83
1 3
𝑆𝐶𝐸 34 .3
MCE= 𝑛 = = 4.95
𝑘 14
𝑀𝐶𝐴 128.83
FA=𝑀𝐶𝐸 = = 5.1635
24. 5
45
UNIVERSIDAD NACIONAL DE CAJAMARCA
c)
I. 𝑋 1. = 35.83 1=6
𝑋 2. = 41.68 2 =3
𝑋 3. = 30.8 3 =5
𝑋 4. = 4 .5 4 =4
II. 𝑝 = 𝛼 𝑝, 𝑓
𝛼 = 0.05
𝑘=4
𝑓 = 14
2 = . 5 ,14 = 3.03
3 = . 5 3,14 = 3.18
4 = . 5 4,14 = 3. 7
𝑀 𝐸 4.95
√ =√ = .434
40⁄57
46
UNIVERSIDAD NACIONAL DE CAJAMARCA
METODOS
A B ABP
132 17 10
14 16 11
12 16 15
13 17 10
12 17 14
15 13 13
11 10
14 13
11
14
13
10
a) Al nivel de significancia 𝛼 = 0.05 ¿indican los datos obtenidos que no
existen diferencias significativas entre los tres métodos de
enseñanza?.
b) Realice un ordenamiento de efectividad de los tres métodos
aplicando el método de rangos de Duncan al nivel de 𝛼 = 0.05.
47
UNIVERSIDAD NACIONAL DE CAJAMARCA
SOLUCION
b)
i. Hipótesis:
𝐻: 1= 2= 3=
𝐻 :∃ 𝑖 ≠
ii. Nivel de significancia:
𝛼 = 0.05.
2
SCT=∑ ∑(𝑋𝑖𝑗 ) = 4678 4551.385 = 1 6.615
𝑋1. 2 1 4 2 2 144 2
SCA=∑ ∑ = + + 4551.385 = 64.615
𝑛𝑖 8 12
𝑆𝐶𝐴 4. 15
MCA= 𝐾 = = 3 .3075
1 2
𝑆𝐶𝐸 2
MCE= 𝑛 = 23 = .696
𝑘
𝑀𝐶𝐴 32.3 75
FA=𝑀𝐶𝐸 = = 11.9835
2.
iv. Decisión: Dado que 𝐹𝑐𝑎𝑙 = 11.98 > 3.4 , se debe rechazar la
𝐻 , el factor método influye en la enseñanza de matemática I.
48
UNIVERSIDAD NACIONAL DE CAJAMARCA
vi. 𝑋 1. = 13 1 =8
𝑋 2. = 16 2 =6
𝑋 3. = 1 3 =1
𝑋 3. < 𝑋 1. < 𝑋 2.
1 < 13 < 16
vii. 𝑝 = 𝛼 𝑝, 𝑓
𝛼 = 0.05
𝑘=3
𝑓= 3
2 = . 5 , 3 = .77
3 = . 5 3, 3 = .9
𝑀 𝐸 .696
√ =√ = 0.58
8
𝑅2 = .77 × 0.58 = 1.606
𝑅3 = .9 × 0.58 = 1.693
49
UNIVERSIDAD NACIONAL DE CAJAMARCA
7
= =8
9
ENTENAMIENTO
Grup.1: 1 Grup.2: Grup.3: 2 Grup.4: 2.5
hora 1.5horas horas horas
25 14 7 8
19 26 10 7
22 17 9 9
20 15 11 4
Estadísticas descriptivas:
50
UNIVERSIDAD NACIONAL DE CAJAMARCA
Prueba de hipótesis
Variable Variable
1 2
Media 18.00 9.25
Varianza (conocida) 1.52 2.20
Observaciones 4.00 4.00
Diferencia hipotética de las medias 5.00
z 3.89
P(Z<=z) una cola 0.00
Valor crítico de z (una cola) 1.64
Valor crítico de z (dos colas) 0.00
Valor crítico de z (dos colas) 1.96
Análisis de varianza
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 4 86 21.5 7.00
Columna 2 4 72 18 30.00
Columna 3 4 37 9.25 2.92
Columna 4 4 28 7 4.67
ANÁLISIS DE VARIANZA
O. variaciones s.cuadrados Gl P. cuadrados F P V. crít. F
Entre grupos 575.19 3.00 191.73 17.20 0.00 3.490
D. de los grupos 133.75 12.00 11.15
51
UNIVERSIDAD NACIONAL DE CAJAMARCA
Tabletas
T1 T2 T3 T4
5 11 6 12
3 5 4 10
8 3 7 9
4 3 5 8
2 4 6 7
6 2 2 8
SOLUCIÓN:
𝐻 : µ1=µ2=µ3=µ4=µ,
𝐻1 :ᴈµ =µ
52
UNIVERSIDAD NACIONAL DE CAJAMARCA
ANÁLISIS DE VARIANZA
Origen de Promedio Valor
las Suma de Grados de de los crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Entre
grupos 80.67 3 26.89 4.949 0.010 3.098
Dentro de
los grupos 108.67 20 5.43
Total 189.33 23
De la gráfica:
SCA= 80.67 SCE=108.67
SCT= 189.33 MCE=5.43
Luego:
RC= [F (3,20)>3.10]
P [F>4.95]=0.01
Entonces: se rechaza 𝐻
SOLUCION:
Aplicando Duncan:
α=0.05 k=4 f=20
MCE=5.43
r2= . 5 (2,20)=2.95
r3= . 5 (3,20)=3.10
r4= . 5 (4,20)=3.19
N= muestras iguales=6
𝑀𝐶𝐸 5.43
√ =√ =0.95
𝑛
R2=2.95*0.951=2.805
R3=3.10*0.951=2.948
R4=3.19*0.951=3.033
Por lo tanto:
µ1 =µ2 =µ3 <µ4
53
UNIVERSIDAD NACIONAL DE CAJAMARCA
𝑋: 𝑡𝑎𝑠𝑎𝑠 𝑑𝑒 𝑒𝑚𝑑𝑖𝑚𝑖𝑒𝓃𝑡𝑜
Niveles de rendimiento
Control Bajo Medio Alto
4.6 2 7 7.9
2 7.4 4.5 6.8
6.8 1.8 11.6 5.8
4.2 3.2 6 9.2
1.6 4 6.8 11
a) ¿Existen diferencias reales entre las medias de los cuatro niveles de
rendimiento al nivel de significación 1%, y al 5%?
b) ¿Son las tasas medias de rendimiento en los niveles de apalancamiento
financiero bajo, medio y alto más altas que la de nivel de control?
SOLUCIÓN:
10
8
rendimiento
0
A B C M
Niveles de rendimiento
The pooled standard deviation was used to calculate the intervals.
54
UNIVERSIDAD NACIONAL DE CAJAMARCA
2.
2 2
𝑋.. 114.
= = = 65 .08
𝓃 0
2 2 2 2
∑ ∑ 𝑥𝑖𝑗 = 4.6 + + ⋯ + 11 = 813.8
2
= ∑ ∑ 𝑥𝑖𝑗 = 813.8 65 .08 = 161.74
2 2 2 2
𝑋𝑖. 19. + 18.4 + 35.9 + 40.7
= ∑ = = 78.4
5
𝐸= = 161.74 78.4 = 83.3
Grados
Fuente de Suma de Medias Razón F P-
de
Variación Cuadrados Cuadráticas Calculada Value
Libertad
Nivel de
rendimiento 78.42 3 26.14 5.02 0.0012
Error 83.32 16 5.2
Total 161.74 19
𝑀𝐶𝐴
La estadística de la prueba es: 𝐹𝐴 = 𝑀𝐶𝐸 ∼ 𝐹 3,16
55
UNIVERSIDAD NACIONAL DE CAJAMARCA
10
7
rendimiento
1
A B C M
Niveles de rendimiento
The pooled standard deviation was used to calculate the intervals.
b)
𝐻𝑜 ∶ 1 = 2 = 3 = 4
𝐻1 ∶ No todas las 𝑖 son iguales
𝑋.. 2 114. 2
= = = 65 .08
𝓃 0
2 2 2 2
∑ ∑ 𝑥𝑖𝑗 = 4.6 + + ⋯ + 11 = 813.8
2
= ∑ ∑ 𝑥𝑖𝑗 = 813.8 65 .08 = 161.74
2 2 2 2
𝑋𝑖. 19. + 18.4 + 35.9 + 40.7
= ∑ = = 78.4
5
𝐸= = 161.74 78.4 = 83.3
Dado que 𝑃[𝐹 > 5.0 ] = 0.01 < 𝛼 = 0.05, se rechaza la 𝐻𝑜, y se concluye que
no todas las medias de los cuatro niveles de rendimiento son iguales.
56
UNIVERSIDAD NACIONAL DE CAJAMARCA
El factor 𝑃 es pacientes
Los bloques ℬ son los tipos de medicinas
57
UNIVERSIDAD NACIONAL DE CAJAMARCA
𝑘
2 2 2
1 2
67 + 65 + 48
= ∑ 𝑋𝑖. = 3600 = 7 .667
3
𝑖=1
𝑟 2 2 2
1 2
58 + 68 + 54
ℬ = ∑ 𝑋.𝑗 = 3600 = 34.667
𝑘 3
𝑖=1
𝐸= + ℬ = 64.667
Las sumas de cuadrados, los grados de libertad, los cuadrados medios y
las F calculadas se resumen mimitav
Región de rechazo
Se rechazara Ho con un nivel de significancia 𝛼 = 0.05, si 𝐹𝐴 > 𝐹 . 5,2,4
Decisión
Dado que 𝐹𝐴 = . 5 < 𝐹 . 5,2,4 = 6.94, se debe aceptar la Ho y concluir con
probabilidad de error tipo I, 𝛼 = 0.05, los tiempos promedios de
recuperación de los pacientes son iguales; es decir: 1 = 2 = 3 = 4
b)
Hipótesis
𝐻𝑜 ∶ 𝛽1 = 𝛽 = 𝛽3 = 𝛽4
𝐻1 ∶ No todas las 𝛽𝑖 son iguales
Región de rechazo
Se rechazara Ho con un nivel de significancia 𝛼 = 0.05, si 𝐹Β > 𝐹 . 5,2,4
58
UNIVERSIDAD NACIONAL DE CAJAMARCA
Decisión
Dado que 𝐹Β = 1.07 < 𝐹 . 5,2,4 = 6.94, se debe aceptar la Ho y concluir con
probabilidad de error tipo I, 𝛼 = 0.05, que fue correcto incluir a los
pacientes como una fuente de variación en el diseño del experimentos los
tiempos promedios de recuperación de los pacientes son iguales.
17.- La empresa “Fertilizantes agrícolas” que quiere comparar los efectos de los
tres tipos de fertilizantes 1 , 2 𝑦 3 en la siembra de una variedad de papa. Para
esto se sembró la papa en cuatro terrenos escogidos, se supone, con iguales
características para cada uno, pero que podrían ser una fuente de variabilidad
de la producción de papa. Cada terreno se dividió en tres partes de áreas iguales
y cada fertilizante s asigno aleatoriamente a una parte de cada terreno
consiguiendo así un diseño de un factor (fertilizante) aleatorizado por bloques
(terrenos). El rendimiento de la cosecha se midió en kilogramos, resultando los
siguientes datos:
Terreno 1 Terreno 2 Terreno 3
Terreno 4
2 = 50 3 = 63 1 = 46 3 = 64
1 = 45 2 =5 3 =6 1 = 44
3 = 60 1 = 45 2 = 53 2 =5
59
UNIVERSIDAD NACIONAL DE CAJAMARCA
1 45 50 60 155 51.67
2 45 5 63 160 53.33
3 46 53 6 161 53.67
4 44 5 64 160 53.33
𝑜𝑡𝑎𝑙 𝑋𝑖. 180 07 49 𝑋.. = 636
𝑋.. 2 = 33708
=
𝑘
𝑘 𝑟
2 =6 0
= ∑ ∑ 𝑋𝑖𝑗
𝑖=1 𝑗=1
𝑘
1 2 = 604.5
= ∑ 𝑋𝑖.
𝑖=1
𝑟
1 2 𝐵 = 7.333
𝐵 = ∑ 𝑋.𝑗
𝑘
𝑖=1
𝐸= + 𝐵 𝐸 = 8.167
𝐻1 : ∃𝛼𝑖 ≠ 0
60
UNIVERSIDAD NACIONAL DE CAJAMARCA
𝐹𝐴 = .061
𝑔𝑙 = ,6 𝐹 . 5,2, = 5.14
Como Fa resulta ser mayor F(2,6), rechazamos la hipótesis nula, por lo tanto los
fertilizantes si producen una diferencia significativa en la variabilidad de la
producción de papa.
1 < 2< 3
b) Analizamos el F(0.95,3,6):
𝐹 . 5,3, = 4.76
𝐹𝐵 = 1.796
Finalmente:
𝐹𝐵 < 𝐹 . 5,3, ~1.796 < 4.76
61
UNIVERSIDAD NACIONAL DE CAJAMARCA
Método
Operario 1 2 3
1 3 9 5
2 4 8 6
3 3 7 8
4 5 9 7
5 4 6 3
𝑋.. 2 = 576.6
=
𝑘 62
𝑘 𝑟
2
= ∑ ∑ 𝑋𝑖𝑗
𝑖=1 𝑗=1
UNIVERSIDAD NACIONAL DE CAJAMARCA
= 64.4
𝑘
1 2
= ∑ 𝑋𝑖. = 44.8
𝑖=1
𝑟
1 𝐵 = 3.067
2
𝐵 = ∑ 𝑋.𝑗
𝑘
𝑖=1
𝐸= + 𝐵 𝐸 = 16.533
a) 𝐻 : 𝛼𝑖 = 0 ; 𝑖 = 1, ,3
𝐻1 : ∃𝛼𝑖 ≠ 0
𝐹𝐴 = 10.839
𝑔𝑙 = ,8
63
UNIVERSIDAD NACIONAL DE CAJAMARCA
Por último, se rechaza la hipótesis nula y se concluye que sí existe una diferencia
significativa entre los métodos de montaje.
1 < 3 = 2
𝐸𝑙 𝑚𝑒𝑗𝑜 𝑚é𝑡𝑜𝑑𝑜 𝑒𝑠 𝑒𝑙 .
b)
𝐹 . 5,4,8 = 3.838
𝐹𝐵 = 0.371
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 5 19 3.8 0.7
Columna 2 5 39 7.8 1.7
Columna 3 5 35 7 2.5
ANÁLISIS DE VARIANZA
O. las variaciones S.cuadrados Gl P.cuadrados F P Valor F
Entre grupos 44.80 2.00 22.40 13.71 0.00 3.89
Dentro de los grupos 19.60 12.00 1.63
64
UNIVERSIDAD NACIONAL DE CAJAMARCA
1 2 3
C D B
39.9 43.4 42.7
A B D
40.1 42.9 42.9
B A C
41.1 42.2 41.4
D C A
42.1 42.3 41.9
65
UNIVERSIDAD NACIONAL DE CAJAMARCA
Donde:
tipos
totalXi. n=r medias X⁻i.
fertilizantes 1 2 3
A 40.1 42.2 41.9 124.2 3 41.4
42.333333
B 41.4 42.9 42.7 127 3 3
C 39.9 42.3 41.4 123.6 3 41.2
D 42.1 43.4 42.9 128.4 3 42.8
TOTAL
DE 167.73333
164.5 172.8 171.9 503.2 12
BLOQUE 3
X.j
CALCULOS.
2
X. . 5032
= = = 1100.85333
n 1
ΣΣx 2 ij = 1113.76
SCT = ΣΣx^ ij C = 1 .90666667
2
Σ Xi.
SCA = C = 5.
r
SCB = Σx. J ^ /k C = 516.571666
SCE = SCT SCB + SCA = 0.534666667
varianza = 1.173333333
OTRA FORMA DE OBTENER SCT
SCT = n 1 Sx^ = 1 .90666667
La suma de los cuadrados de libertad, los cuadrados medios y las F
calculadas se resumen.
66
UNIVERSIDAD NACIONAL DE CAJAMARCA
20. El gerente de ventas del grupo mercados realizó un estudio estadístico para
comparar volumen de ventas dirás de sus cuatro mercados. Para esto diseño
un experimento considerando solo las ventas de los días jueves, viernes,
sábado y domingo de días de semana como una posible fuente de variabilidad
en el monto de las ventas. Los mercados 1, 2, 3,4fueron asignados al azar a
los 4 jueves, 4 viernes, a los 4 sábados y los 4 domingos consiguiendo así un
diseño aleatorio por bloque. Las ventas diría EN MILES DE SOLES SE DAN en
la tabla que siguen
Días
Jueves viernes sábado Domingo
42(3) 55(1) 61(2) 40(4)
50(1) 52(3) 44(4) 60(2)
35(4) 59(2) 46(3) 52(1)
62(2) 38(4) 54(1) 50(3)
67
UNIVERSIDAD NACIONAL DE CAJAMARCA
Cálculos.
2
X. .
C= = 3889664 . 6853637
n
𝛴𝛴𝑥 2 𝑖𝑗 = 50765
= 𝛴𝛴𝑥 2 𝑖𝑗 = 1080.01
𝛴 𝑋𝑖. ^ / 958.48
𝐵 = 1/𝐾 𝛴𝑥. 𝐽 ^ = 41.50
𝐸= 𝐵+ = 80.03
68
UNIVERSIDAD NACIONAL DE CAJAMARCA
Las sumas de cuadrados los grados de libertad los cuadrados medios y las F
calculadas se resuman:
69
UNIVERSIDAD NACIONAL DE CAJAMARCA
21. El decano de estudios generales ciencias de la PUCP quiere saber si son los
niveles de evaluación de cursos y/o el conocimiento de los alumnos que
producen la variabilidad en las notas finales que obtienen. Para esto, se diseñó
un experimento de dos factores sin réplicas, escogiendo 4 alumnos al azar del
tercer nivel que cursaron las materias: matemática (M), estadística (E), física (F)
y lengua (L), observando las calificaciones siguientes:
CURSOS
Alumno M E F L
1 14 13 14 16
2 13 18 15 19
3 11 16 13 18
4 12 15 112 16
SOLUCIÓN
Análisis de varianza de dos factores con una sola muestra por grupo
M 4 50 12.5 1.667
E 4 62 15.5 4.333
F 4 54 13.5 1.667
L 4 69 17.25 2.250
70
UNIVERSIDAD NACIONAL DE CAJAMARCA
ANÁLISIS DE VARIANZA
Origen de Grados Promedio Valor
Suma de
las de de los F Probabilidad crítico
cuadrados
variaciones libertad cuadrados para F
Filas 14.188 3.000 4.729 2.735 0.106 3.863
Columnas 53.688 3.000 17.896 10.349 0.003 3.863
Error 15.563 9.000 1.729
Total 83.438 15.000
SCA 53.688
SCB 14.188
SCE 15.563
SCT 83.438
a)
𝐻 : 𝑎𝑖 = 0
Tenemos un rango de1-4
Según la tabla 𝐹𝐴 = 10,349 con grados de libertad 3,9,
Tenemos P [F (3,9)>10,349]=0.003
Como la probabilidad es menor que 0.05 entonces se rechaza.
1-(a)/2 = 0.994
n-k = 12.000
2.934
error= 2.228
71
UNIVERSIDAD NACIONAL DE CAJAMARCA
Operarios
Horas 𝑜1 𝑜2 𝑜3 𝑜4
10-11 am 3.0 3.5 3.2 3.3
2-3 pm 1.8 2.1 2.0 1.9
4-5 pm 2.4 2.5 2.4 2.4
72
UNIVERSIDAD NACIONAL DE CAJAMARCA
SOLUCIÓN
Cálculo del análisis de datos
ANÁLISIS DE VARIANZA
Origen Suma de Grad Promedio Probabilid Valor
de las cuadrado os de de los F ad crítico
variacion s liberta cuadrado para F
es d s
Filas 3.461666 2 1.730833 201 3.1803E- 5.143252
67 33 06 85
Columna 0.135833 3 0.045277 5.258064 0.040744 4.757062
s 33 78 52 02 66
Error 0.051666 6 0.008611
67 11
Total 3.649166 11
67
SCA 0.136
SCB 3.462
SCE 0.052
SCT 3.649
73
UNIVERSIDAD NACIONAL DE CAJAMARCA
a) Operarios(A),
Tenemos como hipótesis,𝐻 : 𝑖 donde i va de 1-4
De la tabla se ha calculado 𝐹𝐴 = 5. 58, y con grados de libertad 3,6
También calculamos P [F>5.258]=0.04, por lo cual se acepta 𝐻
b) Horas (B),
Tenemos 𝐻 : 𝑏𝑗 y tiene un rango 1, 2,3
Según la tabla tenemos 𝐹𝐴 = 10, con grado de libertad 2,6
Calculamos P [F>210]=0.000 por lo cual se rechaza 𝐻 .
74
UNIVERSIDAD NACIONAL DE CAJAMARCA
ANÁLISIS DE VARIANZA
Origen de Grados Promedio
las Suma de de de los Valor crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Filas SCB=2.8255 3 0.942 31.22 5.978E-06 3.490
Columnas SCA=4.718 4 1.180 39.10 8.606E-07 3.259
Error SCE=0.362 12 0.030
Total SCT=7.9055 19
b)
1. H0: 𝛼𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4,5
líneas de
producción promedio
L1 2.98
L2 3
L3 3.55
L4 3.8
L5 4.25
3.
𝛼 = 0.05 , k=5, f= 12
R2=r0.05 (2, 12)=3.08
R3=r0.05 (3, 12)=3.23
R4=r0.05 (4, 12)=3.33
R5=r0.05 (5, 12)=3.36
Se calculan los rangos mínimos significativos:
75
UNIVERSIDAD NACIONAL DE CAJAMARCA
𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √
𝑀 𝐸 0.030
√ =√
4
𝑀 𝐸
√ = 0.0866
1 = 2 < 3 = 4 < 5
d) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
76
UNIVERSIDAD NACIONAL DE CAJAMARCA
materias
primas Promedio
M1 3
M2 3.4
M3 3.62
M4 4.04
3.
𝛼 = 0.05 , k=4, f= 12
R2=r0.05 (2, 12) =3.08
R3=r0.05 (3, 12) =3.23
R4=r0.05 (4, 12) =3.33
R5=r0.05 (5, 12) =3.36
𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √
𝑀 𝐸 0.030
√ =√
5
𝑀 𝐸
√ = 0.077
77
UNIVERSIDAD NACIONAL DE CAJAMARCA
1 < 2 = 3 < 4
78
UNIVERSIDAD NACIONAL DE CAJAMARCA
ANÁLISIS DE VARIANZA
Origen de Grados Promedio Valor
las Suma de de de los crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Filas SCB= 18.5 3 6.167 0.185 0.904 3.863
SCA=
Columnas 1671.5 3 557.167 16.715 0.001 3.863
Error SCE= 300 9 33.333
Total SCT= 1990 15
A) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor:
sistemas de
administración promedio
de archivos
A1 379.25
A2 383.5
A3 396.25
A4 405
3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41
Se calculan los rangos mínimos significativos:
𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √
79
UNIVERSIDAD NACIONAL DE CAJAMARCA
1 = 4 < 3 = 2
A) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias:
sistemas de
administración promedio
de archivos
A1 379.25
A2 405
A3 396.25
A4 383.5
3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41
80
UNIVERSIDAD NACIONAL DE CAJAMARCA
𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √
𝑀 𝐸 33.333
√ =√
3
𝑀 𝐸
√ = 3.33
1 = 4 < 3 = 2
a) 1. H0: 𝛼𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor:
81
UNIVERSIDAD NACIONAL DE CAJAMARCA
sistemas de
administración promedio
de archivos
A1 379.25
A2 383.5
A3 396.25
A4 405
3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41
Se calculan los rangos mínimos significativos:
𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √
𝑀 𝐸 33.333
√ =√
3
𝑀 𝐸
√ = 3.33
82
UNIVERSIDAD NACIONAL DE CAJAMARCA
1 = 4 < 3 = 2
b) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias:
operadores promedio
O1 389.5
O2 390.5
O3 391.75
O4 392.25
3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41
Se calculan los rangos mínimos significativos:
𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √
83
UNIVERSIDAD NACIONAL DE CAJAMARCA
𝑀 𝐸 33.333
√ =√
3
𝑀 𝐸
√ = 3.33
1 = 2 = 3 = 4
84
UNIVERSIDAD NACIONAL DE CAJAMARCA
MAQUINAS
OPERARIOS
M1 M2 M3
O1 102.33 130.00 114.33
O2 114.00 142.67 126.67
85
UNIVERSIDAD NACIONAL DE CAJAMARCA
SOLUCIÓN
PARTE a): Gráfica lineal de medias para la interacción entre los dos
factores considerados.
Interacción de Medias
160
140
120
100
80
60
40
20
0
M1 M2 M3
MAQUINAS
O1 O2
PARTE b):
Antes de realizar el proceso para elaborar la tabla ANOVA, describiremos
los siguientes datos:
𝑦. . = 𝑝 𝑜𝑚𝑒𝑑𝑖𝑜 𝑡𝑜𝑡𝑎𝑙
𝑦𝑖. = 𝑝 𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑓𝑖𝑙𝑎
𝑦̂. 𝑗 = 𝑝 𝑜𝑚𝑒𝑑𝑖𝑜 𝑜𝑙𝑢𝑚 𝑎
𝑗 = #𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒 𝑢 𝑎 𝑜𝑙𝑢𝑚 𝑎
𝑖 = #𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒 𝑢 𝑎 𝑓𝑖𝑙𝑎
𝑖𝑗 = #𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒 𝑎𝑑𝑎 𝑒𝑙𝑑𝑎
𝑎 = #𝑓𝑖𝑙𝑎𝑠
𝑏 = # 𝑜𝑙𝑢𝑚 𝑎𝑠
𝑁 = #𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Previo a pasar al desarrollo realizaremos la prueba de hipótesis
86
UNIVERSIDAD NACIONAL DE CAJAMARCA
N= 18
n= 3
n i= 9
n j= 6
y..= 121,667
Donde:
N= # de datos * # de réplicas
n= # de réplicas
ni= # de réplicas * # de filas
nj=# de réplicas * # de columnas
La tabla ANOVA cuenta con todas las sumas de cuadrados menos con la
del ERROR, entonces:
+ 𝐵+ 𝐸+ 𝐵=
𝐸 = 1 4.67
87
UNIVERSIDAD NACIONAL DE CAJAMARCA
88
UNIVERSIDAD NACIONAL DE CAJAMARCA
𝑝 = 𝛼 𝑝, 𝑓
2 = , 5 ,1 3,08
3 = , 5 3,1 3,23
𝑀 𝐸
𝑅𝑝 = 𝛼 ∗√
6
R2= 4,0529
R3= 4,2503
PROMEDIO M1
89
UNIVERSIDAD NACIONAL DE CAJAMARCA
Semilla de Maíz
Fertilizante
A1 A2 A3
B1 35 33 38 37 33 3
30 5 35 36 3 34
B2 31 30 40 39 36 35
3 9 43 4 40 38
SOLUCIÓN
90
UNIVERSIDAD NACIONAL DE CAJAMARCA
PARTE b):
Primero realizamos la prueba de hipótesis:
H0= No hay interacción entre los cultivos de fertilizante y maíz.
H1= Existe interacción entre los cultivos de fertilizante y maíz.
Proponemos un cuadro estadístico descriptivo para facilitarnos el manejo
de los datos:
FACTOR B FACTOR A TOTAL MEDIA N
A1 B1 150 37,5 4
B2 122 30,5 4
Total 272 34 8
A2 B1 146 36,5 4
B2 164 41 4
Total 310 38,75 8
A3 B1 131 32,75 4
B2 149 37,25 4
Total 280 35 8
TOTAL B1 427 35,5833 12
B2 435 38,5833 12
Total 862 37,0833 24
2
𝑋∙∙∙
= 30960,1667
𝑎𝑏
91
UNIVERSIDAD NACIONAL DE CAJAMARCA
100,3333
𝑟 2,6667
1 2
𝐵= ∑ 𝑋∙𝑗∙
𝑘×
𝑖=1
2 3 2
𝑋𝑖𝑗∙ 176,3333
𝐵 = ∑∑ + + 𝐵 =
𝑖=1 𝑗=1
92
UNIVERSIDAD NACIONAL DE CAJAMARCA
PARTE c):
Ya no sería necesario realizar un análisis de rango para la comprobación
del contraste de hipótesis, ya que tanto gráfica como analíticamente se ha
comprobado la validez de la hipótesis.
93
UNIVERSIDAD NACIONAL DE CAJAMARCA
Solución
a) Gráfico:
Gráfica de medidas
120
100
80
60
40
20
0
0 1 2 3 4 5 6
El grafico podemos observar que no existe una intersección entre las líneas por
lo tanto concluimos no hay indicios de interacción
94
UNIVERSIDAD NACIONAL DE CAJAMARCA
= 1 17 .4 9
= 1938. 01
𝐸 = 8080 3
𝐵 = 99 0.801
Interacción entre promoción y publicidad:
𝐻 : 𝛼, 𝛽 , =0
𝐻𝑎 : ∃ 𝛼, 𝛽 , ≠0
𝐹𝐴∗𝐵 = 3.047
𝐻 : 𝛼1 = 0
𝐹𝑎 = 8.777
𝐹𝑏 = 136.905
28. Con el fin de estudiar los efectos de tipo de carga y de las empresas que
las transportan sobre el tiempo de reparto terrestre de cargas, la distribuidora
¨DOCASA¨ diseño un modelo de análisis de varianza de dos vías con réplicas.
Cada una de las tres empresas terrestres: 𝐵1, , 𝐵2 𝑌 𝐵3 transporto una misma
distancia cada uno de los tipos de carga 1, = 𝐿𝑖𝑞𝑢𝑖𝑑𝑜 , 2 = 𝑜𝑙𝑖𝑑𝑜 ,
repitiéndose el experimento tres veces. Se registraron los siguientes tiempos
en minutos.
Tipo de carga
1 2
140 130
𝐵1 145 128
135 132
135 125
TRANSPORTE 𝐵2 136 126
134 124
95
UNIVERSIDAD NACIONAL DE CAJAMARCA
90 83
𝐵3 92 82
88 84
SOLUCIÓN
a) Grafico:
Gráfica de medidas
160
140
120
100
80
60
40
20
0
0 1 2 3 4 5 6 7 8
96
UNIVERSIDAD NACIONAL DE CAJAMARCA
= 8984.5
= 364.5
𝐸=7
𝐵=9
𝐻 : 𝛼, 𝛽 , = 0
𝐻𝑎 : ∃ 𝛼, 𝛽 , ≠ 0
𝐹𝐴∗𝐵 = 0.75
𝐻 : 𝛼1 = 0
𝐹𝑎 = 60.75
𝐹𝑏 = 711.58
97
UNIVERSIDAD NACIONAL DE CAJAMARCA
SOLUCIÓN
a) Defina la variable dependiente y el modelo de este diseño de experimento
La variable dependiente es X=Diseño de una batería que no sea sensible a la
temperatura ambiente
El modelo del anova de dos factores con replicas es:
𝑋𝑖𝑗𝑘 = 𝑢 + 𝛼𝑖 + 𝛽𝑗 + 𝛼𝛽 𝑖𝑗 + ԑ𝑖𝑗𝑘
98
UNIVERSIDAD NACIONAL DE CAJAMARCA
FACTOR FACTOR
A B TOTAL MEDIA DESV.ESTAND. N
B1 6.2 1.0333 0.21602469 6
A1 B2 8.1 1.35 0.104880885 6
B3 6.5 1.0833 0.116904519 6
TOTAL 20.8 3.4667 0.437810094 18
B1 7 1.1667 0.150554531 6
A2 B2 8.6 1.4333 0.121106014 6
B3 6.7 1.1167 0.147196014 6
TOTAL 22.3 3.7167 0.418856559 18
B1 7.6 1.2667 0.27325202 6
A3 B2 9.1 1.5167 0.194079022 6
B3 5.8 0.9667 0.175119007 6
TOTAL 22.5 3.75 0.642450049 18
B1 20.8 3.4667 0.639831241 6
TOTAL B2 25.8 4.3 0.420065921 6
B3 19 3.1667 0.439219541 6
TOTAL 65.6 10.933 1.499116703 18
SCA=0.096
SCB=1.379
SCI=0.226
SCE=1.367
SCT=3.068
G.L=2,2,4,45,53
99
UNIVERSIDAD NACIONAL DE CAJAMARCA
ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F
Materiales 1.379259259 2 0.68962963 22.70731707 1.52023E-07 3.204317292
Niveles de temperatura 0.095925926 2 0.047962963 1.579268293 0.21733653 3.204317292
Interacción 0.226296296 4 0.056574074 1.862804878 0.133552632 2.578739184
Dentro del grupo 1.366666667 45 0.03037037
Total 3.068148148 53
30. Con el fin de estudiar los efectos de tipo de carga y los efectos que puedan
ocasionar las empresas que la transportan sobre el tiempo de reparto terrestre
de cargas se diseñó un modelo de análisis de varianza con los tipo de cargas
A1=Liquido ,A2= sólido y tres empresas de transporte terrestre B1,B2,B3,.Cada
empresa transporto una misma distancia cada tipo de carga repitiéndose el
experimento tres veces .Se registraron los tiempos en minutos y se procesaron
obteniendo las siguientes estadísticas:
100
UNIVERSIDAD NACIONAL DE CAJAMARCA
TIPO DE NÚMERO DE
CARGA TRANSPORTE DATOS MEDIAS
A1 B1 3 140
A1 B2 3 135
A1 B3 3 90
A2 B1 3 130
A2 B2 3 125
A2 B3 3 83
SOLUCIÓN
a) Defina el modelo estadístico de este problema de ANOVA
TABLA ANOVA
101
UNIVERSIDAD NACIONAL DE CAJAMARCA
DECISIÓN:
Dado que 𝐹𝐴∗𝐵 =0.75<3.89 no deberíamos rechazar Ho al nivel de significación
α=0.05.Esto es la interacción observada no es significativa.
Por tanto no existe interacción entre los factores CARGAS y EMPRESAS DE
TRANSPORTE TERRESTRE.
102
UNIVERSIDAD NACIONAL DE CAJAMARCA
SOLUCIÓN
Estadísticas descriptivas:
RESUMEN A2 A3 A4 Total
6
Cuenta 6.00 6.00 6.00 18.00
Suma 19.00 20.00 18.00 57.00
Promedio 3.17 3.33 3.00 3.17
Varianza 0.57 2.67 0.80 1.21
Total
Cuenta 6.00 6.00 6.00
Suma 19.00 20.00 18.00
Promedio 3.17 3.33 3.00
Varianza 0.57 2.67 0.80
103
UNIVERSIDAD NACIONAL DE CAJAMARCA
ANÁLISIS DE VARIANZA
O.Variaciones S.Cuadrados GL P.cuadrados F Probabilidad V. crítico F
Muestra 0.0 3 65535.0 65535.0 0.1
Columnas 0.3 2 0.2 0.1 0.9 3.7
Interacción 0.0 6 65535.0 65535.0 0.2
Dent. del grupo 20.2 15 1.3
Total 20.5 17
GRAFICO DE PROMEDIOS
20
18
16
14
12
10
8
6
4
2
0
1 2 3 4 5 6
104
UNIVERSIDAD NACIONAL DE CAJAMARCA
105
UNIVERSIDAD NACIONAL DE CAJAMARCA
106
UNIVERSIDAD NACIONAL DE CAJAMARCA
SOLUCIÓN
Análisis de varianza de dos factores con varias muestras por grupo:
Alto Medio Bajo
RESUMEN Total
Norte
Sur
Centro
Oriente
107
UNIVERSIDAD NACIONAL DE CAJAMARCA
Total
Cuenta 12.000 12.000 12.000 12.000 12.000 12.000
Suma 175.000 157.000 201.000 184.000 159.000 130.000
Promedio 14.583 13.083 16.750 15.333 13.250 10.833
Varianza 3.720 3.902 1.477 8.061 4.023 3.061
ANÁLISIS DE VARIANZA
Del cuadro:
TENEMOS
SCA= 239.333
SCB= 5.056
SCI= 22.278
SCE= 253.278
SCT= 519.944
108
UNIVERSIDAD NACIONAL DE CAJAMARCA
Graficas:
109
UNIVERSIDAD NACIONAL DE CAJAMARCA
33. La industria P&C que utiliza para su producción tres máquinas de marcas
distintas 1, 2 y 3 y dos fuentes de materia prima A y B quiere saber si el
número de unidades defectuosas resultantes es la misma para las tres
máquinas y para las dos materias primas. P ara esto, el ingeniero a cargo
del control llevo a cabo un experimento de la producción observando el
número de unidades defectuosas, con cada una de las máquinas y con
cada tipo de materia prima durante dos días y entre los resultados
presentó el siguiente resumen descriptivo.
110
UNIVERSIDAD NACIONAL DE CAJAMARCA
Tabla ANOVA
Fuente De Suma De Grados De Medias Estadística
Variabilidad Cuadrados Libertad Cuadráticas F
Materia prima 22.427
Maquinas 49.480
Interacción
Error 2.580
total
SOLUCIÓN
111
UNIVERSIDAD NACIONAL DE CAJAMARCA
HIPÓTESIS
Se contrasta la hipótesis nula
HO: (ab) y =0 (no existe interacción), para i=1, 2,3, j=1, 2,3
Contra:
H1: (ab) y ≠0 para algún i≠j (si existe interacción)
ESTADÍSTICA Y REGIÓN CRÍTICA
DECISIÓN:
112
UNIVERSIDAD NACIONAL DE CAJAMARCA
Tabla N°2
RESUMEN 1 2 3 Total
A
Cuenta 4 4 4 12
Suma 36.4 45.2 29.6 111.2
Promedio 9.1 11.3 7.4 9.27
Varianza 0.54 2.22 0.82 3.76
B
Cuenta 4 4 4 12
Suma 28.4 36 23.6 88
Promedio 7.1 9 5.9 7.33
Varianza 0.98 0.69 1.85 2.74
Total
Cuenta 8 8 8
Suma 64.8 81.2 53.2
Promedio 8.1 10.15 6.65
Varianza 1.79 2.76 1.79
ANÁLISIS DE VARIANZA
O.de las S.
variaciones Cuadrados Gl Cuadrados F Probabilidad Valor F
Muestra 22.43 1.00 22.43 18.95 0.00 4.41
Columnas 49.5 2.0 24.7 20.9 0.0 3.6
Interacción 0.7 2.0 0.3 0.3 0.8 3.6
Dentro del grupo 21.3 18.00 1.18
Total 93.86 23
113
UNIVERSIDAD NACIONAL DE CAJAMARCA
A=Capacitación
B=Turnos
A1 A2 A3
4 5 8 6 6 7
B1
5 6 5 6 7 6
6 7 7 5 8 7
B2
4 6 6 8 7 6
6 5 6 7 8 6
B3
5 6 6 6 7 7
114
UNIVERSIDAD NACIONAL DE CAJAMARCA
SOLUCIÓN
Estadísticas descriptivas:
B2
Cuenta 2.00 2.00 2.00 2.00 2.00 2.00 12.00
Suma 10.00 13.00 13.00 13.00 15.00 13.00 77.00
Promedio 5.00 6.50 6.50 6.50 7.50 6.50 6.42
Varianza 2.00 0.50 0.50 4.50 0.50 0.50 1.36
B3
Cuenta 2 2 2 2 2 2 12
Suma 11 11 12 13 15 13 75
Promedio 5.5 5.5 6 6.5 7.5 6.5 6.25
Varianza 0.5 0.5 0 0.5 0.5 0.5 0.75
Total
Cuenta 6.00 6.00 6.00 6.00 6.00 6.00
Suma 30.00 35.00 38.00 38.00 43.00 39.00
Promedio 5.00 5.83 6.33 6.33 7.17 6.50
Varianza 0.80 0.57 1.07 1.07 0.57 0.30
115
UNIVERSIDAD NACIONAL DE CAJAMARCA
20
15
10
0
1 2 3
116