Está en la página 1de 116

UNIVERSIDAD NACIONAL DE CAJAMARCA

UNIVERSIDAD NACIONAL DE CAJAMARCA

FACULTAD DE INGENIERÍA

ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA CIVIL

ANÁLISIS DE VARIANZA

CURSO:

 ESTADÍSTICA APLICADA
DOCENTE:

 Dr. MACETAS HERNÁNDEZ, Miguel Ángel


ALUMNOS:

 DIAZ TARRILLO, Josué Alex


 JULCA SANCHEZ, José Armando
 MARÍN IDROGO, José Lalo
 BOÑON VARGAS, Jaimito
 VILLANUEVA RODRIGUEZ, Jhon Kenedy

Cajamarca, Julio de 2019

1
UNIVERSIDAD NACIONAL DE CAJAMARCA

DEDICATORIA

El presente trabajo es dedicado en primer lugar a Dios, luego a mis padres por el sustento
que me dan día a día para alcanzar mis objetivos, también al docente del curso por
impartir los conocimientos necesarios para tener una buena preparación académica y
profesional.

2
UNIVERSIDAD NACIONAL DE CAJAMARCA

INDICE
INTRODUCCIÓN ............................................................................................... 4
OBJETIVOS ....................................................................................................... 5
MARCO TEÓRICO............................................................................................. 6
1. COMPARACIÓN DE MEDIAS .................................................................... 6
2. FUNDAMENTOS DEL ANÁLISIS DE LA VARIANZA ................................. 8
2.1. Modelo .................................................................................................. 8
2.2. Hipótesis requeridas.............................................................................. 8
2.3. Contraste ANOVA ................................................................................. 9
3. TABLA ANOVA ......................................................................................... 10
4. ANÁLISIS DE LA DIFERENCIA ENTRE LAS MEDIAS ................................ 13
5. PROCEDIMIENTO DE APLICACIÓN .......................................................... 13
Representación de los datos ........................................................................ 13
Construcción de la tabla ANOVA y realización del contraste........................ 14
Validación de las hipótesis............................................................................ 14
APLICACIÓN MINITAB................................................................................. 16
Construcción de la tabla ANOVA y realización del contraste........................ 17
APLICACIÓN MINITAB................................................................................. 17
Validación de las hipótesis............................................................................ 20
Independencia de los datos ...................................................................... 20
Normalidad de las perturbaciones ............................................................. 20
Heterocedasticidad ................................................................................... 20
RESOLUCIÓN DE EJERCICIOS ..................................................................... 22

3
UNIVERSIDAD NACIONAL DE CAJAMARCA

INTRODUCCIÓN

En las aplicaciones empresariales modernas del análisis estadístico, hay


algunas situaciones que requieren hacer comparaciones de procesos en más de
dos niveles. Por ejemplo, al director de Circuitos Integrados S.A. Ir gustaría saber
si cualquiera de cinco procesos para montar componentes aumenta la
productividad por hora y reduce el número de componentes defectuosos. Los
análisis para responder a estas cuestiones se conocen con el nombre general
de diseño experimental. Un importante instrumento para organizar y analizar los
datos de este experimento se llama análisis de la varianza, que es el tema que
vamos a abordar. EI experimento también podrá extenderse a un diseño que
incluyera la cuestión de cual de cuatro fuentes de materias primas aumenta más
la productividad en combinaci6n con los diferentes métodos de producci6n. Esta
cuestión podrá responderse con un análisis de la varianza de dos factores. Por
poner otro ejemplo, el presidente de una empresa de cereales tiene interés en
comparar las ventas semanales de cuatro marcas diferentes en tres tiendas
distintas. Una vez más, tenemos un diseño de un problema que puede analizarse
utilizando el análisis de la varianza.

4
UNIVERSIDAD NACIONAL DE CAJAMARCA

OBJETIVOS

 Entender qué es y por qué es importante un contraste de hipótesis.


 Saber distinguir en qué situaciones es útil realizar un análisis de la
varianza.
 Conocer pautas para elegir el modelo más adecuado para nuestro
problema.
 Saber aplicar el ANOVA, con ayuda de Minitab.
 Interpretar los distintos valores que aparecen en una tabla ANOVA.
 Dar respuesta al problema del contraste de hipótesis planteado

5
UNIVERSIDAD NACIONAL DE CAJAMARCA

MARCO TEÓRICO

1. COMPARACIÓN DE MEDIAS
Supongamos que se están evaluando las características de calidad de los
productos de tres proveedores. Para ello se han realizado los ensayos cuyos
resultados se recogen en la Tabla 1. Si la escala de medida de la calidad es
tal que cuanto mayor sea su valor, mejor es su calidad ¿qué proveedor
suministra productos con mayor calidad?

Si se representan estos valores en la Figura 1, podría concluirse que los


productos fabricados por el proveedor C tienen mejor calidad que los de A y
B. Sin embargo, la comparación entre A y B no es tan concluyente aunque
parece que los productos de A son algo mejores que los de B. Resulta pues
necesario objetivar este análisis.

6
UNIVERSIDAD NACIONAL DE CAJAMARCA

¿Qué razonamiento se ha seguido para sacar esta conclusión sobre la


calidad de los productos de los proveedores A, B y C? En el caso de C se ha
visto que cualquiera de sus muestras es superior a cualquiera de las de A ó
B, de modo que la conclusión es inmediata. Sin embargo, en el caso de la
comparación entre A y B, los resultados están mezclados, es decir que la
variabilidad de los elementos de la misma muestra A ó B no es mucho menor
que la variabilidad global de las muestras A ó B consideradas como un
conjunto. Utilizando los conocimientos estadísticos adquiridos en capítulos
anteriores, podrían compararse las muestras dos a dos con el contraste de
la t de Student, pero esto no resulta muy práctico en problemas reales.
La herramienta estadística que sirve para resolver el problema de comparar
más de dos medias es el ANÁLISIS DE LA VARIANZA, que se llama así
precisamente porque compara la variabilidad de las medias muéstrales (a
través de la varianza muestral) con la variabilidad de los elementos dentro
de la muestra.
El ANÁLISIS DE LA VARIANZA permite también descomponer la
variabilidad total en componentes independientes que puedan asignarse a
causas distintas (ver Tabla 2).

7
UNIVERSIDAD NACIONAL DE CAJAMARCA

Volviendo al caso de los proveedores, si realizando un ANÁLISIS DE LA


VARIANZA se puede concluir que las diferencias entre las medias de alguno
de ellos es estadísticamente significativa, entonces se puede afirmar que el
proveedor en cuestión suministra “una calidad distinta”; por el contrario, si
las diferencias no son estadísticamente significativas, no se puede concluir
lo anterior, siendo las fluctuaciones de los datos muéstrales entre
proveedores únicamente debidas al azar.

2. FUNDAMENTOS DEL ANÁLISIS DE LA VARIANZA


2.1. Modelo
Los valores de las características de calidad de las piezas de cada proveedor
tendrán una variabilidad entorno a un valor medio. Si representamos como
yij al valor de la muestra j del proveedor i:

El problema a resolver cuál de las dos situaciones siguientes es la que


explican mejor los datos:

• Todos los proveedores son iguales, es decir tienen la misma media


µ1= µ2 =µ3
• La media de alguno de los proveedores es diferente a la de los demás.
2.2. Hipótesis requeridas
Para que se pueda aplicar el ANÁLISIS DE LA VARIANZA es preciso que se
cumplan estas tres hipótesis:

8
UNIVERSIDAD NACIONAL DE CAJAMARCA

• Los datos han de ser independientes. Para asegurar esto, las muestras
cuyas medias se desea comparar han de extraerse de manera aleatoria.
• Las poblaciones base de donde proceden las muestras han de ser
normales.
• Las poblaciones base de donde proceden las muestras han de tener la
misma varianza.
Estas hipótesis implican que las perturbaciones se distribuyan según una
N(0, σ2).
2.3. Contraste ANOVA
Podremos estimar la varianza de la población σ2 a través de los siguientes
estimadores:
• Estimar la varianza de la población σ^2 a través de la varianza de cada
una de las muestras. Esta estimación se hace ponderando las varianzas
muéstrales. Si k es el número de muestras (en adelante denominaremos a
cada “muestra” “tratamiento”, ni es el tamaño de la muestra correspondiente
a tratamiento i-ésimo y N es el número total de datos disponible en las
distintas muestras, el estimador denominado “varianza residual” se define:

Estimar la varianza de la población σ^2 suponiendo que los


tratamientos no tienen ningún efecto (es decir que todos tienen la misma
media). En estas condiciones podremos estimar σ^2 a través de la varianza
de las medias muestrales:

De este modo, si se verifican la hipótesis de que los tratamientos no tienen


ningún efecto, ambas estimaciones no podrán diferir mucho. En efecto, si la
hipótesis es cierta, el estadístico cociente de ambas varianzas muestrales se
distribuye según una F. Es decir:

La metodología para realizar el ANÁLISIS DE LA VARIANZA puede


resumirse como sigue:
 Fijar el nivel de significación para el contraste, por ejemplo α=95%.
Establecer el contraste de hipótesis:

9
UNIVERSIDAD NACIONAL DE CAJAMARCA

⇒ H0: Los tratamientos son todos iguales: µ1=µ2=µ3=…=µk.


⇒ H1: Alguno de los tratamientos es diferente.
 Calcular los estimadores sR^2 y sT^2.
 Calcular el valor del estadístico sT^2/ sR^2.
 Calcular el valor de Fk-1, n -k para el nivel de significación prefijado.
Si:

La diferencia entre los tratamientos es estadísticamente significativa con un


nivel de significación α.

La diferencia entre los tratamientos no es estadísticamente significativa con


un nivel de significación α.

3. TABLA ANOVA
Denominando S a la suma de los cuadrados, se tiene:

Si SD es la suma de los cuadrados con respecto a la media global, el


estadístico SD^2 es también un estimado de σ^2 si se cumplen las hipótesis
de igualdad de medias:

Es fácil comprobar que se verifica la siguiente igualdad:

En cuanto a los grados de libertad:

10
UNIVERSIDAD NACIONAL DE CAJAMARCA

SD se denomina también “suma corregida de cuadrados” y se calcula


fácilmente mediante la siguiente ecuación:

En general lo más cómodo es calcular SD y ST, calculando SR por diferencia.


Es costumbre presentar el ANÁLISIS DE LA VARIANZA en forma de tabla:

A esta tabla se le suele denominar “tabla ANOVA”, (del inglés Analysis of


Variance). De amera análoga al análisis de regresión, al cociente de la

11
UNIVERSIDAD NACIONAL DE CAJAMARCA

variabilidad explicada por los tratamientos respectos de la variabilidad total,


se denomina coeficiente de determinación:

Construyendo la tabla ANOVA correspondiente al caso de los proveedores,


resulta:

Como 19,16 > 3,88 se rechaza la hipótesis de que todos los proveedores
son iguales. No obstante, para poder dar por bueno el resultado es preciso
comprobar que se satisfacen las hipótesis de partida. Para ello se realiza un
análisis de los residuos (ver Figura 2) sin que se aprecie en él ningún aspecto
que haga dudar de la normalidad de sus distribución.

12
UNIVERSIDAD NACIONAL DE CAJAMARCA

4. ANÁLISIS DE LA DIFERENCIA ENTRE LAS MEDIAS


El análisis de la varianza nos indica si alguno de los proveedores es distinto,
pero no indica cual es. Para resolver esto se puede hacer lo siguiente:

1. Construir una distribución de referencia con la t de Student para cada uno


de los proveedores para ver si solapa o no a los otros.
2. Contrastar las diferencias de las medias de todos los pares posibles de
medias utilizando la distribución de Student. Esto presenta el inconveniente
de que si cuantos más niveles se analicen (proveedores distintos, en este
caso) la probabilidad de cometer un error de tipo I aumenta . En efecto, si el
nivel de confianza es 0,95 y tenemos 3 proveedores, el número de
comparaciones es 3; entonces la probabilidad de concluir que un grupo es
diferente sin que lo sea es 1-0.953= 0,143.
3. Método de Bonferroni. Es útil cuando el número de grupos es grande
porque corrige en parte el efecto anterior.
4. Realizar comparaciones múltiples. Proporciona intervalos de confianza
para las diferencias de las medias de todos los pares de grupos. Los más
utilizados son:
a. Dunnet. Se utiliza cuando se toma uno de los grupos como referencia.
b. MCB (Multiple Comparation with the Best) de Hsu. Compara con el grupo
“bueno” (el más alto o el más bajo.
c. Fisher LSD (least significant difference)
d. Tukey.

5. PROCEDIMIENTO DE APLICACIÓN
En general, el procedimiento de aplicación del análisis de la varianza consta
de los siguientes pasos (ver esquema en Figura 3).
Representación de los datos
Como en la mayor parte de los procedimientos estadísticos debe
comenzarse por representar gráficamente los datos. Si el número de datos
por grupo es menor que 10, se recomienda emplear el diagrama de puntos;
si es superior a 10 se recomiendan histogramas o diagramas de caja. En
esta representación deben buscarse valores atípicos. Si estos valores
atípicos no se deben a un error o una causa subsanable (por ejemplo, error
de transcripción de datos) debe pensarse en la necesidad de transformar los
datos para que cumplan las hipótesis de normalidad. En la Tabla 5 se dan
algunas indicaciones de transformaciones recomendadas. De manera
general se pueden emplear las transformaciones de Box Cox.

13
UNIVERSIDAD NACIONAL DE CAJAMARCA

Si los datos proceden de un fenómeno de tipo binomial, por ejemplo


porcentaje de unidades rechazadas, la transformación adecuada es
y = arcsin(p). Si proceden de un fenómeno de tipo Poisson, por ejemplo
número de defectos, la transformación adecuada es

Construcción de la tabla ANOVA y realización del contraste


Esto puede completarse con la construcción de intervalos de confianza para
las medias de cada grupo y los contrastes múltiples.
Validación de las hipótesis
Es muy importante tener en cuenta en todo momento que la validez de las
conclusiones está supeditada a que las hipótesis realizadas sean ciertas.
Estas comprobaciones pueden hacerse analizando los residuos, es decir las
diferencias que existen entre lo explicado por el modelo y los valores
obtenidos.

Por lo tanto es preciso realizar las siguientes comprobaciones:


• Independencia de los datos. En caso de que los datos se hayan producido
según patrones temporales, etc. se deben representar los residuos en la
secuencia que se obtuvieron y no deben observarse tendencias, rachas, etc.
♦ Normalidad de las perturbaciones. Los residuos deben distribuirse
normalmente. Debe representarse en un papel probabilístico.
♦ Heterocedasticidad. Se representan los residuos por grupos tener una
dispersión parecida. Ver por ejemplo la Figura 2. Si el número de datos es al
mismo para todos los grupos, el ANOVA es bastante robusto frente a esta
hipótesis.

14
UNIVERSIDAD NACIONAL DE CAJAMARCA

Figura 3: Esquema de los pasos de aplicación del ANOVA

15
UNIVERSIDAD NACIONAL DE CAJAMARCA

EJEMPLO 1. COMPARACIÓN DE TERMÓMETROS


Se está realizando una comparación de cuatro termómetros. Con cada uno
de ellos se ha realizado tres ensayos de medida del punto de fusión de un
compuesto químico.
Los datos obtenidos son los de la tabla siguiente:

Representación de los datos


Como solo se dispone de 3 datos por termómetro, se representará un
diagrama de puntos.
APLICACIÓN MINITAB
Minitab dispone de la opción Graf->DotPlot. Se obtiene:

16
UNIVERSIDAD NACIONAL DE CAJAMARCA

En este diagrama no se observan diferencias entre termómetros. Si se


calculan los estadísticos, los datos anteriores podrían encajar en una normal
de media 172,58 °C y desviación 0,996 °C.

Construcción de la tabla ANOVA y realización del contraste


APLICACIÓN MINITAB
Minitab dispone de la opción Stat->ANOVA->One Way. Se obtiene la salida
siguiente:

17
UNIVERSIDAD NACIONAL DE CAJAMARCA

18
UNIVERSIDAD NACIONAL DE CAJAMARCA

19
UNIVERSIDAD NACIONAL DE CAJAMARCA

Validación de las hipótesis


Independencia de los datos
No se conoce en el orden en el que se han tomado los datos, por lo que no se
puede estudiar esta tendencia. En la Figura 5 se ha representado el residuo en
función de la temperatura, sin que se aprecien tendencias.

Normalidad de las perturbaciones


En la Figura 6 puede verse la normalidad de los residuos.

Heterocedasticidad
En la Figura 7 se aprecia que en los termómetros C Y D los datos están algo
más dispersos. No obstante solo son tres datos y además al tener el mismo
número de datos por termómetro, no se considera importante esta indicación.

20
UNIVERSIDAD NACIONAL DE CAJAMARCA

Tras este análisis de residuos quedan validadas las hipótesis y las


conclusiones del estudio.

21
UNIVERSIDAD NACIONAL DE CAJAMARCA

RESOLUCIÓN DE EJERCICIOS

1. Tres lotes pilotos de 5 cerdos cada uno escogió un ingeniero para realizar
durante tres meses de prueba de alimentación. El lote 1 recibió el método
de alimentación A, el lote 2 el B y el lote 3 el C. los rendimientos de los
métodos de alimentación medidos como el peso final (en kilogramos) de
los cerdos se resumen en la siguiente tabla de análisis de varianza
a) Describa la variable dependiente y el modelo de este ANOVA
b) ¿existe evidencia de una diferencia significativa entre los tres tipos de
alimentación? Plantee las hipótesis nula y alternativa, describa la
estadística y la región de rechazo de la hipótesis nula al nivel de
significación α=0.05 y finalmente tome la decisión completando
previamente la tabla ANOVA

SOLUCIÓN:
a) La viable dependiente es el rendimiento pues esta depende del
método de alimentación que les sea aplicado
b)
 H₀: µ₁=µ₂=µ₃
 H₁: Una µₓ es diferente

Fuente de
SC GL MC 𝐹𝑐𝑎𝑙
Varianzas
Tipos de
377.733 2 188.8665
Alimentación 10.4346133
Error 217.2 12 18.1
Total 594.933 14 206.9665

 Métodos de Alimentación: 3
 N° de Cerdos por métodos: 5
 N° de Cerdos totales: 15

Sabemos que:
α=0.05

Al calcular el Ft obtenemos:
𝐹𝑡 = 3.89

Además Tenemos que:


𝐹𝑐𝑎𝑙 = 10.435

Entonces al saber eso observamos que:


𝐹𝑐𝑎𝑙 > 𝐹𝑡

22
UNIVERSIDAD NACIONAL DE CAJAMARCA

Por lo tanto al saber esto decimos que:


Se rechaza la hipótesis nula
2. La empresa P&C que maneja 15 merados quiere comparar la efectividad
de tres tipos e publicidad usados para sus mercados. Se asignaron 5 de
estos mercados al azar a cada uno de los tres tipos distintos de publicidad
con el propósito de estudiar el impacto de los carteles en las ventas. Al
cabo de un mes, el monto de las ventas X (en miles de dólares) de cada
uno de los cinco mercados asignados a cada uno de los tipos de
publicidad dieron los siguientes resultados:
3 5
2
𝑋∗∗ = ∑ ∑ 𝑥𝑖𝑗 2 = 96,698
1 1

Ventas totales para cada tipo de publicidad


𝑥1∗ = 400 𝑥2∗ = 425
𝑥3∗ = 375
Al nivel de significancia de 0.05, ¿proporcionan estos datos suficiente evidencia
para inferir que los promedios de ventas son iguales para los tres tipos de
carteles?
SOLUCIÓN
PLANTEAMOS LA HIPÓTESIS
𝐻𝑜: µ1 = µ2 = µ3

HACEMOS UNA TABLA CON LOS DATOS DADOS

MERCADO TIPOS DE PUBLICIDAD TOTAL MEDIAS DE


S LOS BLOQUES
1 2 3
1
2
3
4
5 400- 425- 375-
(a+b+c+d) (e+f+g+h) (i+j+k+l)
TOTAL 400 425 375 1200
MEDIAS 80 85 75 80

23
UNIVERSIDAD NACIONAL DE CAJAMARCA

𝑋∗∗ = 80
𝑋1∗= 80

𝑋2∗ = 85

𝑋3∗ = 75

𝑋∗∗
=

SACAMOS EL VALOR DE C, EL CUÁL SERÁ:


96000
SACAMOS LOS VALORES DE SCT, SCE Y SCA

2 𝑋𝑖∗ 2
= ∑∑𝑋 =∑ SCE = ECT - SCA

SCT 698 SCA 250 SCE 448

HACEMOS LA TABLA ANOVA CON LOS DATOS YA CALCULADOS

FUENTE DE SUMA DE GRADOS MEDIAS RAZÓN F


VARIACIÓN CUADRADOS DE CUADRATICAS CALCULADA
LIBERTAD
PUBLICIDAD 250 2 125 3.34821429
ERROR 448 12 37.33333333
TOTAL 698 14

RC = {F(2,12)>3.89}
FCAL= 3.35
P=P[F(3,12)>3.35]
F(3,12)(5%)=3.89>3.35
RPTA: Al ver que cumple que el F de la tabla es mayor que F(cal) podemos
aceptar la hipótesis nula
Por lo tanto 
𝐻𝑜: µ1 = µ2 = µ3

Se cumple

24
UNIVERSIDAD NACIONAL DE CAJAMARCA

SCA = 250
SCE = 448
SCT = 698
P = P[F>3.35] = 0.07

3. Para comparar el rendimiento de una variedad de uva un Ingeniero diseño


un experimento con tres métodos de cultivo en una de las viñas de San
Antonio en San Martin. Se escogieron tres terrenos de siembra de iguales
características en las que se sembró el mismo número de plantas por
pacerla de la nueva variedad de uva. El lugar B de 6 parcelas no se abonó.
El lugar A de 5 parcelas se abonó con abono ecológico casero y el lugar
C de 7 parcelas se abonó con abono industrial comercial. La primera
cosecha ha dado las siguientes estadísticas e kilogramos de uva.

X: Rendimiento en kilogramos

Modos de Tamaño de Total Medias


Cultivo Muestra
A 5 450 90
B 5 400 80
C 5 500 100

Desviación estándar de X, igual a 10.


a) Al nivel de significación 𝛼 = 0.05 , ¿Se podría inferir que los promedios
de rendimiento por modos de cultivo de la uva son significativamente
diferentes?
b) Si se concluye hay diferencias significativas en los promedios de
rendimiento por modos de cultivo. ¿Cuál modo de cultivo se debería
seguir? Aplique el método de comparaciones múltiples de Benferroni
para pares de medias con nivel de confianza de al menos 95%.

25
UNIVERSIDAD NACIONAL DE CAJAMARCA

SOLUCIÓN
a)
1. Planteamos:
Ho: = 2= 3
1
H1: Son diferentes

2. De los datos tenemos:

A X^2 B X^2 C X^2


1 90 8100 80 6400 100 10000
2 90 8100 80 6400 100 10000
3 90 8100 80 6400 100 10000
4 90 8100 80 6400 100 10000
5 90 8100 80 6400 100 10000
total 450 40500 400 32000 500 50000

Modos Numero Tamaño


de de de Total Medias Suma de
cultivo Parcelas muestra Cuadrados
A 5 5 450 90 40500
B 6 5 400 80 32000
C 7 5 500 100 50000
total 18 15 1350 270 122500

3. Aplicando las formulas hallamos SCT, SCI y SCE:

26
UNIVERSIDAD NACIONAL DE CAJAMARCA

Donde:

SCT 1400.00
SCI 1000
SCE 400.00
J 3
J-1 2
N 15
N-J 12

4. Calculo de Medias Cuadráticas:

Donde:

MCI = SCI /( J-1) 500


SCE / (N-
MCE = J) 33.33

5. Estadístico de contraste:

F = 14.999

6. Regla de Decisión

Rechazar Ho, si 𝐹 1 𝛼𝐹 , .. . 5 𝐹2,12 = 3.89

7. Decisión:
Puesto que el estadístico F cae en la zona critica, se rechaza Ho con
un nivel de confianza del 95%. Podemos concluir que las medias del
rendimiento no son iguales.

27
UNIVERSIDAD NACIONAL DE CAJAMARCA

4. Un fabricante va adquirir una de cuatro marcas de componentes A, B, C


y D, disponibles en el mercado, para determinado sistema. El análisis
estadístico encargado del estudio, diseño un experimento de un factor
completamente aleatorio con cinco unidades de cada componente para
cada una de las marcas. En una prueba de laboratorio con simuladores
obtuvo las siguientes estadísticas de vida útil en días:
X: Vida útil

Marca de Tamaño de Total


Componentes Muestras
A 5 454
B 5 397
C 5 506
D 5 450

Desviación estándar Sx = 8,2671


a) Al nivel de significación 𝛼 = 0.05 , ¿se podrá inferir que la marca de la
componente es un efecto en el rendimiento de las mismas?
b) ¿Qué marca de componente debería adquirir el fabricante?. Use el
método de intervalos de pares de medias de Bonferroni con nivel de
confianza global de al menos 95%.
Solución
a)

1. Planteamos:
Ho: = 2= 3
1
H1: Son diferentes

2. De los datos tenemos:

A X^2 B X^2 C X^2 D X^2


90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
454 41223.2 397 31521.8 506 51207.2 450 40500

28
UNIVERSIDAD NACIONAL DE CAJAMARCA

Tamaño
Marca de Suma de
de Total Media
componentes Cuadrados
muestras
A 5 454 90.8 41223.2
B 5 397 79.4 31521.8
C 5 506 101.2 51207.2
D 5 450 90 40500
total 20 1807 361.4 164452.2

3. Aplicando las formulas hallamos SCT, SCI y SCE:

Donde:

SCT 1298.55
SCI 1189.75
SCE 108.80
J 4
J-1 3
N 20
N-J 16

4. Calculo de Medias Cuadráticas:

Donde:
SCI /( J-
MCI = 1) 396.58
SCE / (N-
MCE = J) 6.80

29
UNIVERSIDAD NACIONAL DE CAJAMARCA

5. Estadístico de contraste:

F = 58.322
6. Regla de Decisión

Rechazar Ho, si 𝐹 1 𝛼𝐹 1, .. . 5 𝐹3,1 = 3.252

Donde F = 58.322 > 3.252

7. Decisión:
Puesto que el estadístico F cae en la zona critica, se rechaza Ho con
un nivel de confianza del 95%. Podemos concluir que las medias del
rendimiento no son iguales.

5. Un investigador médico realizó una evaluación a profesionales que


trabajan en forma dependiente en diferentes áreas para ver si alguna de
estas es más propensa a producir stress. Usó un cuestionario de 20
preguntas de 4 opciones cada una en donde pueden marcar de 1 a 5. Los
puntajes obtenidos de 20(nivel bajo de stress) a 100(nivel elevado de
stress) se resumen en la siguiente tabla:
Tamaño de las Media Desviación
muestras Estándar
Economistas 10 56.5 1.780
Ingenieros 10 45.6 1.897
Docentes 10 60.3 1.947
universitarios

a) Se puede inferir que no existe diferencia significativa entre los puntajes


promedios de stress de los ingenieros y docentes universitarios? Utilice la
probabilidad de error tipo I igual a 0.05.
b) Pruebe la hipótesis que afirma que no existe diferencia significativa en el
stress que ocasiona el trabajo de estas profesiones. Use nivel de
significación a=0.05.
c) Si existiera diferencia significativa entre los promedios, cuál de estas
profesiones produce mayor stress?
Solución

A. Se puede inferir que no existe diferencia significativa entre los puntajes


promedios de stress de los ingenieros y docentes universitarios? Utilice la
probabilidad de error tipo I igual a 0.05.
1) Formulación de Hipótesis

30
UNIVERSIDAD NACIONAL DE CAJAMARCA

𝑯𝟎 : 2 = 3
𝑯𝟏 : 2 ≠ 3

2) Estadígrafo de prueba
∝= 0.05 ˄ 𝐺 𝑎𝑑𝑜 𝑑𝑒 𝐿𝑖𝑏𝑒 𝑡𝑎𝑑 = 0 1 1 = 18
2
𝑥𝑐𝑎𝑙 = 𝐼𝑁𝑉. 𝐻𝐼 𝑈 𝐷. 𝐷 0.05,18
2
𝑥𝑐𝑎𝑙 = 8.869

3) Toma de decisión:

Las varianzas son iguales, entonces se rechaza 𝑯𝟎 .

B. Pruebe la hipótesis que afirma que no existe diferencia significativa en el


stress que ocasiona el trabajo de estas profesiones. Use nivel de significación
a=0.05
1) Formulación de Hipótesis

𝑯𝟎 : 𝑎𝑖 = 0 𝑖 = 1, ,3
𝑯𝟏 : ∃ 𝑎 𝑖 ≠ 0

2) Análisis de Varianza- tabla ANOVA


Tamaño Media Desviación ∑ 𝑥𝑖 ∑ 𝑥𝑖 2 ∑ 𝑥
de las Estándar
muestras 𝑥̅ 2
Economistas 10 56.5 1.780 565 31954.184 5.601
Ingenieros 10 45.6 1.897 456 20829.586 72.818
Docentes 10 60.3 1.947 603 36398.808 38.028
universitarios
1624 89182.3578 116.447

 ∑ 𝒙𝒊 = 𝑿 ∗ 𝒏

∑ 𝑥1 = 56.5 ∗ 10 = 565

∑ 𝑥2 = 45.6 ∗ 10 = 456

∑ 𝑥3 = 60.3 ∗ 10 = 603

 ∑ 𝑥𝑖 2 = [𝛿 2 + 𝑋 2 ] ∗ 𝒏

31
UNIVERSIDAD NACIONAL DE CAJAMARCA

∑ 𝑥1 2 = [ 1.780 2
+ 56.5 2 ] ∗ 10 = 31954.184

∑ 𝑥2 2 = [ 1.897 2
+ 45.6 2 ] ∗ 10 = 08 9.586

∑ 𝑥3 2 = [ 1.947 2
+ 60.3 2 ] ∗ 10 = 36398.808

3) Resultados:
16 4
= = 8791 .533
30
= 8918 .578 8791 .533 = 1 59.4667
= 10 ∗ 116.447 = 1164.4667
𝐸 = 1 59.4667 1164.4667 = 95

2
1 59.4667
𝑇 = = 43.4 99
30 1
𝑘=3
= 30
4) Tabla ANOVA:
Fuentes de Suma de Grado de Medias Razón F
Varianzas Cuadrados Libertad Cuadráticas calculada
Tratamiento 1164.467 2 582.233 165.47678
Error 95 27 3.519
Total 1259.467 29

5) Nivel de significancia:
∝= 0.05 ˄ 𝐹𝑜 = 165.4767

𝐹 = 𝐼𝑁𝑉. 𝐹. 𝐷 0.05, , 7
𝑭 = 𝟑. 𝟑𝟓𝟒𝟏
𝑃 𝐹𝑜 > 165.4767 = 𝐷𝐼 . 𝐹. 𝐷 165.4767,3,16
𝑷 𝑭𝒐 > 165.4767 = 𝟕. 𝟎𝟐𝟔𝟔𝟖𝑬 𝟏𝟔

6) Región Critica:
R.C= [F (2,27)>3.35]
7) Toma de decisión:
Se rechaza Ho.

32
UNIVERSIDAD NACIONAL DE CAJAMARCA

C. Si existiera diferencia significativa entre los promedios, cuál de estas


profesiones produce mayor stress?
⇨ La que produce mayor estrés es la profesión de Docentes
Universitarios.

45.6 < 56.5 < 60.3

2 < 1 < 3

6. El proyecto académico de un ingeniero es el diseño de un experimento a


fin de determinar el rendimiento de 4 variedades de papa sin tener en
cuenta la influencia de la fertilidad de las tierras de cultivo. Las 20 parcelas
de igual fertilidad que le fueron asignadas los dividio en 4 grupos de 5
parcelas cada una. A cada grupo de parcelas le asignó una variedad
distinta de papa escogida al azar, resultando un diseño completamente
aleatorizado. Los rendimientos medidos en kilogramos de las cinco
variedades por parcela se dan en la tabla que sigue:
V1 V2 V3 V4
55 52 53 52
53 58 55 50
60 50 57 51
52 60 51 49
53 52 54 53
a) Defina la variable dependiente, los niveles del factor, el modelo del diseño
y los supuestos del modelo.
b) Compare descriptivamente las medias de los rendimientos utilizando un
método gráfico.
c) Estime el efecto que produce la variedad 3 en el valor medio global del
rendimiento.
d) Al nivel de significación del 5%, ¿se puede inferir que existen diferencias
significativas entre las producciones medias de las 4 variedades de papa?

Solución

1) Formulación de Hipótesis:
𝑯𝟎 : 1 = 2 = 3 = 4 =
𝑯𝟏 : ∃ 1 ≠

33
UNIVERSIDAD NACIONAL DE CAJAMARCA

2) Análisis de Varianza – Tabla ANOVA:

3) Nivel de Significancia:

∝= 0.05 ˄ 𝐹𝑜 = 1.55

𝐹 = 𝐼𝑁𝑉. 𝐹. 𝐷 0.05,3,16
𝑭 = 𝟑. 𝟐𝟒
𝑃 𝐹𝑜 > 1.55 = 𝐷𝐼 . 𝐹. 𝐷 1.55,3,16
𝑷 𝑭𝒐 > 𝟏. 𝟓𝟓 = 𝟎. 𝟐𝟒
8) Región Critica:
R.C= [F (3,16)>3.35]
9) Toma de decisión:
Se acepta Ho.

34
UNIVERSIDAD NACIONAL DE CAJAMARCA

7. Para comparar el tiempo empleado en realizar una tarea específica bajo


tres procedimientos, un investigador diseñó un experimento seleccionado
al azar tres muestras independientes de 10 operarios cada una y asignó
al azar un procedimiento a cada muestra. Los tiempos registrados en
segundos se dan en la tabla que sigue:

P1 P2 P3
13.45 22.81 18.92
19.1 20.69 21.32
20.73 24.4 25.93
23.6 26.86 19.07
13.45 22.37 20.98
23.29 19.98 26.4
14.93 20.98 28.04
17.07 24.08 23.44
13.65 18.35 18.47
18.79 17.22 25.42
Además, la desviación estándar de la variable dependiente es igual a 4.0072
a) Describa la variable dependiente, el factor y sus niveles. El modelo del
diseño y sus supuestos. Además, describa si hay indicios de diferencias
significativas entre los tres procedimientos.
b) ¿Existe diferencia significativa entre los promedios de tiempos empleados
por los procedimientos 2 y 3? Utilice el nivel de confianza 0.95.
c) Realice una prueba de hipótesis global de los promedios de los tres
procedimientos, al nivel se significación α = 0.05.
d) ¿Cuál de los procedimientos empleados es óptimo? Aplique el método de
intervalos de pares de medias de Bonferroni con nivel de confianza al
menos 96% y el método de rangos de Duncan con nivel se significación
0.05.
SOLUCIÓN:
a)
- Variable independiente: X = Tiempo, en segundos, para realizar
una tarea específica.
- Variable dependiente o factor: A = Procedimientos
- Niveles o Tratamientos: Son los procedimientos P1, P2 y P3.
- El modelo de este ANOVA está dado por:
𝑋𝑖𝑗 = + 𝛼𝑖 + 𝜀𝑖𝑗 , i = 1,2,3 j = 1, 2, …,10.
- Supuestos:
𝛼𝑖 = 𝑖

35
UNIVERSIDAD NACIONAL DE CAJAMARCA

b) COMPARACIÓN POR BONFERRON

Entonces: 𝑢2 = 𝑢3

c)

A = Procedimientos
P1 P2 P3
13.45 22.81 18.92
19.1 20.69 21.32
20.73 24.4 25.93
23.6 26.86 19.07
13.45 22.37 20.98
23.29 19.98 26.4
14.93 20.98 28.04
17.07 24.08 23.44
13.65 18.35 18.47
18.79 17.22 25.42
TOTALES 𝑋𝑖∙ 𝑋∙∙ =623.79
178.06 217.74 227.99
= 30
ni = r 10 10 10
MEDIAS̅𝑋 ∙ 𝑋∙∙ =62.379
17.806 21.774 22.799

De los datos se obtiene:


- SCT = 465.66123
- SCA = 139.08566
- SCE = 326.57557
HIPOTESIS:
- 𝐻 : 𝑢1 = 𝑢2 = 𝑢3
Contra:
- 𝐻1 : ∃ 𝑢𝑖 ≠ 𝑢𝑗

36
UNIVERSIDAD NACIONAL DE CAJAMARCA

ESTADÍSTICA Y REGIÓN CRÍTICA:


Fuente de Suma de Grados de Medias Razón F
Variación Cuadrados Libertad Cuadráticas Calculada
Máquinas 139.08566 2 69.54283
5.750
Error 326.57557 27 12.09539148
Total 465.66123 29

- 𝐹 . 5;2;27 = 0.05139

DECISIÓN:
Dado que 𝐹𝑐𝑎𝑙 = 5.75 > 0.05139, se debería rechazar 𝐻 con probabilidad de
error tipo I igual a 0.05, por lo tanto, el factor procedimiento tiene efecto
significativo sobre el tiempo necesario para realizar una tarea específica.
d)
Utilizando el método de intervalos de pares de medias de Bonferroni
con nivel de confianza al menos 96%:

Entonces: 𝑢1 < 𝑢2 = 𝑢3
Utilizando el método de rangos de Duncan con un nivel de
significación 0.05:
- Ordenamos las medias de menor a mayor:
𝑋1 < 𝑋2 < 𝑋3

17.806 < 1.774 < .799


- Se obtienen los rangos estudentizados:
2 = . 5 , 7 = .9345
3 = . 5 3, 7 = 3.09

- Calculamos los rangos mínimos significativos:


𝑀 𝐸 1 .09539
√ =√ = 1.0998
10
𝑅2 = .9345 ∗ 1.0998 = 3. 74
𝑅3 = 3.09 ∗ 1.0998 = 3.3984
- Para p=3
𝑋3 𝑋2 = 1.0 5 < 3. 74

37
UNIVERSIDAD NACIONAL DE CAJAMARCA

- Para p=2
𝑋3 𝑋1 = 1.774 17.806 = 3.968 Son significativamente
diferentes.
Entonces: 𝑢1 < 𝑢2 = 𝑢3

8. La empresa de transporte terrestre CARGA va adquirir una de 4 marcas


de neumáticos que hay en el mercado. El ingeniero de pruebas de la
empresa diseñó un experimento escogiendo al azar seis neumáticos de
cada marca de características similares. En el laboratorio de pruebas, con
una carga específica simulada, observó la duración de cada neumático
hasta que se deteriore. Los datos redondeados en miles de kilómetros se
dan en la tabla que sigue:

N1 N2 N3 N4
55 63 48 59
53 67 50 68
50 55 59 57
60 62 50 66
55 70 47 71
65 75 61 73
Al nivel de significación del 5%
¿Indican estos datos que las marcas de los neumáticos producen efectos
significativos en el rendimiento?
SOLUCIÓN:

De los datos se obtiene:


- SCT = 37322.625
- SCA = 36553.125
- SCE = 729.5

38
UNIVERSIDAD NACIONAL DE CAJAMARCA

HIPOTESIS:
- 𝐻 : 𝑢1 = 𝑢2 = 𝑢3
Contra:
- 𝐻1 : ∃ 𝑢𝑖 ≠ 𝑢𝑗

ESTADÍSTICA Y REGIÓN CRÍTICA:


Fuente de Suma de Grados de Medias Razón F
Variación Cuadrados Libertad Cuadráticas Calculada
Marca de
Neumáticos 36553.125 3 12184.375 316.683
Error 769.5 20 38.475
Total 37322.625 23

- 𝐹 . 5;3;2 = 3.10

DECISIÓN:
Dado que 𝐹𝑐𝑎𝑙 = 316068 > 3.10, se debería rechazar 𝐻 con probabilidad de
error tipo I igual a 0.05, por lo tanto, el factor procedimiento tiene efecto
significativo sobre el tiempo necesario para realizar una tarea específica.

9. Un promotor inmobiliario está considerando invertir en su centro comercial


a construirse en el sector medio de una capital del interior del país, Se
evalúan 4 ciudades: Arequipa, Iquitos, Piura y Trujillo, en donde es muy
importante el nivel de los ingresos mensuales de las familias. Con este fin
se diseñó una prueba de hipótesis de medias múltiples, seleccionando
una muestra aleatoria de ingresos familiares en cada una de las cuatro
ciudades. Los ingresos mensuales observados en dólares son los
siguientes:

X:Ingresos mensuales
Arequipa Iquitos Piura Trujillo
610 710 560 500
560 730 610 400
490 660 470 500
550 610 510 500
460 580 500
620 400
650

Además, la desviación estándar de la variable dependiente es igual a


90.3193,

39
UNIVERSIDAD NACIONAL DE CAJAMARCA

a) Describa el modelo de este diseño de experimento y sus supuestos.


SOLUCIÓN

grafica de ingresos promedio


700

600

500

400

300

200

100

0
1 2 3 4

La grafica nos muestra que las medias muestrales no difieren mucho


entre si y tampoco están muy alejadas de la media general.

b) Aplique la prueba (a priori) DMS (o LSD) al nivel de significación 0.05,


para determinar los pares de medias que son significativamente
diferentes.

SOLUCION:
1 1
ES=√𝑀 𝐸 ∗ +𝑛 tₒ=t1-α/2, n-k
𝑛𝑖 𝑗

Intervalos de aceptación = (xi-xj)±tₒ*ES

A continuación se muestra las siguientes tablas obtenidas al usar las


formulas antes mencionadas:

X1 552.5
ES 44.67 X2 634
tₒ 2.101 X3 571.4
ni=4 nj=7 X4 466.7

40
UNIVERSIDAD NACIONAL DE CAJAMARCA

Medias muéstrales Diferencia IC al 95%


límite límite
Xi Xj Xi-Xj inferior superior
1 2 -81.5 -175.35 12.35
3 -18.9 -112.75 74.95
4 85.8 -8.05 132.57
2 3 62.6 -31.25 156.45
4 167.3 73.45 261.15
3 4 104.7 10.85 198.55

De donde:

µ1=µ2; µ1=µ3; µ1=µ4; µ2=µ3; µ2>µ4; µ3>µ4

c) Al nivel de significación del 5% ¿producen efectos significativos en la


variabilidad de los ingresos los niveles del fa=ctor ciudad?. Si su
respuesta es afirmativa use la prueba (a posteriori) de rangos de
Duncan para determinar la ciudad donde se debería construir el centro
comercial.

SOLUCION:

ANÁLISIS DE VARIANZA
Origen de Promedio
Suma de Grados Valor
las de los Probabilida
cuadrado de F crítico
variacione cuadrado d
s libertad para F
s s
Entre
79895.04 3 26631.68 5.24 0.009 3.160
grupos
Dentro de
91414.05 18 5078.56
los grupos

171309.0
Total 21
9

De donde:
SCA=79895.04 SCT=171309.09 Fcal= 5.24
SCE=91414.05 MCE=5078.56

41
UNIVERSIDAD NACIONAL DE CAJAMARCA

APLICANDO DUNCAN:
α=0.05 k=4 f=18
𝑛
n= 1 =5.266
∑𝑘
𝑖=1 𝑛𝑖

𝑀𝐶𝐸 5 78.5
√ =√ =31.0548
𝑛 5.2

r2=2.97 r3=3.12 r4=3.21


R2=2.97*31.0548=92.2327
R3=3.12*31.0548=96.8909
R4=3.21* 31.0548=99.6859
Por lo tanto:
µ4 =µ1 <µ3 =µ2

10. Un proceso de producción que consiste de 4 líneas está controlado si las


líneas utilizan el mismo tiempo promedio (en segundos) antes que las
unidades producidas caigan a una bandeja. Cada cierto periodo un
Ingeniero realiza el control de los tiempos de producción por línea del
producto, si una línea está fuera de control, pasa a mantenimiento. En un
reciente control de las líneas de producción se escogió una muestra
aleatoria de tiempos de producción (x) por unidad en cada línea,
observándose los datos de la tabla que sigue:
Al nivel de significación del 5%,

Muestras
Muestra Muestra Muestra Muestra
1 2 3 4
15 10 20 16
12 12 18 18
14 14 20 16
14 13 22 15
15 18 21
14 20 18
12 19
17 20
14

Además, Sx=3.199. Se supone homocedasticidad.

42
UNIVERSIDAD NACIONAL DE CAJAMARCA

a) ¿Cree usted que se debería realizar el mantenimiento a alguna de las


líneas de producción?
SOLUCION:

Hₒ=µ1=µ2=µ3=µ4

𝐻1 = ⁆µ𝑖≠µ𝑗

RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 6 84 14 1.2
Columna 2 9 130 14.44 10.53
Columna 3 8 158 19.75 1.93
Columna 4 4 65 16.25 1.58

ANÁLISIS DE VARIANZA
Origen de Promedio
Suma de Grados Valor
las de los Probabilida
cuadrado de F crítico
variacione cuadrado d
s libertad para F
s s
Entre
157.60 3 52.53 11.14 0.00 3.03
grupos
Dentro de
108.47 23 4.72
los grupos

Total 266.07 26

De donde:
SCA=157.60 SCT=266.07
SCE=108.47 MCE= 4.72

→ Si se debe realizar mantenimiento de las líneas de producción.

b) Si su respuesta en el inciso a) es afirmativa, ¿a cuál de las 4 líneas se


debería realizar el mantenimiento? Aplique de rangos de Duncan.
APLICANDO DUNCAN:
α=0.05 k=4 f=23
𝑛
n= 1 =6.128
∑𝑘
𝑖=1𝑛𝑖

MCE=4.72

𝑀𝐶𝐸 4.72
√ =√ =0.8776
𝑛 .128

43
UNIVERSIDAD NACIONAL DE CAJAMARCA

Entonces:
µ1=µ2 <µ4<µ3
Por lo tanto se debe hacer mantenimiento a la línea 3.
c) Cree usted que se viola el supuesto de homecedasticidad? Utilice un
paquete de cómputo para resolver este inciso.

SOLUCION:

Prueba de homocedasticidad: 4.144


Grados de libertad: 3 y 23
Signif=0.017

11. El Decano del FACI desea estudiar el número de horas que los alumnos
que los alumnos de los ciclos: 5,6,7 y 8, utilizan los terminales de computo
de la universidad. Una muestra de usos por ciclo ha dado los siguientes
tiempos en hora mensuales:

CICLOS
C5 C6 C7 C8
35 43 28 39
33 47 30 48
30 35 39 37
40 30 46
35 27
42
a) Defina la variable dependiente y estime el efecto que produce el séptimo
ciclo.
b) Describa la regla de decisión para probar globalmente la hipótesis nula
de igualdad de las cuatro media. ¿Cuál es la decisión estadística? Use
𝛼 = 0.05. ¿Cuánto es la probabilidad P de la prueba?
c) Si es adecuado, determine que ciclos difieren significativamente en el
uso promedio de horas por ciclo de los terminales por cómputo. Use
Duncan con 𝛼 = 0.05.

SOLUCIÓN
a)
i. LA VARIABLE DEPENDIENTE ES: X= número de horas
que los alumnos utilizan los terminales de computo.
∑𝑘
𝑖=1 𝜇𝑖
ii. = 𝑘
35 + 33 + 30 + 40 + 35 + 4 15
1 = = = 35.83
6 6
43 + 37 + 35 1 5
2 = = = 41.68
3 3
8 + 30 + 39 + 30 + 7 154
3 = = = 30.8
5 5
44
UNIVERSIDAD NACIONAL DE CAJAMARCA

39 + 48 + 37 + 46 170
4 = = = 4 .5
4 4

35.83 + 41.68 + 30.8 + 4 .5 150.81


= = = 37.70 5
4 4

𝛼𝑖 = 𝑖

𝛼3 = 3 = 30.8 37.70 5

b)
i. Hipótesis:
𝐻: 1= 2= 3= 4=
𝐻 :∃ 𝑖 ≠
ii. Nivel de significancia:
𝛼 = 0.05.
De los datos se obtienen:
𝑋1. = 15 1 = 6
𝑋2. = 1 5 2 = 3
𝑋3∙ = 154 3 = 5
𝑋4. = 170 4 = 4
𝑋.. = 664 = 18

2 2
𝑋.. 664
= = = 4494.
18
2 2 2 2 2 2
.∑ ∑ 𝑋𝑖𝑗 = 35 + 33 + 30 + ⋯ + 37 + 46 = 5 30

2
SCT=∑ ∑(𝑋𝑖𝑗 ) = 5 30 4494. = 735.8

𝑋1. 2 215 2 125 2 154 2 17 2


SCA=∑ ∑ = + + + 4494. = 376.5
𝑛𝑖 3 5 4

SCE= = 735.8 376.5 = 349.3

𝑆𝐶𝐴 38 .3
MCA= 𝐾 = = 1 8.83
1 3

𝑆𝐶𝐸 34 .3
MCE= 𝑛 = = 4.95
𝑘 14

𝑀𝐶𝐴 128.83
FA=𝑀𝐶𝐸 = = 5.1635
24. 5

45
UNIVERSIDAD NACIONAL DE CAJAMARCA

iii. Estadística y Región Crítica


La estadística es, 𝐹𝐴 = 𝑀 ⁄𝑀 𝐸 ~𝐹 3,14 . La región critica de la
prueba es: 𝑅 : 𝐹𝑎 > 𝐹 . 5,3,14 = 3.344
FUENTE GRADOS
SUMA DE MEDIAS RAZON F
DE DE
CUADRADOS CUADRATICAS CALCULADA
VARIACION LIBERTAD
HORAS 386.5 3 128.83
ERROR 349.3 14 24.95 FA=5.1635
TOTAL 735.8 17
iv. Decisión: Dado que 𝐹𝑐𝑎𝑙 = 5.163 > 3.344, se debe rechazar la
𝐻 , el factor horas influye en el uso de los terminales de
computo.
v. La probabilidad P de la prueba es,
𝑃 = 𝑃[𝐹 3,14 > 5.163] =0.013

c)
I. 𝑋 1. = 35.83 1=6
𝑋 2. = 41.68 2 =3
𝑋 3. = 30.8 3 =5
𝑋 4. = 4 .5 4 =4

𝑋 3. < 𝑋 1. < 𝑋 2. < 𝑋 4.


30.8 < 35.83 < 41.68 < 4 .5

II. 𝑝 = 𝛼 𝑝, 𝑓
𝛼 = 0.05
𝑘=4
𝑓 = 14

2 = . 5 ,14 = 3.03
3 = . 5 3,14 = 3.18
4 = . 5 4,14 = 3. 7

III. Rangos mínimos significativos


𝑅𝑝 = 𝑝 √𝑀 𝐸 ⁄
𝑘
Para tamaños diferentes de muestras: = 1
∑𝑘
𝑖=𝑖 𝑛𝑖
4 4 40
= = =
1 1 1 1 57 57
6+3+5+4 60

𝑀 𝐸 4.95
√ =√ = .434
40⁄57

46
UNIVERSIDAD NACIONAL DE CAJAMARCA

𝑅2 = 3.03 × .434 = 7.375


𝑅3 = 3.18 × .434 = 7.740
𝑅4 = 3. 7 × .434 = 7.959

IV. Comparaciones múltiples de rangos de Duncan


𝑋 3. < 𝑋 1. < 𝑋 2. < 𝑋 4.
30.8 < 35.83 < 41.68 < 4 .5

𝑋 4. 𝑋 3. = 11.7 > 7.959 Significativa Duncan:


𝑋 4. 𝑋 1. = 6.67 < 7.740 No Significativa 1 = 3𝑦 1 = 2 = 4
𝑋 2. 𝑋 3. = 10.88 > 7.740 Significativa
𝑋 4. 𝑋 2. = 0.8 < 7.375 No Significativa 40
= = 4. 105
𝑋 2. 𝑋 1. = 5.85 < 7.375 No Significativa 57
𝑋 1. 𝑋 3. = 5.03 < 7.375 No Significativa

12. En EGC de la PUCP se va evaluar la efectividad de tres métodos


diferentes de enseñanza de Matemática I: El método grupal (A), el
tradicional (B) y el aprendizaje basado en problemas (ABP). Del semestre
anterior se ha escogido una muestra aleatoria de calificaciones finales
para cada método de enseñanza cuyos resultados se dan en la tabla que
sigue:

METODOS
A B ABP
132 17 10
14 16 11
12 16 15
13 17 10
12 17 14
15 13 13
11 10
14 13
11
14
13
10
a) Al nivel de significancia 𝛼 = 0.05 ¿indican los datos obtenidos que no
existen diferencias significativas entre los tres métodos de
enseñanza?.
b) Realice un ordenamiento de efectividad de los tres métodos
aplicando el método de rangos de Duncan al nivel de 𝛼 = 0.05.

47
UNIVERSIDAD NACIONAL DE CAJAMARCA

SOLUCION
b)
i. Hipótesis:
𝐻: 1= 2= 3=
𝐻 :∃ 𝑖 ≠
ii. Nivel de significancia:
𝛼 = 0.05.

De los datos se obtienen:


𝑋1. = 104 1 = 8
𝑋2. = 96 2 =6
𝑋3∙ = 144 3 = 1
𝑋.. = 344 = 6
𝑋.. 2 344 2
= = = 4551.3895
6
2 2 2 2 2 2
.∑ ∑ 𝑋𝑖𝑗 = 13 + 14 + 1 + ⋯ + 13 + 10 = 4678

2
SCT=∑ ∑(𝑋𝑖𝑗 ) = 4678 4551.385 = 1 6.615

𝑋1. 2 1 4 2 2 144 2
SCA=∑ ∑ = + + 4551.385 = 64.615
𝑛𝑖 8 12

SCE= = 1 6.615 64.615 = 6

𝑆𝐶𝐴 4. 15
MCA= 𝐾 = = 3 .3075
1 2

𝑆𝐶𝐸 2
MCE= 𝑛 = 23 = .696
𝑘

𝑀𝐶𝐴 32.3 75
FA=𝑀𝐶𝐸 = = 11.9835
2.

iii. Estadística y Región Crítica


La estadística es, 𝐹𝐴 = 𝑀 ⁄𝑀 𝐸 ~𝐹 , 3 . La región critica de la
prueba es: 𝑅 : 𝐹𝐴 > 𝐹 . 5,2,23 = 3.4
FUENTE DE SUMA DE GRADOS DE MEDIAS RAZON F
VARIACION CUADRADOS LIBERTAD CUADRATICAS CALCULADA
METODOS 64.615 2 32.3075
ERROR 62 23 2.696 FA=11.9835
TOTAL 126.615 25

iv. Decisión: Dado que 𝐹𝑐𝑎𝑙 = 11.98 > 3.4 , se debe rechazar la
𝐻 , el factor método influye en la enseñanza de matemática I.
48
UNIVERSIDAD NACIONAL DE CAJAMARCA

v. La probabilidad P de la prueba es,


𝑃 = 𝑃[𝐹 , 3 > 11.985] = 0.000

vi. 𝑋 1. = 13 1 =8
𝑋 2. = 16 2 =6
𝑋 3. = 1 3 =1

𝑋 3. < 𝑋 1. < 𝑋 2.
1 < 13 < 16

vii. 𝑝 = 𝛼 𝑝, 𝑓
𝛼 = 0.05
𝑘=3
𝑓= 3

2 = . 5 , 3 = .77
3 = . 5 3, 3 = .9

viii. Rangos mínimos significativos


𝑅𝑝 = 𝑝 √𝑀 𝐸 ⁄
𝑘
Para tamaños diferentes de muestras: = 1
∑𝑘
𝑖=𝑖 𝑛𝑖
3 3
= = =8
1 1 1 9
+ +
8 6 1 4

𝑀 𝐸 .696
√ =√ = 0.58
8
𝑅2 = .77 × 0.58 = 1.606
𝑅3 = .9 × 0.58 = 1.693

ix. Comparaciones múltiples de rangos de Duncan


𝑋 3. < 𝑋 1. < 𝑋 2.
1 < 13 < 16

𝑋 2. 𝑋 1. = 3 > 1.693 Significativa


𝑋 2. 𝑋 3. = 4 > 1.606 Significativa
𝑋 2. 𝑋 3. = 1 < 1.606 No Significativa
Duncan:
1 = 3 < 2

49
UNIVERSIDAD NACIONAL DE CAJAMARCA

7
= =8
9

13. dieciséis empleados nuevos del grupo “BANC” fueron distribuidos


aleatoriamente en 4 grupos distintos de 4 empleados cada uno. A cada grupo se
le asignó aleatoriamente un tiempo de entrenamiento antes de realizar cierta
tarea. Los resultados de dicha tarea en los tiempos correspondientes se dan en
la siguiente tabla.

ENTENAMIENTO
Grup.1: 1 Grup.2: Grup.3: 2 Grup.4: 2.5
hora 1.5horas horas horas
25 14 7 8
19 26 10 7
22 17 9 9
20 15 11 4

a. Antes de saber los resultados de la prueba global de comparaciones ANOVA


realice una prueba de significación, por partes de medias de la muestras con un
nivel de significancia= 0.05
SOLUCIÓN
a. La variable respuesta o dependiente es X= Rendimiento de los
empleados.
Los factores que posiblemente influyen en el rendimiento son:
A: capacitación del personal: A1= Buena, A2= Regular, A3= Ninguna
B: turno de trabajo: B1= Mañana, B2=Tarde, B3= Noche
El modelo del ANOVA de dos factores con replica es:

Xijk = µ + ai + bj + (ab)y + Eijk

Donde i=1, 2,3, j=1, 2,3, k=1, 2, 3, 4

Estadísticas descriptivas:

50
UNIVERSIDAD NACIONAL DE CAJAMARCA

Prueba de hipótesis

Prueba z para medias de dos muestras

Variable Variable
1 2
Media 18.00 9.25
Varianza (conocida) 1.52 2.20
Observaciones 4.00 4.00
Diferencia hipotética de las medias 5.00
z 3.89
P(Z<=z) una cola 0.00
Valor crítico de z (una cola) 1.64
Valor crítico de z (dos colas) 0.00
Valor crítico de z (dos colas) 1.96

Análisis de varianza

RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 4 86 21.5 7.00
Columna 2 4 72 18 30.00
Columna 3 4 37 9.25 2.92
Columna 4 4 28 7 4.67

ANÁLISIS DE VARIANZA
O. variaciones s.cuadrados Gl P. cuadrados F P V. crít. F
Entre grupos 575.19 3.00 191.73 17.20 0.00 3.490
D. de los grupos 133.75 12.00 11.15

Total 708.94 15.00

Como se aprecia en los resultados se rechaza Ho

51
UNIVERSIDAD NACIONAL DE CAJAMARCA

14. Veinte personas que experimentan fiebres de 38 grados o más fueron


divididos en 4 grupos de 6 personas cada uno y a cada grupo se le
administro una marca de tableta distinta para aliviar el mal. El número de
horas contadas hasta bajar la fiebre luego de administrar la tableta se da
en la siguiente tabla:

Tabletas
T1 T2 T3 T4
5 11 6 12
3 5 4 10
8 3 7 9
4 3 5 8
2 4 6 7
6 2 2 8

a) Pruebe al nivel de significación α=0.05, la hipótesis de que el


promedio del número de horas hasta aliviar el mal es el mismo para
las cuatro marcas de tabletas. ¿Cuál es la decisión con α=0.01?

SOLUCIÓN:

𝐻 : µ1=µ2=µ3=µ4=µ,
𝐻1 :ᴈµ =µ

52
UNIVERSIDAD NACIONAL DE CAJAMARCA

ANÁLISIS DE VARIANZA
Origen de Promedio Valor
las Suma de Grados de de los crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Entre
grupos 80.67 3 26.89 4.949 0.010 3.098
Dentro de
los grupos 108.67 20 5.43

Total 189.33 23

De la gráfica:
SCA= 80.67 SCE=108.67
SCT= 189.33 MCE=5.43

Luego:
RC= [F (3,20)>3.10]
P [F>4.95]=0.01
Entonces: se rechaza 𝐻

b) Si rechaza la hipótesis de igual efectividad, ¿Cuál de las cuatro


tabletas es la más eficaz? Use el método de Duncan al 5%.

SOLUCION:
Aplicando Duncan:
α=0.05 k=4 f=20
MCE=5.43
r2= . 5 (2,20)=2.95

r3= . 5 (3,20)=3.10

r4= . 5 (4,20)=3.19

N= muestras iguales=6

𝑀𝐶𝐸 5.43
√ =√ =0.95
𝑛

R2=2.95*0.951=2.805
R3=3.10*0.951=2.948
R4=3.19*0.951=3.033
Por lo tanto:
µ1 =µ2 =µ3 <µ4

53
UNIVERSIDAD NACIONAL DE CAJAMARCA

15. la estructura financiera de una firma se refiere a la forma en que se dividen


los activos de la empresa por debe y haber, y el apalancamiento financiero
se refiere al porcentaje de activos financiados por deuda. En un estudio
financiero se firma que el apalancamiento financiero puede utilizarse para
aumentar la tasa de rendimiento sobre la inversión, es decir que, los
accionistas pueden recibir rendimientos mas altos con la misma cantidad
de inversión gracias a su uso. Los siguientes datos muestran las tasas de
rendimiento utilizando 3 diferentes niveles de apalancamiento financiero

𝑋: 𝑡𝑎𝑠𝑎𝑠 𝑑𝑒 𝑒𝑚𝑑𝑖𝑚𝑖𝑒𝓃𝑡𝑜
Niveles de rendimiento
Control Bajo Medio Alto
4.6 2 7 7.9
2 7.4 4.5 6.8
6.8 1.8 11.6 5.8
4.2 3.2 6 9.2
1.6 4 6.8 11
a) ¿Existen diferencias reales entre las medias de los cuatro niveles de
rendimiento al nivel de significación 1%, y al 5%?
b) ¿Son las tasas medias de rendimiento en los niveles de apalancamiento
financiero bajo, medio y alto más altas que la de nivel de control?

SOLUCIÓN:

Interval Plot of rendimiento vs Niveles de rendimiento


99% CI for the Mean
12

10

8
rendimiento

0
A B C M
Niveles de rendimiento
The pooled standard deviation was used to calculate the intervals.

a) Gráfica de las medias muestrales.

54
UNIVERSIDAD NACIONAL DE CAJAMARCA

La variable dependiente es:


𝑿: 𝒕𝒂𝒔𝒂𝒔 𝒅𝒆 𝒓𝒆𝒎𝒅𝒊𝒎𝒊𝒆𝓷𝒕𝒐

Asociada a la variable dependiente o factor 𝑅 = nivel de rendimiento, cuyos


tratamientos son: control (C), Bajo (B), Medio (M) y Alto (A)

Sea 𝑖 las medias de los niveles de rendimiento


1. 𝐻𝑜 ∶ 1 = 2 = 3 = 4
𝐻1 ∶ No todas las 𝑖 son iguales

2.

2 2
𝑋.. 114.
= = = 65 .08
𝓃 0
2 2 2 2
∑ ∑ 𝑥𝑖𝑗 = 4.6 + + ⋯ + 11 = 813.8
2
= ∑ ∑ 𝑥𝑖𝑗 = 813.8 65 .08 = 161.74
2 2 2 2
𝑋𝑖. 19. + 18.4 + 35.9 + 40.7
= ∑ = = 78.4
5
𝐸= = 161.74 78.4 = 83.3

Grados
Fuente de Suma de Medias Razón F P-
de
Variación Cuadrados Cuadráticas Calculada Value
Libertad
Nivel de
rendimiento 78.42 3 26.14 5.02 0.0012
Error 83.32 16 5.2
Total 161.74 19
𝑀𝐶𝐴
La estadística de la prueba es: 𝐹𝐴 = 𝑀𝐶𝐸 ∼ 𝐹 3,16

55
UNIVERSIDAD NACIONAL DE CAJAMARCA

𝑅 = { 𝐹 3,16 > 3.01 }


Dado que 𝑃[𝐹 > 5.0 ] = 0.01 > 𝛼 = 0.01, se acepta la 𝐻𝑜, y se concluye que
las medias de los cuatro niveles de rendimiento son iguales.

Interval Plot of rendimiento vs Niveles de rendimiento


95% CI for the Mean

10

7
rendimiento

1
A B C M
Niveles de rendimiento
The pooled standard deviation was used to calculate the intervals.

b)
𝐻𝑜 ∶ 1 = 2 = 3 = 4
𝐻1 ∶ No todas las 𝑖 son iguales

𝑋.. 2 114. 2
= = = 65 .08
𝓃 0
2 2 2 2
∑ ∑ 𝑥𝑖𝑗 = 4.6 + + ⋯ + 11 = 813.8

2
= ∑ ∑ 𝑥𝑖𝑗 = 813.8 65 .08 = 161.74

2 2 2 2
𝑋𝑖. 19. + 18.4 + 35.9 + 40.7
= ∑ = = 78.4
5
𝐸= = 161.74 78.4 = 83.3

Dado que 𝑃[𝐹 > 5.0 ] = 0.01 < 𝛼 = 0.05, se rechaza la 𝐻𝑜, y se concluye que
no todas las medias de los cuatro niveles de rendimiento son iguales.

56
UNIVERSIDAD NACIONAL DE CAJAMARCA

16. La importadora “Drogasa” quiere compara la eficiencia de tres medicinas


para el tratamiento de la rinitis alérgica en adultos mayores de 50 años.
Para esto diseño un experimento seleccionando 3 pacientes mayores de
50 años que sufren la enfermedad. A cada paciente escogido se le
suministro las tres medicinas A, V y C en periodos distintos del ataque de
la enfermedad registrándose el número de días que tardaron en
recuperarse. Los datos se registraron en el siguiente diseño de un factor
(medicina) aleatorizado por bloques (pacientes).

Paciente Paciente Paciente


1 2 3
B 18 C 15 A 16
A 23 B 25 C 16
C 17 A 28 B 22

a) Al nivel de significación 0.05 ¿es válido concluir que no existen diferencias


significativas en los tiempos promedios de días de recuperación de los
pacientes?

b) ¿Fue correcto incluir a los pacientes como una fuente de variación en el


diseño del experimento?
SOLUCIÓN:

a) La variable dependiente es:


𝑿: 𝒕𝒊𝒆𝒎𝒑𝒐𝒔 𝒑𝒓𝒐𝒎𝒆𝒅𝒊𝒐𝒔 𝒅𝒆 𝒅í𝒂𝒔 𝒅𝒆 𝒓𝒆𝒄𝒖𝒑𝒆𝒓𝒂𝒄𝒊ó𝒏 𝒅𝒆 𝒍𝒐𝒔 𝒑𝒂𝒄𝒊𝒆𝒏𝒕𝒆𝒔

El factor 𝑃 es pacientes
Los bloques ℬ son los tipos de medicinas

El modelo de este diseño de experimento es: 𝑋𝑖𝑗 = + 𝛼𝑖 + 𝛽𝑗 + 𝜀𝑖𝑗

Cálculos de los datos


𝑋.. 2 180 2
= = = 3600
∗𝑘 3∗3
2 2
= 𝓃 1 𝑥 = 8 4.6368 = 17

57
UNIVERSIDAD NACIONAL DE CAJAMARCA

𝑘
2 2 2
1 2
67 + 65 + 48
= ∑ 𝑋𝑖. = 3600 = 7 .667
3
𝑖=1
𝑟 2 2 2
1 2
58 + 68 + 54
ℬ = ∑ 𝑋.𝑗 = 3600 = 34.667
𝑘 3
𝑖=1

𝐸= + ℬ = 64.667
Las sumas de cuadrados, los grados de libertad, los cuadrados medios y
las F calculadas se resumen mimitav

Sea 𝑖 tiempos promedios de días de recuperación de los pacientes


 Hipótesis
𝐻𝑜 ∶ 1 = 2 = 3 = 4
𝐻1 ∶ No todas las 𝑖 son iguales

 Región de rechazo
Se rechazara Ho con un nivel de significancia 𝛼 = 0.05, si 𝐹𝐴 > 𝐹 . 5,2,4
 Decisión
Dado que 𝐹𝐴 = . 5 < 𝐹 . 5,2,4 = 6.94, se debe aceptar la Ho y concluir con
probabilidad de error tipo I, 𝛼 = 0.05, los tiempos promedios de
recuperación de los pacientes son iguales; es decir: 1 = 2 = 3 = 4

b)

 Hipótesis
𝐻𝑜 ∶ 𝛽1 = 𝛽 = 𝛽3 = 𝛽4
𝐻1 ∶ No todas las 𝛽𝑖 son iguales

 Región de rechazo
Se rechazara Ho con un nivel de significancia 𝛼 = 0.05, si 𝐹Β > 𝐹 . 5,2,4

58
UNIVERSIDAD NACIONAL DE CAJAMARCA

 Decisión
Dado que 𝐹Β = 1.07 < 𝐹 . 5,2,4 = 6.94, se debe aceptar la Ho y concluir con
probabilidad de error tipo I, 𝛼 = 0.05, que fue correcto incluir a los
pacientes como una fuente de variación en el diseño del experimentos los
tiempos promedios de recuperación de los pacientes son iguales.

17.- La empresa “Fertilizantes agrícolas” que quiere comparar los efectos de los
tres tipos de fertilizantes 1 , 2 𝑦 3 en la siembra de una variedad de papa. Para
esto se sembró la papa en cuatro terrenos escogidos, se supone, con iguales
características para cada uno, pero que podrían ser una fuente de variabilidad
de la producción de papa. Cada terreno se dividió en tres partes de áreas iguales
y cada fertilizante s asigno aleatoriamente a una parte de cada terreno
consiguiendo así un diseño de un factor (fertilizante) aleatorizado por bloques
(terrenos). El rendimiento de la cosecha se midió en kilogramos, resultando los
siguientes datos:
Terreno 1 Terreno 2 Terreno 3
Terreno 4

2 = 50 3 = 63 1 = 46 3 = 64
1 = 45 2 =5 3 =6 1 = 44
3 = 60 1 = 45 2 = 53 2 =5

A nivel de significación: 𝛼 = 0.05,


a) ¿Producen los fertilizantes, efectos significativos en la variabilidad de la
producción de esta variedad de papa? Si fuera así, aplicando el método
de rangos de Duncan, ¿Cuál de los tres fertilizantes es el mejor?
b) ¿Tiene alguna influencia en este diseño la inclusión de los terrenos como
una fuente de variabilidad en la producción? Si no fuera así, modifique el
modelo y la tabla anova para decidir por el mejor fertilizante.
SOLUCIÓN
La variable dependiente es, X = Efectos de diversos fertilizantes.
El factor A es Variedad de fertilizantes
El factor B son los terrenos de siembra
El modelo es: 𝑋𝑖𝑗 = + 𝛼𝑖 + 𝛽𝑗 + 𝜀𝑖𝑗

Donde, 𝛼𝑖 = 𝑒𝑠 𝑒𝑙 𝑒𝑓𝑒 𝑡𝑜 𝑒 𝑋 𝑑𝑒 𝑙𝑎 𝑣𝑎 𝑖𝑒𝑑𝑎𝑑 𝑑𝑒 𝑓𝑒 𝑡𝑖𝑙𝑖𝑧𝑎 𝑡𝑒𝑠 𝑖, 𝑖 = 1, ,3


𝛽𝑗 = 𝑒𝑠 𝑒𝑙 𝑒𝑓𝑒 𝑡𝑜 𝑒 𝑋 𝑑𝑒𝑙 𝑏𝑙𝑜𝑞𝑢𝑒 𝑑𝑒 𝑡𝑒 𝑜 𝑗, 𝑗 = 1, ,3,4

59
UNIVERSIDAD NACIONAL DE CAJAMARCA

Lugares Variedades de fertilizantes 𝑜𝑡𝑎𝑙 𝑑𝑒 𝑀𝑒𝑑𝑖𝑎 𝑑𝑒


(bloques) 𝐵𝑙𝑜𝑞𝑢𝑒 𝑋.𝑗 𝐵𝑙𝑜𝑞𝑢𝑒 𝑋.𝑗
1 2 3

1 45 50 60 155 51.67
2 45 5 63 160 53.33
3 46 53 6 161 53.67
4 44 5 64 160 53.33
𝑜𝑡𝑎𝑙 𝑋𝑖. 180 07 49 𝑋.. = 636

𝑀𝑒𝑑𝑖𝑎𝑠 𝑋𝑖. 45 51.75 6 . 5 𝑋.. = 53

𝑋.. 2 = 33708
=
𝑘

𝑘 𝑟
2 =6 0
= ∑ ∑ 𝑋𝑖𝑗
𝑖=1 𝑗=1

𝑘
1 2 = 604.5
= ∑ 𝑋𝑖.
𝑖=1

𝑟
1 2 𝐵 = 7.333
𝐵 = ∑ 𝑋.𝑗
𝑘
𝑖=1

𝐸= + 𝐵 𝐸 = 8.167

a) Formulamos nuestra hipótesis nula:


𝐻 : 𝛼𝑖 = 0 ; 𝑖 = 1, ,3,4

𝐻1 : ∃𝛼𝑖 ≠ 0
60
UNIVERSIDAD NACIONAL DE CAJAMARCA

𝐹𝐴 = .061

𝑔𝑙 = ,6 𝐹 . 5,2, = 5.14

𝐹 2, < 𝐹𝐴 = 5.143 < .061

Como Fa resulta ser mayor F(2,6), rechazamos la hipótesis nula, por lo tanto los
fertilizantes si producen una diferencia significativa en la variabilidad de la
producción de papa.

1 < 2< 3

𝑀𝑒𝑑𝑖𝑎 𝑡𝑒 𝑒𝑙 𝑚é𝑡𝑜𝑑𝑜 𝑑𝑒 𝑎 𝑔𝑜𝑠 𝑑𝑒 𝐷𝑢 𝑎 𝑠𝑒 𝑜 𝑙𝑢𝑦𝑒 𝑞𝑢𝑒 𝑒𝑙 𝑚𝑒𝑗𝑜 𝑓𝑒 𝑡𝑖𝑙𝑖𝑧𝑎 𝑡𝑒 𝑒𝑠 3.

b) Analizamos el F(0.95,3,6):

𝐹 . 5,3, = 4.76

𝐹𝐵 = 1.796

Finalmente:
𝐹𝐵 < 𝐹 . 5,3, ~1.796 < 4.76

Se concluye que no tiene influencia alguna el diseño de la inclusión de terrenos


como una fuente de variabilidad.

18.- La empresa “Confecciones textiles” realiza un estudio para determinar el


mejor de tres métodos de montaje de una prenda específica. Con este fin, diseñó
un experimento para comparar los tres métodos seleccionando cinco operadores
que se supone sin de velocidad homogénea para reducir la variación debido a
los operarios, asignando a cada operario los tres métodos por tiempos iguales.
El número de prendas terminadas por cada operario y con cada método en el
tiempo fijado se da en la tabla siguiente:

61
UNIVERSIDAD NACIONAL DE CAJAMARCA

Método
Operario 1 2 3
1 3 9 5
2 4 8 6
3 3 7 8
4 5 9 7
5 4 6 3

A nivel de significación del 5%


a) ¿Existe alguna diferencia significativa entre los métodos de montaje de
las prendas? Si fuera así, aplicando el método de rangos de Duncan,
¿Cuál de los tres métodos sería el más recomendable para la empresa?
b) ¿Fue correcto incluir a los operarios en el diseño del experimento como
una fuente de variabilidad del número de prendas terminadas? Si no es
así, resuelva el problema de ANOVA sin considerar los bloques de
operarios, como una fuente variabilidad del número de montajes.
¿Cambia el resultado obtenido en el inciso a)? ¿Cambia el resultado de
Duncan obtenido en el inciso a)?
SOLUCIÓN

La variable dependiente es, X = Determinar el mejor de los métodos.


El factor A son los operarios
El factor B son los métodos
El modelo es: 𝑋𝑖𝑗 = + 𝛼𝑖 + 𝛽𝑗 + 𝜀𝑖𝑗

Donde, 𝛼𝑖 = 𝑒𝑠 𝑒𝑙 𝑒𝑓𝑒 𝑡𝑜 𝑒 𝑋 𝑑𝑒 𝑑𝑒𝑡𝑒 𝑖𝑚𝑎 𝑒𝑙 𝑚𝑒𝑗𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑚é𝑡𝑜𝑑𝑜𝑠 𝑖, 𝑖 = 1, ,3


𝛽𝑗 = 𝑒𝑠 𝑒𝑙 𝑒𝑓𝑒 𝑡𝑜 𝑒 𝑋 𝑑𝑒𝑙 𝑏𝑙𝑜𝑞𝑢𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑚é𝑡𝑜𝑑𝑜𝑠 𝑗, 𝑗 = 1, ,3,4,5

Operarios Métodos 𝑜𝑡𝑎𝑙 𝑑𝑒 𝑀𝑒𝑑𝑖𝑎 𝑑𝑒


(bloques) 𝐵𝑙𝑜𝑞𝑢𝑒 𝑋.𝑗 𝐵𝑙𝑜𝑞𝑢𝑒 𝑋.𝑗
1 3
1 3 9 5 17 5.67
2 4 8 6 18 6
3 3 7 8 18 6
4 5 9 7 21 7
5 4 6 9 19 6.33
𝑜𝑡𝑎𝑙 𝑋𝑖. 19 39 35 𝑋.. = 93

𝑀𝑒𝑑𝑖𝑎𝑠 𝑋𝑖. 3.8 7.8 7 𝑋.. = 6.

𝑋.. 2 = 576.6
=
𝑘 62
𝑘 𝑟
2
= ∑ ∑ 𝑋𝑖𝑗
𝑖=1 𝑗=1
UNIVERSIDAD NACIONAL DE CAJAMARCA

= 64.4

𝑘
1 2
= ∑ 𝑋𝑖. = 44.8
𝑖=1

𝑟
1 𝐵 = 3.067
2
𝐵 = ∑ 𝑋.𝑗
𝑘
𝑖=1

𝐸= + 𝐵 𝐸 = 16.533

a) 𝐻 : 𝛼𝑖 = 0 ; 𝑖 = 1, ,3

𝐻1 : ∃𝛼𝑖 ≠ 0

𝐹𝐴 = 10.839
𝑔𝑙 = ,8

Como el valor de: 𝐹 . 5,2,8 = 4.459

Finalmente: 𝐹 . 5,2,8 < 𝐹𝐴 = 4.459 < 10.839

63
UNIVERSIDAD NACIONAL DE CAJAMARCA

Por último, se rechaza la hipótesis nula y se concluye que sí existe una diferencia
significativa entre los métodos de montaje.

Aplicando en método de rangos de Duncan:

1 < 3 = 2

𝐸𝑙 𝑚𝑒𝑗𝑜 𝑚é𝑡𝑜𝑑𝑜 𝑒𝑠 𝑒𝑙 .

b)
𝐹 . 5,4,8 = 3.838

𝐹𝐵 = 0.371

Se concluye que no fue correcto incluir a los operarios en el diseño del


experimento.
Por lo que se resolverá el problema de ANOVA sin considerar los bloques
operarios:

RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 5 19 3.8 0.7
Columna 2 5 39 7.8 1.7
Columna 3 5 35 7 2.5

ANÁLISIS DE VARIANZA
O. las variaciones S.cuadrados Gl P.cuadrados F P Valor F
Entre grupos 44.80 2.00 22.40 13.71 0.00 3.89
Dentro de los grupos 19.60 12.00 1.63

Total 64.40 14.00

Finalmente se concluye que dicha tabla no cambia los resultados obtenidos en


el inciso a.

64
UNIVERSIDAD NACIONAL DE CAJAMARCA

19. A empresa agroindustrial ARROZSA, estudia el efecto de 4 clases de


fertilizantes A, B, C y D en el rendimiento de la producción de arroz. Para esto,
diseño un experimento dividiendo el terreno del cultivo en tres bloques 1, 2,3 con
cuatro parcelas homogéneas de cada uno, asignado aleatoriamente los
fertilizantes de cada uno de los bloques para conseguir aso un diseño de bloques
completamente aleatorizado. El rendimiento, medido en kilogramos por parcela,
se da en la siguiente tabla:

1 2 3
C D B
39.9 43.4 42.7
A B D
40.1 42.9 42.9
B A C
41.1 42.2 41.4
D C A
42.1 42.3 41.9

a) Describa la variable dependiente y el modelo de este diseño de


experimento.
b) ¿proporcionan estos datos suficiente evidencia de alguna diferencia
significativa en la medida de los rendimientos de los fertilizantes? ¿si
es, así ¿ cuál de los fertilizantes es el mejor?
c) Si un analista opina que fue innecesario dividir los terrenos en bloque
considerarlos como fuente de variabilidad de la producción. Solo
bastaba con comparado con el efecto de los fertilizantes sobre la
producción aplicando un diseño o factor completamente aleatorio.
estaría de acuerdo usted con el analista.
SOLUCIÓN.
a)
La variable dependiente de este problema es:
X= efecto de fertilizantes A, B, C, D
Asociada a variable dependiente o factor a= terreno del cultivo en tres
bloques 1, 2,3 con cuatro parcelas homogéneas de cada uno.
El modelo de este ANOVA está dado por:
Xij=µ+∝i+𝜀ij i=1, 2, 3,4

65
UNIVERSIDAD NACIONAL DE CAJAMARCA

Donde:

𝛼i= µi -µ es el efecto de los fertilizantes.

Tabla ANOVA los datos se obtienen:

tipos
totalXi. n=r medias X⁻i.
fertilizantes 1 2 3
A 40.1 42.2 41.9 124.2 3 41.4
42.333333
B 41.4 42.9 42.7 127 3 3
C 39.9 42.3 41.4 123.6 3 41.2
D 42.1 43.4 42.9 128.4 3 42.8
TOTAL
DE 167.73333
164.5 172.8 171.9 503.2 12
BLOQUE 3
X.j

CALCULOS.
2
X. . 5032
= = = 1100.85333
n 1
ΣΣx 2 ij = 1113.76
SCT = ΣΣx^ ij C = 1 .90666667
2
Σ Xi.
SCA = C = 5.
r
SCB = Σx. J ^ /k C = 516.571666
SCE = SCT SCB + SCA = 0.534666667
varianza = 1.173333333
OTRA FORMA DE OBTENER SCT
SCT = n 1 Sx^ = 1 .90666667
La suma de los cuadrados de libertad, los cuadrados medios y las F
calculadas se resumen.

66
UNIVERSIDAD NACIONAL DE CAJAMARCA

fuente de suma de grados de medias Razón F


variación cuadrados libertad cuadráticas calculada
A=fertilizante 5.2 3 1.73333333 Fcal=
bloques 7.172 2 3.586 19.4513716
error 0.53466667 6 0.08911111 40.2418953
total 12.9066667 11

 Se quiere contrastar la hipótesis nula:


Ho: αi = 0, para todo i=1, 2, 3,4
Contra
H1: una de las αi no es nulo
La región de rechazo
Se rechazara Ho el nivel de significación α=0.05, si Fa>F0.95, 3,6
DECISION
Dado que Fa=19.451, P [F (3.6)>19.451]=0.002
C) SE TIENE ADEMAS
Fb= 40.241 con un nivel de significación = 0.00.
Se establece que el diseño por bloques es el adecuado.

20. El gerente de ventas del grupo mercados realizó un estudio estadístico para
comparar volumen de ventas dirás de sus cuatro mercados. Para esto diseño
un experimento considerando solo las ventas de los días jueves, viernes,
sábado y domingo de días de semana como una posible fuente de variabilidad
en el monto de las ventas. Los mercados 1, 2, 3,4fueron asignados al azar a
los 4 jueves, 4 viernes, a los 4 sábados y los 4 domingos consiguiendo así un
diseño aleatorio por bloque. Las ventas diría EN MILES DE SOLES SE DAN en
la tabla que siguen
Días
Jueves viernes sábado Domingo
42(3) 55(1) 61(2) 40(4)
50(1) 52(3) 44(4) 60(2)
35(4) 59(2) 46(3) 52(1)
62(2) 38(4) 54(1) 50(3)

67
UNIVERSIDAD NACIONAL DE CAJAMARCA

A un nivel de significación α=0.05


a) ¿muestras estos datos que existe muestras significativas en los
volúmenes de las ventas promedios delas 4 sucursales? SI ES ASI ¿Cuál
sucursal vende más?
b) ¿ha sido adecuado considerar a los días como una fuente de variabilidad
a los día Con este monto de las ventas en las 4 sucursales?
c) Si los días no considerados no afectan a la variabilidad en el monto de
las ventas en las sucursales, rediseñe el experimento sin considerar como
fue la variabilidad alas días. Con este modelo, ¿cuál de las sucursales
vende más? ¿use la prueba del rango de Duncan?
Solución.

Tabla ANOVA los datos se obtienen:

datos dias Medias


Total. n=r
MERCADOS Jueves viernes sabado Domingo Xi.
A 126 55 122 160 463 4 115.75
B 50 156 176 120 502 4 125.5
C 140 118 138 52 448 4 112
D 124 152 54 150 480 4 120
TOTAL DE 440 481 490 482 1893 16 473.25
BLOQUE X.j
media
bloque X.j 44 48.1 49

Cálculos.
2
X. .
C= = 3889664 . 6853637
n

𝛴𝛴𝑥 2 𝑖𝑗 = 50765

= 𝛴𝛴𝑥 2 𝑖𝑗 = 1080.01

𝛴 𝑋𝑖. ^ / 958.48
𝐵 = 1/𝐾 𝛴𝑥. 𝐽 ^ = 41.50
𝐸= 𝐵+ = 80.03
68
UNIVERSIDAD NACIONAL DE CAJAMARCA

OTRA FORMA DE OBTENER SCT


= 1 𝑥^ = 1080.01

Las sumas de cuadrados los grados de libertad los cuadrados medios y las F
calculadas se resuman:

fuente de suma de grados de medias Razón F


variación cuadrados libertad cuadráticas calculada
A=fertilizante 958.48 3 95.848183 35.9298375
bloques 41.50 9 4.61117071 1.72855248
error 80.02946 15 2.66764867
total 1080.01183 27

 Se quiere contrastar la hipótesis nula:


Ho: αi = 0, para todo i=1, 2, 3,4 , j=1,2
Contra
H1: una de las αi no es nulo
La región de rechazo
Se rechazara Ho el nivel de significación α=0.05, si Fa > F0.95,
3,047
DECISION
Dado que Fa=19.451, P [F (3.6)>19.451]=0.002
C) SE TIENE ADEMAS
Fb= 31.56 con un nivel de significación = 0.00. , con 5%
µ4<µ3<µ2<µ1.

69
UNIVERSIDAD NACIONAL DE CAJAMARCA

21. El decano de estudios generales ciencias de la PUCP quiere saber si son los
niveles de evaluación de cursos y/o el conocimiento de los alumnos que
producen la variabilidad en las notas finales que obtienen. Para esto, se diseñó
un experimento de dos factores sin réplicas, escogiendo 4 alumnos al azar del
tercer nivel que cursaron las materias: matemática (M), estadística (E), física (F)
y lengua (L), observando las calificaciones siguientes:
CURSOS
Alumno M E F L
1 14 13 14 16
2 13 18 15 19
3 11 16 13 18
4 12 15 112 16

A) ¿podemos concluir que los cursos presentan la misma dificultad? Si no


es así, ¿Cuál de estos cursos es más difícil? Use Bonferroni con nivel de
confianza al menos del 95% y Duncan 5%.
B) ¿son los alumnos un factor de variabilidad significativo de las notas
finales obtenidas? Utilice el método de la probabilidad P.

SOLUCIÓN

Análisis de varianza de dos factores con una sola muestra por grupo

RESUMEN Cuenta Suma Promedio Varianza


1 4 57 14.25 1.583
2 4 65 16.25 7.583
3 4 58 14.5 9.667
4 4 55 13.75 4.250

M 4 50 12.5 1.667
E 4 62 15.5 4.333
F 4 54 13.5 1.667
L 4 69 17.25 2.250

70
UNIVERSIDAD NACIONAL DE CAJAMARCA

ANÁLISIS DE VARIANZA
Origen de Grados Promedio Valor
Suma de
las de de los F Probabilidad crítico
cuadrados
variaciones libertad cuadrados para F
Filas 14.188 3.000 4.729 2.735 0.106 3.863
Columnas 53.688 3.000 17.896 10.349 0.003 3.863
Error 15.563 9.000 1.729
Total 83.438 15.000

Tenemos sacando la tabla de cuadrados:

SCA 53.688
SCB 14.188
SCE 15.563
SCT 83.438

 a)
𝐻 : 𝑎𝑖 = 0
Tenemos un rango de1-4
Según la tabla 𝐹𝐴 = 10,349 con grados de libertad 3,9,
Tenemos P [F (3,9)>10,349]=0.003
Como la probabilidad es menor que 0.05 entonces se rechaza.

 UTILIZAMOS EL METODO DE BONFERRINI


Calculamos los siguientes datos necesarios:
n= 6
a= 0.013

1-(a)/2 = 0.994

n-k = 12.000
2.934
error= 2.228

71
UNIVERSIDAD NACIONAL DE CAJAMARCA

Tabla de diferencias de medias


𝑥𝑖 𝑥𝑗 𝑥 𝑖-𝑥𝑗 L.inf L.sup
12.5 15.5 -3 -5.228 -0.772 xe-xm
15.5 13.5 2 -0.228 4.228 xe-xf
13.5 17.25 -3.75 -5.978 -1.522 xf-xl
17.25 12.5 4.75 2.522 6.978 ul-xm

Del cuadro calculamos que:


𝑢1 < 𝑢4 , 𝑢2 = 𝑢3 , 𝑢2 = 𝑢4 , 𝑢3 < 𝑢4 , Duncan, subconjunto homogéneo 𝑢1 con 𝑢3 ,
𝑢3 con 𝑢2 y 𝑢2 con 𝑢4
 b)
Tenemos una hipótesis 𝐻 : 𝑏𝑗 = 0

El rango de trabajo es de 1-4


Según la tabla 𝐹𝑏 = .735 con grados de libertad 3,9,
Tenemos P [F (3,9)>2.735]=0.106 entonces no se rechaza.
22. Cuatro operarios del grupo “construye” realizan la misma tarea de construir
paredes de ladrillo en tiempos iguales. El grupo quiere determinar si hay alguna
diferencia significativa en el metraje promedio debido a la habilidad de los
operarios y/o debido al horario. Para esto diseñaron un análisis de varianza de
dos factores sin replicas, registrando los siguientes datos en metros cuadrado de
pared construida por cada operario en tres horas cualesquiera:

Operarios
Horas 𝑜1 𝑜2 𝑜3 𝑜4
10-11 am 3.0 3.5 3.2 3.3
2-3 pm 1.8 2.1 2.0 1.9
4-5 pm 2.4 2.5 2.4 2.4

a) Plantea la hipótesis nula y alternativa para determinar si existen


diferencias significativas en el metraje construido debido a los operarios.
b) Plantee la hipótesis nula y alternativa para determinar si existen
diferencias significativas en el metraje construido debido a los horarios.
c) Si existen diferencia en alguno de los dos factores, ¿Qué pares de
niveles de este, producen la diferencias? Utilice el método de Ducan.
Use un nivel de significancia =0.01 en todas las pruebas

72
UNIVERSIDAD NACIONAL DE CAJAMARCA

SOLUCIÓN
Cálculo del análisis de datos

RESUMEN Cuenta Suma Promedio Varianza


10-11 am 4.0000 13.0000 3.2500 0.0433
2-3 pm 4.0000 7.8000 1.9500 0.0167
4-5 pm 4.0000 9.7000 2.4250 0.0025

3.0000 7.2000 2.4000 0.3600


3.0000 8.1000 2.7000 0.5200

3.0000 7.6000 2.5333 0.3733


3.0000 7.6000 2.5333 0.5033

ANÁLISIS DE VARIANZA
Origen Suma de Grad Promedio Probabilid Valor
de las cuadrado os de de los F ad crítico
variacion s liberta cuadrado para F
es d s
Filas 3.461666 2 1.730833 201 3.1803E- 5.143252
67 33 06 85
Columna 0.135833 3 0.045277 5.258064 0.040744 4.757062
s 33 78 52 02 66
Error 0.051666 6 0.008611
67 11

Total 3.649166 11
67

Resumen del cuadro

SCA 0.136
SCB 3.462
SCE 0.052
SCT 3.649

73
UNIVERSIDAD NACIONAL DE CAJAMARCA

a) Operarios(A),
Tenemos como hipótesis,𝐻 : 𝑖 donde i va de 1-4
De la tabla se ha calculado 𝐹𝐴 = 5. 58, y con grados de libertad 3,6
También calculamos P [F>5.258]=0.04, por lo cual se acepta 𝐻

b) Horas (B),
Tenemos 𝐻 : 𝑏𝑗 y tiene un rango 1, 2,3
Según la tabla tenemos 𝐹𝐴 = 10, con grado de libertad 2,6
Calculamos P [F>210]=0.000 por lo cual se rechaza 𝐻 .

c) Duncan por horas:


𝑢2 < 𝑢3 < 𝑢3

23. La firma confecciones quiere saber si las perdidas en porcentajes de


producción defectuosa producida, dependen de las líneas de producción y/o de
los tipos de materia prima de sus proveedores. Para esto, el ingeniero a cargo
del control, diseño un experimento de dos factores sin replicas asignando a cada
una de las 5 líneas de producción L1, L2, L3, L4 y L5 una de las 4 materias primas:
M1, M2, M3, M4 por día. Los porcentajes de producción defectuosa por día se dan
en la tabla que sigue:
líneas de
producción
materias
primas L1 L2 L3 L4 L5
M1 2.3 2.5 3.0 3.2 4
M2 2.8 2.7 3.5 3.8 4.2
M3 3.2 3.0 3.7 3.9 4.3
M4 3.6 3.8 4.0 4.3 4.5

a) Defina la variable dependiente y el modelo de ANOVA.


b) ¿Son significativamente diferentes los promedios de porcentajes de
producción defectuosa debido a las líneas de producción? Si es así ¿cuál
es la línea de mayor producción defectuosa? Use el método de rangos de
Duncan.
c) ¿Son significativamente diferente los promedios de porcentajes de
producción defectuosa debido a las materias primas? Si es así, ¿Cuál es
la materia prima optima? Use Duncan.

74
UNIVERSIDAD NACIONAL DE CAJAMARCA

En todas las pruebas use el nivel de significación 𝛼 = 0.05


SOLUCION:
a)

ANÁLISIS DE VARIANZA
Origen de Grados Promedio
las Suma de de de los Valor crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Filas SCB=2.8255 3 0.942 31.22 5.978E-06 3.490
Columnas SCA=4.718 4 1.180 39.10 8.606E-07 3.259
Error SCE=0.362 12 0.030
Total SCT=7.9055 19

b)
1. H0: 𝛼𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4,5

2. se calculan las medias y se proceden a ordenar de menor a mayor.

líneas de
producción promedio
L1 2.98
L2 3
L3 3.55
L4 3.8
L5 4.25

3.
𝛼 = 0.05 , k=5, f= 12
R2=r0.05 (2, 12)=3.08
R3=r0.05 (3, 12)=3.23
R4=r0.05 (4, 12)=3.33
R5=r0.05 (5, 12)=3.36
Se calculan los rangos mínimos significativos:

75
UNIVERSIDAD NACIONAL DE CAJAMARCA

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

𝑀 𝐸 0.030
√ =√
4

𝑀 𝐸
√ = 0.0866

Las muestras adyacentes se tienen:


𝑅2 = 3.08 ∗ 0.0866 = 0. 68
𝑅3 = 3. 3 0.0866 = 0. 80
𝑅4 = 3.33 ∗ 0.0866 = 0. 88
𝑅5 = 3.36 ∗ 0.0866 = 0. 91
Se realiza una comparación entre las medias y los rangos mínimos:

medias comparación de rangos de Duncan


5y4 0.45 > 0.29 significativa
5y 3 0.7 > 0.29 significativa
5y 2 1.25 > 0.29 significativa
5y1 1.28 > 0.29 significativa
4y3 0.25 < 0.29 no significativa
4y2 0.8 > 0.29 significativa
4y1 0.83 > 0.29 significativa
3y2 0.55 > 0.28 significativa
3y1 0.58 > 0.28 significativa
2y1 0.02 < 0.268 no significativa

Podemos afirmar que:


𝐹𝐴 = 39.1
𝑃[𝐹 > 39.1] = 0

1 = 2 < 3 = 4 < 5

d) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4

76
UNIVERSIDAD NACIONAL DE CAJAMARCA

2. se calculan las medias y se proceden a ordenar de menor a mayor.

materias
primas Promedio
M1 3
M2 3.4
M3 3.62
M4 4.04

3.
𝛼 = 0.05 , k=4, f= 12
R2=r0.05 (2, 12) =3.08
R3=r0.05 (3, 12) =3.23
R4=r0.05 (4, 12) =3.33
R5=r0.05 (5, 12) =3.36

Se calculan los rangos mínimos significativos:

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

𝑀 𝐸 0.030
√ =√
5

𝑀 𝐸
√ = 0.077

Las muestras adyacentes se tienen:


𝑅2 = 3.08 ∗ 0.077 = 0. 37
𝑅3 = 3. 3 ∗ 0.077 = 0. 49
𝑅4 = 3.33 ∗ 0.077 = 0. 56
Se realiza una comparación entre las medias y los rangos mínimos:

77
UNIVERSIDAD NACIONAL DE CAJAMARCA

medias comparación de rangos de Duncan


4y3 0.42 > 0.26 significativa
4y2 0.64 < 0.26 significativa
4y1 1.04 > 0.26 significativa
no
3y2
0.22 > 0.25 significativa
3y1 0.62 > 0.25 significativa
2y1 0.40 > 0.237 significativa
Podemos afirmar que:
𝐹𝐴 = 31.
𝑃[𝐹 > 31. ]=0

1 < 2 = 3 < 4

24. Para evaluar 4 sistemas de administración de archivos de diseño un


experimento con 4 operadores de procesamiento de palabras a quienes se les
observo el tiempo X necesario, en minutos, para aprender a usar cada uno de
los siguientes sistemas de administración de archivos. Los tiempos observados
se dan en la tabla que sigue:

sistemas de administración de archivo


operadores A1 A2 A3 A4
B1 390 402 392 385
B2 380 403 394 385
B3 377 411 399 380
B4 370 404 400 384

Además Sx= 11.5181


¿Existen alguna diferencia significativa en la media del tiempo,
a) Debido a los sistemas de administración de archivos?
b) Debido a los operadores?
c) ¿Cuál de los sistemas es el más adecuado? Use el método de rangos de
Duncan.

En todas las pruebas use el nivel de significación 𝛼 = 0.05


SOLUCIÓN:
Realizamos el cuadro ANOVA:

78
UNIVERSIDAD NACIONAL DE CAJAMARCA

ANÁLISIS DE VARIANZA
Origen de Grados Promedio Valor
las Suma de de de los crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Filas SCB= 18.5 3 6.167 0.185 0.904 3.863
SCA=
Columnas 1671.5 3 557.167 16.715 0.001 3.863
Error SCE= 300 9 33.333
Total SCT= 1990 15

A) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor:

sistemas de
administración promedio
de archivos
A1 379.25
A2 383.5
A3 396.25
A4 405

3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41
Se calculan los rangos mínimos significativos:

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

𝑀𝐶𝐸 33.333 𝑀𝐶𝐸


√ =√ =√ = 3.33
𝑛 3 𝑛

79
UNIVERSIDAD NACIONAL DE CAJAMARCA

Las muestras adyacentes se tienen:


𝑅2 = 3. 0 ∗ 3.33 = 10.66
𝑅3 = 3.34 ∗ 3.33 = 11. 1
𝑅4 = 3.41 ∗ 3.33 = 11.36
Se realiza una comparación entre las medias y los rangos mínimos:

medias comparación de rangos de Duncan


no
4y3
8.75 < 11.36 significativa
4y2 21.50 > 11.36 significativa
4y1 25.75 > 11.36 significativa
3y2 12.75 > 11.12 significativa
3y1 17.00 > 11.12 significativa
no
2y1
4.25 < 10.36 significativa

Podemos afirmar que:


𝐹𝐴 = 16.715
𝑃[𝐹 > 16.715] = 0.001

1 = 4 < 3 = 2

A) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias:

sistemas de
administración promedio
de archivos
A1 379.25
A2 405
A3 396.25
A4 383.5

3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41

80
UNIVERSIDAD NACIONAL DE CAJAMARCA

Se calculan los rangos mínimos significativos:

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

𝑀 𝐸 33.333
√ =√
3

𝑀 𝐸
√ = 3.33

Las muestras adyacentes se tienen:


𝑅2 = 3. 0 ∗ 3.33 = 10.66
𝑅3 = 3.34 ∗ 3.33 = 11. 1
𝑅4 = 3.41 ∗ 3.33 = 11.36
Se realiza una comparación entre las medias y los rangos mínimos:

medias comparación de rangos de Duncan


no
4y3
8.75 < 11.36 significativa
4y2 21.50 > 11.36 significativa
4y1 25.75 > 11.36 significativa
3y2 12.75 > 11.12 significativa
3y1 17.00 > 11.12 significativa
no
2y1
4.25 < 10.36 significativa

Podemos afirmar que:


𝐹𝐴 = 16.715
𝑃[𝐹 > 16.715] = 0.001

1 = 4 < 3 = 2

a) 1. H0: 𝛼𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor:

81
UNIVERSIDAD NACIONAL DE CAJAMARCA

sistemas de
administración promedio
de archivos
A1 379.25
A2 383.5
A3 396.25
A4 405

3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41
Se calculan los rangos mínimos significativos:

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

𝑀 𝐸 33.333
√ =√
3

𝑀 𝐸
√ = 3.33

Las muestras adyacentes se tienen:


𝑅2 = 3. 0 ∗ 3.33 = 10.66
𝑅3 = 3.34 ∗ 3.33 = 11. 1
𝑅4 = 3.41 ∗ 3.33 = 11.36
Se realiza una comparación entre las medias y los rangos mínimos:

82
UNIVERSIDAD NACIONAL DE CAJAMARCA

medias comparación de rangos de Duncan


no
4y3
8.75 < 11.36 significativa
4y2 21.50 > 11.36 significativa
4y1 25.75 > 11.36 significativa
3y2 12.75 > 11.12 significativa
3y1 17.00 > 11.12 significativa
no
2y1
4.25 < 10.36 significativa

Podemos afirmar que:


𝐹𝐴 = 16.715
𝑃[𝐹 > 16.715] = 0.001

1 = 4 < 3 = 2

b) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias:

operadores promedio

O1 389.5
O2 390.5
O3 391.75
O4 392.25

3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41
Se calculan los rangos mínimos significativos:

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

83
UNIVERSIDAD NACIONAL DE CAJAMARCA

𝑀 𝐸 33.333
√ =√
3

𝑀 𝐸
√ = 3.33

Las muestras adyacentes se tienen:


𝑅2 = 3. 0 ∗ 3.33 = 10.66
𝑅3 = 3.34 ∗ 3.33 = 11. 1
𝑅4 = 3.41 ∗ 3.33 = 11.36

Se realiza una comparación entre las medias y los rangos mínimos:

medias comparación de rangos de Duncan


no
4y3
0.50 < 11.36 significativa
no
4y2
1.75 < 11.36 significativa
no
4y1
2.75 < 11.36 significativa
no
3y2
1.25 < 11.12 significativa
no
3y1
2.25 < 11.12 significativa
no
2y1
1.00 < 10.36 significativa

Podemos afirmar que:


𝐹𝐴 = 0.185
𝑃[𝐹 > 0.185] = 0.904

1 = 2 = 3 = 4

c) El más adecuado sería el sistema A4.

84
UNIVERSIDAD NACIONAL DE CAJAMARCA

25. La empresa de “Torneados metálicos” diseño un experimento de dos factores


con tres replicas para determinar si existen diferencias significativas en la
cantidad de piezas producidas debido a las máquinas y debido a los operarios.
Se emplearon dos operarios y cada uno de ellos utilizo cada una de las tres
máquinas para procesar el producto en tres periodos iguales de tiempo.
Los valores promedios de las cantidades de piezas producidas para cada
combinación de los niveles de los factores se dan en la tabla que sigue:

MAQUINAS
OPERARIOS
M1 M2 M3
O1 102.33 130.00 114.33
O2 114.00 142.67 126.67

Y la tabla ANOVA resultante es:


Fuente de Sumas de Grados de Medias Estadísticas
variabilidad cuadrados Libertad cuadráticas F
Maquinas 2392.33
Operario 672.22
Interacción 0.778
Error
Total 3190.000

a) Realice una gráfica lineal de medias y analice descriptivamente la


existencia podría o no de interacción entre los dos factores considerados.
b) ¿Es significativa la interacción entre los factores considerados? ¿Qué
puede decir de los efectos de las máquinas y de los operarios?
c) ¿Qué máquina y operario tienen mayor rendimiento? Utilice el método de
rangos de Duncan donde sea posible aplicar.

85
UNIVERSIDAD NACIONAL DE CAJAMARCA

Aplique el nivel de significación α=5% en todas las pruebas.

SOLUCIÓN
PARTE a): Gráfica lineal de medias para la interacción entre los dos
factores considerados.

Interacción de Medias
160
140
120
100
80
60
40
20
0
M1 M2 M3
MAQUINAS

O1 O2

Según la gráfica nos podemos dar cuenta de que descriptivamente no


existe ningún tipo de interacción entre los operarios y sus máquinas
correspondientes.

PARTE b):
Antes de realizar el proceso para elaborar la tabla ANOVA, describiremos
los siguientes datos:
𝑦. . = 𝑝 𝑜𝑚𝑒𝑑𝑖𝑜 𝑡𝑜𝑡𝑎𝑙
𝑦𝑖. = 𝑝 𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑓𝑖𝑙𝑎
𝑦̂. 𝑗 = 𝑝 𝑜𝑚𝑒𝑑𝑖𝑜 𝑜𝑙𝑢𝑚 𝑎
𝑗 = #𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒 𝑢 𝑎 𝑜𝑙𝑢𝑚 𝑎
𝑖 = #𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒 𝑢 𝑎 𝑓𝑖𝑙𝑎
𝑖𝑗 = #𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒 𝑎𝑑𝑎 𝑒𝑙𝑑𝑎
𝑎 = #𝑓𝑖𝑙𝑎𝑠
𝑏 = # 𝑜𝑙𝑢𝑚 𝑎𝑠
𝑁 = #𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Previo a pasar al desarrollo realizaremos la prueba de hipótesis

86
UNIVERSIDAD NACIONAL DE CAJAMARCA

H0= No hay interacción entre los operarios con sus respectivas


máquinas.
H1= Existe interacción entre los operarios con sus respectivas
máquinas.

N= 18
n= 3
n i= 9
n j= 6
y..= 121,667

Donde:
N= # de datos * # de réplicas
n= # de réplicas
ni= # de réplicas * # de filas
nj=# de réplicas * # de columnas

Ahora teniendo en cuenta la tabla de valores de las cantidades producidas


por los dos factores, procedemos a sacar los promedios:
_Para los operarios:
Promedio de O1 𝑦̂1. = 115,553
Promedio de O2 𝑦̂ . = 127,78

_Para las máquinas:


Promedio de M1 𝑦.
̂1 = 108,165
Promedio de M2 𝑦.
̂ = 136,335
Promedio de M3 𝑦.
̂3 = 120,5

La tabla ANOVA cuenta con todas las sumas de cuadrados menos con la
del ERROR, entonces:
+ 𝐵+ 𝐸+ 𝐵=
𝐸 = 1 4.67

87
UNIVERSIDAD NACIONAL DE CAJAMARCA

La tabla ANOVA quedaría de la siguiente manera:

Fuente de Sumas de Grados de Medias Estadísticas


variabilidad cuadrados Libertad cuadráticas F

Maquinas 2392,33 2 1196,165 115,1340


Operario 672,22 1 672,22 64,7029
Interacción 0,778 2 0,389 0,0374
Error 124,67 12 10,3893
Total 3190 17

Para realizar el contraste de hipótesis, para ello recurrimos a la tabla de


distribución F:
Fcritico = F 𝑔𝑙𝑓𝑎𝑐𝑡𝑜𝑟 , 𝑔𝑙𝑒𝑟𝑟𝑜𝑟 , 𝛼
Fmáquinas 3.89
Foperario 4.75
Finteracción 3.89

Como: Fmáquinas>Fcrítico, rechazamos la H0


Como: Foperario>Fcrítico, rechazamos la H0
Como: Finteracción<Fcrítico, aceptamos la H0

Después de haber realizado el contraste de la hipótesis concluimos en


que no existe interacción entre observadores y máquinas, a un nivel de
significancia del 5%
PARTE c):
Primero ordenamos de forma creciente las medias
𝑋1 < 𝑋3 < 𝑋2
108.165 < 1 0.5 < 136.335

88
UNIVERSIDAD NACIONAL DE CAJAMARCA

Con la tabla Duncan obtenemos:

𝑝 = 𝛼 𝑝, 𝑓
2 = , 5 ,1 3,08

3 = , 5 3,1 3,23

Los rangos mínimos y significativos:

𝑀 𝐸
𝑅𝑝 = 𝛼 ∗√
6

R2= 4,0529
R3= 4,2503

Contrastamos las diferencias entre pares de medias muéstrales comparando el


rango de medias adyacentes con el valor critico de mínimo significación.
Para p=3 𝑋2 𝑋1 = 28,17 > 𝑅3 = 4, 503 𝑠𝑖𝑔 𝑖𝑓𝑖 𝑎𝑡𝑖𝑣𝑎

Para p=2 𝑋2 𝑋3 = 15,835 > 𝑅2 = 4,0,5 9 𝑠𝑖𝑔 𝑖𝑓𝑖 𝑎𝑡𝑖𝑣𝑎


𝑋3 𝑋1 = 12,335 > 𝑅2 = 4,0,5 9 𝑠𝑖𝑔 𝑖𝑓𝑖 𝑎𝑡𝑖𝑣𝑎

Entonces concluimos en que:


1 < 3 < 2

Completamos la información con el siguiente cuadro:

Rendimiento de las Máquinas


160
140
120
100
80
60
40
20
0
1 2 3

PROMEDIO M1

89
UNIVERSIDAD NACIONAL DE CAJAMARCA

26. Para seleccionar la mejor semilla de maíz y el mejor fertilizante la empresa


“AGROSA” diseñó un experimento de dos factores con cuatro réplicas en
terrenos de igual fertilidad. El terreno se dividió en 24 pares iguales. Cada
combinación de tipo de semilla y tipo de fertilizante se asignaron a cuatro pares
iguales. Los rendimientos obtenidos en kilogramos se dan en la tabla siguiente:

Semilla de Maíz
Fertilizante
A1 A2 A3
B1 35 33 38 37 33 3
30 5 35 36 3 34
B2 31 30 40 39 36 35
3 9 43 4 40 38

a) Realice una gráfica de medias y el análisis descriptivo de interacción.


b) ¿es significativa la interacción observada entre los tipos de maíz y tipos
de fertilizante? Utilice el método de la probabilidad P.
c) ¿Se debería seguir analizando el efecto de los dos factores?

SOLUCIÓN

PARTE a): gráfica de medias y el análisis descriptivo de interacción

INTERACCION ENTRE MAIZ Y FERTILIZANTE


180
160
140
120
100
80
60
40
20
0
A1 A2 A3
Fertilizante Semilla de Maíz

Series1 Series2 Series3 Series4

De la gráfica observamos claramente que si existe interacción entre


ambos factores

90
UNIVERSIDAD NACIONAL DE CAJAMARCA

PARTE b):
Primero realizamos la prueba de hipótesis:
H0= No hay interacción entre los cultivos de fertilizante y maíz.
H1= Existe interacción entre los cultivos de fertilizante y maíz.
Proponemos un cuadro estadístico descriptivo para facilitarnos el manejo
de los datos:
FACTOR B FACTOR A TOTAL MEDIA N

A1 B1 150 37,5 4
B2 122 30,5 4
Total 272 34 8
A2 B1 146 36,5 4
B2 164 41 4
Total 310 38,75 8
A3 B1 131 32,75 4
B2 149 37,25 4
Total 280 35 8
TOTAL B1 427 35,5833 12
B2 435 38,5833 12
Total 862 37,0833 24

Cuya desviación estándar va a ser igual a: 3,90001858


Con los datos obtenidos, comenzamos a realizar los cálculos para la tabla
ANOVA:
_Primero para el SST:
2
= 𝑁 1 × 𝑥 349,833333

2
𝑋∙∙∙
= 30960,1667
𝑎𝑏

_Luego empezamos con las sumas de cuadrados para los factores:


𝑘
1 2
= ∑ 𝑋𝑖∙∙
×
𝑖=1

91
UNIVERSIDAD NACIONAL DE CAJAMARCA

100,3333

𝑟 2,6667
1 2
𝐵= ∑ 𝑋∙𝑗∙
𝑘×
𝑖=1

_Lo mismo hacemos con la Interacción:

2 3 2
𝑋𝑖𝑗∙ 176,3333
𝐵 = ∑∑ + + 𝐵 =
𝑖=1 𝑗=1

_Para el error tenemos que la SSE es igual a:


+ 𝐵+ 𝐵 = 𝐸 70,5

Con los datos anteriores ya podemos completar la tabla ANOVA para su


respectivo análisis:

Fuente de Sumas de Grados de Medias Estadísticas


variabilidad cuadrados Libertad cuadráticas F

S. MAIZ 100,3333 2 50,1667 12,8085


FERTILIZANTE 2,6667 1 2,6667 0,6809
INTERACCION 176,3333 2 88,1667 22,5106
ERROR 70,5 18 3,9167
TOTAL 349,8333 23

Para realizar el contraste de hipótesis, para ello recurrimos a la tabla de


distribución F:

92
UNIVERSIDAD NACIONAL DE CAJAMARCA

Fcritico = F 𝑔𝑙𝑓𝑎𝑐𝑡𝑜𝑟 , 𝑔𝑙𝑒𝑟𝑟𝑜𝑟 , 𝛼


FS. Maíz 3.55
Ffertilizante 4.41
Finteracción 3.55

Ahora ya podemos realizar el contraste de hipótesis:

S. MAIZ Como: Fmaiz>Fcrítico, entonces: Rechazamos Ho


FERTILIZANTE Como: Ffertilizante<Fcrítico, entonces: Aceptamos Ho
INTERACCION Como: Fmaiz>Fcrítico, entonces: Rechazamos Ho

PARTE c):
Ya no sería necesario realizar un análisis de rango para la comprobación
del contraste de hipótesis, ya que tanto gráfica como analíticamente se ha
comprobado la validez de la hipótesis.

27. El grupo de mercados ¨P&C¨ quiere saber el efecto que la publicidad y la


promoción pueden ejercer sobre la venta de uno de sus productos de consumo
popular. Las ventas en miles de dólares durante un mes, de 16 mercados
escogidos al azar en un experimento diseñado en dos factores con cuatro
replicas se dan en la tabla que sigue:
publicidad
Promoción Con propaganda Sin propaganda
Con 110.5 105.4 80.5 78.6
descuento 90.7 95.8 60.8 65.8
Sin 50.4 45.8 35.8 40.1
descuento 40.6 44.9 20.7 25.7

a) Realice una gráfica de medidas y el análisis de interacción.


b) ¿es significativa la interacción observada?
c) Si no existe interacción entre promoción y publicidad, pruebe si
existe efecto de los factores en forma independiente. Si existe

93
UNIVERSIDAD NACIONAL DE CAJAMARCA

efecto alguno de los factores sobre las ventas, haga un análisis


de los mejores modos de venta.

Solución

a) Gráfico:

Gráfica de medidas
120

100

80

60

40

20

0
0 1 2 3 4 5 6

con propaganda sin propaganda

El grafico podemos observar que no existe una intersección entre las líneas por
lo tanto concluimos no hay indicios de interacción

b) De la siguiente tabla obtenemos los datos

94
UNIVERSIDAD NACIONAL DE CAJAMARCA

= 1 17 .4 9
= 1938. 01
𝐸 = 8080 3
𝐵 = 99 0.801
Interacción entre promoción y publicidad:

𝐻 : 𝛼, 𝛽 , =0
𝐻𝑎 : ∃ 𝛼, 𝛽 , ≠0

Efecto alguno de los factores sobre las ventas:

𝐹𝐴∗𝐵 = 3.047

Análisis de los mejores modos de venta.

𝐻 : 𝛼1 = 0
𝐹𝑎 = 8.777
𝐹𝑏 = 136.905

28. Con el fin de estudiar los efectos de tipo de carga y de las empresas que
las transportan sobre el tiempo de reparto terrestre de cargas, la distribuidora
¨DOCASA¨ diseño un modelo de análisis de varianza de dos vías con réplicas.
Cada una de las tres empresas terrestres: 𝐵1, , 𝐵2 𝑌 𝐵3 transporto una misma
distancia cada uno de los tipos de carga 1, = 𝐿𝑖𝑞𝑢𝑖𝑑𝑜 , 2 = 𝑜𝑙𝑖𝑑𝑜 ,
repitiéndose el experimento tres veces. Se registraron los siguientes tiempos
en minutos.
Tipo de carga
1 2
140 130
𝐵1 145 128
135 132
135 125
TRANSPORTE 𝐵2 136 126
134 124

95
UNIVERSIDAD NACIONAL DE CAJAMARCA

90 83
𝐵3 92 82
88 84

Asumiendo que los factores en estudio son de efectos fijos.


a) Realice una gráfica de medidas y el análisis descriptivo de la
interacción.
b) ¿Es significativa la interacción observada entre tipo de carga y de
transporte?
c) ¿son significativos los efectos de los tipos de carga? Si es así,
¿Cuál de los dos tipos de carga llega primero?
d) ¿son todos significativos los efectos de las empresas? Si fuera así
determine la empresa de transporte que utiliza el menor tiempo
promedio

SOLUCIÓN

a) Grafico:

Gráfica de medidas
160

140

120

100

80

60

40

20

0
0 1 2 3 4 5 6 7 8

tipo de carga A1 tipo de carga A2

El grafico podemos observar que no existe una intersección entre


las líneas por lo tanto concluimos no hay indicios de interacción

96
UNIVERSIDAD NACIONAL DE CAJAMARCA

b) De la siguiente tabla obtenemos los datos

= 8984.5
= 364.5
𝐸=7
𝐵=9

Interacción entre promoción y publicidad:

𝐻 : 𝛼, 𝛽 , = 0
𝐻𝑎 : ∃ 𝛼, 𝛽 , ≠ 0

Efecto alguno de los factores sobre las ventas:

𝐹𝐴∗𝐵 = 0.75

Análisis de los mejores modos de venta.

𝐻 : 𝛼1 = 0
𝐹𝑎 = 60.75
𝐹𝑏 = 711.58

97
UNIVERSIDAD NACIONAL DE CAJAMARCA

29. La empresa "BATERIAS" estudia el diseño de una batería que no sea


sensible a la temperatura ambiente .Para esto aprueba 3 materias distintas
A1, A2, A3, bajo tres niveles de temperatura ambiente B1=Baja, B2=Media,
B3=Alta, aplicando un diseño de experimento de clasificación de dos factores
con 6 réplicas .La duración de las baterías, en niveles de horas, se da en la tabla
adjunta:

MATERIALES USADO EN LAS BATERIAS


NIVELES DE T°
A1 A2 A3
1.1 0.9 1.2 1.3 1.1 0.9
B1 1.2 1.3 1.1 1.3 1.2 1.4
0.7 1 0.9 1.2 1.7 1.3
1.4 1.3 1.5 1.6 1.7 1.6
B2 1.5 1.2 1.4 1.3 1.2 1.5
1.3 1.4 1.3 1.5 1.7 1.4
0.9 1.2 1.1 0.9 0.7 1
B3 1.1 1 1.2 1.3 1.2 0.9
1.2 1.1 1 1.2 0.9 1.1

a) Defina la variable dependiente y el modelo de este diseño de experimento


b) Realice el análisis descriptivo de la interacción.
c) ¿Es significativa la interacción muestra observada entre los factores:
Materiales y Temperaturas
d) ¿Son significativos los efectos debido a los materiales utilizados en las
baterías?

SOLUCIÓN
a) Defina la variable dependiente y el modelo de este diseño de experimento
La variable dependiente es X=Diseño de una batería que no sea sensible a la
temperatura ambiente
El modelo del anova de dos factores con replicas es:

𝑋𝑖𝑗𝑘 = 𝑢 + 𝛼𝑖 + 𝛽𝑗 + 𝛼𝛽 𝑖𝑗 + ԑ𝑖𝑗𝑘

98
UNIVERSIDAD NACIONAL DE CAJAMARCA

Donde i=1,2,3 , j=1,2,3, k=1,2,3,4,5,6

c) Realice el análisis descriptivo de la interacción.

FACTOR FACTOR
A B TOTAL MEDIA DESV.ESTAND. N
B1 6.2 1.0333 0.21602469 6
A1 B2 8.1 1.35 0.104880885 6
B3 6.5 1.0833 0.116904519 6
TOTAL 20.8 3.4667 0.437810094 18
B1 7 1.1667 0.150554531 6
A2 B2 8.6 1.4333 0.121106014 6
B3 6.7 1.1167 0.147196014 6
TOTAL 22.3 3.7167 0.418856559 18
B1 7.6 1.2667 0.27325202 6
A3 B2 9.1 1.5167 0.194079022 6
B3 5.8 0.9667 0.175119007 6
TOTAL 22.5 3.75 0.642450049 18
B1 20.8 3.4667 0.639831241 6
TOTAL B2 25.8 4.3 0.420065921 6
B3 19 3.1667 0.439219541 6
TOTAL 65.6 10.933 1.499116703 18

 SCA=0.096

 SCB=1.379

 SCI=0.226

 SCE=1.367

 SCT=3.068

 G.L=2,2,4,45,53

99
UNIVERSIDAD NACIONAL DE CAJAMARCA

ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F
Materiales 1.379259259 2 0.68962963 22.70731707 1.52023E-07 3.204317292
Niveles de temperatura 0.095925926 2 0.047962963 1.579268293 0.21733653 3.204317292
Interacción 0.226296296 4 0.056574074 1.862804878 0.133552632 2.578739184
Dentro del grupo 1.366666667 45 0.03037037

Total 3.068148148 53

c) ¿Es significativa la interacción muestral observada entre los factores:


Materiales y Temperaturas
Interacción:
𝐻𝑜 𝛼𝛽 𝑖𝑗 = 0 ; 𝑖 = 1, ,3 𝑗 = 1, ,3
𝐻𝑖: 𝑒𝑥𝑖𝑠𝑡𝑒 𝛼𝛽 𝑖𝑗 ≠ 0 ; 𝑖 = 1, ,3 𝑗 = 1, ,3
𝐹𝐴∗𝐵 = 1.863 ; 𝐼𝐺𝑁𝐼𝐹𝐼 𝑁 𝐼 = 0.134
No hay interacción muestral entre los factores: Materiales y temperatura.
d) ¿Son significativos los efectos debido a los materiales utilizados en las
baterías?
MATERIALES (A):
𝐻𝑜: 𝛼 = 0 𝑜𝑙𝑢𝑚 𝑎𝑠 ; 𝐹𝐴 = 1.579
𝐼𝐺𝑁𝐼𝐹𝐼 𝑁 𝐼 = 0. 17
Se acepta Ho

30. Con el fin de estudiar los efectos de tipo de carga y los efectos que puedan
ocasionar las empresas que la transportan sobre el tiempo de reparto terrestre
de cargas se diseñó un modelo de análisis de varianza con los tipo de cargas
A1=Liquido ,A2= sólido y tres empresas de transporte terrestre B1,B2,B3,.Cada
empresa transporto una misma distancia cada tipo de carga repitiéndose el
experimento tres veces .Se registraron los tiempos en minutos y se procesaron
obteniendo las siguientes estadísticas:

100
UNIVERSIDAD NACIONAL DE CAJAMARCA

TIPO DE NÚMERO DE
CARGA TRANSPORTE DATOS MEDIAS
A1 B1 3 140
A1 B2 3 135
A1 B3 3 90
A2 B1 3 130
A2 B2 3 125
A2 B3 3 83

DESVIACIÓN ESTANDAR DE LA VARIABLE DEPENDIENTE= 22.9891279

a) Defina el modelo estadístico de este problema de ANOVA


b) ¿Existe interacción significativa entre los factores considerados? ¿Qué puede
decir de los efectos de tipos de carga y de las empresas de transporte?

SOLUCIÓN
a) Defina el modelo estadístico de este problema de ANOVA

TABLA ANOVA

F. DE SUMAS MEDIAS ESTADISTICA


VARIABILIDAD .CUADRADOS G.L CUADRATICAS F
TIPO DE CARGA 364.5 1 364.5 60.75
TRANSPORTE 8539 2 4269.5 711.5833333
INTERACCION 9 2 4.5 0.75
ERROR 72 12 6
TOTAL 8984.5 17

SCA= 364.5 MCA= 364.5


SCB= 8539 MCB= 4269.5
SCAB= 9 MCAB= 4.5
SCE= 72 MCE= 6

101
UNIVERSIDAD NACIONAL DE CAJAMARCA

b) ¿Existe interacción significativa entre los factores considerados? ¿Qué puede


decir de los efectos de tipos de carga y de las empresas de transporte?
HIPOTESIS
Se contrasta la hipótesis nula

𝐻𝑜: 𝛼𝛽 𝑖𝑗 = 0 No existe interacción; para i=1,2; j=1, 2,3


𝐻𝑜: 𝛼𝛽 𝑖𝑗 ≠ 0 Para algún i≠ j (si existe interacción)

Estadística y región critica:


F=MCAB/MCE= 0.75
RC= {F (2,12)>3.89}

DECISIÓN:
Dado que 𝐹𝐴∗𝐵 =0.75<3.89 no deberíamos rechazar Ho al nivel de significación
α=0.05.Esto es la interacción observada no es significativa.
Por tanto no existe interacción entre los factores CARGAS y EMPRESAS DE
TRANSPORTE TERRESTRE.

31. para producir una prenda la firma de confecciones “JEANS” disponible de 4


máquinas de marcas distintas (Ai) que se supone producen con igual velocidad,
y de 3 fuentes distintas de materia prima (Bi) que se supone de igual calidad.
Para determinar si el porcentaje de producción defectuosa es la misma para las
máquinas y para las materias primas, se realizó un experimento que consistió en
operar cada marca de maquina con cada tipo de material durante 2 días
resultando. Los porcentajes de unidades defectuosas producidas se dan en la
tabla adjunta.

a. Defina la variable dependiente y el modelo de este diseño de experimento.


b. ¿Existe efecto de interacción significativamente entre máquinas y
materias primas?
c. ¿Cuál de estas materias primas es óptima?
Aplique nivel de significancia= 0.05

102
UNIVERSIDAD NACIONAL DE CAJAMARCA

SOLUCIÓN

a. La variable respuesta o dependiente es X= Rendimiento de los


empleados.
Los factores que posiblemente influyen en el rendimiento son:
A: capacitación del personal: A1= Buena, A2= Regular, A3= Ninguna
B: turno de trabajo: B1= Mañana, B2=Tarde, B3= Noche
El modelo del ANOVA de dos factores con replica es:

Xijk = µ + ai + bj + (ab)y + Eijk

Donde i=1, 2,3, j=1, 2,3, k=1, 2, 3, 4

Estadísticas descriptivas:

Análisis de varianza de dos factores con varias muestras por grupo

Análisis de varianza de dos factores con varias muestras por grupo

RESUMEN A2 A3 A4 Total
6
Cuenta 6.00 6.00 6.00 18.00
Suma 19.00 20.00 18.00 57.00
Promedio 3.17 3.33 3.00 3.17
Varianza 0.57 2.67 0.80 1.21

Total
Cuenta 6.00 6.00 6.00
Suma 19.00 20.00 18.00
Promedio 3.17 3.33 3.00
Varianza 0.57 2.67 0.80

103
UNIVERSIDAD NACIONAL DE CAJAMARCA

ANÁLISIS DE VARIANZA
O.Variaciones S.Cuadrados GL P.cuadrados F Probabilidad V. crítico F
Muestra 0.0 3 65535.0 65535.0 0.1
Columnas 0.3 2 0.2 0.1 0.9 3.7
Interacción 0.0 6 65535.0 65535.0 0.2
Dent. del grupo 20.2 15 1.3

Total 20.5 17

GRAFICO DE PROMEDIOS
20
18
16
14
12
10
8
6
4
2
0
1 2 3 4 5 6

Series1 Series2 Series3 Series4

104
UNIVERSIDAD NACIONAL DE CAJAMARCA

Como se aprecia en los resultados no hay interacción

105
UNIVERSIDAD NACIONAL DE CAJAMARCA

32. El analista estadístico del grupo “Estudios de mercado” quiere


comprobar si la región geográfica y/o los ingresos familiares influyen en las
puntuaciones obtenidas en una prueba de rozamiento. Para esto, diseño un
experimento de dos factores con réplicas eligiendo al azar de cada una de 4
regiones, 6 jefes de familias con ingresos bajos, 6 con ingresos medios y 6 con
ingresos altos. Los puntajes obtenidos en la prueba de rozamiento por las 72
personas se dan en la tabla que sigue:
Región Ingresos
gráfica Alto Medio Bajo
Norte 10 15 16 17 14 12
16 14 18 15 13 11
14 12 16 12 09 12
Sur 13 12 15 18 13 10
17 16 17 16 15 11
15 11 15 13 12 09
Centro 14 16 17 17 11 12
14 10 19 11 15 08
17 13 17 18 16 13
Oriente 15 14 18 12 12 13
14 13 17 20 15 8
16 11 16 15 14 11

a) Analice, descriptivamente, si existe o no, indicios de interacción entre


ingresos y regiones.
b) Defina la variable dependiente y el modelo de este diseño de experimento.
c) Pruebe si es o no significativa la interacción muestral entre los factores
región e ingresos.
d) Si rechaza la hipótesis que afirma la existencia de interacción entre los
factores región e ingresos, ¿produce algún efecto en la variabilidad de la
prueba de razonamiento los niveles de ingreso familiares?, ¿y los niveles
de la región? Si su respuesta es afirmativa, ¿Cuál de los niveles produce
el mismo efecto?
Tome las decisiones estadísticas con probabilidad de error tipo I igual a
0.05 en todos los casos.

106
UNIVERSIDAD NACIONAL DE CAJAMARCA

SOLUCIÓN
Análisis de varianza de dos factores con varias muestras por grupo:
Alto Medio Bajo
RESUMEN Total
Norte

Cuenta 3.000 3.000 3.000 3.000 3.000 3.000 18.000


Suma 40.000 41.000 50.000 44.000 36.000 35.000 246.000
Promedio 13.333 13.667 16.667 14.667 12.000 11.667 13.667
Varianza 9.333 2.333 1.333 6.333 7.000 0.333 6.118

Sur

Cuenta 3.000 3.000 3.000 3.000 3.000 3.000 18.000

Suma 45.000 39.000 47.000 47.000 40.000 30.000 248.000

Promedio 15.000 13.000 15.667 15.667 13.333 10.000 13.778

Varianza 4.000 7.000 1.333 6.333 2.333 1.000 6.771

Centro

Cuenta 3.000 3.000 3.000 3.000 3.000 3.000 18.000


Suma 45.000 39.000 53.000 46.000 42.000 33.000 258.000
Promedio 15.000 13.000 17.667 15.333 14.000 11.000 14.333
Varianza 3.000 9.000 1.333 14.333 7.000 7.000 9.412

Oriente

Cuenta 3.000 3.000 3.000 3.000 3.000 3.000 18.000


Suma 45.000 38.000 51.000 47.000 41.000 32.000 254.000
Promedio 15.000 12.667 17.000 15.667 13.667 10.667 14.111
Varianza 1.000 2.333 1.000 16.333 2.333 6.333 7.987

107
UNIVERSIDAD NACIONAL DE CAJAMARCA

Total
Cuenta 12.000 12.000 12.000 12.000 12.000 12.000
Suma 175.000 157.000 201.000 184.000 159.000 130.000
Promedio 14.583 13.083 16.750 15.333 13.250 10.833
Varianza 3.720 3.902 1.477 8.061 4.023 3.061

ANÁLISIS DE VARIANZA

Grados Promedio Valor


Origen de las Suma de
de de los F Probabilidad crítico
variaciones cuadrados
libertad cuadrados para F
Muestra 5.056 3.000 1.685 0.338 0.798 2.798
Columnas 253.278 5.000 50.656 10.159 0.000 2.409
Interacción 22.278 15.000 1.485 0.298 0.993 1.880
Dentro del
grupo 239.333 48.000 4.986

Total 519.944 71.000

Del cuadro:

TENEMOS
SCA= 239.333
SCB= 5.056
SCI= 22.278
SCE= 253.278
SCT= 519.944

108
UNIVERSIDAD NACIONAL DE CAJAMARCA

Los grados de libertad son: 3, 5, 15, 48,71.


c) La prueba de hipótesis nula: 𝐻 :  𝑖𝑗 = 0, donde i=1, 2, 3,4: contra la prueba
de hipótesis nula: 𝐻𝑎 : ∋  𝑖𝑗 ≠ 0, según la tabla logramos 𝐹𝐴∗𝐵 =0.58, con
significancia =0.999,
d) Los ingresos (A) con la prueba de hipótesis: 𝐻 : 𝑎1 = 0, tenemos que el Excel
nos ha arrojado 𝐹𝐴 = 18.045677, con significancia =0.0000, y según Duncan
tenemos 𝑢3 < 𝑢1 < 𝑢2 . En la región (B), 𝐻 : 𝑏𝑗 = 0, 𝐹𝐴 = 0.316 y significancia de
0.814.

Graficas:

109
UNIVERSIDAD NACIONAL DE CAJAMARCA

33. La industria P&C que utiliza para su producción tres máquinas de marcas
distintas 1, 2 y 3 y dos fuentes de materia prima A y B quiere saber si el
número de unidades defectuosas resultantes es la misma para las tres
máquinas y para las dos materias primas. P ara esto, el ingeniero a cargo
del control llevo a cabo un experimento de la producción observando el
número de unidades defectuosas, con cada una de las máquinas y con
cada tipo de materia prima durante dos días y entre los resultados
presentó el siguiente resumen descriptivo.

Materia Máquinas Número De Datos Media de unidades


Prima defectuosas
A 1 4 9.1
A 2 4 11.3
A 3 4 7.4
B 1 4 7.1
B 2 4 9.0
B 3 4 5.9

110
UNIVERSIDAD NACIONAL DE CAJAMARCA

Desviación estándar de la variable dependiente= 1.8075

Tabla ANOVA
Fuente De Suma De Grados De Medias Estadística
Variabilidad Cuadrados Libertad Cuadráticas F
Materia prima 22.427
Maquinas 49.480
Interacción
Error 2.580
total

a. Defina el modelo estadístico de este problema de ANOVA. Haga un


gráfico de líneas de los factores máquina y materia prima e indique si,
en forma descriptiva, se podría suponer o no interacción entre los dos
factores considerados.
b. ¿Es significativa la interacción entre los dos factores considerados?
¿Qué puede decir de los efectos de las materias primas y las máquinas
en la producción defectuosa? Use el nivel de significación a=0.05
c. ¿Qué maquina produce menos unidades defectuosas? Con
probabilidad de error tipo I, igual a 0.05

SOLUCIÓN

 Es un modelo de clasificación doble con replica

Fuente De Suma De Grados De Medias Estadística


Variabilidad Cuadrados Libertad Cuadráticas F
Materia prima 22.427 1 22.43 156.47
Maquinas 49.48 2 24.74 172.60
Interacción 0.653 2 0.3265 2.28
Error 2.58 18 0.14
total 75.14 23 47.64

111
UNIVERSIDAD NACIONAL DE CAJAMARCA

Se aprecia en el gráfico y los resultados que no hay interacción

HIPÓTESIS
Se contrasta la hipótesis nula
HO: (ab) y =0 (no existe interacción), para i=1, 2,3, j=1, 2,3
Contra:
H1: (ab) y ≠0 para algún i≠j (si existe interacción)
ESTADÍSTICA Y REGIÓN CRÍTICA

F=MCAB/MCE ~ F (2.28); RC= {(F0.95 (2.28) < 3.76}

DECISIÓN:

Dado que FA*B=3.6<3.76, no rechazamos la hipótesis nula al nivel de


significación del 0.05 entonces se dice que no hay interacción.

112
UNIVERSIDAD NACIONAL DE CAJAMARCA

Análisis De Varianza De Dos Factores Con Varias Muestras Por


Grupo

Tabla N°2

RESUMEN 1 2 3 Total
A
Cuenta 4 4 4 12
Suma 36.4 45.2 29.6 111.2
Promedio 9.1 11.3 7.4 9.27
Varianza 0.54 2.22 0.82 3.76

B
Cuenta 4 4 4 12
Suma 28.4 36 23.6 88
Promedio 7.1 9 5.9 7.33
Varianza 0.98 0.69 1.85 2.74

Total
Cuenta 8 8 8
Suma 64.8 81.2 53.2
Promedio 8.1 10.15 6.65
Varianza 1.79 2.76 1.79

ANÁLISIS DE VARIANZA
O.de las S.
variaciones Cuadrados Gl Cuadrados F Probabilidad Valor F
Muestra 22.43 1.00 22.43 18.95 0.00 4.41
Columnas 49.5 2.0 24.7 20.9 0.0 3.6
Interacción 0.7 2.0 0.3 0.3 0.8 3.6
Dentro del grupo 21.3 18.00 1.18

Total 93.86 23

113
UNIVERSIDAD NACIONAL DE CAJAMARCA

De la tabla N° 2 se obtiene que:


µ3< µ1< µ2
Entonces la máquina que produce menos defectos es la maquina
número 3.

34. La empresa R&G realiza una investigación para determinar si el


rendimiento de sus empleados está influenciado por el nivel capacitación
y el turno de trabajo. Para realizar este estudio, se diseñó un experimento
de dos factores: el factor A: capacitación del personal con tres niveles,
A1= Buena, A2= Regular, A3= Ninguna, y el factor B: turno de trabajo con
tres niveles, B1= Mañana, B2=Tarde, B3= Noche. En cada combinación
de los niveles de capacitación y de turno, se midieron el rendimiento de
cuatro trabajadores. En la medición de los rendimientos se utilizó un
procedimiento cuyos resultados son tiempos en minutos, indicando que a
menor tiempo mayor rendimiento. Los tiempos de rendimiento observados
se dan en la tabla:

A=Capacitación
B=Turnos
A1 A2 A3
4 5 8 6 6 7
B1
5 6 5 6 7 6
6 7 7 5 8 7
B2
4 6 6 8 7 6
6 5 6 7 8 6
B3
5 6 6 6 7 7

a. Realice una gráfica de líneas de las medias muéstrales, ¿indica la


gráfica presencia de interacción los dos factores considerados?
b. Al nivel de significancia de 0.05, ¿existe interacción entre el factor de
capacitación y el factor turno de trabajo?

114
UNIVERSIDAD NACIONAL DE CAJAMARCA

SOLUCIÓN

b. La variable respuesta o dependiente es X= Rendimiento de los


empleados.
Los factores que posiblemente influyen en el rendimiento son:
A: capacitación del personal: A1= Buena, A2= Regular, A3= Ninguna
B: turno de trabajo: B1= Mañana, B2=Tarde, B3= Noche
El modelo del ANOVA de dos factores con replica es:

Xijk = µ + ai + bj + (ab) y + Eijk

Donde i=1, 2,3, j=1, 2,3, k=1, 2, 3, 4

Estadísticas descriptivas:

Análisis de varianza de dos factores con varias muestras por grupo


RESUMEN A1 A2 A3 Total
B1
Cuenta 2.00 2.00 2.00 2.00 2.00 2.00 12.00
Suma 9.00 11.00 13.00 12.00 13.00 13.00 71.00
Promedio 4.50 5.50 6.50 6.00 6.50 6.50 5.92
Varianza 0.50 0.50 4.50 0.00 0.50 0.50 1.17

B2
Cuenta 2.00 2.00 2.00 2.00 2.00 2.00 12.00
Suma 10.00 13.00 13.00 13.00 15.00 13.00 77.00
Promedio 5.00 6.50 6.50 6.50 7.50 6.50 6.42
Varianza 2.00 0.50 0.50 4.50 0.50 0.50 1.36

B3
Cuenta 2 2 2 2 2 2 12
Suma 11 11 12 13 15 13 75
Promedio 5.5 5.5 6 6.5 7.5 6.5 6.25
Varianza 0.5 0.5 0 0.5 0.5 0.5 0.75

Total
Cuenta 6.00 6.00 6.00 6.00 6.00 6.00
Suma 30.00 35.00 38.00 38.00 43.00 39.00
Promedio 5.00 5.83 6.33 6.33 7.17 6.50
Varianza 0.80 0.57 1.07 1.07 0.57 0.30

115
UNIVERSIDAD NACIONAL DE CAJAMARCA

ANALISIS DESCRIPTIVO DE LA INTERACCÍON


25

20

15

10

0
1 2 3

Series1 Series2 Series3

Indica que el rendimiento de los que no reciben capacitación es más bajo


de los que reciben una regular capacitación.

116

También podría gustarte