Está en la página 1de 8

Práctica 5.

Análisis de la Varianza (ANOVA)

El análisis de la varianza (ANOVA) es una potente herramienta estadística, de gran utilidad tanto en la
industria, para el control de procesos, como en el laboratorio de análisis, para el control de métodos
analíticos. Los ejemplos de aplicación son múltiples, pudiéndose agrupar, según el objetivo que
persiguen, en dos principalmente: la comparación de múltiples columnas de datos y la estimación de
los componentes de variación de un proceso.

ANOVA - A un criterio de clasificación

Ejercicios propuestos para clases teórico-prácticas

1) Demostrar que SCT = SCE + SCD


2) La FED está efectuando un estudio sobre el rendimiento de los bonos del tesoro de EEUU. Para ello
cuenta con los datos de cuatro entidades financieras representativas del año 2010, donde las
condiciones económicas fueron estables, que se detallan a continuación.

Año 2010 A B C D
Bimestre 1 3,10 % 2,90 % 3,20 % 3,00 %
Bimestre 2 3,50 % 3,00 % 3,00 % 3,10 %
Bimestre 3 3,00 % 2,80 % 3,15 % 3,00 %
Bimestre 4 2,90 % 2,80 % 3,18 % 2,90 %
Bimestre 5 2,85 % 2,90 % 3,05 % 3,00 %
Bimestre 6 2,95 % 3,00 % 3,02 % 3,15 %

Con un nivel de significación del 5%, ¿puede afirmarse que el rendimiento de los bonos del tesoro de las
cuatro entidades son semejantes?

Ejercicios propuestos para resolución del alumno

3) El departamento de selección de una compañía está modificando sus métodos de reclutamiento a


fin de mejorar el rendimiento promedio del personal. Para ello pone a prueba los métodos A, B y C
en la selección para las incorporaciones del último año y constata la calificación de su evaluación de
desempeño. La información se detalla a continuación:

Método A Método B Método C


73 54 79
83 74 95
76 71 87
68
80

¿Puede afirmarse que los tres métodos son igualmente efectivos en el proceso de selección? Utilice un
nivel de significación del 5%.
4) Un estudio sobre el nivel de ahorro en la provincia de Buenos Aires durante la década del 80 indicaba
que el ahorro promedio per cápita era uniforme en todo su territorio. A partir del año 90 se
implementaron cambios estructurales en su economía y se recopilan los siguientes datos:

Tamaño de la población Tamaño de la muestra Ahorro promedio en $ Desvío estándar en $


Menos de 20.000 hab. 13 439 70
Entre 20.000 y 100.000 hab. 31 488 64
Más de 100.000 hab. 100 642 90

A partir de esta información, ¿qué efecto tuvieron las nuevas políticas económicas sobre el nivel de
ahorro promedio per cápita?

5) Un inversor está interesado en colocar su dinero en algún fondo común de inversión. Para ello, toma
en cuenta los ofrecidos por cuatro entidades financieras distintas, y los rendimientos de cada uno
de ellos durante cuatro meses.

Banco 1 Banco 2 Banco 3 Banco 4


12 % 14 % 21 % 14 %
15 % 17 % 19 % 21 %
18 % 12 % 20 % 25 %
10 % 19 % 23 % 20 %

Con un nivel de significación del 5%, ¿existe alguna diferencia entre los rendimientos promedio de cada
uno de los fondos?

6) Una operación de llenado de tiene tres máquinas idénticas que se ajustan para vaciar una cantidad
específica de un producto de recipientes de igual tamaño. Con el propósito de verificar la igualdad
de las cantidades promedio vaciadas por cada una de las máquinas se tomaron muestras, en forma
periódica, de cada una. La información recopilada se presenta a continuación:

4
2
Máquina 1 𝑛1 = 4 4𝑠12 = ∑(𝑥𝑖𝑗 − 15) = 2
𝑗=1

6
2
Máquina 2 𝑛2 = 6 6𝑠22 = ∑(𝑥𝑖𝑗 − 19) = 2
𝑗=1

5
2
Máquina 3 𝑛3 = 5 5𝑠32 = ∑(𝑥𝑖𝑗 − 19,2) = 2,8
𝑗=1

Construir la tabla ANOVA y decidir si existen algunas diferencias estadísticamente significativas en las
cantidades promedio vaciadas por las tres máquinas explicando el resultado obtenido en términos de
varianza entre los grupos y dentro de los grupos. Empléese un nivel de significación del 5%.

7) El gerente de marketing de una compañía de teléfonos celulares presentó en una reunión


departamental modificaciones para las cuatro variedades de teléfonos que comercializa la firma, a
fin de lograr un incremento de ventas. El gerente financiero se opone a los cambios, fundamentando
que a pesar que se traten de diferenciar las cuatro líneas de productos los ingresos promedios que
generan no difieren entre sí y que las modificaciones propuestas solo bajarían la ganancia neta. En
base a la facturación de los últimos cinco meses elaboró la siguiente tabla parcial de ANOVA.
Suma de cuadrados Grados de libertad Cuadrado medio
SCE
SCD 14.713,69
SCT 310.500,76

Completar la tabla, expresar las hipótesis pertinentes y decidir si el gerente financiero tiene razón a un
nivel de significación del 5%.

8) En un curso de Estadística de una universidad, se desea saber si el nivel de conocimientos que


adquieren sus estudiantes depende del curso en el cual se hallan inscriptos. Para ello se
seleccionaron al azar seis estudiantes de cada uno de los cursos y se los somete a una evaluación a
fin de comprobar si sus rendimientos medios, medidos a través de calificaciones obtenidas,
difieren entre los cursos. Las calificaciones se resumen en el siguiente cuadro:

6
𝑥̅𝑖 ∑ 𝑥𝑖𝑗2
𝑗=1

Curso I 61 22.554
Curso II 60 21.986
Curso III 65 25.444

Construya la tabla de ANOVA y decida si existen diferencias en los rendimientos medios de los
estudiantes de los tres cursos a un nivel de 5%.

9) Un estudio compara los efectos sobre las ventas de 4 promociones de un mes en el punto de venta.
Se presentan las ventas unitarias de 5 tiendas que utilizaron las 4 promociones en meses distintos:

Muestras gratis 78 87 81 89 85
Regalo de un paquete 94 91 87 90 88
Descuento 73 78 69 83 76
Reembolso por correo 79 83 78 69 81

a. Calcule las ventas unitarias medias para cada promoción y luego determina la gran media.
b. Realice el análisis de la varianza para responder a lo siguiente: ¿Las promociones
producen efectos sobre las ventas?
c. Plantee las hipótesis correspondientes. Trabaje al nivel de significancia del 0.05.

10) A continuación se detallan las cifras de consumo de tres muestras aleatorias


independientes de tres tipos de automóviles.

Automóvil A 22.2 19.9 20.3 21.4 21.2 21


Automóvil B 24.6 23.1 22 23.5 23.6 22.1
Automóvil C 22.7 21.9 23.2 24.1 22.1 23.4

a. Elabore la tabla de análisis de la varianza.


b. Contraste la hipótesis nula de que las medias de consumo son iguales.

11) Una fábrica de café ha registrado datos de ventas mensuales de sus tres tipos de producto en
diferentes localidades elegidas al azar en la provincia de Buenos Aires, con los siguientes totales por
combinación, para 6 meses:

Tipo I Tipo II Tipo III


300 426 380
358 349 420
332 394 370
¿Puede asegurarse que hay diferencias de ventas entre los tres tipos de café? Realice el análisis de la
varianza para un factor trabajando con un nivel de significación del 5%.

12) Tres proveedores suministran artículos en envíos de 500 unidades. Se han comprobado
minuciosamente muestras aleatorias de seis envíos de cada uno de los tres proveedores y se
anotó el número de artículos que no se ajustan a las normas de calidad, dicho número se presente
en la siguiente tabla:

Proveedor 1 Proveedor 2 Proveedor 3


28 22 33
37 27 29
34 29 39
29 20 33
31 18 37
33 30 38

a. Elabore la tabla de análisis de la varianza para estos datos.


b. Plantee las hipótesis correspondientes y tome la decisión estadística de acuerdo a lo realizado.

13) En la preparación de una sustancia se utilizan cuatro modificaciones de un procedimiento estándar.


Los datos contenidos en la siguiente tabla se corresponden a la preparación de la sustancia mediante
cinco procedimientos de fabricación, donde la primera columna se corresponde con el
procedimiento estándar.

Métodos
1 2 3 4 5
63 27 10 28 47
48 41 30 45 28
57 23 24 44 30
54 31 37 31 35
41 2 40 29 21
43 33 24 44 37

a. Elabore la tabla de análisis de la varianza para estos datos. Plantee las hipótesis correspondientes
a fin de determinar si existen diferencias entre los distintos métodos de preparación.

14) Cuatro atletas de triple salto saltan las siguientes distancias, en metros, en diferentes reuniones de
atletismo. ¿Puede suponerse que los cuatro saltan la misma distancia? Realice el análisis de la varianza
utilizando un nivel de significación de 0,05.

1 8,25 6,97 7,65 7,86


2 7,31 8,26 6,5 9,42 10,4
Atletas
3 7 7,25 8
4 6,69 7,32
15) El departamento de RRHH de una empresa busca aumentar la productividad de sus trabajadores
mediante la utilización de 3 métodos de incentivación diferentes (aumento de salario, horas flexibles
o cupones de descuentos). Para ver si los 3 métodos son igualmente de eficaces se toman al azar 3
empleados por método para comprobar los resultados de cada uno. Además, para verificar los
resultados me dan la siguiente tabla:

Fuente variación Suma de Grados de Cuadrado medio Estadístico


cuadrados libertad
SCE 587267,04
SCD 18376,16
SCT 697524

a. Complete el cuadro.
b. Determine si todos los métodos son igualmente eficaces para aumentar la productividad.

16) El Ministerio de Desarrollo Social desea saber si un plan de integración y ayuda económica en lugares
donde el acceso a la educación es mínimo o nulo es efectivo en la reducción del número de deserción
escolar entre los chicos de 10 a 15 años. Para ello hace un seguimiento en 5 localidades, realizando
una encuesta para determinar la cantidad de chicos que desertaron antes de la implementación del
plan y otra encuesta luego de la misma. Los resultados arrojados fueron los siguientes:

Localidad 1 Localidad 2 Localidad 3 Localidad 4 Localidad 5


Antes 55 63 90 47 75
Después 52 60 85 49 65

Analice los datos y obtenga conclusiones a un nivel de significación del 5%.

17) El gerente de producción de la empresa Perfect Parachute


Company lo contrata a usted para que lo asesore en términos
estadísticos. En la fábrica se tejen los paracaídas usando una
fibra sintética que se compra a cuatro proveedores diferentes.
Por razones obvias, una de las características de calidad más
importantes de un paracaídas es su resistencia. El gerente
necesita decidir si con las fibras sintéticas de sus proveedores
se fabrican paracaídas con igual resistencia. Para responder a
esta pregunta, usted decide diseñar un experimento para
probar la resistencia de los paracaídas tejidos con las fibras
sintéticas de cada uno de los cuatro proveedores.
Posteriormente, usted le indicará que necesita incorporar información a partir del análisis de los datos
experimentales para determinar a cuál proveedor contratar para fabricar los paracaídas más
resistentes.
Se realizó un experimento para determinar si existen diferencias significativas en la resistencia de los
paracaídas fabricados con fibras sintéticas provenientes de diferentes proveedores. Se tejieron cinco
paracaídas por cada grupo: proveedor 1, proveedor 2, proveedor 3 y proveedor 4. Se mide la resistencia
de los paracaídas colocándoles en un dispositivo de prueba que tira de ambos extremos del paracaídas
hasta que se desgarra. La cantidad de fuerza necesaria para desgarrar el paracaídas se mide en una escala
de resistencia de tensión en la que cuando más grande es el valor, más resistente será el paracaídas. Los
resultados de este experimento (en términos de resistencia a la tensión) se muestran en la siguiente tabla
junto con la media muestral y la desviación estándar por cada proveedor. Plantee las hipótesis
correspondientes a la situación del problema, realice la tabla de ANOVA y explique la decisión:
Grupos Cuenta Suma Promedio Desviación estándar
Proveedor 1 5 97,6 19,52 2,69
Proveedor 2 5 121,3 24,26 1,92
Proveedor 3 5 114,2 22,84 2,13
Proveedor 4 5 105,8 21,16 2,98
ANOVA - A dos criterios de clasificación

Ejercicios propuestos para clases teórico-prácticas

18) Se quiere probar las tres formas de exhibir un nuevo producto en los puntos de venta. Se presentan
a continuación los datos sobre los volúmenes de venta para tres formas de exhibición
correspondientes a cada uno de tres puntos de venta diferentes. Se utilizó el diseño de bloques
aleatorizados. Realice el análisis de la varianza trabajando con un nivel de significación de 0.05.

Puntos de
venta

Formas de exhibición del producto 1 2 3 Promedio


A 86 97 96 93
B 55 82 79 72
C 60 88 77 75
Promedio 67 89 84 80

19) La tabla a continuación muestra las producciones por hectárea de cuatro semillas sembradas en
campos tratados con tres fertilizantes distintos. Determinar al nivel de significación 0.05 si hay
diferencias en producción por hectárea debida (A) a los fertilizantes y (B) debida a las semillas.

Semilla I Semilla II Semilla III Semilla IV

Fertilizante A 4,5 6,4 7,2 6,7

Fertilizante B 8,8 7,8 9,6 7

Fertilizante C 5,9 6,8 5,7 5,2

Ejercicios propuestos para resolución del alumno

20) Una fábrica de café ha registrado datos de ventas mensuales de sus tres tipos de producto en tres
localidades elegidas al azar en la provincia de Buenos Aires, con los siguientes totales por
combinación, para 6 meses:

Tipo I Tipo II Tipo III


Localidad 1 300 426 380
Localidad 2 358 349 420
Localidad 3 332 394 370

¿Puede asegurarse que las diferencias de ventas entre los tres tipos de café dependen de las
localidades? Realice el análisis de la varianza para dos factores trabajando con un nivel de significación
del 5%.
21) Están en consideración cuatro máquinas diferentes, M1, M2, M3 y M4, para ensamblar un producto
específico. Se decidió que para comparar las maquinas deben utilizarse 6 operadores distintos en
un experimento por bloques completamente aleatorizados. Las máquinas se asignan al azar a
cada operador. La operación de las máquinas requiere destreza física, y se anticipa que habrá
una diferencia en la velocidad con que los operadores trabajan con las máquinas. Se registró la
cantidad de tiempo (en segundos que tomó ensamblar el producto.
Pruebe la hipótesis nula de que con un nivel de significación de 0,05, las máquinas se desempeñan
con la misma velocidad media.

Operador
Máquina 1 2 3 4 5 6
1 42,5 39,3 39,6 39,9 42,9 43,6
2 39,8 40,1 40,5 42,3 42,5 43,1
3 40,2 40,5 41,3 43,4 44,9 45,1
4 41,3 42,2 43,5 44,2 45,9 42,3

22) Se hizo un estudio para comparar el rendimiento del combustible para 3 marcas competidoras. Se
seleccionaron al azar 4 modelos diferentes de automóvil de tamaño variable. A continuación se
presentan los datos, en km por litro de combustible. El orden de prueba es aleatorio para cada
modelo.

Marca de combustible
Modelo Y S E
A 32,4 35,6 38,7
B 28,8 28,6 29,9
C 36,5 37,6 39,1
D 34,4 36,2 37,9

Realice el análisis de la varianza para dos factores y determine si es importante la marca de


combustible. Trabaje al 0,05 de significación.

23) Los datos presentados a continuación corresponden al análisis de observaciones de diferencias en


tiempo medio de CPU para ejecutar programas de comparación en dos computadoras.

Programa de comparación
Computadoras 1 2 3 4 5 6
1 1,12 1,73 1,04 1,86 1,47 2,10
2 1,15 1,72 1,10 1,87 1,46 2,15

a) Trate los seis programas como bloques y pruebe para una diferencia entre los tiempos CPU para las
dos usando un análisis de bloques aleatorizados. Use un nivel de significación de 0,05.
b) Plantee las hipótesis adecuadas y tome la decisión.

24) A partir de la siguiente información, se desea conocer si las variaciones en el sueldo


promedio del gerente de Recursos Humanos se deben al tipo de empresa o se deben a la
región o a ambas cuestiones. Realice el análisis de la varianza a dos criterios de clasificación
utilizando una significación de 0,05. Considere a las empresas como tratamientos.
Sueldo promedio del gerente de Recursos Humanos.
Cifras en miles de $. Ingreso bruto mensual sin considerar el SAC.
Región
Empresa
Buenos Aires / CABA Cuyo Centro Patagonia NOA / NEA
Pequeña 29 23 23 39 23
Mediana 37 31 32 49 31
Grande 54 43 45 72 44
Fuente: Guía Salarial Regional 2014, ADECCO.

25) Prueba de estrés para controladores de tráfico aéreo. En un estudio para


medir la fatiga y el estrés de los controladores de tráfico aéreo, se propusieron
modificaciones y rediseños a su estación de trabajo. Después de evaluar
diversos diseños, se seleccionaron tres alternativas consideradas con el mayor
potencial para reducir el estrés en los controladores. Se instalaron tres
alternativas de estación de trabajo (Sistema), que es el factor de interés en
este estudio. Se seleccionó en forma aleatoria a seis controladores y se le asignó a cada individuo uno
de los sistemas para que lo operara. Después de aplicar una entrevista y un examen médico a cada
uno de los participantes en el estudio, se obtuvieron las mediciones de estrés de cada controlador en
cada uno de los sistemas. La información se resume en la siguiente tabla:

Controlador Controlador Media


Controlador 1 Controlador 2 Controlador 5 Controlador 6
3 4
Sistema A 15 14 10 13 16 13 13,5
Sistema B 15 14 11 12 13 13 13
Sistema C 18 14 15 17 16 13 15,5
Media 16 14 12 14 15 13

Se desea estudiar: ¿En qué medida difieren estas tres alternativas en su efecto sobre el estrés de los
sujetos de estudio?
a) Plantee las hipótesis correspondientes a la situación del problema.
b) Complete la tabla de ANOVA. Responda: ¿Los resultados muestrales justifican la conclusión de
que difieren las medias poblacionales de los niveles de estrés con estos tres sistemas?

También podría gustarte