Está en la página 1de 51

EXPERIMENTOS

GENERALES DE UN
SOLO FACTOR
UNIDAD 4
ANÁLISIS DE VARIANZA DE UNA VÍA
(ANOVA)
Está diseñada específicamente para probar si dos o más poblaciones tienen la misma media.
El análisis de la varianza de un criterio (ANOVA) es una metodología para analizar la variación
entre muestras y la variación al interior de las mismas mediante la determinación de varianzas.
◦ Unidades experimentales: son los objetos que reciben el tratamiento.
◦ Factor: es la variable cuyo impacto en tales unidades experimentales se desea medir.
◦ Tratamiento: es una combinación específica de niveles de factor.

La forma de seleccionar los tratamientos es a través de un modelo de efectos fijos o uno de


modelo de efectos aleatorios.
Los supuestos en que se basa la prueba es para muestras independientes, es decir se asume que
todas las poblaciones son normales y las varianzas poblacionales son iguales.
Ejemplo 1:
Roberto Marroquín es vicepresidente de mercadeo en Banco G&T. Los
recientes esfuerzos promocionales para atraer nuevos depositantes incluyen
algunos juegos y premios en cuatro sucursales del banco. Roberto está
convencido de que diferentes tipos de premios atraerían a diferentes grupos
de ingreso. Las personas de un nivel de ingreso prefieren los regalos, mientras
que los de otro grupo de ingreso pueden sentirse más atraídos por viajes
gratuitos a sitios favoritos para pasar vacaciones. El desea determinar si existe
una diferencia en el nivel promedio de depósitos entre las cuatro sucursales. Si
halla alguna diferencia, ofrecerá una diversidad de premios promocionales.
A continuación aparecen siete depósitos seleccionados aleatoriamente de
cada sucursal, aproximado al $100 más cercano. ¿A qué conclusión llega?
…continuación
Depósito Sucursal 1 Sucursal 2 Sucursal 3 Sucursal 4
1 5.1 1.9 3.6 1.3
2 4.9 1.9 4.2 1.5
3 5.6 2.1 4.5 0.9
4 4.8 2.4 4.8 1.0
5 3.8 2.1 3.9 1.9
6 5.1 3.1 4.1 1.5
7 4.8 2.5 5.1 2.1
ANOVA
ANÁLISIS DE VARIANZA

Origen de las Suma de Grados de Promedio de los Valor crítico


variaciones cuadrados libertad cuadrados F Probabilidad para F

Entre grupos 55.3325 3 18.44416667 78.0902218 1.5974E-12 3.00878657


Dentro de los
grupos 5.668571429 24 0.236190476

Total 61.00107143 27
Conteste: (ejemplo 1)
1. Factor
2. Tratamiento
3. Variable dependiente.
4. Variable independiente.
5. Variabilidad entre las sucursales.
6. Error estándar dentro de las sucursales.
7. Error de estimación de la sucursal 2.
8. Media global.
9. Sucursal que parece tener un mejor promedio en depósitos.
10. Agencia con mayor estabilidad en el número promedio de depósitos.
11. El 90% de los clientes de la sucursal 1, ¿Cuál es la cantidad mínima y máxima de sus depósitos?
…continuación
12. Hipótesis nula.
13. Hipótesis alternativa.
14. Valor de prueba.
15. Tipo de prueba.
16. Valor critico.
17. Nivel de significancia.
18. Nivel de confianza.
19. Tamaño de la muestra.
20. Conclusión
Ejemplo 2
Se pretende medir la influencia que tiene en la venta de un producto de alimentación, la posición
en que se exhibe al público dentro del establecimiento. Las posiciones establecidas son:
-ALTA: por encima de los ojos.
-MEDIA: nivel de los ojos.
-BAJA: por debajo del nivel de los ojos.
-Para la realización del experimento se han seleccionado 12 autoservicios de dimensiones
similares. Los autoservicios se agrupan en tres conjuntos de cuatro elementos cada uno,
procediendo de forma aleatoria en su asignación. Con ello suponemos que los tres conjuntos
son de características similares, colocándose el producto en cada uno de ellos, de una de las
formas anteriormente descritas y registrando sus ventas durante veinte días. Las ventas
resultantes, en unidades, quedan registradas en el cuadro I.
Se pretende responder a las siguientes preguntas:
¿Tiene alguna influencia el posicionamiento del producto en la venta del mismo?.
¿Qué posicionamiento es más eficaz?
Posición del Establecimiento Ventas (unidades)
producto
Alta A 663
B 795
C 922
D 1056
Media E 798
F 926
G 1060
H 1188
Baja I 528
J 660
K 792
L 924
ANOVA
Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma Promedio Varianza
Alta 4 3436 859 28430
Mediana 4 3972 993 28342.6667
Baja 4 2904 726 29040

ANÁLISIS DE VARIANZA
Origen de las Suma de Promedio de los
variaciones cuadrados Grados de libertad cuadrados F Probabilidad Valor crítico para F
Entre grupos 142578.667 2 71289.3333 2.4922661 0.137618097 4.25649473
Dentro de los
grupos 257438 9 28604.2222

Total 400016.667 11
Conclusión:
1. Se puede observar que no afecta las ventas la ubicación del producto. Esto se
determinó según el análisis de varianza, se puede afirmar esto con un nivel de
confianza del 95%.
2. En base al resumen de datos el posicionamiento más eficaz en sus ventas es a
una altura mediana.
Ejemplo 3:
 Parte de un estudio que se llevó a cabo en cierta Universidad, se diseño para medir los niveles de actividad
de fosfatasa alcalina del suero en niños que padecían ataques convulsivos y quienes habían recibido terapia
anticonvulsionante bajo el cuidado de un especialista privado. Se encontraron 45 sujetos para el estudio y se
clasificaron en cuatro grupos de acuerdo con la medicina que se les proporcionó.
 G-1: control (sin recibir anticonvulsionantes y sin tener una historia de desórdenes de este tipo)
 G-2: Fenobarbital
 G-3: carbamazepina
 G-4: otros anticovulsionantes
 A partir de muestras sanguíneas obtenidas de cada sujeto se determinaron los niveles de actividad de
fosfatasa alcalina del suero y se registraron en la tabla siguiente. Pruebe la hipótesis, a nivel de significancia
de 0.05, de que el nivel promedio de actividad de la fosfatasa alcalina en suero es el mismo para los cuatro
grupos.
Tabla:
Grupo de medicamento
G-1 G-2 G-3 G-4
49.20 97.50 97.07 62.10 110.60
44.54 105.00 73.40 94.95 57.10
45.80 58.05 68.50 142.50 117.60
95.84 86.60 91.85 53.00 77.71
30.10 58.35 106.60 175.00 150.00
36.50 72.80 0.57 79.50 82.90
82.30 116.70 0.79 29.50 111.50
87.85 45.15 0.77 78.40
105.00 70.35 0.81 127.50
95.22 77.40
1460.25 440.36 842.45 707.41
Prueba de hipótesis
Prueba de hipótesis: ANOVA (Determinar el nivel de actividad del suero
fosfatado alcalino)
Ho:
H1: al menos una de las medias es diferente.
Nivel de significancia= 0.05
Archivo
Opciones
Complementos
Complementos de excel
Ir…
Datos, análisis de datos.
ANOVA
Seleccionar datos:
ANOVA

RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 20 1460.25 73.0125 662.862367
Columna 2 9 440.36 48.9288889 2219.78124
Columna 3 9 842.45 93.6055556 2168.43403
Columna 4 7 707.41 101.058571 946.031681
Análisis de Varianza
ANÁLISIS DE VARIANZA

Promedio de
Origen de las Suma de Grados de los Valor crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Entre grupos 13938.6014 3 4646.20045 3.5688916 0.02203598 2.83274713
Dentro de los
grupos 53376.2972 41 1301.86091

Total 67314.8985 44
…continuación
Valor Crítico: f  2.84
Gráfica:
Conclusión:
Se acepta H1 con un nivel de confianza de 95%, es decir, se concluye que los niveles de
actividad promedio de fosfatasa alcalina del suero para los cuatro grupos de
medicamentos no son todos iguales.
Ejercicio
En un experimento se compararon tres métodos (auditivo, traducción y combinado) de enseñar
un idioma extranjero; para evaluar la instrucción, se administró una prueba de vocabulario de 50
preguntas a los 24 estudiantes del experimento repartidos de a ocho por grupo. Se desea
comparar la variabilidad de las medias de los métodos de enseñanza.
ANÁLISIS DE
VARIANZA
Origen de las Suma de Grados de Promedio de los Probabili Valor crítico
variaciones cuadrados libertad cuadrados F dad para F
Entre grupos 323.792 0.002 5.78
Dentro de los
grupos 21

Total 1460.958
Responder:
Factor:
Tratamientos:
Hipótesis nula y alternativa:
Nivel se significancia:
Conclusión:
Métodos para realizar
comparaciones pareadas.
Prueba de Tukey
Sirve para probar todas las diferencias entre medias de tratamientos de un
experimento, por medio de intervalos de confianza para todas las diferencias en
parejas.
El procedimiento de Tukey implica encontrar una diferencia significativa entre
las medias y verificar si excede el valor del error.
La única exigencia es que el número de observaciones sea constante en todos
los tratamientos.
Prueba de Tukey

Pasos:
Ordenar las medias muestrales en forma ascendente.
De la tabla de análisis de varianza se toma el cuadrado medio del error y los grados de libertad.
Determinar el error utilizando las tablas de Tukey con un nivel de significancia de 0.05.
Comparar todas las diferencias absolutas con el error y si excede eso indica que hay una
diferencia significativa.
Ejemplo 1: Prueba de Tukey
Aplique la prueba de Tukey para determinar donde existe una diferencia significativa en las
medias de cada tratamiento.
Grupos Cuenta Suma Promedio Varianza
Sucursal 1 7 34.1 4.871428571 0.29904762
Sucursal 2 7 16 2.285714286 0.18142857
Sucursal 3 7 30.2 4.314285714 0.27142857
Sucursal 4 7 10.2 1.457142857 0.19285714

ANÁLISIS DE VARIANZA
Valor crítico para
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad F
Entre grupos 55.3325 3 18.44416667 78.0902218 1.59738E-12 3.00878657
Dentro de los grupos 5.668571429 24 0.236190476

Total 61.00107143 27
Tabla:
Prueba de Duncan
También conocida como la Prueba del Rango múltiple Duncan, determina la diferencia entre
pares de medias después que se ha rechazado la hipótesis nula en el análisis de varianza.
A diferencia con la prueba Tukey es que la prueba de Duncan ajusta la diferencia crítica
considerando si los dos promedios son adyacentes o si por el contrario existe uno o más medias
entre las medias que se están comparando.
𝑟𝑝 = 𝑟𝑎𝑛𝑔𝑜 𝑒𝑠𝑡𝑢𝑑𝑒𝑛𝑡𝑖𝑧𝑎𝑑𝑜
𝑅𝑝 = 𝑅𝑎𝑛𝑔𝑜
Tabla
Ejercicio
Supóngase que se tienen 6 tratamientos con un diseño completamente aleatorizado de un
solo factor con 5 observaciones por tratamiento. El cuadrado medio del error es de 𝒔𝟐 = 𝟐. 𝟒𝟓
(24 grados de libertad). Las medias muestrales están dadas por (en orden ascendente):

y2 y5 y1 y3 y6 y4
14.5 16.75 19.84 21.12 22.90 23.20

Utilice el método de Tukey para comparar donde existe diferencia significativa en las medias.
Diseño de bloques
completos aleatorizados
Concepto
El principal objetivo de la experimentación es el control de las fuentes de
variación extrañas. La neutralización o control de las variables extrañas
incide directamente en la reducción de la variación del error.
Mediante la técnica de bloques se pretende conseguir una mayor
homogeneidad entre los sujetos o unidades experimentales intrabloque y
una reducción del tamaño del error experimental.
Formato del diseño de bloques de
grupos al azar.
Ventajas
Se consigue un material experimental mucho más
homogéneo.
Se reduce la magnitud del error experimental
Se incrementa el grado de precisión.
Ejemplo 1:
Variables

Bloques I II III IV X
CI 94 CI 96 CI 98 CI 100 ..... CI 112

A1 A1 A1 A1 A1

Tratamien- A2 A2 A2 A2 ..... A2
tos
A3 A3 A3 A3 A3

A1 método tradicional
A2 método de programación
A3 método audio-visual
Prueba estadística
Paso 1. Se asume, por hipótesis nula, que las medias de los grupos experimentales
proceden de una misma población y que, por consiguiente, son iguales:
H0: µ1 = µ2 = µ3
Paso 2. En la hipótesis alternativa se especifica que, por lo menos, hay una diferencia
entre las medias de los tres tratamientos. En términos estadísticos, se tiene:
H1: por lo menos una desigualdad

Paso 3. Se elige, como prueba estadística, el Análisis de la Variancia (ANOVA), un


nivel de significación de  = 0.05.
Diseño de bloques

Bloques
Tratamiento 1 2 3 4 5 6 7 8 9 10
A1 6 7 4 5 7 3 5 8 7 6
A2 7 6 8 9 5 4 6 8 7 5
A3 8 7 9 7 8 10 7 9 10 7
ANOVA
Fuente de Suma de Grados Cuadrados Calculada Valor crítico
variación cuadrados de medios f
libertad
Método 30.47 2 15.23 7.18 3.55

Bloques 19.50 9 2.16 1.02 2.46

Error 38.19 18 2.12

Total 88.16 29
Conclusión:
Se acepta H1 con un nivel de confianza de 95%, se infiere que hay una diferencia
significativa entre los métodos de enseñanza.
Ejemplo 2
Para el ensamblaje de un artículo en particular se están considerando
cuatro máquinas diferentes. Se decide que debe utilizarse seis operadores
diferentes en un experimento de bloques aleatorizado para comparar las
máquinas. Las máquinas se asignan a cada operador en un orden aleatorio.
La operación de las máquinas requiere determinada destreza física y se
anticipa que habrá una diferencia entre los operarios en cuanto a la
velocidad con la cual operarán la maquinaria. Se registraron los siguientes
tiempos, en segundos, para el ensamble del producto terminado.
Pruebe la hipótesis, de que las máquinas llevan a cabo la tarea a la misma
velocidad promedio.
Datos:
Operador 1 M2 39.8 M4 41.3 M3 40.2 M1 42.5
Operador 2 M3 40.5 M1 39.3 M2 40.1 M4 42.2
...

Tabla:
Grupos de Operadores
Máquina Total
1 2 3 4 5 6
1 42.5 39.3 39.6 39.9 42.9 43.6 247.8
2 39.8 40.1 40.5 42.3 42.5 43.1 248.3
3 40.2 40.5 41.3 43.4 44.9 45.1 255.4
4 41.3 42.2 43.5 44.2 45.9 42.3 259.4
Total 163.8 162.1 164.9 169.8 176.2 174.1 1010.9
Solución
Ho: 𝝁𝟏 = 𝝁𝟐 = 𝝁𝟑 = 𝝁𝟒
H1: al menos una de las medias no es igual
Nivel de significancia 0.05
ANOVA
Fuente de Suma de Grados Cuadrados Calculada Valor crítico
variación cuadrados de medios f
libertad
Máquinas 15.93 3 5.31 3.34 3.29

Operadores 42.09 5 8.42 5.29 2.90

Error 23.84 15 1.59

Total 81.86 23
Conclusión:
Se rechaza Ho con un nivel de confianza del 95% y se
concluye que las máquinas no se comportan a la misma
velocidad promedio.