Está en la página 1de 16

Análisis de la Varianza

Uso de la variabilidad de un proceso en la identificación de factores


que lo afectan.
Caso: Análisis de la Varianza: de un factor, modelo de efectos fijos y
completamente aleatorizado.

1
Objetivos

• Identificar la variable respuesta en una situación


específica.

• Identificar los factores que pudieran afectar a la


variable respuesta.

• Presentar como alternativa de estudio de un proceso a


la variabilidad observada de una variable respuesta.

2
Variable Respuesta
Es la variable que ocupa la atención del investigador, quien procura
medirla en el contexto de un diseño experimental. A la variable
respuesta también se le llama variable dependiente . Usaremos la
letra Y para identificarla.

Ejemplos:
• Y : volumen de ventas (unidades) semanal.
• Y: calificación obtenida en el segundo parcial de Estadística
• Y : # de reclamos diarios que recibe un departamento de
atención al cliente.

3
Factores
Son variables (cualitativas o cuantitativas) que pudieran afectar el
comportamiento de una variable respuesta específica. También se
les llama variables independientes.

Ejemplo.Para la variable respuesta Y: “calificación que se obtiene en


el segundo parcial de Estadística II”, podrían ser factores a
considerar:

1) Número de ejercicios resueltos antes del parcial.

2) Nivel de ansiedad. 3) Número de exámenes esa semana.

4) Sección del curso. 5) Carrera que cursa el estudiante


4
Niveles de un Factor
Son los valores o condiciones del factor, bajo los cuales se observará
a la variable respuesta. También se les llama tratamientos (o
poblaciones).

Ejemplo. Para la variable respuesta del ejemplo anterior, podriamos


considerar el factor, “carrera que cursa el estudiante”. Entonces lo
niveles serían tres: Administración y Gerencia, Contaduría y
Economía.

En Análisis de la Varianza, los factores (variables independientes) a


considerar serán, preferiblemente, de naturaleza cualitativa.

5
Ejemplo
¿Qué factores afectan las ventas de un determinado producto? En el
siguiente ejemplo vemos como se estudia un factor en particular.

Ejercicio 17.2 (texto). Un fabricante de cereales tiene que elegir


entre tres colores para las cajas de cereales: rojo, amarillo y azul.
Para averiguar si el color influye en las ventas, se eligen 16 tiendas
de tamaño parecido. Se envían cajas rojas a 6 de estas tiendas, cajas
amarillas a 5 y cajas azules a las 5 restantes. Después de unos días,
se comprueba el número de cajas vendidas en cada tienda. La tabla

adjunta muestra los resultados obtenidos (en decenas de cajas)

6
Ejemplo

Rojo Amarillo Azul

43 52 61
52 37 29
59 38 38
76 64 53
61 74 79
81
Con base en los datos que de muestran en la tabla, ¿podemos decir
que el color de las cajas influye en las ventas?

7
Ejemplo
Si definimos:

m1 = ventas promedio de cajas con color Rojo

m2 = ventas promedio de cajas con color Amarillo

m3 = ventas promedio de cajas con color Azul

Entonces la pregunta puede ser abordada mediante el contraste de


hipótesis:

H0 : m1 = m2 = m3 (las ventas no están afectadas por el color de la caja)

H1 : algún par difiere (el color de la caja si influye en las ventas)

8
TABLA ANOVA
Este contraste se lleva a cabo, mediante la construcción e
interpretación de una Tabla ANOVA (n es el número de datos y k es
el número de tratamientos o poblaciones)
FUENTE DE GRADOS DE SUMA DE CUADRADOS VALOR F
VARIACIÓN LIBERTAD CUADRADOS MEDIOS
TRATAMIENTOS k-1 SCTR CMTR VALOR F
ERROR n-k SCE CME
TOTAL n-1 STC

SCTR : suma de cuadrados de los tratamientos o poblaciones (mide


la variabilidad entre un tratamiento (población) y otro(a))
SCE : suma de cuadrados de los errores(mide la variabilidad dentro
de los tratamientos)
STC : suma total de cuadrados (mide la variabilidad total)
9
TABLA ANOVA

10
TABLA ANOVA
Ecuación Fundamental del Análisis de la Varianza:

STC = SCTR + SCE

Según esta ecuación, la variabilidad total de las observaciones (STC)


tiene dos fuentes: la variabilidad entre los tratamientos (SCTR) y la
variabilidad dentro de los tratamientos (SCE). Analizar la relación
entre estas cantidades conduce a determinar si la variabilidad
observada se debe principalmente a los tratamientos.

El estadístico de prueba es F (de la tabla Anova) que, bajo Ho,


tiene distribución F de Fisher, con (k-1;n-k) grados de libertad. La
región de rechazo tiene la forma
0 fa 11
TABLA ANOVA
No es difícil verificar que en nuestro ejemplo (ejercicio 17.2) la
Tabla Anova resulta ser:
FUENTE DE GRADOS DE SUMA DE CUADRADOS VALOR F
VARIACIÓN LIBERTAD CUADRADOS MEDIOS
TRATAMIENTOS 2 340,94 170,47 0,6162
(colores)
ERROR 13 3.608,00 277,54
TOTAL 15 3.948,94

Si se decide un nivel de significancia del 5%, entonces la RR resulta


ser a partir de la tabla F con (2;13) g.l.
0 3,8056

Dado que F = 0,6162 no cae en la RR, entonces no se rechaza Ho y se


concluye que el color de la caja NO afecta las ventas.
12
TABLA ANOVA
Conviene recordar lo siguiente:

Si tenemos un conjunto de n datos x1 , x2 , . . . , xn entonces:

13
TABLA ANOVA

𝑛 𝑛

෍ 𝑥𝑖 − 𝑥ҧ 2 = ෍ 𝑥𝑖2 − 𝑛𝑥ҧ 2
𝑖=1 𝑖=1

14
Rojo Amarillo Azul
43 52 61

52 37 29

59 38 38

76 64 53

61 74 79

81

Tamaño muestral 6 5 5
Media muestral 62 53 52
Varianza muestral 205,5 261 384

15
Rojo Amarillo Azul
𝑛𝑘 6 5 5
𝑛𝑘
372 265 384
෍ 𝑥𝑖
𝑖=1
𝑛𝑘
24.092 15.089 15.0056
෍ 𝑥𝑖2
𝑖=1

Construya la tabla ANOVA a partir de la información dada

16

También podría gustarte