Está en la página 1de 24

ANÁLISIS DE VARIANZA

ESTADÍSTICA APLICADA III


MACHICAO BEJAR NILTON
INTRODUCCION

El Análisis de la Varianza ( ANVA ) es un


método estadístico que permite determinar si
tres o mas muestras aleatorias para una
variable respuesta elegida, proceden de una
misma población o bien de poblaciones
distintas
EJEMPLOS DE APLICACIÓN DE ANVA

 Una cadena de electrodomésticos dispone de


las cifras de ventas clasificadas por tipo de
producto y establecimiento. Las preguntas que
nos formulamos son:

¿Difieren las ventas por tipo de producto?.


¿Difieren las ventas según el envase del
producto?.
EJEMPLOS DE APLICACIÓN ANVA

¿Existen diferencias significativas en el


rendimiento de tres grupos de operarios de
una empresa según el método de
adiestramiento empleado en cada uno de
esos tres grupos?.

A cada grupo se le adiestra según un


método (A,B ó C).
Objetivos del Capitulo

 Reconocer situaciones en las cuales se haga uso


del Analisis de Variancia (ANVA).
 Desarrollar el Analisis de Variancia ANVA e
interpretar sus resultados.
 Conducir e Interpretar la prueba de Tukey Post-
analisis para determinar cuales de las medias son
diferentes.

5
El uso del ANVA involucra

Variable Variable dependiente


respuesta (Cuantitativa)

Variable independiente
Factor
Los niveles del factor son los
grupos o poblaciones
Las muestras deben ser independientes, extraída
aleatoriamente de cada una de las poblaciones

Objetivo: Medir el efecto del factor (diferentes


grupos) sobre la variable respuesta
EJEMPLO
Variable respuesta: Rendimiento de un operario

FACTOR Métodos de adiestramiento


Método 1
Método 2 Poblaciones o grupos también
llamados tratamientos
Método 3

Unidad elemental Operario


OBJETIVO: MEDIR EL EFECTO DEL MÉTODO DE
ADISTRAMIENTO SOBRE EL RENDIMENTO DE LOS OPERARIOS
Supuestos del ANOVA

 Normalidad de los datos

 Homogeneidad de varianza de las poblaciones

 Muestras independientes
Disposición de los Datos
Pob 1 Pob 2 … Pob k
Y11 Y12 … Y1k

Y21 Y22 … Y2k

… … … …
Y(n1)1 Y(n2)2 Y(nk)k

T1 T2 Tk

n=n1+n2+…+nk y T=T1+T2+…+Tk
Procedimiento de prueba de hipótesis para las medias
de los Tratamientos:
1.- - Formulación de la hipótesis
H 0 : 1   2  3  .........   k
H1 : al menos un i  j
2.- - Fijar el nivel de significancia

3.- Prueba Estadística


CMTR
F   Fk 1, n  k , 
CME
4.- Valor crítico
Fk 1, n  k , 

5.- Conclusión:
Si Fcal > Ftabla se rechaza H0,

Si Fcalc < Ftabla no se rechaza

Si los resultados se dan en base a salida de


software de estadística:
p  valor  se rechaza Ho
CUADRO ANVA

Fuente de Grados Suma de Cuadrado FCal


Variación de Cuadrados Medio
Libertad
Tratamiento k-1 SCTra SCTra CMTra
CMT  FC 
k 1 CME

Error n-k SCE SCE


CME 
nk
Total n-1 SCTotal

 Donde: k : número de poblaciones o tratamientos


 n : total de observaciones
Formulas de Sumas de Cuadrados

SCTotal = SCTrat + SCE


k ni 2
T
SCTotal   y  2
ij
..

i 1 K 1 n
n
Ti 2 T..2
SCTra   
i  ni n

SCE  SCT  SCTR


Problema 1:

Una importante compañía de construcciones desea


comparar tres marcas de camiones antes de ordenar
toda una nueva flota de una clase de camión. La
compañía probó los camiones durante un periodo de 6
meses y calculó el costo de operación para cada camión,
en dólares por kilómetro. Los datos se encuentran en la
siguiente tabla. ¿Sugieren los datos que el costo medio
de operación por kilómetro es el mismo para cada marca
de camión?. Use  = 0.05.
Problema 1:
Marca A Marca B Marca C
7.3 7.5 7.1
7.7 7.4 7.0
7.6 8.1 6.2
6.8 7.0
7.5

Paso 1: Formular La Hipótesis de Trabajo

H0: A = B = C (El costo medio de operación por kilómetro es el mismo para cada
marca de camión)
H1: Al menos un i es diferente a los demás
Paso 2: Establecer El Nivel de Significación

 = 0.05
Paso 3: Estadístico de Prueba
Análisis de Variancia (ANVA)

Tenemos:

nA  5 ; n B  3 ; n C  4 ; n  nA  n B  n C  12

TA  36.9 ; TB  23 ; TC  27.3 ; T  TA  TB  TC  87.2

Calculo de las Sumas de Cuadrados:

T2 87.22
SCTotal   X 2
  7.3  7.7  ....................  6.2  7.0  
2 2 2 2
 2.6467
n 
ij
12

3
Ti 2 T 2  36.92 232 27.32  87.22
SCTratamiento         12  1.3245
i 1 n i n  5 3 4 

SCError  SCTotal  SCTratamiento  2.6467 1.3245  1.3222


Cuadro ANVA:

Fuente
De GL SC CM Fcal Ftab
Variabilidad F(0.05,2,9)

Tratamiento (Marca) 2 1.3245 0.6623 4.51 4.2565


Error 9 1.3222 0.1469
Total 11 2.6467

Paso 4: Criterio de decisión

Distribución F
Con (2,9) grados de
libertad

F(0.05 ,2,9) = 4.2565

Fcal = 4.51

Paso 5: Conclusión

Se Rechaza H0: Existe suficiente evidencia estadística para afirmar que Al menos un i
es diferente a los demás, El costo medio de operación por kilómetro es diferente para
cada marca de camión a un nivel de significación del 5%.
PRUEBAS DE COMPARACIÓN DE TUKEY
PRUEBAS DE COMPARACIÓN DE TUKEY
ANÁLISIS DE LOS RESULTADOS

NO HAY DIFERENCIA
SIGNIFICATIVA ENTRE LAS
MEDIAS POBLACIONALES A Y B
NO HAY DIFERENCIA
SIGNIFICATIVA ENTRE LAS
MEDIAS POBLACIONALES A
YC
LA MEDIA POBLACIONAL DE B
ES SIGNIFICATIVAMENTE MAYOR
QUE C
ANÁLISIS DE LOS RESULTADOS

Luego, ordenando las medias en forma ascendente


según las medias muestrales, y colocando una
línea debajo de las medias donde no se encontró
diferencia significativa. Se tiene.

Conclusión:
Entre comprar el camión C y B es preferible C.
Es indistinto comprar C o A.
Es indistinto comprar A o B.
Problema 2
Tres tipos distintos de motores de gasolina fueron probados para
determinar cuánto tiempo son útiles antes de necesitar una
reparación; si los tiempos de vida de los motores de cada tipo se
distribuyen normalmente y tienen la misma varianza, haga una
prueba usando alfa 0.05 para determinar si difieren las medias de
vida útil antes de requerir una reparación. En la tabla aparecen los
tiempos de vida útil, en decenas de miles de millas para cada tipo de
motor.

A B C
6 8 3
2 7 2
4 7 5
1 2 4
7 6 1
Problema 3

Existen cuatro estaciones de radio. Cada estación toca música rock durante cierto número de
minutos por hora y se desea determinar si el promedio que cada estación toca esta música, por
hora, es el mismo. Para esto se tomó muestras de 10 horas de cada estación y se encontró los
siguientes tiempos promedios en los cuales se toca música rock (en minutos)

x1  51.43 x2  44.64 x3  47.2 x4  50.85

Además, se sabe que: SCT = 650.75 (suma de cuadrados del total). Aplique la técnica
estadística adecuada y haga un análisis al respecto.
Bibliografía:

1.- Anderson, S. (2006). Estadísticas para


administración y economía, ( 8tva ed.) México:
Thomson.

2. Montgomery D. - Runger G.. Probabilidad y


Estadística aplicadas a la ingeniería, MgGRAW-
HILL INTERAMERICANA EDITORES. México D.F.,
1996

También podría gustarte