Está en la página 1de 21

ANALISIS DE VARIANZA

INTRODUCCIN

ElAnlisisdelaVarianza(tambinconocidaporsussiglaseninglsANOVA)esunatcnicaestadstica
muy poderosa que permite estudiar desde los problemas ms sencillos, como la comparacin de dos
poblaciones,hastalosmscomplicados,comoelestudiosimultneodelosefectosqueunconjuntode
variosfactoresysusinteraccionestienensobreunadeterminadavariablerespuesta.

Ademsesunatcnicaestadsticaquedivideyanalizalavariabilidadtotalobservadadeunavariable
enporcionesatribuiblesadistintosfactoresdeintersparaelinvestigador,ascomotambinrealizaun
anlisiscompletosobrelasmediasquecomprendenlashiptesisparasurespectivoanlisis.

Esteestudiosedeberealizardeformaindividualparaobtenerresultadosfiablesylomsprximosala
realidad.

El objetivo principal de muchos experimentos con el estudio de la varianza consiste en determinar el


efectoquehaysobrealgunavariabledependientesitienendistintosnivelesdealgnfactorX(variable
independienteydiscreta).Elfactorpuedeserlatemperatura,laempresaquehaproducidoelbien,el
dadelasemana,etc.

Entoncesseconcluyequeelanlisisdelavarianzapermitemedirlavariacindelosdatosycomprara
sustamaosrelativos.

LA DISTRIBUCIN F

La distribucin de probabilidad es la distribucin F, la cual debe su nombre a sir


Ronald Fisher, uno de los pioneros de la estadstica actual. Esta distribucin de
probabilidad sirve como la distribucin del estadstico de prueba Para varias
situaciones.Conellaseponeapruebasidosmuestrasprovienendepoblaciones
que tienen varianzas iguales, y tambin se aplica cuando se desean comparar
varias medias poblacionales en forma simultnea. La comparacin simultnea de
variasmediaspoblacionalessedenominaanlisis de la varianza (ANOVA).Enlas
dossituaciones,laspoblacionesdebenseguirunadistribucinnormal,ylosdatos
debenseralmenosdeescaladeintervalos.

CARACTERSTICAS DE LA DISTRIBUCIN F

1. - Existe una familia de distribuciones F.- Unmiembroparticulardelafamiliasedetermina


mediantedosparmetros:losgradosdelibertadenelnumeradorylosgradosdelibertadenel
denominador.
2. - La distribucin F es continua.- Estosignificaquesesuponeunnmeroinfinitode
valoresentreceroyelinfinitopositivo.

3.- La distribucin F no puede ser negativa.- ElvalormenorqueF puedetomares0.

4. - Tiene sesgo positivo.- Lacolalargadeladistribucineshaciaelladoderecho.Cuandoel


nmerodegradosdelibertadaumenta,tantoenelnumeradorcomoeneldenominador,la
distribucinseaproximaasernormal.

5. - Es asinttica.- CuandolosvaloresdeX aumentan,lacurvaF seaproximaalejeX pero


nuncalotoca.Estoessimilaralcomportamientodeladistribucindeprobabilidadnormal.

LA PRUEBA ANOVA
Cmo funciona la prueba ANOVA? Recuerde que se desea determinar si varias medias muestrales
provienen de una sola poblacin o de poblaciones con medias diferentes. En realidad, estas medias
muestralessecomparanmediantesusvarianzas.

Una de estas suposiciones fue que las desviaciones estndar de las diversas poblaciones normales
tenanqueserlasmismas.SeaprovechaesterequisitoenlapruebaANOVA.Laestrategiaesestimarla
varianzadelapoblacin(desviacinestndaralcuadrado)dedosformasydespusdeterminarlarazn
de dichos estimados. Si esta razn es aproximadamente 1, entonces por lgica los dos estimados son
iguales,yseconcluyequelasmediaspoblacionalesnosoniguales.

LadistribucinFsirvecomounrbitroalindicarenqueinstancialarazndelasvarianzasmuestraleses
muchomayorque1parahaberocurridoporcasualidad.

MODELOS DE ANLISIS DE LA VARIANZA


ElAnovapermitedistinguirdosmodelosparalahiptesisalternativa:

Modelo I o de efectos fijosenelquelaH1suponequelaskmuestrassonmuestrasdekpoblacionesdistintas


yfijas.

Modelo II o de efectos aleatoriosen el que se supone que las k muestras, se han seleccionado
aleatoriamentedeunconjuntodem>kpoblaciones.

Un ejemplo de modelo Ideanovaesqueseasumequeexistencincopoblaciones(sintratamiento,conpoca


sal,sinsal,etc.)fijas,delasquesehanextradolasmuestras.

Un ejemplo de modelo II serauninvestigadorestinteresadoendeterminarelcontenido,ysusvariaciones,


degrasasenlasclulashepticasdecobayas;tomadelanimalario5cobayasalazarylesrealiza,acadauna,
3biopsiashepticas.

Lamaneramssencilladedistinguirentreambosmodelosespensarque,siserepitieraelestudiountiempo
despus, en un modelo I las muestras seran iguales (no los individuos que las forman) es decir
corresponderanalamismasituacin,mientrasqueenunmodeloIIlasmuestrasserandistintas.

Aunque las asunciones iniciales y los propsitos de ambos modelos son diferentes, los clculos y
laspruebasde significacin son los mismos y slo difieren en lainterpretaciny en algunas pruebas de
hiptesissuplementarias.

ANLISIS DE VARIANZA A UNA VA


DISEO COMPLETAMENTE ALEATORIZADO
HayvariasformasenlascualespuededisearseunexperimentoANOVA.Quizselmscomneseldiseo
completamente aleatorizado a una va. El trmino proviene del hecho que varios sujetos o unidades
experimentales se asignan aleatoriamente a diferentes niveles de un solo factor. Por ejemplo: varios
empleados(unidadesexperimentales)puedenseleccionarsealeatoriamenteparaparticiparendiversostipos
(nivelesdiferentes)deunprogramadecapacitacin(elfactor).

El anlisis de varianza se basa en una comparacin de la cantidad de variacin en cada uno de los
tratamientos. Si de un tratamiento al otro la variacin es significativamente alta, puede concluirse que los
tratamientostienenefectosdiferentesenlaspoblaciones.

VARIACIN TOTAL.- Sumadelasdiferenciaselevadasalcuadradoentrecadaobservacinylamedia


global.

VARIACIN DE TRATAMIENTO.- Sumadelasdiferenciaselevadasalcuadradoentrelamediadecada


tratamientoylamediatotaloglobal.

VARIACIN ALEATORIA.- Sumadelasdiferenciaselevadasalcuadradoentrecadaobservacinysumedia


detratamiento.

SUPOSICIONES EN EL ANLISIS DE LA VARIANZA (ANOVA)


OtrousodeladistribucinFeselanlisisdelatcnicadelavarianza(ANOVA),enlacual
secomparantresomsmediaspoblacionalesparadeterminarsipuedenseriguales.

ParaemplearANOVA,sesuponelosiguiente:
1.Laspoblacionessiguenladistribucinnormal.
2.Laspoblacionestienendesviacionesestndariguales().
3.Laspoblacionessonindependientes.
Cuandosecumplenestascondiciones,Fseempleacomoladistribucindelestadsticode
pruebaypormediodelatablaAnova.

Losresultadosdeunanovasesuelenrepresentarenunatablacomola
siguiente:

TABLA ANOVA
Fuente de
variacin
Tratamiento
Error
Total

Suma
de
Grados de
Media cuadratica
F
cuadrad libertad
os
SST
k -1
SST/(k 1) = MST
MST/MSE
SSE
n -k
SSE/(n k) = MSE
SS Total
n-1

El cociente F se usa para realizar el contraste de lahiptesisde medias iguales. La


regincrticapara dicho contraste es si el valor obtenido de F > al valor critico que
estableceenlatabla.

Noestaninmediato,perolassumasdecuadradoscumplenlamismapropiedad,llamada
identidadopropiedadaditivadelasumadecuadrados:SS Total = SST + SSE.

Ejemplo: de anlisis con dos poblaciones


Lammers Limos ofrece servicio de transporte en limusina del ayuntamiento de
Toledo, Ohio, al aeropuerto metropolitano de Detroit. Sean Lammers, presidente de la
compaa, considera dos rutas. Una por la carretera 25 y la otra por la autopista I-75.
Lammers desea estudiar el tiempo que tardara en conducir al aeropuerto por cada
ruta y luego comparar los resultados. Recopilo los siguientes datos muestrales,
reportados en minutos. Mediante el nivel de significancia 0.10, .hay alguna diferencia
en la variacin en los tiempos de manejo para las dos rutas?

Total

Carretera Autopista I25


75
52
59
67
60
56
61
45
51
70
56
54
63
64
57
65
408
472

Paso 1: Inicia por formular las hiptesis nula y alternativa. La prueba es de dos colas
debido a que se busca una diferencia en la variacin de las dos rutas. No se trata de
demostrarqueunarutatienemsvariacinquelaotra.

Paso 2: Selecciona el nivel de significancia de 0.10.


Paso 3: El estadstico de prueba apropiado sigue la distribucin F.
Paso 4: El valor critico lo obtenemos de la tabla de distribucin F.
Puesto que conduce una prueba de dos colas, el nivel de
significancia en la tabla es 0.05, determinado mediante /2 =
0.10/2 = 0.05.
n1 1 = 7 1 = 6 grados de libertad en el numerador, y
n2 1 = 8 1 = 7 grados de libertad en el denominador.
El valor crtico es 3.87. Por tanto, la regla de decisin es: rechazar
la hiptesis si la razn de las varianzas muestrales es mayor que

Paso 5: Porultimodebetomarlarazndelasdosvarianzasmuestrales,
determinarelvalordelestadsticodepruebaytomarunadecisin
respectodelahiptesisnula.
Se debe elevar al cuadrado las desviaciones estndar para determinar
lasvarianzas.

La decisin es rechazar la hiptesis nula, debido a que el valor F


calculado(4.23)esmayorqueelvalorcritico(3.87).Elconcluyequehay
una diferencia en la variacin de los tiempos de recorrido por las dos
rutas.

Ejemplo: de anlisis de mas de dos poblaciones


1.- Un inversionista en bienes races considera invertir en un centro comercial en los
suburbios deAtlanta, Georgia, para lo cual evala tres terrenos. El ingreso familiar en el
rea circundante al centro comercial propuesto tiene una importancia particular. Se
selecciona una muestra aleatoria de cuatro familias cerca de cada centro comercial
propuesto. A continuacin se presentan los resultados de la muestra. Con un nivel de
significanciade0.05,.elinversionistapuedeconcluirquehayunadiferenciaenelingreso
medio?Utiliceelprocedimientodepruebadehiptesishabitualdecincopasos.

rea de
Southwyc Frankli
k
n Park
64
74
68
71
70
69
60
70

Old
Orchard
75
80
76
78

Paso 1: Formule las hiptesis nula y alternativa.

Paso 2: Seleccione el nivel de significancia.


Niveldesignificancia0.05

Paso 3: Determine el estadstico de prueba.


ElestadsticodepruebasiguelatabladedistribucinFenunniveldesignificanciade
0.05.

Paso 4: Formule la regla de decisin.


Gradosdelibertadenelnumerador=k 1=31=2
Gradosdelibertadeneldenominador=n k =123=9
El valor en esta interseccin es 4.26. Por tanto, la regla de decisin es rechazar si el
valorcalculadodeF esmayorque4.26.
Paso 5: Seleccione la muestra, realice los clculos y tome una decisin.
EsconvenienteresumirlosclculosdelestadsticoFenunatablaANOVA.

Fuente de Suma de
variacin cuadrados
Tratamien
to
SST
Error
Total

SSE
SS Total

Fuente de Suma de
variacin cuadrados
Tratamien
to
276.48
Error
Total

87.74
364.22

TABLA ANOVA
Grados de
Media cuadrtica
F
libertad
SST/(k 1) =
k -1
MST
MST/MSE
SSE/(n k) =
n -k
MSE
n-1

TABLA ANOVA
Grados de
Media
libertad
cuadrtica
(k 1)
(276.48/11)=13
(31)=2
8.24
(n k)
(123)=9
(87.74/9)=9.75
11

F
138.24/9.75
=14.18

SS

Xg(mediaGlobal)==855/12=71.25

rea de
Southwyck
64
68
70
60
T/column
a
N
Media
Global

Franklin
Park
74
71
69
70

Old
Orchard
75
80
76
78

262
4

284
4

309
4

855
12

71.25

TOTAL

rea de
Franklin Park
Old Orchard
Southwyck
(642
2
(74-71.25)
=
7.56
(75-71.25)
=14.06
71.25)2=52.56
(682
2
(71-71.25)
=0.06
(80-71.25)
=76.56
2
71.25) =10.56
(70-71.25)2=1.56 (69-71.25)2=5.06 (76-71.25)2=22.56

(60(70-71.25)2=1.56 (78-71.25)2=45.56
2
71.25) =126.56
T/columna
191.24
14.24
158.74

SS Total
364.22

SSE2

rea de Southwyck

Franklin Park

Old Orchard

64
68
70
60
262
4
65.5

74
71
69
70
284
4
71

75
80
76
78
309
4
77.25

T/ columna
n
Media Muestral

T/columna
SSE

rea de Southwyck
(64-65.5)2=2.25
(68-65.5)2=6.25
(70-65.5)2=20.25
(60-65.5)2=30.25

Franklin Park

Old Orchard

(74-71)2=
(71-71)2=
(69-71)2=
(70-71)2=

59
87.74

14

9
0
4
1

(75-77.25)2=5.06
(80-77.25)2=7.56
(76-77.25)2=1.56
(78-77.25)2=0.56
14.74

TABLA ANOVA
Fuente Suma de
de
cuadrado
variacin
s
Tratamie
nto
276.48
Error
Total

87.74
364.22

Grados de
libertad
(k 1)
(31)=2
(n k)
(123)=9
11

Media
cuadrtica
(276.48/11)
=138.24
(87.74/9)=9
.75

F
138.24/9.75=
14.18

Respuesta: El valor calculado de F es 14.18, el cual es


mayor que el valor critico de 4.26, por tanto, la hiptesis
nulaserechaza.Laconclusinesquenotodaslasmedias
poblacionales son iguales. Los ingresos medios no son
igualesparalos3estados.