Está en la página 1de 27

El anlisis de varianza es una tcnica que se puede utilizar para decidir si las

medias de dos o ms poblaciones son iguales. La prueba se basa en una


muestra nica, obtenida a partir de cada poblacin.
El anlisis de varianza puede servir para determinar si las diferencias entre las
medias mustrales revelan las verdaderas diferencias entre los valores medios
de cada una de las poblaciones, o si las diferencias entre los valores medios de
la muestra son ms indicativas de una variabilidad de muestreo.
Si el valor estadstico de prueba (anlisis de varianza) nos impulsa a aceptar la
hiptesis nula, se concluira que las diferencias observadas entre las medias de
las muestras se deben a la variacin casual en el muestreo (y por tanto, que los
valores medios de poblacin son iguales). Si se rechaza la hiptesis nula, se
concluira que las diferencias entre los valores medios de la muestra son
demasiado grandes como para deberse nicamente a la casualidad (y por ello,
no todas las medias de poblacin son iguales).
Los datos para el anlisis de varianza se obtienen tomando una muestra de
cada poblacin y calculando la media muestral y la variancia en el caso de
cada muestra.
Existen tres supuestos bsicos que se deben satisfacer antes de que se pueda
utilizar el anlisis de variancia.

1) Las muestras deben ser de tipo aleatorio independiente.


2) Las muestras deben ser obtenidas a partir de poblaciones normales.
3) Las poblaciones deben tener variancias iguales (es decir,

El anlisis de varianza, como su nombre lo indica, comprende el clculo de


varianzas. La varianza de una muestra es el promedio de las desviaciones
elevadas al cuadrado de la media del grupo.
Simblicamente, esto se representa de la siguiente manera:

Cabe observar que se debe utilizar n -1, ya que se est trabajando con datos
mustrales. De ah que, para obtener la varianza muestral, el procedimiento
sea el siguiente:
1) Calcular la media muestral
2) Restar la media de cada valor de la muestra.
3) Elevar al cuadrado cada una de las diferencias.
4) Sumar las diferencias elevadas al cuadrado.
5) Dividir entre n -1

LA RAZN F
A diferencia de otras pruebas de medias que se basan en la diferencia existente
entre dos valores, el anlisis de varianza emplea la razn de las estimaciones,
dividiendo la estimacin intermediante entre la estimacin interna

Esta razn F fue creada por Ronald Fisher (1890-1962), matemtico britnico,
cuyas teoras estadsticas hicieron mucho ms precisos los experimentos
cientficos. Sus proyectos estadsticos, primero utilizados en biologa,
rpidamente cobraron importancia y fueron aplicados a la experimentacin
agrcola, mdica e industrial. Fisher tambin contribuy a clarificar las
funciones que desempean la mutacin y la seleccin natural en la gentica,
particularmente en la poblacin humana.
El valor estadstico de prueba resultante se debe comparar con un valor
tabular de F, que indicar el valor mximo del valor estadstico de prueba que
ocurra si H0 fuera verdadera, a un nivel de significacin seleccionado. Antes
de proceder a efectuar este clculo, se debe considerar las caractersticas de la
distribucin F

CARACTERSTICAS DE LA DISTRIBUCIN F
Existe una distribucin F diferente para cada combinacin de tamao de
muestra y nmero de muestras. Por tanto, existe una distribucin F que se
aplica cuando se toman cinco muestras de seis observaciones cada una, al
igual que una distribucin F diferente para cinco muestras de siete
observaciones cada una. A propsito de esto, el nmero distribuciones de
muestreo diferentes es tan grande que sera poco prctico hacer una extensa
tabulacin de distribuciones. Por tanto, como se hizo en el caso de la
distribucin t, solamente se tabulan los valores que ms comnmente se
utilizan.
En el caso de la distribucin F, los valores crticos para los niveles
0,05 y 0,01 generalmente se proporcionan para determinadas combinaciones

de tamaos de muestra y nmero de muestras.


La distribucin es continua respecto al intervalo de 0 a + . La razn ms
pequea es 0. La razn no puede ser negativa, ya que ambos trminos de la
razn F estn elevados al cuadrado. Por otra parte, grandes diferencias entre
los valores medios de la muestra, acompaadas de pequeas variancias
mustrales pueden dar como resultado valores extremadamente grandes de la
razn F.

La forma de cada distribucin de muestreo terico F depende del nmero de


grados de libertad que estn asociados a ella. Tanto el numerador como el
denominador tienen grados de libertad relacionados.
DETERMINACIN DE LOS GRADOS DE LIBERTAD
Los grados de libertad para el numerador y el denominador de la razn F se
basan en los clculos necesarios para derivar cada estimacin de la variancia
de la poblacin. La estimacin intermediante de variancia (numerador)
comprende la divisin de la suma de las diferencias elevadas al cuadrado entre
el nmero de medias (muestras) menos uno, o bien, k -1. As, k -1es el nmero
de grados de libertad para el numerador.
En forma semejante, el calcular cada variancia muestral, la suma de las
diferencias elevadas al cuadrado entre el valor medio de la muestra y cada
valor de la misma se divide entre el nmero de observaciones de la muestra
menos uno, o bien, n -1. Por tanto, el promedio de las variancias mustrales se
determina dividiendo la suma de las variancias de la muestra entre el nmero
de muestras, o k. Los grados de libertad para el denominador son entonces,
k(n -l).
Uso de la tabla de F del anlisis de variancia (ANOVA)
En la tabla se ilustra la estructura de una tabla de F para un nivel de
significacin de 0,01 o 1% y 0,05 o 5%. Se obtiene el valor tabular, localizando
los grados de libertad del numerador (que se listan en la parte superior de la

tabla), as como los del denominador (que se listan en una de las columnas
laterales de la tabla) que corresponden a una situacin dada. Utilizando el
nivel de significacin de 0,05 para grados de libertad, el valor de F es 8,89

El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para


comparar dos o ms medias, que es necesario porque cuando se quiere
comparar ms de dos medias es incorrecto utilizar repetidamente el contraste
basado en la t de Student. Por dos motivos:
En primer lugar, y como se realizaran simultnea e independientemente
varios contrastes de hiptesis, la probabilidad de encontrar alguno
significativo por azar aumentara. En cada contraste se rechaza la H0 si la t
supera el nivel crtico, para lo que, en la hiptesis nula, hay una probabilidad
a. Si se realizan m contrastes independientes, la probabilidad de que, en la
hiptesis nula, ningn estadstico supere el valor crtico es (1 - a)m, por lo
tanto, la probabilidad de que alguno lo supere es 1 - (1 - a)m, que para valores
de a prximos a 0 es aproximadamente igual a m. Una primera solucin,
denominada mtodo de Bonferroni, consiste en bajar el valor de a, usando en
su lugar a/m, aunque resulta un mtodo muy conservador.
Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras
provienen de la misma poblacin, por lo tanto, cuando se hayan realizado
todas las comparaciones, la hiptesis nula es que todas las muestras provienen
de la misma poblacin y, sin embargo, para cada comparacin, la estimacin

de la varianza necesaria para el contraste es distinta, pues se ha hecho en base


a muestras distintas.
El mtodo que resuelve ambos problemas es el anova, aunque es algo ms que
esto: es un mtodo que permite comparar varias medias en diversas
situaciones; muy ligado, por tanto, al diseo de experimentos y, de alguna
manera, es la base del anlisis multivariante.

EJERCICIO N 1
Una lista de palabras sin sentido se presenta en la pantalla del ordenador
con cuatro procedimientos diferentes, asignados al azar a un grupo de
sujetos. Posteriormente se les realiza una prueba de recuerdo de dichas
palabras, obtenindose los siguientes resultados:
PROCEDIMIENTO 1
5
7
6
3
9
7
4
2

PROCEDIMIENTO 2
9
11
8
7
7

PROCEDIMIENTO 3
8
6
9
5
7
4
4

PROCEDIMIENTO 4
1
3
4
5
1
4

TABLA DE REALIZACION DE EJERCICIO


PROCED. 1

PROCED. 2

PROCED. 3

PROCED.4

TOTAL

Tc

43

42

43

18

146

Nc

26

Tc2/nc

231.10

352.8

264.10

54

902

X2

269

364

287

68

988

SST= 902 (146)2 /26


SST= 902- 819.80
SST= 82.20
SSE= 988-902
SSE= 86

FUENTE

DE SUMA

DE GRADOS

DE CUADRADO MEDIO

VARIACION

CUADRADOS

LIBERTAD

ENTRE LOS GRUPOS

82.20

4-1= 3

27.40

EN GRUPO

86

26-4= 22

3.90

TOTAL

7.03

El valor en la F terica con 3 y 22 grados de libertad a un nivel de confianza


del 95% es 3.05. Por consiguiente se rechaza la hiptesis nula y se concluye
que los cuatro procedimientos de presentacin producen diferencias
significativas.

EJERCICIO N 2
Se quiere evaluar la eficacia de distintas dosis de un frmaco contra la
hipertensin arterial, comparndola con la de una dieta sin sal. Para ello se
seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente en 5
grupos- Al primero de ellos no le suministra ningn tratamiento, al
segundo una dieta con un contenido pobre en sal, al tercero una dieta sin
sal, al cuarto el frmaco a una dosis determinada y al quinto el mismo
frmaco a otra dosis. Las presiones arteriales sistlicas de los 25 sujetos al
finalizar los tratamientos son:
GRUPO
1

180

172

163

158

147

173

158

170

146

152

175

167

158

160

143

182

160

162

174

155

181

175

170

155

160

LA TABLA DE ANOVA
LA TABLA DE ANOVA ES:
FUENTE DE VARIACION
TRATAMIENTO
ERROR
TOTAL

GL

SS

MS

2010,64

502,66

11,24

20

894,4

44,72

24

2905,04

Como F=2,87 y 11,25 > 2,87 rechazamos la hiptesis nula y concluimos


que los resultados de los tratamientos son diferentes

EJERCICIO NO. 3
Se tienen las lecturas de hemoglobina de estudiantes varones de 3 aulas de
primero de secundarias en un colegio:

1er Grado A

1er Grado B

1er Grado C

14

16

13

15
16

17
15

15
14

13

14

17

9
15

8
12

13
10

16

14

Media m =
Tc
nc

14

13.71

12.86

40.57

98

96

90

284

21

1408

1370

1212

3990

FORMULAS:

Entre grupos

Dentro de los grupos

98

Tc

96

90

284
3845.71

nc

21

1408

1370

1212

3990

/N
2

/21

Formato General de la tabla de anlisis de la varianza


Fuente de variacin
Entre los grupos
En los grupos

Suma de cuadrados

Grados de libertad

Cuadrado medio

SST

K-1

SST/K=MSTR

SSE

N-K

SSE/N-K=MSR

Suma de cuadrados

Grados de libertad

Cuadrado medio

4.95

3-1

4.95/2=2.475

144.29

21-3

144.29/18=8.016

Total

Fuente de variacin
Entre los grupos
En los grupos
Total

INTERPRETACIN:

= 0.309, es la funcin de prueba

Con (3-1) y (21-3) grados de libertad = 2 grados de libertad en el


numerador y 18 en el denominador.

, es el valor critico de la distribucin F

Se acepta la hiptesis nula.


Las medias aritmticas son iguales.

EJERCICIO N 4
Un profesor del curso de mercadotecnia pidi a los alumnos de un de sus
grupos que evaluaran su desempeo como excelente, bueno, regular o
deficiente. Un estudiante egresado recopilo las evaluaciones y aseguro a los
estudiantes que el profesor las recibira hasta que las calificaciones del
curso se hubieran enviado a las oficinas de registro. La evaluacin (es decir,
el tratamiento) que cada alumno asigno al profesor se compar con las
calificaciones, que podr ir de 0 a 100 que obtuvo el estudiante en el curso.
A continuacin se presenta la informacin de la muestra existe diferente
entre los promedios de las calificaciones de los alumnos en cada uno de las
cuatro categora de evaluacin? Utilice el nivel de significancia 0.01
CALIFICACIONES DEL CURSO
EXCELENTE
94
90
85
80

BUENO
75
68
77
83
88

REGULAR
70
73
76
78
80
68
65

DEFICIENTE
68
70
72
65
74
65

1. Plantear la hiptesis nula y la hiptesis alternativa

2. Seleccionar el nivel de significancia


Se elige el nivel 0.01
3. Cul es la regla de decisin
Grados de libertad en el numerador = k-1= 4-1=3
Grados de libertad en el numerador= n-k=22-4=18
EXCELENTE
X
94
8836
90
8100
85
7225
80
6400

349
4

BUENO
X
75
68
77
83
88

5625
4624
5929
6889
7744

391
5
30561

REGULAR
X
70
73
76
78
80
68
65
510
7

30811

4900
5329
5776
6084
6400
4624
4225

DEFICIENTE
TOTAL
X
68
4624
70
4900
72
5184
65
4225
74
5476
65
4225
414
6

37338

4. Calcule SST, SSE Y SS total


SUMA DE CUADRADOS; TOTAL SS total =
127344 -

= 1485.09

1664
22
28634 127344

SUMA DE CUADRADOS DEBIDOS AL TRATAMIENTO

SST =

SUMA DE CUADRADOS DEL ERROR

SSE = SS total SST


1485.09-890.68 =594.41

5. elabore una tabla de ANOVA


TABLA ANOVA
FUENTE DE

SUMA DE

GRADOS DE

CUADRADO

VARIACION

CUADRADOS

LIBERTAD

MEDIO

TRATAMIENTOS

SST

k-1

SST/(K-1) = MST

ERROR

SSE

n-k

SSE/(N-K) =MSE

TOTAL

SS total

n-1

MST/MSE

TABLA ANOVA
FUENTE DE VARIACION SUMA DE CUADRADOS GRADOS DE LIBERTAD CUADRADO MEDIO F
TRATAMIENTOS

890,68

296,89

ERROR

594,41

18

33,02

TOTAL

1485,09

21

8,99

EJERCICIO N 5
Los miembros de un equipo ciclista se dividen al azar en tres grupos que
entrenan con mtodos diferentes. El primer grupo realiza largos recorridos
a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y
el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta
frecuencia. Despus de un mes de entrenamiento se realiza un test de
rendimiento consistente en un recorrido cronometrado de 9 Km. Los
tiempos empleados fueron los siguientes:

METODO I
15
16
14
15
17

MEDOTO II
14
13
15
16
14

METODO III
13
12
11
14
11

A un nivel de confianza del 95% Puede considerarse que los tres mtodos
producen resultados equivalentes? O por el contrario Hay algn mtodo
superior a los dems?

DESARROLLO
TC
NC
TC / NC

77

72

61

210

15

1185,8

1036,8

744,2

2966,8

1191

1042

751

2984

SST= (TC /NC) - () /N


SST= 2966, 8 (210) / 15
SST= 2966, 8 2940= 26, 8

SSE= - (TC /NC)


SSE= 2984 2966, 8 = 17, 2

FUENTE DE

SUMA DE

GRADOS DE

CUADRADO

VARIACION

CUADRADOS

LIBERTAD

MEDIO

SST

K-1

SSE

N-K

ENTRE GRUPOS
EN LOS GRUPOS
TOTAL

SST/K-1= MSTR
SSE/N-K= MSE
F(MSTR/MSE)

ENTRE GRUPOS
EN LOS GRUPOS

26, 8

3-1= 2

13, 4

17, 2

15- 3= 12

1, 43

F= (MSTR/MSE)
F= 13, 4 / 1, 43
F= 9, 37

El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza


del 95% es 3,89. Por consiguiente se rechaza la hiptesis nula y se concluye
que los tres mtodos de entrenamiento producen diferencias significativas.

EJERCICIO 6
Una compaa ofrece el servicio desde el edificio Toledo hasta el aeropuerto metro
(Detroit). El representante de la compaa est considerando dos rutas:
Ruta 1 Us

25

Ruta 2 Intertatal

75

Desea estudiar el tiempo necesario para llegar al aeropuerto por cada uno de estos
caminos y despus comparar resultados. Obtuvo los siguientes datos de muestra de
minuto. Utilizo el nivel de significativa del 0,005
Existe alguna diferencia en la variacin de los tiempos de recorrido de ambas rutas?
US 25

INTERSTATAL 75
52

59

67

60

56

61

45

51

70

56

54

63

64

57
65

408

472

= 880

US 25

INTERSTATAL 75
2704

3481

4489

3600

3136

3721

2025

2601

4900

3136

2916

3969

4096

3249
4225

24266

27982

SST =
SST =51.628,57 8802 / 15
SST = 51.628,57 51.628,67
SST = 1,9

-
SSE =
SSE = 52248 51.628,57
SSE = 619,43

= 52,248

FUENTE

SUMA DE

GRADOS DE

CUADRADO

VARIACION

CUADRADOS

LIBERTAD

MEDIO

Entre los grupos

SST 1,90

2-1=1

1,9

SST 619,43

15 - 2 = 13

47,64
F = 0,03

En los grupos

Valor Critico 4,67: Se rechaza la hiptesis nula debido a que el valor critico
es mayor al valor F .

ANGULO CERON DIANA


BERNAL CONSUEGRA CHRISTIAN
CHAVEZ ESTRELLA VALERIA
CHOEZ PLUAS KERLY
GALEAS VIVANCO MARIA
SANCHEZ PALACIOS MARIA FERNANDA

También podría gustarte