Está en la página 1de 28

5.

ANÁLISIS DE VARIANZA
El análisis de la varianza es un método para comparar más de dos medias, que es necesario porque cuando se quiere comparar más de dos medias es
incorrecto utilizar repetidamente el contraste basado en la T-Student.

El análisis de la varianza permite contrastar la hipótesis nula de que las medias de p poblaciones (p >2) son iguales, frente a la hipótesis alternativa de que
por lo menos una de las poblaciones difiere de las demás en cuanto a su valor esperado.

H 0 :µ1=µ2=µ3 =…=µ p
H a :∃ µi ≠ µ j ∀ i ≠ ji , j=1,2 , ⋯ , p

¿Qué se entiende por diseño experimental?


Se refiere a un estudio de investigación en el que se manipulan deliberadamente una o más variables independientes (supuestas causas) para analizar las
consecuencias que la manipulación tiene sobre una o más variables dependientes (supuestos efecto), dentro de de condiciones controladas por el
investigador.

Se entiende por diseño experimental, el proceso de planeamiento de un experimento, tal que se tomen datos apropiados con la mayor realidad posible, los
cuales deben ser analizados mediante métodos estadísticos que deriven conclusiones válidas y objetivas. Podemos decir que la filosofía del diseño
experimental es la obtención de información con una alta fidelidad sobre el mensaje de la naturaleza a un costo mínimo.

Definiciones importantes:
¿Qué es una investigación no experimental?: Es la que se realiza sin manipular deliberadamente las variables independientes, se basa en variables que
ya ocurrieron o se dieron en la realidad sin la intervención directa del investigador.

Unidad experimental (UE): es el objeto en el que se toma una medición.


Error Experimental: Una característica de todo material experimental es la variación. Asociada con la unidad experimental está el error experimental, este
error es el reflejo de que las UE no son iguales. También podemos decir que es una medida de la variación existente entre las respuestas de las UE tratadas
en forma similar.

Un factor: es una variable independie4nte cuyos valores controlados y variados por el experimentador.

Un nivel: es la intensidad de un factor.

Un tratamiento: es una combinación específica de niveles de factor.

La variable de respuesta: es la variable que es medida por el experimentador.

Principios básicos del diseño experimental:


1. Homogeneidad de las unidades experimentales.
2. Replica en cada uno de los tratamientos, se entiende que cada tratamiento debe ser aplicado a varias unidades experimentales
3. Aleatorización, existen varias formas prácticas para la asignación aleatoria de los tratamientos a las unidades experimentales.
4. Control local, en el cual la idea básica es particionar el conjunto total de las UE en subconjuntos (bloques) que sean lo más homogéneo posible, eliminando
de esta forma los efectos de factores extraños que contribuyen a la variación sistemática de las diferencias entre las unidades experimentales

Existen varios diseños experimentales dependiendo de ciertas características estructurales, uno de los diseños experimentales más sencillos es el Diseño
Completamente Aleatorio (DCA), en el que muestras aleatorias se seleccionan de manera independiente de cada una de p poblaciones. Este diseño
comprende sólo un factor, la población de donde proviene la medición, de aquí la designación como una clasificación en una dirección.

Repetició TRATAMIENTO
n
T1 T2 T3 …… TP

El modelo de una observación en el DCA es …… X ij =μ+ τ j + ε ij


r
Donde:
X ij es la respuesta
μ es la media general del experimento
τj es el efecto del tratamiento
ε ij es el error aleatorio asociado a la respuesta

µ1=µ 2=µ 3=µ4=… … … …=µ p


H0 :
Ha:∃ µi ≠ µ j i,j=1,2,3,4,……,p

SCTotal=SCT + SCE

p ni
SCTotal=∑ ∑ X 2ij – CM
i =1 j=1

p ni 2

CM =
(∑ ∑ )
i=1 j=1
X ij

n
T 2ip
SCT=∑ −CM
i=1 ni

SCE=SCTotal – SCT

TABLA ANOVA
FUENTE DE VARIACION GRADOS DE LIBERTAD SUMA DE CUADRADOS CUADRADO MEDIO F calculado

TECNICAS p-1 SCT CMT =SCT/(p-1) CMT/CME

ERROR n-p SCE CME = SCE/(n-p)

TOTAL n-1 SCTotal

El valor Fcalculado se compara contra un F(p-1;n-p) ,si el Fcalculado es mayor al F(p-1;n-p) se acepta Ha, de lo contrario se acepta Ho.

El análisis de procedimiento de varianza provee una prueba general para juzgar la igualdad de las p medias poblacionales. Una vez que haya determinado si
hay en realidad una diferencia en las medias, se puede usar otro procedimiento para averiguar dónde están las diferencias.
Una vez que se ha determinado que existen diferencias entre las medias, los contrastes de comparaciones múltiples post hoc, o comparaciones a posteriori,
permiten determinar entre qué medias existen diferencias significativas.

Uno de los métodos que nos responde a esta inquietud, es el método de Tukey para comparaciones pareadas, hace que la probabilidad de manifestar que
existe una diferencia entre por lo menos un par de medias en un conjunto de p medias de tratamiento.

Existen varios métodos para cumplir con este objetivo, uno de ellos, el método de Tukey para hacer comparaciones pareadas está basado en el análisis usual
de suposiciones de varianza.

Criterio para efectuar comparaciones pareadas de Tukey:


Ho=μi =μ j
Ha=μi ≠ μ j

Los supuestos para realizar un ANOVA son:


1. Las observaciones dentro de cada población están distribuidas normalmente.
2. Varianzas iguales en cada una de los tratamientos.

El procedimiento de ANOVA es robusto cuando los tamaños muestrales son iguales y cuando existe un comportamiento Normal en los datos. Violar el
supuesto de igualdad de varianzas es muy serio, en especial cuando los tamaños muestrales no son cercanamente iguales.

Ejemplo 1:Qué tipo de comerciales de televisión captan mejor la atención de los niños? Para dar respuesta a la pregunta anterior, se observó la actitud de 15
niños; 5 niños fueron observados mientras veían comerciales de juguetes y juegos, 5 mientras veían comerciales sobre comida y goma de mascar y 5
mientras veían comerciales relacionados con ropa para niños. Todos los comerciales tenían 60 segundos de duración. En la siguiente tabla aparecen los
tiempos de atención a los comerciales para los 15 niños:
JUGUETES COMIDA ROPA μ
45 50 25

40 25 15

30 55 22

25 45 27

45 50 35
Si se desea probar si existe diferencia entre los tiempos medios de atención de los niños a las tres clases de comerciales. Se debe usar la prueba de Tukey.
Realícela.

¿Diseño experimental?
JUGUETES COMID ROPA μ
A

45 50 25

40 25 15

30 55 22

25 45 27

45 50 35

ni 5 5 5

Suma 185 225 124

μi 37 45 24.8 35.6

Análisis de los supuestos:


1. Las observaciones dentro de cada población están distribuidas normalmente. También se puede realizar una prueba sobre la Normalidad de los errores.
Ho: Los datos para( Juguetes , Comida, Ropa) son Normales
Ha: Los datos para( Juguetes ,Comida , Ropa)no son Normales
Pruebas de Normalidad para JUGUETES
Prueba Estadístico Valor-P
Estadístico W de Shapiro- 0.866714 0.250298
Wilk

Pruebas de Normalidad para COMIDA


Prueba Estadístico Valor-P
Estadístico W de Shapiro- 0.813083 0.101599
Wilk

Pruebas de Normalidad para ROPA


Prueba Estadístico Valor-P
Estadístico W de Shapiro- 0.988017 0.961153
Wilk
Con un nivel de significancia del 5% los datos para (Juguetes, Comida, Ropa son Normales.

Ho: Los errores ( residuales ) son Normales


Ha: Los errores ( residuales ) no son Normales
Pruebas de Normalidad para RESIDUOS
Prueba Estadístico Valor-P
Estadístico W de Shapiro- 0.920512 0.195452
Wilk
Con un nivel de significancia del 5% los errores son Normales

X ij =μ+ τ j + ε ij =μ+ ( μi−μ ) +( X ij −μ i)


X ij μ τ j=( μ i−μ ) ε ij=( X ij −μ i)
45 35. (37-35.6)=1.4 8
6

40 35. (37-35.6)=1.4 3
6

30 35. (37-35.6)=1.4 -7
6

25 35. (37-35.6)=1.4 -12


6

45 35. (37-35.6)=1.4 8
6

50 35. (45-35.6)=9.4 5
6

25 35. (45-35.6)=9.4 -20


6
55 35. (45-35.6)=9.4 10
6

45 35. (45-35.6)=9.4 0
6

50 35. (45-35.6)=9.4 5
6

25 35. (24.8-35.6)=- 0.2


6 10.8

15 35. (24.8-35.6)=- -9.8


6 10.8

22 35. (24.8-35.6)=- -2.8


6 10.8

27 35. (24.8-35.6)=- 2.2


6 10.8

35 35. (24.8-35.6)=- 10.2


6 10.8

2. Homocedasticidad o igualdad de las varianzas de los diferentes tratamientos: Existen varias pruebas para demostrar esto, usaremos la prueba de Levene.

Ho: σ 2J =σ 2C =σ 2R
Ha: σ 2i ≠ σ 2j ∀i ≠ ji , j=J ,C , R

Verificación de Varianza
Prueba Valor-P
Levene' 0.43348 0.6580
s 9

Comparación Sigma1 Sigma2 F-Ratio P-Valor


JUGUETES / COMIDA 9.08295 11.726 0.6 0.6328
JUGUETES / ROPA 9.08295 7.2938 1.55075 0.6812
3
COMIDA / ROPA 11.726 7.2938 2.58459 0.3801
3
Procedimiento:

1. Hipótesis nula y alternativa:

µJ =µC =µ R
H0 :
Ha:∃ µi ≠ µ j i,j=J,C,R
2. Nivel de significancia α=0.05

3. Estadística de prueba:
Para calcular la estadística de prueba es necesario seguir estos pasos.
p ni
SCTotal=∑ ∑ X 2ij – CM=452 +40 2+30 2+ …..+27 2+ 352 – CM=21138−19010.4=( n−1 ) ( S 2n−1 ) =( 15−1 ) ( 151.9714 )=2127.5996
i =1 j=1
p ni
2
( ∑ ∑ X ij )
i=1 j=1 (534)2 2
CM = =
=n(x́) =19010.4
n 15
p
T 2i 1852 2252 124 2
SCT=∑ −CM = + + – CM =20045.2 – 19010.4=1034.8
i=1 ni 5 5 5
SCE=SCTotal – SCT =2127.5996−1034.8=1092.7996
TABLA ANOVA
FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO F calculado
VARIACION LIBERTAD CUADRADOS

TECNICAS p-1= 3-1=2 SCT = 1034.8 CMT = 1034.8/2 =517.8 CMT/CME = =


517.8/91.0666=
ERROR n-p=15-3=12 SCE = 1092.7996 CME =
1092.799612=91.0666 5.6816

TOTAL n-1=14 SCTotal = 2127.5996

Método del Valor crítico Método del p-valor

El valor Fcalculado se compara contra un F(p-1;n-p) , p-valor =0.0184 < α=0.05


si el Fcalculado es mayor al F(p-1;n-p) se acepta Ha,
Se acepta Ha, Con un nivel de significancia del 5% existen razones
de lo contrario se acepta Ho. para creer que el tiempo medio de atención a los comerciales de
juguetes,
comida y ropa son diferentes.
Fcalculado=5.6816 > F(p-1;n-p) =F2;12=3.89 ,
Se acepta Ha, Con un nivel de significancia del 5% existen razones para
creer que el tiempo medio de de atención a los comerciales de juguetes,
comida y ropa son diferentes.

Salida del paquete Statgraphics:


Tabla ANOVA
Fuente Suma de Cuadrados Gl Cuadrado Razón-F Valor-P
Medio
Entre 1034.8 2 517.4 5.68 0.0184
grupos
Intra grupos 1092.8 12 91.0667
Total (Corr.) 2127.6 14
Dado que la prueba F, encontró diferencias entre los promedios, se deben realizar pruebas de múltiples rangos. Existen varias pruebas, escogemos una de
ellas, la prueba de Tukey.

Pruebas de Múltiple Rangos


Método: 95.0 porcentaje Tukey HSD
Casos Media Grupos Homogéneos
ROPA 5 24.8 X
JUGUETES 5 37.0 XX
COMIDA 5 45.0 X

Contraste Sig Diferencia +/- Límites


.
JUGUETES - COMIDA -8.0 16.146
JUGUETES - ROPA 12.2 16.146
COMIDA - ROPA * 20.2 16.146
* indica una diferencia significativa.
Con un nivel de significancia del 5%, existen razones para creer que el nivel medio de atención a los comerciales de Comida y Ropa es diferente. Mientras, el
tiempo medio entre Juguetes y Comida, y entre Juguetes y ropa es igual.

Ejemplo 2: Los Bifenilos Policlorados (PCB) empleados en la fabricación de transformadores y condensadores eléctricos de gran tamaño, son contaminantes
extremadamente peligrosos cuando se liberan en el medio ambiente. Se tomaron muestras de peces de cinco ríos y se analizaron para determinar la
concentración de PCB (en ppm).

RIO 1 RIO 2 RIO 3 RIO RIO 5


4

2 4 12 7 13

3 6 9 5 9

1 3 11 5 15

5 5 8 9 10

7 11

ni 4 5 4 4 6

Suma 11 25 40 26 65

Los datos proporcionan pruebas suficientes que indiquen diferencias en la concentración media de PCB entre los peces de los cinco ríos con un α=0.01. Se
debe usar la prueba de Tukey. Realícela.

¿Diseño no experimental? ¿Podría lograrse un diseño experimental, con que características?

Análisis de los supuestos:


1. Las observaciones dentro de cada población están distribuidas normalmente. También se puede realizar una prueba sobre la Normalidad de los errores.
Ho: Los errores ( residuales ) son Normales
Ha: Los errores ( residuales ) no son Normales
Pruebas de Normalidad para RESIDUOS
Prueba Estadístico Valor-P
Estadístico W de Shapiro- 0.913413 0.15314
Wilk

Con un nivel de significancia del 1% los errores son Normales

2. Homocedasticidad o igualdad de las varianzas de los diferentes tratamientos: Existen varias pruebas para demostrar esto, usaremos la prueba de Levene.

Ho: σ 21=σ 22=σ 23 ¿ σ 24 =σ 25


Ha: σ 2i ≠ σ 2j ∀i ≠ ji , j=1,2,3,4,5

Verificación de Varianza

Con un nivel de significancia del 1% las varianzas son iguales.

1. Hipótesis nula y alternativa:

µ1=µ 2=µ 3=µ4=µ5


H 0:
Ha:∃ µi ≠ µ j i,j=1,2,3,4,5

2. Nivel de significancia α=0.01

3. Estadística de prueba:

Para calcular la estadística de prueba es necesario seguir estos pasos.


p ni
2 2 2 2 2
SCTotal=∑ ∑ X ij – CM=2 +3 +1 +… ..+7 – CM =296.4348
i =1 j=1

p ni
2
( ∑ ∑ X ij )
(167)2
i=1 j=1
CM = =1212.5652 =
n 23
p
T 2i 112 252 402 262 65 2
SCT=∑ −CM = + + + + – CM =1428.4167 – 1212.5652=215.8515
i=1 ni 4 5 4 4 6
SCE=SCTotal – SCT =80.5833

TABLA ANOVA
FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO F calculado
VARIACION LIBERTAD CUADRADOS

TECNICAS p-1= 5-1=4 SCT = 215.8515 CMT = 712.586448/3 = CMT/CME = =


53.9629 12.0536

ERROR n-p=23 - 5=18 SCE = 80.5833 CME = 1196.630952/19 =


4.4769

TOTAL n-1=22 SCTotal = 296.4348

Tabla ANOVA
Fuente Suma de Cuadrados Gl Cuadrado Razón-F Valor-P
Medio
Entre 215.851 4 53.9629 12.05 0.0001
grupos
Intra grupos 80.5833 18 4.47685
Total (Corr.) 296.435 22

Con un nivel de significancia del 1% existen razones para creer que hay diferencias entre en la concentración media de PCB entre los peces de los cinco
ríos.

Pruebas de Múltiple Rangos


Método: 99.0 porcentaje Tukey HSD
Casos Media Grupos Homogéneos
RIO 4 2.75 X
1
RIO 5 5.0 XX
2
RIO 4 6.5 XXX
4
RIO 4 10.0 XX
3
RIO 6 10.8333 X
5

Contraste Sig. Diferencia +/- Límites


RIO 1 - RIO -2.25 5.36531
2
RIO 1 - RIO * -7.25 5.65553
3
RIO 1 - RIO -3.75 5.65553
4
RIO 1 - RIO * -8.08333 5.16277
5
RIO 2 - RIO -5.0 5.36531
3
RIO 2 - RIO -1.5 5.36531
4
RIO 2 - RIO * -5.83333 4.84311
5
RIO 3 - RIO 3.5 5.65553
4
RIO 3 - RIO - 5.16277
5 0.833333
RIO 4 - RIO -4.33333 5.16277
5
* indica una diferencia significativa.
Con un nivel de significancia del 1% existen diferencias en la concentración media de PCB entre los ríos 1 y 3, 1 y 5, y 2 y 5.

Ejemplo 3: Una compañía planea promover un nuevo producto por medio de una de tres campañas de publicidad. Para investigar la magnitud de
reconocimiento del producto con estas tres campañas se seleccionaron 15 zonas de mercado y se asignaron al azar cinco a cada campaña de publicidad. Al
final de las campañas publicitarias se seleccionaron muestras aleatorias de 400 adultos en cada zona y se registraron las proporciones de quienes estaban
familiarizados con el nuevo producto.
Campaña Campaña Campaña
1 2 3
0.33 0.28 0.21

0.29 0.41 0.30

0.21 0.34 0.26

0.32 0.39 0.33

0.25 0.27 0.31

Analice este diseño completamente al azar. ¿Se violó alguno de los supuestos del análisis de varianza en este experimento? ¿Diseño experimental?

Análisis de los supuestos:


1. Las observaciones dentro de cada población están distribuidas normalmente. También se puede realizar una prueba sobre la Normalidad de los errores.
Ho: Los errores ( residuales ) son Normales
Ha: Los errores ( residuales ) no son Normales
Pruebas de Normalidad para RESIDUOS
Prueba Estadístico Valor-P
Estadístico W de Shapiro- 0.913413 0.15314
Wilk
Con un nivel de significancia del 5% los errores son Normales

2. Homocedasticidad o igualdad de las varianzas de los diferentes tratamientos: Existen varias pruebas para demostrar esto, usaremos la prueba de Levene.

Ho: σ 21=σ 22=σ 23


Ha: σ 2i ≠ σ 2j ∀ i ≠ ji , j=1,2,3
Verificación de Varianza
Prueba Valor-P
Levene' 0.38629 0.6877
s 3

Comparación Sigma1 Sigma2 F-Ratio P-Valor


Campaña 1 / Campaña 0.05 0.063007 0.62972 0.6651
2 9 3
Campaña 1 / Campaña 0.05 0.047644 1.10132 0.9277
3 5
Campaña 2 / Campaña 0.063007 0.047644 1.7489 0.6015
3 9 5
Con un nivel de significancia del 5% las varianzas son iguales

1. Hipótesis nula y alternativa:

H0 :µ1=µ 2=µ 3
H1:∃ µi ≠ µ j i,j=1,2,3

2. Nivel de significancia α=0.05

3. Estadística de prueba:
Tabla ANOVA
Fuente Suma de Cuadrados Gl Cuadrado Razón-F Valor-P
Medio
Entre 0.01084 2 0.00542 1.86 0.1978
grupos
Intra grupos 0.03496 12 0.00291333
Total (Corr.) 0.0458 14
Con un nivel de significancia del 5% existen razones para creer que no hay diferencias entre las proporciones promedio de quienes estaban familiarizados
con el nuevo producto.

Se debe realizar la prueba de Tukey: No, debido a que no se encontraron diferencias entre los promedios de acuerdo al ANOVA.

¿Se violó algún supuesto? No. Cuando no se cumplen los supuestos del ANOVA a menudo se remedia transformando los datos de la respuesta. Es decir, en
lugar de usar los datos originales, se podrían usar raíces cuadradas, logaritmos, o alguna otra función de la respuesta. Las transformaciones tienden a
estabilizar la varianza de la respuesta. Cuando no se logra nada con las transformaciones, se debe utilizar la estadística no paramétrica.

Ejemplo 4: Cuatro grupos de estudiantes se sometieron a técnicas de enseñanza diferentes y se examinaron al final de un periodo específico de tiempo.
Debido a las bajas en los grupos experimentales (por enfermedad, transferencias, etc.), el número de estudiantes en los grupos no fue el mismo. Presentan
los siguientes datos suficiente evidencia para concluir que hay diferencias en el rendimiento medio correspondiente a las cuatro técnicas?.
TECNICAS ( i )

J 1 2 3 4

1 65 75 59 94
2 87 69 78 89

3 73 83 67 80

4 79 81 62 88

5 81 72 83

6 69 79 76

7 90

ni 6 7 6 4

Ti 454 549 425 351

Supuestos:

1. Homocedasticidad o igualdad de las varianzas de los diferentes tratamientos: En la misma ruta para realizar el ANOVA, se escoge la opción de
“verificación de la varianza”, Existen varias pruebas para demostrar esto, usaremos

la prueba de Levene.

Ho: σ 21=σ 22=σ 23 =σ 24

Ha: σ 2i ≠ σ 2j ∀i ≠ ji , j=1,2,3,4

Verificación de Varianza

Prueba Valor-P
Levene' 1.21784 0.3304
s
Comparació Sigma1 Sigma2 F-Ratio P-Valor
n
1-2 8.16497 7.11471 1.31703 0.7379
1-3 8.16497 9.57949 0.72648 0.7344
1-4 8.16497 5.79511 1.98511 0.6075
2-3 7.11471 9.57949 0.55160 0.4892
6
2-4 7.11471 5.79511 1.50727 0.7916
3-4 9.57949 5.79511 2.73251 0.4375
Con un nivel de significancia del 0.05, existe evidencia para pensar que las varianzas del rendimiento de las diferentes técnicas son iguales.

2. Debe existir Normalidad en los errores, se escoge esta opción:

Se calculan los residuos, y posteriormente se hace una prueba de Normalidad de Shapiro-Wilks:

Ho: Los errores son Normales


Ha: Los erroresno son Normales

Pruebas de Normalidad para RESIDUOS

Prueba Estadístico Valor-P


Estadístico W de Shapiro- 0.954135 0.35769
Wilk
Con un nivel de significancia del 0.05, existen razones para pensar que los residuos son Normales o siguen una distribución Normal. Luego el
procedimiento de ANOVA es válido.
1. Hipótesis nula y alternativa:

H0 : µ1=µ 2=µ 3=µ4


H1:∃ µi ≠ µ ji,j=1,2,3,4

2. Nivel de significancia α=0.05

3. Estadística de prueba:
Para calcular la estadística de prueba es necesario seguir estos pasos.

p ni
SCTotal=∑ ∑ X 2ij – CM=652+ 872 +732 +… ..+882 – CM =1909.2174
i =1 j=1

p ni
2
( ∑ ∑ X ij )
(1779)2
i=1 j=1
CM = =
=137601.7826
n 23
p
T 2i 454 2 5492 425 2 3512
SCT=∑ −CM = + + + – CM =138314.369 – 137601.7826=712.586448
i=1 ni 6 7 6 4

SCE=SCTotal – SCT =1196.630952

TABLA ANOVA
FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO F calculado
VARIACION LIBERTAD CUADRADOS

TECNICAS p-1= 4-1=3 SCT = 712.586448 CMT = 712.586448/3 = 237.528816 CMT/CME = 3.771461449

ERROR n-p=23 - 4=19 SCE = 1196.630952 CME = 1196.630952/19 = 62.98057642

TOTAL n-1=22 SCTotal =


1909.2174

Si se diseña el archivo de esta forma:

Ruta en Statgraphics para análisis de varianza: CompararVarias muestrasComparación de varias muestrasMultiples columnas de datosAceptarSe seleccionan todas
las columnas y se asignan en “Muestras”Aceptar. Se escogen las siguientes opciones: Tabla ANOVA, Prueba de Múltiples rangos, Verificación de la varianza  Aceptar.

Si se diseña el archivo de esta forma:

RENDIMIENTO TECNICA

65 1

87 1

73 1

79 1

81 1

69 1

. .

. .

94 4

89 4

80 4

88 4
Ruta en Statgraphics: Compararanálisis de varianzaANOVA simpleVariable: Rendimiento; Factor: Técnica, AceptarTabla ANOVA, Prueba de múltiples rangos.

Tabla ANOVA
Fuente Suma de Cuadrados Gl Cuadrado Razón-F Valor-P
Medio

Entre 712.586 3 237.529 3.77 0.0280


grupos

Intra grupos 1196.63 19 62.9806

Total (Corr.) 1909.22 22

4. Región de rechazo: La prueba solo se hace hacia la cola derecha. Se usa la distribución F. Valores de la estadística de prueba superiores a 3.13 se
rechaza la H0.

5. Decisión: En este caso el valor de 3.771461449 es superior a 3.13, entonces se rechaza Ho, con un nivel de significancia del 0.05 existe evidencia para
pensar que el rendimiento medio correspondiente a las cuatro técnicas de enseñanza es diferente.

Dado que se encontraron diferencias entre los promedios, entonces se debe aplicar la prueba de Tukey para saber cuáles promedios son diferentes. Se
deben seguir los siguientes pasos:
Ho=μi =μ j
Ha=μi ≠ μ j
∀ i≠j i,j=1,2,3,4

1. Se calculan los promedios de cada tratamiento:


Técnicas 1 2 3 4

Promedio 75.6667 78.4286 70.8333 87.75

2. Se calcula el valor crítico de Tukey:


CME 1 1 62.9806 1 1 62.9806 1 1
ω=q ɑ ( p , v )
√ ( )
+ =q 0.05 ( 4,19 )
2 ni n j 2 √
+ =3.977
ni n j 2 ( +
ni n j ) √ ( )
CME 1 1
3. Comparación entre | X́ i− X́ j| y q ɑ(p ,v)
√ 2
( + )
ni n j

Comparaciones entre ni , n j | X́ i− X́ j| 3.977 Diferencias μi ? μ j


promedios 62.9806 1 1 ?

√ 2
( + )
ni n j

X́ 1 − X́ 2 6,7 |75.6667−78.4286|=2.7619 12.4163 NO μ1=μ 2

X́ 1 − X́ 3 6,6 |75.6667−70.8333| 12.8850 NO μ1=μ3


=4.8334

X́ 1 − X́ 4 6,4 |75.6667−87.75|=12.0833 14.4058 NO μ1=μ 4

X́ 2 − X́ 3 7,6 |78.4286−70.8333|=7.5953 12.4163 NO μ2=μ 3

X́ 2 − X́ 4 7,4 |78.4286−87.75|=9.3214 13.9882 NO μ2=μ 4

X́ 3 − X́ 4 6,4 |70.8333−87.75|=¿16. 14.4058 SI μ3 ≠ μ 4


9167

Luego existen diferencias entre el rendimiento medio de las técnicas 3 y 4 con un nivel de significancia del 0.05.

La salida del paquete Statgraphics es:


Pruebas de Múltiple Rangos
Casos Media Grupos Homogéneos

3 6 70.833 X
3

1 6 75.666 XX
7

2 7 78.428 XX
6

4 4 87.75 X

Se han identificado dos grupos homogéneos, según la alineación de las X´s, en este caso el rendimiento de la la técnica 1,2,y 3 son homogéneas y 1,2 y 4
pertenecen a otros grupo homogéneo. No existen diferencias estadísticamente significativas entre los promedios de rendimiento de las técnicas que
compartan una misma columna de X's.

Método: 95.0 porcentaje Tukey HSD


Contra Si Diferen +/-
ste g. cia Límit
es

1-2 - 12.41
2.7619 93

1-3 4.8333 12.88


3 81

1-4 - 14.40
12.083 94
3

2-3 7.5952 12.41


4 93

2-4 - 13.99
9.3214 16
3

3-4 * - 14.40
16.916 94
7

* indica una diferencia significativa.


Ejemplo 5:Se utilizaron tres localidades diferentes para colectar mediciones de ozono, en partes por millón. Se colectaron cantidades de ozono en 5 muestras
en cada localidad.

LOCALIDAD

A B C

0.09 0.15 0.10

0.10 0.12 0.13

0.08 0.18 0.08

0.08 0.17 0.08

0.11 0.14 0.09

ni 5 5 5

Ti 0.46 0.76 0.48

Existen diferencias entre las cantidades promedio de ozono por localidad. Se debe usar la prueba de Tukey. Realícela.

Supuestos:

1. Homocedasticidad o igualdad de las varianzas de los diferentes tratamientos: En la misma ruta para realizar el ANOVA, se escoge la opción de
“verificación de la varianza”, Existen varias pruebas para demostrar esto, usaremos la prueba de Levene.

Ho: σ 21=σ 22=σ 23

Ha: σ 2i ≠ σ 2j ∀ i ≠ ji , j=1,2,3
Verificación de Varianza

Prueba Valor-
P
Levene' 0.75340 0.4918
s 8

Comparación Sigma1 Sigma2 F-Ratio P-Valor


A/B 0.013038 0.023874 0.298246 0.2682
4 7
A/C 0.013038 0.020736 0.395349 0.3907
4 4
B/C 0.023874 0.020736 1.32558 0.7914
7 4
Con un nivel de significancia del 0.05, existe evidencia para pensar que las varianzas de las cantidades de ozono de las diferentes localidades son iguales.

2. Debe existir Normalidad en los errores, se escoge esta opción:

Se calculan los residuos, y posteriormente se hace una prueba de Normalidad de Shapiro-Wilks:

Ho: Los errores son Normales


Ha: Los erroresno son Normales

Pruebas de Normalidad para RESIDUOS

Prueba
Estadístico W de Shapiro-Wilk

Estadístic Valor-P
o
0.958206 0.631153
Con un nivel de significancia del 0.05, existen razones para pensar que los residuos son Normales o siguen una distribución Normal. Luego el
procedimiento de ANOVA es válido.

1. Hipótesis nula y alternativa:


H0: µ1=µ 2=µ 3
H1:∃ µi ≠ µ j ∀ i ≠ j i , j=1,2,3

2. Nivel de significancia α=0.05

3. Estadística de prueba:
Para calcular la estadística de prueba es necesario seguir estos pasos.

p ni
SCTotal=∑ ∑ X 2ij – CM=0.092+ 0.102+ 0.082 +… ..+0.092 – CM =0.0159
i =1 j=1

p ni
2
( ∑ ∑ X ij )
(1.7)2
i=1 j=1
CM = =0.1927 =
n 15
p
T 2i 0.462 0.76 2 0.482
SCT=∑ −CM = + + – CM =0.20392 – 0.1927=0.0112
i=1 ni 5 5 5

SCE=SCTotal – SCT =0.00468

TABLA ANOVA
FUENTE DE VARIACION GRADOS DE LIBERTAD SUMA DE CUADRADO MEDIO F calculado

CUADRADOS

TECNICAS p-1= 3-1=2 SCT = 0.0112 CMT = 0.0112/2 = 0.0056 CMT/CME = 14.3590

ERROR n-p=15 - 3=12 SCE = 0.00468 CME = 0.00468/12 =


0.00039

TOTAL n-1=14 SCTotal =


0.0159

Tabla ANOVA
Fuente Suma de Cuadrados Gl Cuadrado Razón-F Valor-P
Medio

Entre 0.0112533 2 0.00562667 14.43 0.0006


grupos

Intra grupos 0.00468 12 0.00039

Total (Corr.) 0.0159333 14

4. Región de rechazo: La prueba solo se hace hacia la cola derecha. Se usa la distribución F con 2 grados de libertad en el numerador y 12 en el
denominador con ɑ=0.05, el valor critico es 6.93. Valores de la estadística de prueba superiores a 6.93 se rechaza la H0.

5. Decisión: En este caso el valor de 14.3590 es superior a 6.93, entonces se rechaza Ho, con un nivel de significancia del 0.05 existe evidencia para pensar
que las cantidades promedio de ozono son diferentes en las tres localidades.

Dado que se encontraron diferencias entre los promedios, entonces se debe aplicar la prueba de Tukey para saber cuáles promedios son diferentes. Se
deben seguir los siguientes pasos:
Ho=μi =μ j
Ha=μi ≠ μ j
∀ i≠j i,j=A,B,C
1. Se calculan los promedios de cada tratamiento:
Técnicas 1 2 3

Promedio 0.092 0.152 0.096

2. Se calcula el valor crítico de Tukey:


CME 1 1 0.00039 1 1 0.00039 1 1
ω=q ɑ ( p , v )
√ ( )
+ =q 0.05 ( 3,12 )
2 ni n j 2√ ( )
+ =3.773
5 5 2 √
+ =0.0333
5 5 ( )
CME 1 1
3. Comparación entre

| X́ i− X́ j| y q ɑ(p ,v) 2
( + )
ni n j

Comparaciones entre ni , n j | X́ i− X́ j| ω Diferencias μi ? μ j


promedios ?

X́ A − X́ B 5,5 |0.092−0.152|=0.06 0.0333 SI μ A ≠ μB

X́ A − X́ C 5,5 |0.092−0.096|=0.0040.0333 NO μ A =μC

X́ B− X́ C 5,5 |0.152−0.096|=0.0520.0333 SI μ B ≠ μC

Luego existen diferencias entre las cantidades promedio de ozono en las localidades A y B y entre las B y C con un nivel de significancia del 0.05.

Método: 99.0 porcentaje Tukey HSD


Caso Medi Grupos
s a Homogéneo
s

A 5 0.092 X

C 5 0.096 X

B 5 0.152 X

Se han identificado dos grupos homogéneos, según la alineación de las X´s, en este caso la cantidad de ozono de la localidad A y son homogéneas y la
localidad B difiere de las localidades anteriores. No existen diferencias estadísticamente significativas entre aquellas localidades que compartan una misma
columna de X's.

Contrast Sig. Diferencia +/- Límites


e

A-B * -0.06 0.044174

A-C -0.004 0.044174

B-C * 0.056 0.044174


* indica una diferencia significativa.

También podría gustarte