Está en la página 1de 52

ESCUELA DE POST GRADO DE LA UNIVERSIDAD NACIONAL DE TUMBES

MAESTRIA EN GESTION PUBLICA

METODOS ESTADISTICOS APLICADOS A LA


INVESTIGACION

ANOVA DE UN FACTOR

Mag. JUAN BLAS PEREZ


La técnica de análisis de varianza (ANOVA) también conocida como análisis

factorial y desarrollada por Fisher en 1930, constituye la herramienta básica para el

estudio del efecto de uno o más factores (cada uno con dos o más niveles) sobre la

media de una variable continua. Es por lo tanto el test estadístico a emplear cuando

se desea comparar las medias de dos o más grupos. Esta técnica puede generalizarse

también para estudiar los posibles efectos de los factores sobre la varianza de una

variable.
También llamado ANOVA unifactorial es una técnica estadística que señala si dos
variables (una dependiente y otra independiente) están relacionadas, en base a si las
medias de la variable dependiente son diferentes en las categorías o grupos de la
variable independiente. Es decir señala si la media entre dos o más grupos son similares
o diferentes

Como usar el anova de un factor.- Usamos ANOVA de un factor cuando queremos


saber si las medias de una variable son diferentes entre los niveles o grupos de otra
variable.

En ANOVA de un factor solo se relacionan dos variables: una variable dependiente (o a


explicar) y una variable independiente (que en esta técnica se suele llamar factor)
 La variable dependiente es cuantitativa (escalar) y la variable independiente
es categórica (nominal u ordinal)
 El procedimiento funciona comparando las varianzas entre las medias de los
grupos y la varianza dentro de los grupos como una manera de determinar si
los grupos son todos parte de una población mas grande o poblaciones
separadas con características diferentes.

SUPUESTOS

 La variable de interes debe ser continua


 La variable de interes debe tener una distribucion aproximadamente
normal dentro de cada grupo
 Homogeneidad de varianzas
 Las observaciones deben ser independientes entre si
Aleatorización
Consiste en la asignación aleatoria de los tratamientos a
las unidades experimentales.
Factor
Es una variable independiente que afecta los resultados del
experimento.
A los distintos valores que son estudiados se les llama niveles del
factor.
Niveles del Factor: Cada uno de los resultados de un factor.
Los factores (tratamiento) pueden ser cualitativos o
cuantitativos.
Ejemplos de factores cualitativos y sus niveles respectivos :
• Proveedor (diferentes proveedores de una materia prima),
• Tipo de máquina (diferentes tipos o marcas de máquinas),
• Trabajador (los trabajadores encargados de hacer una
tarea),
• Tipo de procesador (los procesadores de los que se
quiere comparar su velocidad de ejecución),
Ejemplos de factores cuantitativos son los
siguientes:
• Tamaño de memoria (diferentes tamaños de
memoria de ordenadores),
• Droga (distintas cantidades de la droga),
• La temperatura (conjuntos de temperaturas
seleccionadas en unos rangos de interés).
Tratamiento
Corresponde a una combinación de los niveles de los distintos factores en
estudio, pudiendo ser estos uno o más.
Testigo
Es un tratamiento de comparación en el que no se aplica procedimiento
alguno. También se le conoce como tratamiento control.
Unidad experimental
Es la unidad a la cual se le aplica un tratamiento, en el que se mide y se
analiza la variable que se investiga.
Análisis de Varianza
Es una técnica estadística que permite descomponer la variabilidad total de
los resultados de un experimento en sus distintas fuentes (Factores
tratamientos, bloques, interacciones entre factores, covariables, error
experimental), con la finalidad de compararlas e identificar su importancia
relativa en la explicación de la variabilidad total.
Diseño Completamente al Azar (DCA)

El diseño completamente al azar (DCA) es el más simple de todos


los diseños.
• Es un diseño en el cual los tratamientos son asignados
aleatoriamente a las unidades experimentales sin ningún tipo de
restricción.
Formulación de hipótesis
H 0 : 1   2  .........   k
H 1 : al menos un  i es diferente :
α = 0.05

Análisis de varianza
Fuentes de
Variación
(ANVA)
Sumas de
Cuadrados
Grados de
Libertad
Cuadrados Medios
(CM)
Estadístico de
Prueba
(FV) (SC) (gl) (Fc)

Tratamientos SCTrat t 1 CMTrat CM Tratam


Error CM Error
Experimental SCE t (r  1) CMError

Total tr 1
F.C.= Factor de Corrección

Y 2 Y..2
F .C 
t ri
SC (Total)   Y  2 ..

i 1 j 1
ij
r. r.

Yi.2 t
SC (Tratamientos)    F .C
i 1 ri

SC ( Error )  SC (Total )  SC (Tratamient os )


CME
C.V %  
Y..
Decisión:
CM Trat
Ftab.  F1 , ( gl ( trat ), gl ( err )) Fcal 
CM Error

Método tabular
Si el Estadístico de prueba
se acepta la H 0 o se rechaza la H1
Fcal  Ftab
se rechaza la H 0 o se acepta la H1
Fcal  Ftab
Cuadro 1: Concentración de los datos para un Diseño Completamente al Azar con “i”
tratamientos y “j” repeticiones

Tratamientos
1
Repeticiones
2 3 ……j Y i.

1 Y11 Y12 Y13 Y1j Y1.


2 Y21 Y22 Y23 Y2j Y2.
3 Y31 Y32 Y33 Y3j Y3.
…..i Yi1 Yi2 Yi3 Yij Yi.

Y .j
Y.1 Y.2 Y.3 Y.j Y..
DCA Con desigual Nº de observaciones por Tratamiento

TRATAMIENTOS

1 2 3 4

Y11 Y21 Y31 Y41

Y12 Y22 Y32 Y42

Y13 Y23 Y33 Y43

Y14 Y24 Y34 Y44

Y15 Y25 Y35 Y45

Y26
Pruebas de Comparación de Medias de Tratamientos
Permiten efectuar un conjunto de comparaciones para poder averiguar
conque tratamiento obtiene mejores resultados y también que tratamiento es
significativamente superior a los demás
Prueba t
Es una prueba para comparaciones planeadas con anterioridad. El nivel de
significación se toma como un error individual. Los supuestos para la
realización de esta prueba son:

Caso A Caso B Caso C

H 0 : i   j  k H 0 : i   j  k H 0 : i   j  k
H1 : i   j  k H1 : i   j  k H1 : i   j  k
(Yi.  Y j . )  k
t cal  → t( gl.error )
sd
1 1
sd  CME (  ) desv. standar de la diferencia de las medias muestrales
ri rj
Si todos los tratamientos tienen el mismo número de repeticiones
(Yi.  Y j . )  k
t cal 
2CME
r
Ho se rechaza si tcal > ttab
PRUEBA DLS.- Prueba t para el caso bilateral. La prueba consiste en
calcular una diferencia limite significativa. (DLS)

H 0 : i   j
H1 : i   j

DLS  t (1 s
, glerror ) d
2
1 1
sd  CME (  ) desv. standar de la diferencia de las medias muestrales de los 2 tratam.
ri rj

H 0 se rechaza con  si Yi.  Y j.  DLS


PRUEBA DE TUKEY
Hipotesis
H0 : µi = µij
i  j

H1 : µi ≠ µj

Consiste en calcular un valor teórico común o diferencia mínima significativa

W  q( ,t ,Glerr ) S d
Desviación estándar de la diferencia de las medias muestrales de dos
CME
Sd  tratamientos cuando los tratamientos tienen el mismo número de
r repeticiones.

cuando los tratamientos no tienen el mismo número


CME 1 1
Sd  (  ) de repeticiones.
2 ni nj
1. Se realizo un experimento para evaluar el efecto de la adición de
compuestos vitamínicos al alimento balanceado en la ganancia de
peso en cerdos. Tres diferentes compuestos fueron evaluados ( A, B y
C ) y un control (D – sin la adición de compuesto vitamínico). El
aumento de peso tras una semana en una muestra aleatoria de 22
cerdos se da a continuación:
COMPUESTO VITAMINICO Aumento de peso tras una semana en lib
A 11.1 10.9 10.8 10.2 11.4 10.7
B 11.5 11 10.8 10.6 11.2 10.9
C 10.1 10.6 11.2 10.2 10.4
D 9.2 9.8 10.1 9.7 10.4
COMPUESTO VITAMINICO
A B C D
11.1 11.5 10.1 9.2
10.9 11 10.6 9.8
10.8 10.8 11.2 10.1
10.2 10.6 10.2 9.7
11.4 11.2 10.4 10.4
10.7 10.9

Totales Yi. 65.1 66 52.5 49.2 Y.. = 232.8


ni = r 6 6 5 5 n = 22 = r.

Yi . 10.85 11 10.5 9.84 Y..  10 .55


es la ganancia de peso obtenida en el j-esimo cerdo alimentado con el i-esimo
Yij  compuesto vitamínico

 = es el efecto de la media general de las ganancias de peso

i  es el efecto del i-esimo compuesto vitamínico

t 4 (Numero de tratamientos)
H0 = Todos los compuestos vitamínicos tienen el mismo efecto en la ganancia de peso de los
cerdos
H1 = Con al menos uno de los compuestos vitamínicos se obtiene una ganancia de peso
diferente

  0.05
H 0 : 1   2   3   4  0
H 1 :  i  0 al menos para un i
CM (trat)
FCal 
CM (error)

Ftab  F0.95;3,18  3.16


Ftab  F1 ;GL ( trat ),GL ( error )
2
t Yri
SC (Total)   Yij2  .. Y..2
i 1 j 1 r. F .C 
r.

232 .8 2
(11 .1  10 .9  ....  10 .4 ) 
2 2 2
 7.1527
22
Yi.2t
SC (Tratamientos)    F .C
i 1 ri

65.12 662 52.52 49.2 2


SC(Tratamientos)      2463.45  4.2657
6 6 5 5

SC ( Error )  SC (Total )  SC (Tratamient os )

SC ( Error )  7.1527  4.2657  2.8870


H0 = Todos los compuestos vitamínicos tienen el mismo efecto en la ganancia de peso de los
cerdos
H1 = Con al menos uno de los compuestos vitamínicos se obtiene una ganancia de peso
diferente
  0.05
FCal 
CM (trat) Ftab  F1 ;GL ( trat ),GL ( error )
CM (error)

Ftab  F0.95;3,18  3.16


Los efectos estimados de los tratamientos
2
t Y
ri
SC (Total)   Yij2  .. Y..2
i 1 j 1 r. F .C 
232 .8 2 r.
(11 .1  10 .9  ....  10 .4 ) 
2 2 2
 7.1527
22
Y 232 .8 2 2

t Y2
F .C    2463 .45
..

SC (Tratamientos)   i.  F .C r 22 .

i 1 ri
65.12 66 2 52.52 49.2 2
SC (Tratamientos )      2463.45  4.2657
6 6 5 5

SC ( Error )  SC (Total )  SC (Tratamient os )

SC ( Error )  7.1527  4.2657  2.8870


ANALISIS DE VARIANZA

ANVA
F.V. S.C G.L S.C Fcal Pvalue Ftab

Tratmtos 4.266 3 1.4219 8.8654 0.0008 3.1599


Error 2.887 18 0.1604

Total 7.1527 21

Ftab  F0.95;3,18  3.16 < FCal  8.87


ANALISIS DE VARIANZA HECHO EN SPSS

ANOVA de un factor

AUMENTO DE PESO EN libras

F.V. Suma de gl Media F Sig.


cuadrados cuadrática
Tratamientos 4,266 3 1,422 8,865 ,001
Error 2,887 18 ,160
Total 7,153 21

Ftab  F0.95;3,18  3.16 <


FCal  8.87
Se rechaza H0

Con al menos uno de los compuestos vitamínicos se obtiene una


ganancia de peso diferente

Coeficiente de Variación

CME 0.1604
C.V    3.80%
Y 10.55
..
RESUMEN
Grupos Cuenta Suma Promedio Varianza
A 6 65.1 10.85 0.163
B 6 66 11 0.1
D 5 52.5 10.5 0.19
D 5 49.2 9.84 0.203
10.5475
HOMOGENEIDAD DE VARIANZAS-BARLETT

Promedio Varianza (ri-1) (ri-1)Si^2 (ri-1)LnSi^2


10.85 0.163 5 0.815 -9.07002539
11 0.1 5 0.5 -11.5129255
10.5 0.19 4 0.76 -6.64292483
9.84 0.203 4 0.812 -6.3781972
10.5475 18 2.887 -33.6040729

H :      
0
2
1
2
2
2
3
4
4

H : Al menos para un  es diferente


1
2
i

α = 0.05
S  0.163 S  0.1 S  0.19
2
1
2
2 3
2
S  0.203
2
4

2.887
S  2
p
 0.1604
18
 32.94277  (33.60407 )
Q
1 1 1 1 1 1 
1  (    )
3(4  1)  5 5 4 4 18 
0.66193
Q 0.66193
1 2 2 1    0.6095
1  (    1.0861
9  5 4 18 

 
2
tab 1 ,t 1
 2
1 0.05 , 3
 7.815
 Q
2
tab

Se acepta la Ho
Evaluar si el aumento de peso logrado por el compuesto vitamínico B
superaba al logrado con D en más de una libra
H0 : B  D  1
H1 :  B   D  1
ttab  t0.95,18  1.734
(Yi.  Y j . )  k (11  9.84)  1
t cal    0.6598
sd 0.2425

1 1 1 1
sd  CME (  )  0.1604(  )  0.2425
ri r j 6 5

ttab  t0.95,18  1.734


Se acepta H0 . En conclusión no existe suficiente evidencia
estadística para aceptar que el aumento de peso logrado por el
comp. Vitam. B supere al logrado con D en mas de una libra.
Aplique la prueba DLS para comparar los tratamientos A y B
H0 :  A  B
H1 :  A   B

1 1 1 1
DLS  t ( 0.975,18) CME (  )  2.101 0.1604(  )  0.4858
rA rB 6 6

H 0 se rechaza con  si YA.  YB. 

10.85.  11.  0.15 < 0.4858 Se acepta H0

No existe suficiente evidencia estadística para aceptar que la


ganancia de peso obtenida con el compuesto vitamínico A sea
diferente a la obtenida con el compuesto vitamínico B
PRUEBA DE TUKEY
Hipotesis

H0 : µi = µij
i  j
H1 : µi ≠ µj

Consiste en calcular un valor teórico común o diferencia mínima significativa

W  q( ,t ,Glerr ) S d

CME Desviación estándar de la diferencia de las medias muestrales de


Sd 
r dos tratamientos cuando los tratamientos tienen el mismo
número de repeticiones.
CME 1 1 Si los tratamientos no están igualmente
Sd  (  )
2 ni n j repetidos entonces

α = Nivel de significación de la tabla Tukey, se considera 0.05 o 0.01

t = Numero de tratamientos
Glerr. = grados de libertad del error
Regla de decisión

H0 se rechaza con un nivel de significancia α si Yi.  Y j.  W


• Aplique la prueba de Tuckey para evaluar la significancia de las diferencias
ente los tratamientos

H 0 :  A  B H 0 :  A  C H 0 :  A  D
H1 :  A   B H 1 :  A  C H1 :  A   D

H 0 :  B  C H 0 : B  D H 0 : C   D
H 1 :  B  C H1 :  B   D H 1 : C   D
Tratamientos Numero de
comparados repeticiones CME 1 1 W Yi.  Y j. Significancia
(  )
2 ri r j
A y B 6 y 6 0.1635 0.6540 0.15 n.s
A y C 6 y 5 0.1715 0.6859 0.35 n.s
A y D 6 y 5 0.1715 0.6859 1.01 *
B y C 6 y 5 0.1715 0.6859 0.50 n.s

B y D 6 y 5 0.1715 0.6859 1.16 *

C y D 5 y 5 0.1791 0.7164 0.66 n.s


• n.s. significa que la diferencia entre ambos tratamientos no es
significativo (es decir, que no existe evidencia suficiente para
rechazar Ho)
• * significa que la diferencia entre ambos tratamientos si es
significativo.
Comparaciones múltiples
Variable dependiente: AUMENTO DE PESO EN libras
HSD de Tukey
(I) COMPUESTO (J) COMPUESTO Diferencia de Intervalo de confianza al 95%
VITAMINICO VITAMINICO Error típico Sig.
medias (I-J) Límite inferior Límite superior
B -,15000 ,23122 ,915 -,8035 ,5035
A C ,35000 ,24251 ,490 -,3354 1,0354
D 1,01000* ,24251 ,003 ,3246 1,6954
A ,15000 ,23122 ,915 -,5035 ,8035
B C ,50000 ,24251 ,203 -,1854 1,1854
D 1,16000* ,24251 ,001 ,4746 1,8454
A -,35000 ,24251 ,490 -1,0354 ,3354
C B -,50000 ,24251 ,203 -1,1854 ,1854
D ,66000 ,25329 ,077 -,0559 1,3759
A -1,01000* ,24251 ,003 -1,6954 -,3246
D B -1,16000* ,24251 ,001 -1,8454 -,4746
C -,66000 ,25329 ,077 -1,3759 ,0559
*. La diferencia de medias es significativa al nivel 0.05.
PRUEBA DE DUNNET
La prueba de Dunnet es utilizada cuando se quiere comparar a
cada uno de los tratamientos contra el tratamiento testigo o
control. En esta prueba, el error también es familiar. Los
supuestos para la realización de esta prueba son
• Varianzas homogéneas
• Y las muestras son extraidas al azar
H 0 : T   i i  T (tratamien to testigo)
H 1 : T   i

Amplitud Limite significativa de Dunnet

ALS(Dn) = t(Dn)sd

t(Dn) es el valor de la tabla para la prueba, obtenida desde la tabla de


Dunnet con α = nivel de significancia, p = número de tratamientos
del experimentos sin incluir el control y los grados del error del
error experimental
2CME
Sd  desviacion standar de la diferencia , cuando los tratamientos tienen el
r
mismo numero de repeticiones

1 1
S d  CME (  ) desviacion standar de la diferencia , cuando los tratamientos
rT ri
no tienen el mismo numero de repeticiones

Regla de decisión

H0 se rechaza con α si YT .  Yi ,  ALS ( Dn)


Aplique la prueba de Dunnet para evaluar la significancia de las
diferencias de los tratamientos con el tratamiento testigo
En este caso se piensa evaluar un conjunto de hipótesis

H 0 : D   A H 0 : D  B
H1 :  D   A H1 :  D   B
Valor de la Tabla con α = 0.05 p = 4 pero considerando el control el control y 18
g.l del error experimental (Dn) = 2.56 .Como los tratamientos tienen diferente
número de repeticiones.

Tratamientos Numero de
comparados repeticiones ALS(Dn) Significancia

D y A 5 y 6 0.2425 0.6208 1.01 *


D y B 5 y 6 0.2425 0.6208 1.16 *
D y C 5 y 5 0.2533 0.6844 0.66 *

También podría gustarte