Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Comparaciones multiples
Supuestos del ANOVA
Transformaciones mas comunes
Numero de repeticiones
1. No rechazar H0 Cuando no se rechaza, se cree que hasta allí llega el análisis de los datos en cuanto a
las comparaciones de tratamientos, pero esto no es cierto debido a que la prueba F hace una comparación
simultánea global sobre todos los tratamientos, es posible que este hecho no permita detectar algunas
diferencias reales entre estos.
2. Rechazar H0 En este caso el investigador desearía conocer cuáles tratamientos son diferentes y cuales
de ellos se comportan de igual manera, pero la prueba F no permite resolver esto porque solamente
informa de una manera global que existe diferencia entre todos ellos.
Otro situación sucede cuando el investigador al planear su estudio diseña comparaciones específicas
entre tratamientos; esto resulta algunas veces casi imposible cuando se desconoce el comportamiento de
los tratamientos como sucede en investigaciones de tipo exploratorio, caso en el cual las comparaciones
surgen luego de observar los datos.
Pruebas planeadas
Estas resultan un poco difícil de construir en experimentos puramente exploratorios y no solo son
comparaciones entre pares de medias, sino comparaciones que involucran más de un par de medias. Algunas
técnicas utilizadas para comparaciones de éste tipo son:
- Contrastes simples
- Contrastes ortogonales
Son una herramienta muy utilizada, sin embargo puede fácilmente dárseles mal uso, para evitar esto
se deben seguir los siguientes principios:
1. Deben ser planeadas porque si se eligen las comparaciones según lo que indiquen los datos, se
incrementa la probabilidad de cometer error tipo I.
2. Deben ser limitadas en número, esto evita el problema de ``expedición de pesca'' en el que se
requiere buscar solo diferencias significantes y de esta manera poder tener alto riesgo de obtener
conclusiones inválidas
Todos contra todos: LSD ó DMS, Duncan, Tukey, Scheffe, Bonferroni, etc.
Todos contra un control: Dunnett
𝑡 𝑡!
Se realizan = comparaciones
2 2! 𝑡 − 2 !
Hipótesis H 0 : i j - vs - H1 : i j Para i j
1 1 Cuando el diseño es
DMS t ( / 2, glerror) CM EE
r r desbalanceado
i j
Estadístico
2CM EE
DMS t ( / 2, glerror) Cuando el diseño es balanceado
r
Criterio de decisión
Ventajas
1. Fácil de realizar
2. Es válida cuando se han planeado las comparaciones que se van a hacer previamente a la obtención de los
resultados.
Desventajas
Puede dar resultados falsamente significativos en un nivel del 0.05 si el experimentador se dedica a hacer
comparaciones exclusivamente entre tratamientos de resultados extremos.
En el caso de que hubiera que hacer preferentemente comparaciones de resultados extremos, es necesario optar por un
nivel de 0.01 en lugar de 0.05
Hipótesis H 0 : i j - vs - H1 : i j Para i j
Donde:
es el nivel de significancia Criterio de decisión:
Se rechaza H0 si:
X i X j T
t es el numero de tratamientos
El valor de q se encuentra en la tabla de TUKEY
Norbey Marín Arredondo - Estadístico 10
PRUEBA DE RANGO MULTIPLE DE DUNCAN
Se utiliza para comparar todos los pares de medias.
Fue desarrollado por primera vez por Duncan en 1951 pero posteriormente él mismo modificó su
primer método generando el que ahora se denomina Nuevo método de Rango Múltiple de Duncan.
Esta prueba no requiere de una prueba previa de F, como sucede con la DMS o sea que aún sin ser
significativa la prueba F puede llevarse a cabo.
Hipótesis H 0 : i j - vs - H1 : i j Para i j
CM EE
Estadístico R p q( , p. gl EE ) SY y SY
r
Donde:
es el nivel de significancia
p es el numero de medis inclusive entre las dos madias a comparar
El valor de q se encuentra enla tabla de DUNCAN
p 2 3 ... t
q(α,p,glEE) q2 q3 ... qt
Sy SY SY ... SY
Rp q2 SY q3 SY ... qtSY
t
r~ 2
t R
r
j 1
j 1 / r1 1 / rt
r1 y rt son el numero de repeticiones del tratamiento mas pequeño y mas grande respectivamente
2CM EE
DU d t 1, glee Cuando el diseño es balanceado
r
Estadístico
1 1 Cuando el diseño es
DU d t 1, glee CM EE *
r desbalanceado
0 rj
1 1
𝑆= (𝑡 − 1)𝐹(𝛼,𝑡−1,𝑔𝑙𝑒𝑟𝑟𝑜𝑟) 𝐶𝑀𝐸 + Cuando el diseño es balanceado
𝑟𝑖 𝑟𝑗
Si se desea tener una tasa de error por familia determinada, a que nivel de significancia se deben
realizar las comparaciones individuales
Por ejemplo, si se quiere tener una tasa de error por familia del 5%, para un experimento con 10
comparaciones, el nivel de significancia de cada comparación debe ser:
𝛼 = 1 − 1 − 0,05 1/10
𝛼 = 0,005
Uno de este tipo de funciones son los llamados contrastes. Un contraste denotado por C se define
como una combinación lineal de medias o efectos de tratamientos y se denota por la expresión:
C c1 1 c2 2 ct t
Reemplazando
ˆ c Y c Y c Y
C 1 1 2 2 t t
t
H1 : C 0 ó H1 : c j j 0
t
H0 : C 0 ó H0 : c j j 0
j 1 j 1
t
Sí C1 y C2 son contrastes, estos son ortogonales si y solo si: c
j 1
c 0
1j 2j
t
Q2
Donde: Q c jY . j SC (C i ) SC (C i )
j 1
t
r c j 2 Fc
CM EE
j 1
Se rechaza H0 si, Fc > F(,1,glerror)
1 2 3
Entonces: H 0 : 0
3
Entonces: 1 2
H0 : 3
2
H 0 : 1 2 23 0
No diferencia entre las
Despejando e igualando a cero
dosis de droga
- Cuando sólo se hacen comparaciones por parejas, el método de Tukey conduce a límites de
confianza más estrechos que el método de Scheffé, por lo cual el método de Tukey encontrará más
diferencias significativas, siendo en este caso el método preferido. En cambio cuando los contrastes
son más complicados que la diferencia de medias, es el método de Scheffé el que tiene límites de
confianza más estrechos
- Cuando el número de comparaciones por parejas es muy grande no se debe utilizar el método de
Bonferroni, ya que el nivel de significación de cada comparación puede llegar a ser demasiado
pequeño para considerarse de utilidad. En estas situaciones los tests de rangos múltiples como
Tukey, Newman-Keuls y Duncan ofrecen una solución de compromiso entre la tasa de error global
deseada y una tasa de error individual demasiado pequeña y por tanto inaceptable. Estos métodos
son preferidos en el sentido de producir intervalos de confianza más estrechos
- El procedimiento de Tukey tiene un error tipo I menor que los correspondientes errores de los
tests de Newman-Keuls y de Duncan; es decir, es un test más conservador. En consecuencia, el
procedimiento de Tukey tiene menos potencia que los procedimientos de Newman-Keuls o de
Duncan
- Si se desea controlar la tasa de error global, los métodos más útiles incluyen el test de Bonferroni
y procedimiento de Tukey. Ambas técnicas tienen fuertes defensores. El test de Bonferroni tiene la
ventaja de utilizar un estadístico t, siendo su principal desventaja, cuando se realizan un gran
número de comparaciones, que el nivel de significación individual se hace demasiado pequeño.
http://www-01.ibm.com/support/knowledgecenter/SSEP7J_10.2.0/com.ibm.swg.ba.cognos.ug_cr_rptstd.10.2.0.doc/c_id_obj_anova.html%23id_obj_anova?lang=es
T2 de T2 de Tamhane es una prueba conservadora. Se considera más adecuada que HSD de Tukey
Tamhane cuando el tamaño de las celdas es desigual o cuando se infringe la homogeneidad de las
varianzas.
T3 de Utilice estas pruebas en lugar de Games-Howell cuando sea fundamental mantener el control
Dunnett, C de sobre el nivel de significación entre varias pruebas.
Dunnett
http://www-01.ibm.com/support/knowledgecenter/SSEP7J_10.2.0/com.ibm.swg.ba.cognos.ug_cr_rptstd.10.2.0.doc/c_id_obj_anova.html%23id_obj_anova?lang=es
Porcentaje
70
60
- Los gráficos QQ y PP 50
40
30
20
Estas pruebas serán aplicadas directamente 10
5
en práctica de computador
1
0.1
-8 -6 -4 -2 0 2 4 6 8
RESID2
Si se observa algún patrón indica que posiblemente no se cumple el supuesto de homogeneidad de varianzas
Si H0 se rechaza:
1. Se transforman los datos y se realiza nuevamente la prueba
2. Se aplican pruebas no paramétricas,
Por ejemplo: si se tiene un DCA, se aplica una prueba de Games-Howell o kruskal-wallis
Homegeneidad
* * * *
*
** * * ** * * *
* * * *
* *** * * * *
**
Estimados Estimados
Heterogeneidad
* ** * *
*
*
* * *
* * **
Estimados
Norbey Marín Arredondo - Estadístico 32
Prueba de Bartlett
La prueba de Barttlet require el cumplimiento del supuesto de normalidad
1 t
No requiere que los r sean iguales, la estadística es: U
c
v loge (ˆ 2
) v j loge (ˆ 2j )
j 1
t
v jˆ 2j 1 t 1 1
v rj 1
t
v j rj 1 ˆ 2 c 1
Donde: j 1 3( t 1) j 1 v j v
j 1 v
Si los datos presentan mucha asimetría, se reemplaza la media de cada tratamiento por su
respectiva mediana
Cipermetrina
Dravafox
Ext E citrifolium
Ext P aequale
Ext P, crassinervium
Se utiliza cuando:
Las varianzas son proporcionales a los cuadrados de las medias de los tratamientos
Se utiliza cuando:
Se utiliza cuando:
La transformación potencial esta definida como una función continua con respecto
a la potencia lambda (). Para los datos (𝑌1 , 𝑌2 , . . ., 𝑌𝑛 ) se realiza la transformación
de la siguiente manera
𝑘1 ∗ 𝑌𝑖𝜆 − 1 𝑆𝑖 𝜆 ≠ 0
(𝜆)
𝑌𝑖 =
𝑘2 ∗ ln 𝑌𝑖 𝑆𝑖 𝜆 = 0
𝑦 1/𝑛
1
𝐾2 = 𝑌𝑖 = (𝑌1 ∗ 𝑌2 ∗ . . . 𝑌𝑛 )1/𝑛 𝐾1 =
𝜆 ∗ 𝐾2𝜆−1
𝑖=1
Aquella que tenga el menor valor de la suma de residuales será la mejor opción. Note
que K2 es un valor fijo para todos los casos y que sólo hay que calcular de nuevo el
valor K1.
Por replicación se entiende que cada tratamiento debe ser aplicado a varias unidades experimentales.
La replicación sirve para:
i) Proveer un estimado del error experimental, tal estimación se convierte en la unidad básica para
determinar si las diferencias observadas en los datos son estadísticamente significativas
iii) Calcular una estimación más precisa del efecto de un factor en el experimento si se usa la media
muestral (Y) como una estimación de dicho efecto.
Tmax Tmin
e2
Por ello, se recomienda que los estudios preliminares deben ser lo suficientemente grandes para
obtener un buen estimador de σ2e, es decir, un estimado basado sobre un número suficiente de
grados de libertad. Otra manera es dar el valor de Δ como un múltiplo de σ2e.
Si se toma un valor pequeño para Δ es porque se quiere determinar si el mejor y el peor efecto de
tratamiento difieren aún cuando sus efectos sean muy cercanos. Es lógico que en este caso se
requiere tener buenos estimados de los efectos y por consiguiente mayor número de réplicas por
tratamiento.
El experimentador conoce
- El numero de tratamientos k
- Una propuesta inicial del numero de repeticiones r0
- Debe tener un conocimiento del valor
- Debe tener unan idea de la magnitud de la diferencia d deseada entre dos tratamientos
r
d2
Norbey Marín Arredondo - Estadístico 56
Cálculo del número de repeticiones
Con la información que se tenga de ciclos anteriores de cultivo se puede calcular el número de
repeticiones adecuado para obtener la precisión establecida.
La prueba de Tukey considera que dos tratamientos son diferentes cuando la diferencia entre sus
media supera a:
CM error
W q( ,t , glerror)
r
Donde:
W es el valor de comparación de Tukey
q Valor de las tablas de Tukey que depende del número de tratamientos (trat), grados de libertad del
error (glee) y el nivel de significancia (alpha)
CME Cuadrado medio del error
r Número de repeticiones
Al estudiar un solo factor (ej: fungicidas, épocas de aplicación, alimentos, dosis,, etc.), para detectar
una diferencia D, se requiere que D sea significativa.
así:
i 1
CMEi * glei
CME n
gle
i 1
i
Donde:
CME es el cuadrado medio del error ponderado
CMEi es el cuadrado medio del error del experimento I
glei son los grados de libertad del error del experimento i
Norbey Marín Arredondo - Estadístico 58
Número de repeticiones en experimentos factoriales
Cuando se estudian F factores a la vez en experimentos factoriales, en arreglo combinatorio, parcelas
divididas, franjas, parcelas subdivididas, suponiendo que no hay interacciones, el número de
repeticiones necesario con el factor K es:
(q( , t k , glek ) 2 * CMEk
rk
T
t k * Dk2
donde:
rk : número de repeticiones para obtener una precisión Dk en el factor K=1,……..F
tk: número de niveles del factor k
CMEk: cuadrado medio del error para el factor k
gleek: grados de libertad del cuadrado medio del error k
T: número total de tratamientos (t1 * t2 * ………tf)
Al calcular el número adecuado de repeticiones para cada factor, generalmente se obtienen números
diferentes, esto por supuesto no es posible. En tal caso, el número de repeticiones puede seleccionarse
con:
El máximo obtenido para lograr la precisión deseada en todos los factores
El obtenido con el factor más importante para asegurar la precisión deseada de ese factor
El número promedio de repeticiones de los factores
Norbey Marín Arredondo - Estadístico 59
Cuantas replicas para la prueba F
r i2
Función del parámetro de desplazamiento
t t 2
Entonces:
Numero de replicas
Parámetros 3 4 5 6 7 8 9
v2 6 9 12 15 18 21 24
1.32 1.52 1.70 1.87 2.01 2.15 2.28
Potencia 0.35 0.5 0.65 0.75 0.83 0.88 0.93
Si se quiere obtener una potencia mínima del 90%, el numero de replicas debe ser 9
r=5
2
rD
2
2t 2