Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Analisis de Varianza
ANOVA
El análisis de la varianza
• Permite contrastar la hipótesis nula (H0) de que
las medias de K poblaciones (K >2) son iguales,
frente a la hipótesis alternativa (H1) de que por lo
menos una de las poblaciones difiere de las
demás en cuanto a su valor esperado.
•
• Este contraste es fundamental en el análisis de
resultados experimentales, en los que interesa
comparar los resultados de K 'tratamientos' o
'factores' con respecto a la variable dependiente o
de interés.
Ronald Fisher
“The greatest biologist since
Darwin. Not only was he the
most original and constructive
of the architects of the neo-
Darwinian synthesis. Fisher
also was the father of modern
statistics and experimental
design. He therefore provided
researchers in biology and
medicine with their most
important research tools”
Richard Dawkins
Aplicación
Empleado para determinar si hay diferencias significativas
entre diversos grupos (+ de 2 grupos).
Por ejemplo:
• Comparación de notas entre carreras
• Decomposición de efectos entre múltiples factores (p. ej.,
cómo las notas varían con la carreras y el sexo del
estudiante).
El Anova requiere el cumplimiento los
siguientes supuestos:
Kruskal-Wallis
Distribución de F
La distribución F(X) es resultante de la razón de dos
variables (U1 y U2 ) con distribuciones chi-cuadrado (χ2)
escaladas:
𝑼𝟏 Τ𝒅𝟏
𝑭 𝑿 =
𝑼𝟐 Τ𝒅𝟐
Donde
• U1 y U2 variables con distribución chi-cuadrado y con
grados de libertad d1 y d2
• U1 y U2 son independientes
Distribución de F
Cómo se vería la distribución de la razón entre
distribuciones chi-cuadrado (χ2) con k = 3 y 6 escaladas?
Distribución de F
Cómo se vería la distribución de la razón entre
distribuciones chi-cuadrado (χ2) con k = 3 y 6 escaladas?
𝑼𝟏 Τ𝒅𝟏 𝒙𝟑 Τ𝟑
𝑭 𝑿 = 𝑭 𝑿 =
𝑼𝟐 Τ𝒅𝟐 𝒙𝟔 Τ𝟔
k=3
k=6
Distribución de F
Cómo se vería la distribución de la razón entre
distribuciones chi-cuadrado (χ2) con k = 3 y 6 escaladas?
f(X)
𝒙𝟑 Τ𝟑
F3,6 𝑭 𝑿 =
𝒙𝟔 Τ𝟔
X
Distribución de F
Generalizando para distintas distribuciones chi-
cuadrado (χ2)…
f(X)
k1 = 1, k2 = 1
k1 = 10, k2 = 10
k1 = 1, k2 = 10
k1 = 10, k2 = 1
k1 = 15, k2 = 20
X
ANOVA de 1 vía
Para k grupos y N individuos (ni en cada grupo),
descomponemos la variación total en variación entre grupos y
dentro de grupos (residuos):
ANOVA de 1 vía
Para k grupos y N individuos (ni en cada grupo), descomponemos
la variación total en variación entre grupos y dentro de grupos
(residuos):
Promedio global
x
ANOVA de 1 vía
Para k grupos y N individuos (ni en cada grupo),
descomponemos la variación total en variación entre grupos y
dentro de grupos (residuos):
Promedio global
x
x1 x2
ANOVA de 1 vía
Para k grupos y N individuos (ni en cada grupo),
descomponemos la variación total en variación entre grupos y
dentro de grupos (residuos):
Promedio global
x
x1 x2
ANOVA DE UNA VÍA (DE UN FACTOR)
𝜇𝑥 : media de población X (muestras independientes)
HIPÓTESIS:
• H0:𝜇1 = 𝜇2 = ⋯ = 𝜇𝑛 (No hay asociación)
• H1: No (𝜇1 = 𝜇2 = ⋯ = 𝜇𝑛 )↔ 𝜇𝑖 ≠ 𝜇𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙
menos un i y un j (Hay asociación)
ANOVA de un factor
Estima cuánta de la variabilidad observada en los datos Variación
(variables dependiente: VD) puede ser explicada por el
factor (variable independiente: VI o factor)... entre
Ej: ¿Cuánto de la variación de ingresos se explica por el grupos
tipo de trabajo?
Valor en VD (cuantitativa) de
Error de la observación j, del
la observación j, del grupo i
grupo i: distancia de la
Promedio de la VD observación j con el
(cuantitativa) del grupo i promedio de su grupo i
Fobservado = MSGroups
MSError
Fk-1, N-k
FObs
P=?
Tabla de ANOVA 1 VÍA
Ejemplo
Queremos comparar el sueldo de tres clases sociales (variable 1:
alta, media, baja):
n = 300
k=3
Ejemplo
Queremos comparar el sueldo de tres clases sociales (variable 1:
alta, media, baja):
df SS MS F P
• Tres hipótesis:
Pone a prueba el efecto de una variable independiente
controlando por las demás variables independientes.
Uno: H0 = Variable 1 no tiene efecto en el resultado
Dos: H0 = Variable 2 no tiene efecto en el resultado
Tres: H0 = La interacción entre la variable 1 y 2 no tienen
efecto en el resultado.
Ejemplo
Queremos comparar el sueldo de tres clases sociales distintas
(variable 1: alta, media, baja) entre hombres y mujeres (variable 2:
h, m):
n = 300
Hombres
k1 = 3
k2 = 2
Mujeres
Ejemplo
Queremos comparar el sueldo de tres clases sociales distintas
(variable 1: alta, media, baja) entre hombres y mujeres (variable 2:
h, m):
ANOVA
Método paramétrico para
comparar las medias de 3 o más
grupos independiente
Test de Kruskal- Wallis
Conceptualmente
Hipótesis
• H0: las tres o más k muestras independientes, de tamaños
n1, n2, nk…proceden de la misma población o de
poblaciones con medianas iguales.
H0: m1 = m2 = .. = m k
donde
donde
Ejercicio 1
• Ejemplo: Se han valorado los cambios de presión arterial sistólica
(mm Hg) a seis meses de seguimiento con tres regímenes
terapéuticos
• Ordenación de datos.
Se ordenan de menor a mayor todos los valores
observados en k muestras.
• Asignación de rangos
Se asigna el rango 1 al valor inferior, el rango 2 al 2º y
así sucesivamente. En caso de empates (mismo valor
para dos o más casos) se asigna la media de los
números de orden de los individuos empatados
Valor (tas) Grupo (tto) Rango Test de
Kruskal-
-31 C 1 Wallis
-7 B 2
-5,5 B 3
-5 B 4
-4,5 B 5
-4 B 6
-2 A 7
-1 C 8
-0,5 C 9
0 A 10,5
0 C 10,5
2,5 A 12
3 A 13
3,5 A 14
Test de Kruskal- Wallis
ANOVA
Conceptos
Aplicaciones
Kruskal-Wallis
Conceptos
Aplicaciones