Documentos de Académico
Documentos de Profesional
Documentos de Cultura
I
DEPARTAMENTO DE MATEMÁTICAS Y COMPUTACIÓN
Supondremos que las observaciones son independientes y que dentro de cada grupo
siguen una distribución normal de media μ i y con la misma varianza σ 2 para todos
1
ESCUELA POLITÉCNICA SUPERIOR DE BURGOS G.I. I
DEPARTAMENTO DE MATEMÁTICAS Y COMPUTACIÓN
1 ni
( yij − yi )
2
– Varianza de grupo: sˆi2 =
ni − 1 j =1
(𝑛𝑖 −1)𝑠̂𝑖2
Para cada grupo, la distribución de es 𝜒𝑛2𝑖 −1
𝜎2
j =1
VD 1 k
= ( ni − 1) si =
ˆ2 ( N − k ) sˆR2
→ χN2 −k
σ 2 σ 2 i =1 σ2
2
ESCUELA POLITÉCNICA SUPERIOR DE BURGOS G.I. I
DEPARTAMENTO DE MATEMÁTICAS Y COMPUTACIÓN
k ni
= ( yij − yi ) + 2 ( yij − yi ) ( yi − y ) + ( yi − y ) =
2 2
i =1 j =1
k ni k ni k ni
= ( yij − yi ) + 2 ( yij − yi ) ( yi − y ) + ( yi − y ) =
2 2
i =1 j =1 i =1 j =1 i =1 j =1
k ni k ni k
= ( yij − y ) + 2 ( yi − y ) ( yij − yi ) + ni ( yi − y ) =
2 2
i =1 j =1 i =1 j =1 i =1
k ni k
ni ni
k
= ( yij − y ) + 2 ( yi − y ) yij − yi + ni ( yi − y ) =
2 2
i =1 j =1 i =1 j =1 j =1 i =1
k ni k k
= ( yij − y ) + 2 ( yi − y )( ni yi − ni yi ) + ni ( yi − y ) =
2 2
i =1 j =1 i =1 i =1
k k ni
= ni ( yi − y ) + ( yij − yi )
2 2
i =1 i =1 j =1
k
VE = ni ( yi − y )
2
Al primero lo llamaremos variabilidad entre los grupos:
i =1
H0 : μ1 = μ2 = L = μk = μ
Planteamos el siguiente contraste:
H1 : no todas los μi son iguales
3
ESCUELA POLITÉCNICA SUPERIOR DE BURGOS G.I. I
DEPARTAMENTO DE MATEMÁTICAS Y COMPUTACIÓN
( ) = k ( yi − y ) = k yi − y
2
2 2
k n y −y
1 1 k
V = 2 ni ( yi − y ) = i i 2
2
2 E 2 → χk2−1
σ σ i =1 i =1 σ i =1 σ / ni i =1 σ / ni
VD
Además, 2
→ χN2 −ktanto si la hipótesis nula es cierta como si no.
σ
VE ( k − 1)
Por tanto, bajo la hipótesis nula: → Fk −1,N −k
VD ( N − k )
VE ( k − 1)
F= f1−α
VD ( N − k )
donde α es el nivel que hayamos elegido para el contraste.
(También podríamos hallar el p-valor; sería P (Fk −1,N −k F ) .
( y − y ) sˆ
i j R n1 + n1 t1−α 2
i j
4
ESCUELA POLITÉCNICA SUPERIOR DE BURGOS G.I. I
DEPARTAMENTO DE MATEMÁTICAS Y COMPUTACIÓN
H0 : μi = μj
También podemos plantear el contraste .
H1 : μi μj
Utilizando ese mismo estadístico: bajo la hipótesis nula, μi − μj = 0 , y por tanto
yi − y j
→ tN − k
sˆR 1
ni + n1j
La región crítica de este contraste (el de dos lados) al nivel será |T | t1−α 2 .
2. Modelos de 2 factores
2.1 Modelo de factor y bloque
5
ESCUELA POLITÉCNICA SUPERIOR DE BURGOS G.I. I
DEPARTAMENTO DE MATEMÁTICAS Y COMPUTACIÓN
Llamaremos variable bloque a un factor que puede tener influencia sobre la respuesta,
pero en cuyo efecto no estamos especialmente interesados y que no tiene interacción
con el resto de los factores. Entonces, la población objeto de estudio se organiza en
bloques con arreglo a esta variable y dentro de cada bloque se seleccionan al azar
unidades experimentales a las cuales se asignan, también de forma aleatoria, los
distintos niveles de los factores.
Tomaremos una observación para cada combinación de niveles del factor (que se
suelen llamar tratamientos) y de la variable bloque.
Supongamos que hay a tratamientos y b bloques; y i j representa la observación
6
ESCUELA POLITÉCNICA SUPERIOR DE BURGOS G.I. I
DEPARTAMENTO DE MATEMÁTICAS Y COMPUTACIÓN
̂:
Distribución de 𝝁
𝑎 𝑏 𝑎 𝑏 𝑎 𝑏 𝑎
1 1 1 1 1
𝐸𝜇̂ = 𝐸 [ ∑ ∑ 𝑦𝑖𝑗 ] = ∑ ∑ 𝐸𝑦𝑖𝑗 = ∑ ∑(𝜇 + 𝛼𝑖 + 𝛽𝑗 ) = ∑(𝑏𝜇 + 𝑏𝛼𝑖 ) = 𝑎𝑏𝜇 = 𝜇
𝑁 𝑁 𝑁 𝑁 𝑁
𝑖=1 𝑗=1 𝑖=1 𝑗=1 𝑖=1 𝑗=1 𝑖=1
𝑎 𝑏 𝑎 𝑏
1 1 1 𝜎2
VAR𝜇̂ = VAR ( ∑ ∑ 𝑦𝑖𝑗 ) = 2 ∑ ∑ VAR𝑦𝑖𝑗 = 2 𝑎𝑏𝜎 2 =
𝑁 𝑁 𝑁 𝑁
𝑖=1 𝑗=1 𝑖=1 𝑗=1
ˆ → N ,
N
Distribución de ̂ i :
𝑏 𝑏 𝑏
1 1 1 1
𝐸𝛼𝑖 = 𝐸𝑦̄ 𝑖• − 𝐸𝑦̄•• = 𝐸 [ ∑ 𝑦𝑖𝑗 ] − 𝜇 = ∑ 𝐸𝑦𝑖𝑗 − 𝜇 = ∑(𝜇 + 𝛼𝑖 + 𝛽𝑗 ) − 𝜇 = (𝑏𝜇 + 𝑏𝛼𝑖 ) − 𝜇 = 𝛼𝑖
𝑏 𝑏 𝑏 𝑏
𝑗=1 𝑗=1 𝑎 𝑗=1
1 1 1 1
VAR𝛼1 = VAR(𝑦̄ 1• − 𝑦̄•• ) = VAR (𝑦̄ 1• − ∑ 𝑦̄ 𝑖• ) = VAR (𝑦̄ 1• − 𝑦̄ 1• − 𝑦̄ 2• − ⋯ − 𝑦̄𝑎• ) =
𝑎 𝑎 𝑎 𝑎
𝑖=1
𝑎
1 1 1 2 1
= VAR ((1 − ) 𝑦̄ 1• ) + ∑ VAR ( 𝑦̄ 𝑖• ) = (1 − ) VAR𝑦̄ 1• + (𝑎 − 1) 2 VAR𝑦̄ 𝑖• =
𝑎 𝑎 𝑎 𝑎
𝑖=2
1 2 𝑎 − 1 𝜎2 𝑎 − 1 2 𝑎 − 1 2
= [(1 − ) + 2 ] = 𝜎 = 𝜎 (Vale para cualquier 𝛼̂𝑖 )
𝑎 𝑎 𝑏 𝑎𝑏 𝑁
a −1
Y como es combinación lineal de variables normales: ˆi → N i ,
N
Distribución de 𝛽̂𝑗 :
b −1
Se obtiene igual que la de ̂ i : ˆj → N j , .
N
Distribución de :ˆ 2
Eσˆ 2 =
( a − 1)( b − 1) σ 2 ; N σˆ 2
→ χ(2a −1)(b −1) : ̂ 2 no es un estimador insesgado para 2 .
N σ2
Pero si definimos:
7
ESCUELA POLITÉCNICA SUPERIOR DE BURGOS G.I. I
DEPARTAMENTO DE MATEMÁTICAS Y COMPUTACIÓN
a b
N 1
sˆR2 =
( a − 1)( b − 1)
ˆ 2 =
( a − 1)( b − 1) r
i =1 j =1
2
ij (varianza residual)
Sean:
VT = ( yij − y•• )
a b 2
la variabilidad total.
i =1 j =1
a
VE (α) = b αˆi2 la variabilidad debida a los tratamientos.
i =1
b
VE (β) = a βˆ j2 la variabilidad debida a los bloques.
j =1
a b
VR = rij2 la variabilidad residual.
i =1 j =1
2.1.5 Contraste F
Con los resultados anteriores construimos la siguiente tabla de análisis de la varianza:
Fuente de variación Suma de cuadrados G. libertad Varianza F
Entre tratamientos VE (α) a −1 sˆ = VE (α) / (a − 1)
2
α Fα = sˆα2 / sˆR2
Entre bloques VE (β) b −1 sˆ = VE ( β) / (b − 1)
2
β Fβ = sˆ β2 / sˆ R2
Residual VR (a − 1)(b − 1) sˆ R2 = VR /[(a − 1)(b − 1)]
Total VT = VE (α) + VE (β) + VR N −1
Se llama coeficiente de determinación al cociente
VE VE ( ) + VE ( ) VE ( ) VE ( ) 2 2
r2 = = = + = r + r
VT VT VT VT
8
ESCUELA POLITÉCNICA SUPERIOR DE BURGOS G.I. I
DEPARTAMENTO DE MATEMÁTICAS Y COMPUTACIÓN
significativamente grande.
Si queremos también contrastar el efecto bloque: H02 : βj = 0 j y bajo esta hipótesis
significativamente grande.
Si el efecto bloque es nulo o muy pequeño ( F próximo a 1), es más eficaz olvidar los
bloques y trabajar sólo con los tratamientos como en el análisis de la varianza con un
factor. Si no, este último diseño permite detectar mejor las posibles diferencias entre
tratamientos.
otros parámetros (αβ)i j que indican el efecto combinado de los dos factores. El modelo
será similar al anterior (hacer todas las posibles combinaciones de niveles de los dos
factores), pero ahora, para poder estimar la posible interacción hay que tomar varias
observaciones en cada combinación; pongamos n:
Definimos a continuación las medias por casillas, filas y columnas; también la media
global y los residuos:
1
Media global : 𝑦̄••• = ∑𝑎𝑖=1 ∑𝑏𝑗=1 ∑𝑛𝑘=1 𝑦𝑖𝑗𝑘
𝑎𝑏𝑛
1
Media de la casilla i, j : 𝑦̄ 𝑖𝑗 = ∑𝑛𝑘=1 𝑦𝑖𝑗𝑘
𝑛
𝑎 𝑎 𝑛
1 1
Media de la columna 𝑗 : 𝑦̄ •𝑗• = ∑ 𝑦̄ 𝑖𝑗• = ∑ ∑ 𝑦𝑖𝑗𝑘
𝑎 𝑎𝑛
𝑖=1 𝑖=1 𝑘=1
1 1
Media de la fila i : 𝑦̄ 𝑖•• = ∑𝑏𝑗=1 𝑦̄ 𝑖𝑗• = ∑𝑏𝑗=1 ∑𝑛𝑘=1 𝑦𝑖𝑗𝑘
𝑏 𝑏𝑛
9
ESCUELA POLITÉCNICA SUPERIOR DE BURGOS G.I. I
DEPARTAMENTO DE MATEMÁTICAS Y COMPUTACIÓN
dos factores.
𝑎 𝑏 𝑛
2
𝑉𝑅 = ∑ ∑ ∑ 𝑟𝑖𝑗𝑘 es la variabilidad residual.
𝑖=1 𝑗=1 𝑘=1
Bajo esta hipótesis, F sigue una distribución Fa −1, ab(n −1) ; la rechazaremos cuando
2. H02 : βj = 0 j
Bajo esta hipótesis, F sigue una distribución Fb−1, ab(n −1) ; la rechazaremos cuando
3. H03 :(αβ)ij = 0 i , j
Bajo esta hipótesis, F sigue una distribución F(a −1)(b−1), ab(n−1) ; la rechazaremos
10