Está en la página 1de 8

UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA DE INGENIERIA INDUSTRIAL

ESTADISTICA II CICLO V Dra. MARIA TERESITA ROJAS GARCIA

SEMANA 13
ANALISIS DE VARIANZA DE UN SOLO FACTOR
ANOVA
Archivo : Análisis de Varianza de un solo Factor (lectura)

Video 1: ANALISIS DE VARIANZA DE UN FACTOR EN EXCEL Y MANUAL (14.26 m)

Corresponde a un Diseño Completamente Aleatorizado de Clasificación


única o llamado también ANOVA UNIDIRECCIONAL de K poblaciones
(k > 2), se seleccionan muestras aleatorias de tamaño n.

Las K poblaciones diferentes se clasifican con base a un criterio único,


como tratamientos o grupos distintos. Actualmente la palabra
“tratamiento” se utilizan para designar diversas clasificaciones o niveles
de un “Factor o variable” y cada tratamiento tiene n observaciones o
réplicas.
Ejemplos:
Se consideran los experimentos en estudio de los efectos de:
1. Factor: Resistencia a la tensión del papel (psi)
Tratamiento: Concentración de madera cruda (%): 5, 10, 15, 20
2. Factor: Absorción de humedad en agregados para concreto
Tratamiento: Agregado 1, agregado 2, … agregado i
3. Factor: Densidad de cierto tipo de tabique
Tratamiento: Temperatura de cocción (o F): 100, 125, 150, 175

4. Factor: Eficiencia de operación de un motor automotriz mpg


Tratamiento: Marcas de gasolina A, B, C, D
5. Factor: Densidad del color de un espécimen de tela
Tratamiento: Cantidad de tinte utilizado

1. Suposiciones del ANOVA unidireccional


1. Las K muestras sobre las que se aplican los tratamientos son
independientes.
2. Las K poblaciones están distribuidas en forma normal, con medias
μ1, μ2, … μk y una varianza común σ2.
3. Las unidades muestrales se deben asignar al azar.
1
UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA DE INGENIERIA INDUSTRIAL
ESTADISTICA II CICLO V Dra. MARIA TERESITA ROJAS GARCIA

2. Hipótesis a probar:
Se centra en la comparación de más de dos medias de población o
tratamiento
𝑯𝟎 : 𝝁 𝟏 = 𝝁 𝟐 = ⋯ = 𝝁 𝒌
𝑯𝟏 : 𝑨𝒍 𝒎𝒆𝒏𝒐𝒔 𝒅𝒐𝒔 𝒅𝒆 𝒍𝒂𝒔 𝒎𝒆𝒅𝒊𝒂𝒔 𝝁𝒌 𝒏𝒐 𝒔𝒐𝒏 𝒊𝒈𝒖𝒂𝒍𝒆𝒔

4. Modelo del ANOVA


El modelo para cada observación esta dado por:
𝒀𝒊𝒋 = 𝝁 + 𝜶𝒊 + 𝒆𝒊𝒋 i = 1, 2, .., k ; j = 1 2, .., ni

Donde:
𝝁: media general de los tratamientos
𝜶𝒊 : Efecto del i- ésimo tratamiento
𝒆𝒊𝒋 : error aleatorio

Los datos se representan en una tabla, como se indica en la Tabla 1


Tabla 1: K poblaciones con n muestras aleatorias

Tratamiento: 1 2 … i … k
1 𝒚𝟏𝟏 𝒚𝟐𝟏 … 𝒚𝒊𝟏 … 𝒚𝒌𝟏
2 𝒚𝟏𝟐 𝒚𝟐𝟐 … 𝒚𝒊𝟐 … 𝒚𝒌𝟐
.. .. .. .. … ..
. . . .
. 𝒚𝟏𝒋 𝒚𝟐𝒋 … 𝒚𝒊𝒋 … 𝒚𝒌𝒋
n 𝒚𝟏𝒏 𝒚𝟐𝒏 … 𝒚𝒊𝒏 … 𝒚𝒌𝒏
Total 𝒀𝟏. 𝒀𝟐. … 𝒀𝒊. … 𝒀𝒌. Y..
Media ̅𝟏.
𝒚 ̅𝟐.
𝒚 … ̅𝒊.
𝒚 … ̅𝒌.
𝒚 ̅..
𝒚
Con:
y ij : Denota la j-ésima observación del i-ésimo tratamiento
Yi. : Total de todas las observaciones de la muestra del i-ésimo
tratamiento
̅𝒊. ∶ Es la media de todas las observaciones en la muestra del del
𝒚
i-ésimo tratamiento
𝒀. . ∶ es el total de todas las nk observaciones
̅.. ∶ Es la media de todas las nk observaciones
𝒚

2
UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA DE INGENIERIA INDUSTRIAL
ESTADISTICA II CICLO V Dra. MARIA TERESITA ROJAS GARCIA

Los cálculos necesarios para el análisis de varianza se resumen en la


siguiente tabla:
Tabla 2: ANOVA unidireccional

Fuente de Suma de Grados de Cuadrados F0


Variación cuadrados libertad medios calculada
𝑺𝑪𝑻 𝒔𝟐𝟏
Tratamientos SCT k-1 𝒔𝟐𝟏 = 𝒌−𝟏 𝒔𝟐

𝑺𝑪𝑬
Error SCE k(n -1) 𝒔𝟐 = 𝒌(𝒏−𝟏)

Total STC kn -1

Donde:
𝟐
𝑺𝑻𝑪 = ∑𝒌𝒊=𝟏 ∑𝒏𝒋=𝟏(𝒚𝒊𝒋 − 𝒚
̅.. ) = suma total de cuadrados.

𝑺𝑪𝑻 = 𝒏 ∑𝒌𝒊=𝟏(𝒚 ̅.. )𝟐


̅𝒊 . − 𝒚 = suma de los cuadrados de los tratamientos

𝟐
𝑺𝑪𝑬 = ∑𝒌𝒊=𝟏 ∑𝒏𝒋=𝟏(𝒚𝒊𝒋 − 𝒚
̅𝒊 . ) = suma de los cuadrados del error.

Luego, por el Teorema de la identidad de la suma de los cuadrados se


puede expresar simbólicamente como:
STC = SCT + SCE
Lo que indica como las variaciones entre los tratamientos y dentro de los
tratamientos contribuyen a la suma total de cuadrados.
𝑺𝑪𝑻
𝒔𝟐𝟏 = 𝒌−𝟏: Media cuadrática del tratamiento
𝑺𝑪𝑬
𝒔𝟐 = 𝒌(𝒏−𝟏) ∶ Cuadrado medio del error

Es una prueba unilateral de cola superior.


Es estadístico de prueba es una distribución F de Snedecor con:
𝒔𝟐𝟏
Fo = Fα (k-1, k(n-1))
𝒔𝟐

A un nivel de significancia de α se rechaza la hipótesis nula H0 cuando


Fo > Fα (k-1, k(n-1)

3
UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA DE INGENIERIA INDUSTRIAL
ESTADISTICA II CICLO V Dra. MARIA TERESITA ROJAS GARCIA

Ejemplo 1
Suponga que, en un experimento industrial a un ingeniero le interesa la
forma en que la absorción media de humedad del concreto varía para 5
agregados de concreto diferentes. Las muestras se exponen a la
humedad durante 48 horas y se decide que para cada agregado deben
probarse 6 muestras, lo que hace que requiera probar un total de 30
muestras. En la siguiente tabla se presentan los datos registrados.
Tabla 1: Absorción de humedad en agregados para concreto
Agregado: 1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Total
Media

Pruebe la hipótesis de que 𝝁𝟏 = 𝝁𝟐 = 𝝁𝟑 = 𝝁𝟒 = 𝝁𝟓 a un nivel de


significancia del 0.05
Ejemplo 2
Se consideran seis máquinas diferente para la fabricación de sellos de
goma, y están comparando con respecto a la tensión del producto. Se
utiliza una muestra aleatoria de cuatro sellos hechos con cada máquina
para determinar si la resistencia media a la tensión varía de una máquina
a otra. A continuación, se muestran las resistencias a la tensión en
kilogramos por centímetro cuadrado x10-1
Tabla 2: Resistencia a la tensión de sellos de goma
Máquina
1 2 3 4 5 6
17.5 16.4 20.3 14.6 17.5 18.3
16.9 19.2 15.7 16.7 19.2 16.2
15.8 17.7 17.8 20.8 16.5 17.5
18.6 15.4 18.9 18.9 20.5 20.1

4
UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA DE INGENIERIA INDUSTRIAL
ESTADISTICA II CICLO V Dra. MARIA TERESITA ROJAS GARCIA

Realice el ANOVA a un nivel de significancia de 0.05 es indique si la


resistencia a la tensión de las seis máquinas difiere o no de manera
significativa.
Respuesta
Fo = 0.31
No hay evidencia suficiente para apoyar la hipótesis de que existen
diferencia significativa entre las medias.

ANALISIS DE VARIANZA PARA UN DISEÑO DE BLOQUES


COMPLETAMENTE ALEATORIZADO (DBCA)

Video 1: Diseño en bloques completos al azar (17 m)


Video 2: Teoría y ejemplo: Diseño de bloques completamente al azar
(DBCA) (14.54m)
Video 3: Diseño en Bloque al Azar (14.40m)

Conocido también como ANOVA bidireccional, ya que la variación de la


variable respuesta se controla de manera sistemática en dos direcciones
debido a factor y debido a los bloques.
Se va a generalizar y a considerar K tratamientos asignados a b bloques

1. Supuestos:
• Los errores ϵij son independientes y tiene una distribución N (0, σ2),
con varianza constante.
• Hay homogeneidad de varianzas para los tratamientos.
• No existe interacción entre bloque y tratamiento, lo que significa que
un tratamiento su acción o (efecto) no puede estar en uno u otro
bloque.
• El modelo es lineal y aditivo.

2. Modelo Estadístico

𝒀𝒊𝒋 = 𝝁 + 𝝉𝒊 + 𝜷𝒋 + 𝜺𝒊𝒋 ; 𝒊 = 𝟏, 𝟐, … , 𝒌 ; 𝒋 = 𝟏, 𝟐, … , 𝒃
Donde:
Yij : Variable respuesta

5
UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA DE INGENIERIA INDUSTRIAL
ESTADISTICA II CICLO V Dra. MARIA TERESITA ROJAS GARCIA

𝝁: Media global
𝝉𝒊 : Efecto del i-ésimo tratamiento

𝜷𝒋 : Efecto del j-ésimo bloque


𝜺𝒊𝒋 : Error de medición
Los datos se representan en una tabla, como se indica a continuación:
Tabla 3: Arreglos de K x b para el diseñó de BCA
Bloque Total Media
Tratamiento
1 2 … j … b
1 𝒚𝟏𝟏 𝒚𝟏𝟐 … 𝒚𝟏𝒋 … 𝒚𝟏𝒃 T1. ̅𝟏.
𝒚
2 𝒚𝟐𝟏 𝒚𝟐𝟐 … 𝒚𝟐𝒋 … 𝒚𝟐𝒃 T2. ̅𝟐.
𝒚
.. .. .. .. … ..
. . … . … .
i 𝒚𝒊𝟏 𝒚𝒊𝟐 𝒚𝒊𝒋 𝒚𝒊𝒃 Ti. ̅𝒊.
𝒚
.. .. .. .. … ..
. . . .
k 𝒚𝒌𝟏 𝒚𝒌𝟐 … 𝒚𝒌𝒋 … 𝒚𝒌𝒃 Tk. ̅𝒌.
𝒚
Total 𝑻.𝟏 𝑻.𝟐 … 𝑻.𝒋 … 𝑻.𝒃 T..
Media ̅.𝟏
𝒚 ̅.𝟐
𝒚 … ̅.𝒋
𝒚 … ̅.𝒌
𝒚 ̅ ..
𝒀

3. Hipótesis estadística
𝑯𝟎 : 𝝁 𝟏 = 𝝁 𝟐 = ⋯ = 𝝁 𝒌 = 𝝁
𝑯𝟏 : 𝝁𝒊 ≠ 𝝁𝒋 ; 𝒑𝒂𝒓𝒂 𝒂𝒍𝒈ú𝒏 𝒊 ≠ 𝒋

𝑯𝟎 : 𝑳𝒂𝒔 𝒎𝒆𝒅𝒊𝒂𝒔 𝒅𝒆 𝒕𝒐𝒅𝒐𝒔 𝒍𝒐𝒔 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔 𝒔𝒐𝒏 𝒊𝒈𝒖𝒂𝒍𝒆𝒔


𝑯𝟏 : Existe al menos un par de medias de tratamientos diferentes

Lo que es equivalente a probar:


𝑯𝟎 : 𝝉 𝟏 = 𝝉 𝟐 = ⋯ = 𝝉 𝒌 = 𝟎
𝑯𝟏 : 𝝉𝒊 ≠ 𝟎 ; 𝒑𝒂𝒓𝒂 𝒂𝒍𝒈ú𝒏 𝒊
𝑯𝟎 : 𝑻𝒐𝒅𝒐𝒔 𝒍𝒐𝒔 𝒆𝒇𝒆𝒄𝒕𝒐𝒔 𝒅𝒆 𝒍𝒐𝒔 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔 𝝉𝒊 𝒔𝒐𝒏 𝒊𝒈𝒖𝒂𝒍𝒆𝒔 𝒂 𝟎
𝑯𝟏 : Existe al menos un efecto de los tratamientos 𝝉𝒊 diferente de 0
Los cálculos necesarios para el análisis de varianza se resumen en la
siguiente tabla:

6
UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA DE INGENIERIA INDUSTRIAL
ESTADISTICA II CICLO V Dra. MARIA TERESITA ROJAS GARCIA

Tabla 4: ANOVA bidireccional

Fuente de Suma de Grados de Cuadrados F0


Variación cuadrados libertad medios calculada
𝑺𝑪𝑻𝑹𝑨
Tratamientos SCTRA k-1 𝑪𝑴𝑻𝑹𝑨 = 𝒌−𝟏 CMTRA/CME
𝑺𝑪
Bloque SCB b-1 𝑪𝑴𝑩 = 𝒃−𝟏𝑩 CMB/CME
𝑺𝑪𝑬
Error SCE ( k-1)( n -1) 𝑪𝑴𝑬 = (𝒌−𝟏)(𝒏−𝟏)

Total STC kb -1

Donde:

Suma de total de cuadrados ̅ .. )𝟐


𝑺𝑻𝑪 = ∑𝒌𝒊=𝟏 ∑𝒃𝒋=𝟏(𝒚𝒊𝒋 − 𝒀

Suma de cuadrados de tratamientos 𝑺𝑪𝑻𝑹𝑨 = 𝒃 ∑𝒌𝒊=𝟏(𝒚 ̅ .. )𝟐


̅𝒊 . − 𝒀

Suma de cuadrados de bloques 𝑺𝑪𝑩 = k ∑𝒃𝒊=𝟏(𝒚 ̅ .. )𝟐


̅. 𝒋 − 𝒀

𝟐
Suma de Cuadrados del error SCE = ∑𝒌𝒊=𝟏 ∑𝒃𝒋=𝟏(𝒚𝒊𝒋 − 𝒚
̅𝒊 . − 𝒚 ̅ .. )
̅. 𝒋 + 𝒀

Por el Teorema de Identidad de la suma de cuadrados, se tiene que:

STC = SCTRA +SCBB +SCE


Es una prueba unilateral de cola superior.

Es estadístico de prueba es una distribución F de Snedecor con:

Fo = CMTRA/CME Fα (k-1, (k-1)(n-1)


A un nivel de significancia de α se rechaza la hipótesis nula H0 cuando
Fo > Fα (k-1, (k-1)(n-1)

7
UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA DE INGENIERIA INDUSTRIAL
ESTADISTICA II CICLO V Dra. MARIA TERESITA ROJAS GARCIA

Ejemplo 3
Se consideran cuatro máquinas diferentes M1, M2, M3 y M4 para
ensamblar un producto específico. Se decidió que para comparar las
máquinas se usarán 6 operadores distintos en un experimento de
bloques aleatorios. Las se asignaron al azar a cada operador. La
operación de las máquinas requiere destreza física, y se anticipó que
habría una diferencia en la velocidad con que los operadores trabajan
con las máquinas. Se observan los tiempos en (segundos) requeridos
para ensamblar el producto.
Tabla 5: Tiempo para ensamblar un producto en segundos
Operador
Máquina 1 2 3 4 5 6 Total
1 42.5 39.3 39.6 39.9 42.9 43.6
2 39.8 40.1 40.5 42.3 42.5 43.1
3 40.2 40.5 41.3 43.4 44.9 45.1
4 41.3 42.2 43.5 44.2 45.9 42.3
Total

A un nivel de significancia de 0.05 pruebe la hipótesis Ho de que las


máquinas se desempeñan con el mismo índice de velocidad promedio.
Ejemplo 4
Se realizó un experimento para determinar el efecto de cuatro sustancias
químicas diferentes sobre la resistencia de una tela. Estas sustancias
químicas se usan como parte del proceso del acabado de planchado
permanente. Se seleccionan cinco muestras de tela, y se corrió un diseño
de bloques completos aleatorizados para probar que cada tipo de
sustancia química sobre cada muestra de tela en orden aleatorio. Los
datos se muestran a continuación en la siguiente tabla.
Tabla 6: Resistencia de tela
Tipo de Muestra de tela
sustancia química 1 2 3 4 5 Total
1 1.3 1.6 0.5 1.2 1.1
2 2.2 2.4 0.4 2.0 1.8
3 1.8 1.7 0.6 1.5 1.3
4 3.9 4.4 2.0 4.1 3.4
Total
Realice el ANOVA bidireccional para el nivel de significancia del 0.01.
Comente su resultado.
Diseños en Bloque Completos al Azar
Diseños en bloques al azar
8

También podría gustarte