Está en la página 1de 5

HACIA LA FORMACIÓN BASADA EN COMPETENCIAS

Página |1
UNIVERSIDAD AMAZÓNICA DE PANDO
INGENIERÍA INDUSTRIAL - ESTADÍSTICA II

INFERENCIA ESTADISTICA DE VARIANZA


1. Intervalos de Confianza/Hipótesis de la Varianza. Note que la fórmula es para la CUASIVARIANZA.
1.1 Para 1 Varianza (Con Chi Cuadrado)

Para Intervalos: Para Hipótesis


Ejemplo1: Hallar el intervalo de confianza para una muestra de tamaño 10, con varianza muestral de 38.5.

1.2 Para 2 Varianzas (Con Chi Cuadrado)

Para Intervalos: Para Hipótesis


donde Fα/2 es el valor de una distribución F de Fisher-Snedecor con n1 − 1 y n2 − 1 grados de libertad que deja a su derecha
una probabilidad de α/2.
Ejemplo2: Grafico para n1=31 y n2=25 con un error del 5%.

Ejemplo3: Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores
respecto al tiempo en minutos. Los resultados se muestran en la tabla siguiente: n1=31 con varianza de 50 y
Y para el modelo 2 es n2=25 con varianza de 24. Hallar el intervalo de confianza con nivel de confianza del 90%.
𝑛1−1,𝑛2−1 31−1,25−1 30,24 𝑛1−1,𝑛2−1 30,24 1 1 1
(tablas) 𝐹1−𝛼/2 =𝐹1−0.1/2 =𝐹0.95 =1.94 𝐹𝛼/2 =𝐹0.05 = 24,30 = 24,30= = 0.53
𝐹1−0.05 𝐹0.95 1.89

, entonces queda:
Si desea hallar el intervalo de la razón de desviaciones estándar solo debe sacarse raíz al anterior.

Ejemplo4: Estos son los tiempos de secado(minutos) de 10 y 8 hojas cubiertas de poliuretano bajo dos condiciones
ambientales diferentes:
a). Existe heterogeneidad de varianzas? B) Hallar el Intervalo de Confianza.
Condición 1. 50.4 54.3 55.6 55.8 55.9 56.1 58.9 59.9 61.8 63.4
Condición 2. 55 56 61 55 51 59 54 62
Ing. Cesar Usnayo Laura
DOCENTE –02/12/21
HACIA LA FORMACIÓN BASADA EN COMPETENCIAS
Página |2
UNIVERSIDAD AMAZÓNICA DE PANDO
INGENIERÍA INDUSTRIAL - ESTADÍSTICA II

ANÁLISIS DE VARIANZA (ANOVA)


2. Análisis de Varianza de una Vía

Hasta el momento, las comparaciones de medias solo abarcaban para 2 medias


Ho: 𝜇1 = 𝜇2 Ha: 𝜇1 ≠ 𝜇2 (La media de población 1 difiere/es igual al de la población 2?)

Con el Analisis de Varianza, se puede ampliar la comparativa para comparar. 3 o más medias.
Es una colección de Modelos estadísticos y sus procedimientos asociados, donde la varianza esta particionada en
componentes debido a diferentes variables explicadas.

Dentro de cada tratamiento Tk, los datos Xij deben ser homogéneos y probabilísticos (datos elegidos al azar)
Tratamiento T1 T2 ….. Tk
1 X / (𝑋 − 𝑋)2 X / (𝑋 − 𝑋)2 ….. ….
11 11 21 21
2 X12 / (𝑋12 − 𝑋) 2
X22 / (𝑋22 − 𝑋)2 ….. ….
…. …. …. …. ….
r X1r / (𝑋1𝑎 − 𝑋)2 X2r / (𝑋2𝑏 − 𝑋)2 …. ….
Promedio 𝑋1 / 𝑟1 ∗ (𝑋1 − 𝑋)2 𝑋2 / 𝑟2 ∗ (𝑋2 − 𝑋)2 …. 𝑋𝑘 / 𝑟𝑘 ∗ (𝑋𝑘 − 𝑋)2
El modelo matemático es:
𝑋𝑖𝑗 = 𝜇𝑖 + 𝜀𝑖𝑘 Asi, 𝑋𝑖𝑘 = 𝜇 + (𝜇𝑖 − 𝜇) + 𝜀𝑖𝑘
𝑋𝑖𝑘 = 𝜇 + 𝛼𝑖 + 𝜀𝑖𝑘
Dónde: 𝜇 + 𝛼𝑖 es la variabilidad entre tratamientos y 𝜀𝑖𝑘 la variabilidad experimental de cada experimento. Al calcular
los estimadores se tiene: 𝛼̂𝑖 = 𝑋𝑖 − 𝑋 y 𝜀̂
𝑖𝑘 = 𝑋𝑖𝑘 − 𝑋𝑖

Así la hipótesis planteada para comparar varias muestras el análisis es como sigue:
Ho: Los distintos tratamientos no producen efectos, ningún difiere estadísticamente del resto.
Ha: Por lo menos uno de los tratamientos difieren estadísticamente del resto.

Ho: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 … … = 𝜇𝑘 = 𝜇
Ha: 𝜇1 ≠ 𝜇2 ≠ 𝜇3 ≠ 𝜇4 … … ≠ 𝜇𝑘 ≠ 𝜇
Variabilidad Total = Variabilidad Explicada (Entre tratamientos) + Variabilidad Residual (Intrínseca)
SCT = SCE + SCR
Tabulando, los resultados para hallar el estadístico son:
Fuente Suma Cuadrados g.l. Estimador Fc
𝑆𝐶𝐸
Entre SCE = ∑ 𝑟𝑖 ∗ (𝑋𝑖 − 𝑋)2 k-1
𝑆𝐸2 = 𝑆𝐸2
𝑘−1 𝐹𝑐 = 2
Residual SCR = ∑ ∑(𝑋𝑖𝑘 − 𝑋𝑖 )2 n-k 2
𝑆𝑅 =
𝑆𝐶𝑅 𝑆𝑅
𝑛−𝑘
Total SCT = ∑ ∑(𝑋 − 𝑋) 2 n-1
𝑖𝑘

Dónde: 𝑋 es el promedio global o promedio de promedios.

Ejemplos: Se comparan 5 laboratorios que analizan nk veces con el mismo procedimiento la concentración de Pb en una misma muestra de agua de
río. El objetivo del ANOVA aquí es comparar los errores sistemáticos con los aleatorios obtenidos al realizar diversos análisis en cada laboratorio.
Hemos comentado antes que son condiciones importantes que cada laboratorio analice sus muestras de manera independiente y con precisiones
parecidas a las del resto de laboratorios. En la tabla 1 se muestran los resultados obtenidos (expresados en mg/L).
Ho: 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 = 𝜇𝐷 = 𝜇𝐸 (Similares)
Ha: 𝜇𝐴 ≠ 𝜇𝐵 ≠ 𝜇𝐶 ≠ 𝜇𝐷 ≠ 𝜇𝐸 (Difieren)

Ing. Cesar Usnayo Laura


DOCENTE –02/12/21
HACIA LA FORMACIÓN BASADA EN COMPETENCIAS
Página |3
UNIVERSIDAD AMAZÓNICA DE PANDO
INGENIERÍA INDUSTRIAL - ESTADÍSTICA II
Suma
N A cuadrados B C D E
2
(𝑋11 − 𝑋)
(2.3 − 4.1967) 2

1 2.3 3.596 6.5 5.306 1.7 6.232 2.1 4.395 8.5 18.521
2 4.1 0.009 4 0.039 2.7 2.239 3.8 0.157 5.5 1.699
3 4.9 0.495 4.2 0.000 4.1 0.009 4.8 0.364 6.1 3.624
4 2.5 2.878 6.3 4.425 1.6 6.741 2.8 1.950 8.2 16.029
5 3.1 1.202 4.4 0.041 4.1 0.009 4.8 0.364
6 3.7 0.246 2.8 1.950 3.7 0.246
7 4.2 1E-05 Total
Suma 20.6 25.4 17 26.2 28.3 117.5
r 6 5 6 7 4 28
2
𝑟1 ∗ (𝑋1 − 𝑋)
6 ∗ (3.433 − 4.196)2

Prom 𝑋1 =3.4333 3.4939 5.08 3.9035 2.8333 11.148 3.7429 1.4401 7.075 33.145 𝑋 =4.1967
2 𝑆𝐶𝐸 53.145
SCE = ∑ 𝑟𝑖 ∗ (𝑋𝑖 − 𝑋) =3.4939+3.9035+……+33.145=53.145 k-1 = 5-1 = 4 𝑆𝐸2 = = =13.28
𝑘−1 4

SCT = ∑ ∑(𝑋𝑖𝑘 − 𝑋)2 =3.596+0.009+0.495+…..+1.699+3.624+16.029=87.77 n-1=28-1=27


𝑆𝐶𝑅 29.64
SCT = SCE + SCR → SCR = SCT - SCE =29.64 n-k=28-5=23 𝑆𝑅2 = = =1.29
𝑛−𝑘 23
𝑆𝐸2 13.28
𝐹𝑐 = 2 = 1.29 =10.30
𝑆𝑅
𝐺𝐿1,𝐺𝐿2 4 , 23
(Tabla F<Fα) Fteo = 𝐹1−𝛼 =𝐹0.95 =2.80

Tabulando los resultados.

Solución, Como Fcal > Ftab, se puede aceptar Ha, en este caso se podría concluir que al menos uno de los laboratorios ha producido resultados la
media de los cuales difiere de forma estadísticamente significativa de resto de laboratorios.

2. Análisis de Varianza de dos Vías


Puede surgir el caso, donde dentro de los tratamientos puede existir grupos heterogéneos, al clasificarlos se formal los
llamados BLOQUES, y el análisis de varianza en estos casos es como sigue.
Dentro de cada tratamiento Tk, los datos Xij deben ser homogéneos y probabilísticos (datos elegidos al azar)
Tratamiento T1 T2 ….. Tr PROMEDIO
Bloques
B1 X / (𝑋 − 𝑋)2 X / (𝑋 − 𝑋)2 ….. …. 𝑋 / 𝑅 ∗ (𝑋 − 𝑋)2
11 11 21 21 𝐻1 1 ℎ1
…. …. …. …. ….
S X1r / (𝑋1𝑎 − 𝑋)2 X2r / (𝑋2𝑏 − 𝑋)2 …. ….
Promedio 𝑋𝑉1 / 𝑋𝑉2 / …. 𝑋𝑉𝑟 /
𝑆1 ∗ (𝑋𝑣1 − 𝑋) 2
𝑆2 ∗ (𝑋𝑣2 − 𝑋) 2 𝑆𝑘 ∗ (𝑋𝑣𝑟 −
𝑋)2
El modelo matemático es: 𝑋𝑖𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑖 + 𝜀𝑖𝑘 ,
Donde: 𝛼𝑖 es el efecto del bloque, 𝛽𝑖 refleja los efectos del tratamiento y 𝜀𝑖𝑘 la variabilidad experimental de cada
experimento.
Así la hipótesis planteada para comparar varias muestras el análisis es como sigue:
Ho: Los distintos tratamientos no producen efectos, ningún difiere estadísticamente del resto.
Ha: Por lo menos uno de los tratamientos difieren estadísticamente del resto.
Ho: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 … … = 𝜇𝑟 = 𝜇
Ing. Cesar Usnayo Laura
DOCENTE –02/12/21
HACIA LA FORMACIÓN BASADA EN COMPETENCIAS
Página |4
UNIVERSIDAD AMAZÓNICA DE PANDO
INGENIERÍA INDUSTRIAL - ESTADÍSTICA II
Ha: 𝜇1 ≠ 𝜇2 ≠ 𝜇3 ≠ 𝜇4 … … ≠ 𝜇𝑟 ≠ 𝜇
Variabilidad Total = Variabilidad Explicada (Bloques) + Variabilidad Explicada (tratamientos) + Variabilidad Residual (Intrínseca)
SCT = SCEB + SCET + SCR
Tabulando, los resultados para hallar el estadístico (Dónde: 𝑋 es el promedio global o promedio de promedios) son:
Fuente Suma Cuadrados g.l. Estimador Fc
𝑆𝐶𝐵
Entre Bloques SCEB = ∑ 𝑟 ∗ (𝑋𝑖∗ − 𝑋) 2 s-1
𝑆𝐵2 = 𝑆𝐵2
𝑠−1 𝐹𝑐𝐵 = 2
Entre Tratamientos SCET = ∑ 𝑠 ∗ (𝑋 − 𝑋)2
∗𝑗
r-1 2
𝑆𝑇 =
𝑆𝐶𝑇 𝑆𝑅
𝑟−1
𝑆𝐶𝑅
Residual SCR = ∑ ∑(𝑋 − 𝑋 − 𝑋 + 𝑋)2𝑖𝑗 𝑖∗ ∗𝑗
(r-1)(s-1) 𝑆𝑅2 = 𝑆2
(r − 1)(s − 1) 𝑇
𝐹𝑐𝑇 =
Total SCT = ∑ ∑(𝑋𝑖𝑗 − 𝑋) 2 n-1
𝑆𝑅2

Ejemplo (ANOVA 2 Vías). Se presenta el mismo caso, pero ahora compara tratamientos químicos de 5
maquinas, que no deberían incidir en los resultados finales. Además, se consideran 3 tipos de soluciones
salinas para cada maquina. Por ello se solicita verificar si existe algún efecto significativo.
Poca Sal Bastante Sal Mucha Sal Prom Xi. SCFila r SCFila*r
Mq1 24 16.0 26 4.0 29 1.0 26.3 2.8 3 8.33
Mq2 27 1.0 30 4.0 32 16.0 29.7 2.8 3 8.33
Mq3 26 4.0 27 1.0 30 4.0 27.7 0.1 3 0.33
Mq4 25 9.0 28 0.0 28 0.0 27.0 1.0 3 3.00
Mq5 28 0.0 29 1.0 31 9.0 29.3 1.8 3 5.33
Prom X. j /SC 26 28 30 28.0 PromTot
SCColumna 4.0 0.0 4.0
s 5 5 5
SCColum*n 20 0 20

TABULANDO SC gl estimador FB
Maquinas 25.33 4 6.33 10.86
Tipo Agua 40 2 20 34.29
Residual 4.7 8 0.58
Total 70.0 14

Problema ejemplo:
Suponga que usted haya experimentado con levadura para una receta de panes dulces. Parece ser que la cantidad de azúcar y la temperatura del agua
afectan el tamaño de los panes. Basándose en los siguientes datos, usted realiza un análisis de varianza para averiguar lo que es significativo de estas
recetas.
Levadura: Tamaño de los panes dulces
Agua Fría Agua Tibia Agua Caliente
Poco Azúcar 75 87 60
Azúcar Normal 74 82 55
Mucho Azúcar 70 79 53
Esta función permite realizar un análisis de varianza de dos factores con una sola muestra por grupo. En general, el análisis de varianza es un
procedimiento estadístico que se utiliza para determinar si las medias de dos o más muestras han sido extraídas de poblaciones con la misma media. La
función de ANOVA: dos factores con una sola muestra por grupo le pide que provee la siguiente información.
Input Range: Rango de entrada. Escriba la referencia correspondiente al rango de datos de la hoja de cálculo que desee
analizar. El rango de entrada deberá contener dos o más rangos adyacentes organizados en columnas (como se ve arriba) o filas.
Si el rango de entrada contiene títulos de fila o de columna, deberá seleccionar la casilla de verificación.
Output Range: Rango de salida. Escriba la referencia correspondiente a la celda superior izquierda del rango en el cual desea
que aparezcan los resultados.
Para utilizar las herramientas de análisis, seleccione Data Analysis del menú de Tools. Dentro de la caja de herramienta de análisis, escoja "ANOVA:
Two-factor Without Replication." En seguida, registre el Rango de entrada y el Rango de Salida, refiriéndose a la dirección de las celdas requeridas.
Cuando utilize una herramienta de análisis, Excel crea una tabla de resultados. Si usted incluye títulos en el rango de entrada, Excel los utiliza para los
datos de la tabla de salida. El resultado de la tabla de los datos del ejemplo, lo puede encontrar abajo.

Anova: Dos factores con una sola muestra


Resumen Cuenta Suma Promedio Varianza

Ing. Cesar Usnayo Laura


DOCENTE –02/12/21
HACIA LA FORMACIÓN BASADA EN COMPETENCIAS
Página |5
UNIVERSIDAD AMAZÓNICA DE PANDO
INGENIERÍA INDUSTRIAL - ESTADÍSTICA II
Poco 3 222 74 183
Azúcar
Azucar 3 211 70.33 192.33
Normal
Mucho 3 202 67.33 174.33
Azúcar

Agua Fría 3 219 73 7


Agua 3 248 82.67 16.33
Tibia
Agua 3 168 56 13
Caliente

ANOVA
Origen de Suma de Grados Promedio F Prob. Valor
Variaciones Cuadrados Libertad Cuadrados Crítico
Filas 66.89 2 33.44 23.15 0.0063 6.94
Columnas 1093.56 2 546.78 378.53 2.7E- 6.94
05
Error 5.78 4 1.44

Total 1166.22 8

El resultado del ANOVA (Análisis de varianza) indica el valor estadístico de la "F." En este caso el valor de la "F" por las filas (cantidad de azúcar) es
23.15. Para saber si estos resultados son significativos (o sea, si la probabilidad "P" tiene un valor menor a 0.05), el valor de la "F" observado necesita
ser al menos 6.94 (o sea, el valor crítico de la F). Entonces, como el valor de "F" observado es de 23.15 y es mucho mayor que el valor crítico de la F
(6.94), estamos seguros que los resultados de nuestras pruebas son significativas. El valor de la "F" para las columnas (temperatura del agua) es igual a
378.53. Esto es también significativo, porque el valor de "F" crítico es solamente 6.94. En otras palabras, existe una relación significativa en la
cantidad de azúcar, la temperatura del agua y el tamaño de los panes dulces. La probabilidad muestra a qué nivel los resultados son estadísticamente
significativos.

Ing. Cesar Usnayo Laura


DOCENTE –02/12/21

También podría gustarte