Está en la página 1de 10

MA461 Estadística Inferencial

UNIDAD 3: Diseños Experimentales

Semana 6 – Sesión 1

Logro: Al finalizar la unidad, el estudiante identifica variables independientes aplicando la


técnica de análisis de varianza con el apoyo del software Microsoft Excel, diferenciando los
experimentos de uno y dos factores.

Diseños Experimentales

Conceptos Básicos:

Un experimento diseñado es una prueba o serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada (factores controlables, susceptibles a manipulación) de un
proceso o sistema, de manera que sea posible observar e identificar las causas de los cambios en la
variable de salida (variable respuesta, variable dependiente no manipulable).

Ejemplo:
Suponga que el ejecutivo de marketing de la empresa ALOA S.A., desea saber si los tipos de promoción
(variable independiente) de un producto influye en los montos de ventas de este (variable
dependiente), y de ser así, qué promoción sería la recomendable. Por lo tanto, se plantea tres
promociones distintas: P1, P2, P3. Vea la gráfica:

¿La diferencia en los montos de ventas promedios obtenidos con las diferentes promociones en la
muestra nos indica que efectivamente las promociones influyen en los montos de ventas, o sólo se
debe a la variabilidad inherente al muestreo? ¿La promoción 3 es más efectiva?

-1-
MA461 Estadística Inferencial
UNIDAD 3: Diseños Experimentales

Factor: Es una variable independiente o de entrada que puede afectar los resultados del experimento.
Los factores se pueden clasificar en controlables y no controlables. El interés principal del
experimentador es evaluar el efecto de estos factores.
En el ejemplo anterior, la promoción es el factor en estudio. A los distintos valores de los factores en
estudio que son evaluados se les llama niveles del factor. En el ejemplo, el factor promoción tiene tres
niveles (P1, P2 y P3).
Un experimento diseñado puede tener uno, dos o más factores en estudio, por ejemplo, podríamos
estar interesados en evaluar no sólo las promociones sino además las zonas, y el interés radicaría en
saber si las promociones tienen un efecto distinto en las zonas donde se aplican (¿hay interacción
entre la promoción y las zonas?). En este caso los factores son: Promoción y Zona.

Niveles del factor: Son los distintos valores de los factores. Dicho de otro modo, son las diferentes
categorías que corresponden a un factor. En el ejemplo, los niveles son: P1, P2 y P3.

Tratamiento: Un tratamiento corresponde a los niveles de un factor o a una combinación de los


niveles de dos o más factores en estudio y cuyo efecto se mide y compara con los de otros
tratamientos. En el ejemplo, los tratamientos son (P1, P2 y P3).
Suponiendo que en el ejemplo nos interesa analizar un segundo factor: Zona (Z1 y Z2); en ese caso,
los tratamientos serían las combinaciones de los niveles de los factores Promoción (P1, P2 y P3) y
Zona (Z1 y Z2): P1-Z1, P1-Z2, P2-Z1, P2-Z2, P3-Z1 y P3-Z2.

Unidad experimental: Es la unidad a la cual se le aplica un tratamiento y en la cual se mide el efecto


de un tratamiento. En el ejemplo anterior, la unidad experimental sería una tienda.

Variable respuesta: Es la variable en la cual se evaluarán los efectos de los tratamientos. En el ejemplo
anterior, la variable respuesta sería las ventas.

Promoción → Una tienda → Monto de venta semanal


Factor (Var. independiente) (Unidad experimental) Variable respuesta (Var. dependiente)

Error experimental: Es la variabilidad existente entre los resultados de unidades experimentales


tratadas en forma similar. Cualquier factor no controlable contribuye al error experimental. El error
experimental proviene de dos fuentes principales: variabilidad inherente al material experimental y
variabilidad resultante de cualquier falta de uniformidad en la realización física del experimento. En
el ejemplo anterior, a pesar de que se aplicó la promoción 1 a las cuatro tiendas, sus ventas son
distintas.

En este curso se presentan dos casos de análisis:


a. Un factor: El diseño completamente al azar (DCA): Este es un diseño en el que sólo se contempla
un factor de estudio.
b. Dos factores: El experimento factorial AxB: Este es un diseño con dos factores A y B en estudio,
con a y b niveles respectivamente.

-2-
MA461 Estadística Inferencial
UNIDAD 3: Diseños Experimentales

Diseño Completamente al Azar (DCA)

Un Diseño Completamente al Azar, mide el efecto del factor en estudio (variable independiente de
naturaleza cualitativa o cuantitativa) sobre la variable respuesta (variable dependiente de naturaleza
cuantitativa).

Suponga que se cuenta con los resultados de k muestras aleatorias independientes, cada una de
tamaño ni, obtenidas desde k diferentes poblaciones y se desea probar la hipótesis de que las medias
de estas k poblaciones son todas iguales. Las poblaciones que se desea comparar suelen ser producto
de la aplicación de distintos tratamientos a ciertas unidades de análisis.

Los datos por analizar pueden arreglarse en una tabla como la que se muestra a continuación:

Tratamiento
Muestra Tratamiento 1 Tratamiento 2 ... Tratamiento k
1 y11 y21 ... yk1
2 y12 y22 ... yk2
3 y13 y23 ... yk3
. . . ... .
. . . ... .
. . . ... .
ni 𝑦1𝑛1 𝑦2𝑛2 ... 𝑦𝑘𝑛𝑘
Totales yi. y 1. y 2. ... yk.

Considere por ejemplo el caso en el que se desea comparar el efecto de cinco programas de incentivos
en la productividad de los trabajadores; en este caso, los cinco programas de incentivos serían los
cinco tratamientos aplicados (los cuales definen las cinco poblaciones que se van a comparar), y la
unidad de análisis sería un trabajador (quien recibe el tratamiento).

Modelo:
Cada observación yij se descompone en:
𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 ; para 𝑖 = 1, 2, . . . , 𝑘; 𝑗 = 1,2, . . . , 𝑛𝑖

Var. Error
Variación total
Var. Trat.

y=15 U=8 t1=5 e=2

Donde:
yij : Representa la j-ésima observación en la i-ésima muestra.
𝜇 : Media general.
𝜏𝑖 : Efecto del i-ésimo tratamiento.
𝜀𝑖𝑗 : Error aleatorio asociado a la observación yij, donde 𝜀𝑖𝑗 ~ N (µ, 𝜎 2 )

-3-
MA461 Estadística Inferencial
UNIDAD 3: Diseños Experimentales

Supuestos del modelo:


Los errores siguen una distribución normal (supuesto de normalidad) con varianza constante
(supuesto de homogeneidad de varianzas).

Hipótesis:
La hipótesis nula plantea que no hay efecto de los tratamientos, luego no hay diferencia en las medias
poblacionales; por lo tanto, expresamos las hipótesis de la siguiente manera:

H0: µ1 = µ2 = … = µ k No hay diferencia en las El factor en estudio no afecta (no


medias poblacionales influye) a la variable respuesta
H1: No todas las µi son iguales Hay diferencia en las medias El factor en estudio afecta (influye) a
Al menos una µi es diferente poblacionales la variable respuesta

Análisis de Varianza (ANOVA)

Consiste en analizar los cocientes de las varianzas para probar la hipótesis de igualdad o desigualdad
entre las medias debidas a los tratamientos. Para lo cual, se separa la variación total en las partes con
que contribuye cada fuente de variación. En el caso l DCA las fuentes de variación son: Variación entre
grupos (debida a los tratamientos) y Variación dentro del grupo (debida al error experimental).

Con estas fuentes de variación se obtienen los cuadrados de las sumatorias de las desviaciones, tanto
del tratamiento como del error y se construye una tabla de ANOVA que nos servirá para probar las
hipótesis de este estudio.

Tabla del Análisis de Varianza


Fuente de Grados de Suma de Cuadrado
variación libertad (df) Cuadrados (ss) Medio (ms)
Fcal
𝑘
2 2
𝑦𝑖• 𝑦•• SC(Tr)
Tratamientos k–1 SC(Tr) = ∑ − CM(Tr) = 𝐶𝑀(𝑇𝑟)
𝑛𝑖 𝑛• 𝑘−1
𝑖=1 𝐶𝑀𝐸
SCE
Error n. – k SCE = SCT − SC(Tr) CME =
𝑛• − 𝑘
𝑘 𝑛 2
2 𝑦••
Total n. – 1 SCT = ∑ ∑ 𝑦𝑖𝑗 −
𝑛•
𝑖=1 𝑗=1

Pasos para realizar el Diseño Completamente al Azar (DCA)

1) Planteamiento de la Hipótesis

Ho: El factor en estudio no afecta a la variable respuesta ( µ1 = µ2 = … = µk )

H1: El factor en estudio afecta a la variable respuesta ( No todas las µi son iguales )

2) Nivel de significación (α):

3) Estadístico de prueba:

-4-
MA461 Estadística Inferencial
UNIDAD 3: Diseños Experimentales

𝐶𝑀(𝑇𝑟)
F𝑐𝑎𝑙 =
𝐶𝑀𝐸

Fcrítico = F(α; k – 1; n. – k) En Excel: =INV.F.CD(α; k – 1; n. – k)

4) Regiones críticas

5) Decisión

Criterio:

Si F𝑐𝑎𝑙 > F𝑐𝑟𝑖𝑡𝑖𝑐𝑜 se rechaza Ho

Si F𝑐𝑎𝑙 ≤ F𝑐𝑟𝑖𝑡𝑖𝑐𝑜 no se rechaza Ho

6) Conclusión

Se derivan de las comparaciones múltiples y de las variables específicas concerniente al problema


que se encuentra en evaluación.

Comparaciones Múltiples:
Los métodos de comparación múltiple son los procedimientos usados para comparar las medias de
tratamientos individuales en el análisis de varianza. (Montgomery, 2003, p.581)

Prueba de Tukey HSD


Se usará esta prueba para evaluar si existen diferencias significativas entre las medias de cada “par
de tratamientos”.
Ho: µi = µj
H1: µi ≠ µj Para todo i ≠ j
𝑪𝑴𝑬
𝑯𝑺𝑫 = 𝒒𝜶 (𝒌, 𝒏 − 𝒌)√ 𝒏𝒌
• n = número de observaciones por tratamiento
• k = número de tratamientos
• q = es un multiplicador (Tabla de Tukey)
• CME = cuadrado medio del error
• nk = tamaño de muestra de los grupos (si no es un modelo
balanceado se usa el promedio armónico.

-5-
MA461 Estadística Inferencial
UNIDAD 3: Diseños Experimentales

Comparaciones Múltiples (DMS)

Comparaciones Intervalo Conclusión


IC(µA-µB) ( + ; +) µA-µB >0 µA>µB
IC(µA-µB) ( - ; -) µA-µB <0 µA<µB
IC(µA-µB) ( - ; +) µA-µB =0 µB=µB

Para la solución de un problema de DCA:


Etapa 1: Identificar los elementos del diseño (Factor, tratamientos, variable respuesta, etc.)
Etapa 2: Análisis de varianza
Ho: U1=U2=U3
H1: Al menos una U es diferente
Etapa 3: Comparaciones (Comparaciones múltiples-DMS)

-6-
MA461 Estadística Inferencial
UNIDAD 3: Diseños Experimentales

Ejemplo de aplicación:

Pisko Perú S.A. desea crear una nueva marca de Pisco que tenga buena acogida en el mercado, por lo
cual está experimentando con diferentes fórmulas de Pisco para evaluar el efecto de estas nuevas
fórmulas sobre las ventas de botellas (en unidades). La empresa está promocionando 3 tipos de
fórmulas (A, B y C) en 15 licorerías con similares características. Después de un mes, se registró la
cantidad de botellas vendidas de los 3 tipos de fórmulas por licorería:

Fórmulas
Tipo A Tipo B Tipo C
56 51 50
59 50 52
54 53 51
56 51 54
58 51 52
Totales 283 256 259
Promedios 56.6 51.2 51.8
y..=798
𝑡 𝑛𝑖

∑ ∑ 𝑌𝑖𝑗2 = 42570
𝑖=1 𝑗=1

Tabla de Análisis de varianza (ANOVA)

Fuente de Variación GL (df) SC (ss) CM (ms) Fcal


Fórmulas
Error
Total 14 116.4

Prueba de Tukey HSD (al 95% de confianza)

Comparaciones múltiples (DMS)


Comparaciones Lím. Inf. Lím. Sup.
IC(µ1-µ2) 3.2652 7.5348
IC(µ1-µ3) 2.6652 6.9348
IC(µ2-µ3) -2.7348 1.5348

Para promocionar su nueva marca, Pisko Perú S.A. elegirá aquella fórmula o fórmulas de Pisco que
produzca mayor cantidad de botellas vendidas. Asumir que, se cumplen los supuestos del modelo de
normalidad de los errores y homogeneidad de varianzas. Utilizando un nivel de significancia 5% ¿Cuál
de las fórmulas deberá promocionarse?

-7-
MA461 Estadística Inferencial
UNIDAD 3: Diseños Experimentales

Interpretación Representación Cálculo / Análisis Argumentación


Análisis Estadístico Respuesta del
Definición del Elementos del
problema Toma de
problema diseño ANOVA Comparaciones
decisión

Para la solución de un problema de DCA:


Etapa 1: Identificar los elementos del diseño (Factor, tratamientos, variable respuesta, etc.)
Etapa 2: Análisis de varianza
Ho: U1=U2=U3
H1: Al menos una U es diferente
Etapa 3: Comparaciones (Comparaciones múltiples-DMS)

Solución:

Interpretación
Determinar la fórmula de deberá promocionarse.

Representación
Factor : Tipo de fórmula (Niveles del factor: Tipo A, Tipo B y Tipo C)
Tratamientos : Tipo A, Tipo B y Tipo C
Variable respuesta : Las ventas de botellas (en unidades).
Unidad experimental : Una tienda (licorería)
Supuestos del modelo : Normalidad de errores y homogeneidad de varianzas
Técnica estadística : DCA (Diseño completamente al azar) o ANOVA de un factor
Nivel de significación : 5%

Cálculo y Análisis

Hipótesis de Análisis de varianza (ANOVA):


Ho: µA = µB = µc
H1: Al menos una µ es diferente
Nivel de significación:
𝑘2
𝑦𝑖• 𝑦••2
SC(Tr) = ∑ −
𝑛𝑖 𝑛•
𝑖=1

(283)2 (256)2 (259)2 (798)2


SC(Tr) = { + + }− = 87.6
5 5 5 15

-8-
MA461 Estadística Inferencial
UNIDAD 3: Diseños Experimentales

𝑘 𝑛
𝑦••2
SCT = ∑ ∑ 𝑦𝑖𝑗2 −
𝑛•
𝑖=1 𝑗=1

Sabemos que:
𝑡 𝑛𝑖

∑ ∑ 𝑌𝑖𝑗2 = (56)2 + (59)2 + (54)2 + ⋯ + (52)2 = 42570


𝑖=1 𝑗=1
(798)2
SCT = 42570 − = 116.4
15

Tabla de Análisis de varianza (ANOVA)

Fuente de Variación GL (df) SC (ss) CM (ms) Fcal


Fórmulas 3-1=2 87.6 87.6/2=43.8 43.8/2.4=18.25
Error 15-3=12 28.8 28.8/12=2.4
Total 15-1=14 116.4
k=número de tratamientos
ni=número de elemento del tratamiento i
n.=suma del número de elementos de los tratamientos (cantidad total de datos)

𝐶𝑀(𝑇𝑟)
F𝑐𝑎𝑙 = = 18.25
𝐶𝑀𝐸

Fcrítico = F(α; k – 1; n. – k) = F( 0.05;2;12)=3.89 En Excel: =INV.F.CD(α; k – 1; n. – k) = INV.F.CD(

α = 0,05

NRHo | RHo
F(0.05;2;12)=3.89

Decisión estadística: RHo


Conclusión estadística: Con un nivel de significación de 0.05, se puede afirmar que al menos un
promedio de ventas es diferente.

-9-
MA461 Estadística Inferencial
UNIDAD 3: Diseños Experimentales

Comparaciones Intervalo Conclusión


IC(µA-µB) ( + ; +) µA-µB >0 µA>µB
IC(µA-µB) ( - ; -) µA-µB <0 µA<µB
IC(µA-µB) ( - ; +) µA-µB =0 µA=µB

Comparaciones múltiples (DMS)


Comparaciones Lím. Inf. Lím. Sup. Signos Conclusión
IC(µA-µB) 3.2652 7.5348 +;+ µA>µB
IC(µA-µC) 2.6652 6.9348 +;+ µA>µC
IC(µB-µC) -2.7348 1.5348 -;+ µB=µC

Para construir la Tabla de agrupaciones usando Prueba de Tukey HSD (al 95% de confianza)

1. Debemos ordenar los promedios de los Tipos de arcilla en orden descendente.

µB=µC < µA
Otra forma de concluir:
µ2(B) µ3(C) µ1(A)

Conclusión: Con un nivel de significación del 5%, se puede afirmar que el promedio A es mayor

Argumentación

La fórmula que deberá promocionarse es la fórmula Tipo A, ya que le corresponde el mayor


promedio de ventas.

-
10
-

También podría gustarte