Está en la página 1de 23

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

Dpto. de Estadística e Informática

Capítulo III

DISEÑO COMPLETAMENTE A AZAR


(D.C.A.)

Estadística Aplicada a la Economía


y los Negocios I Semestre 2019 - I
Mg. Carmen Saldaña
Contenido:
• Diseño completamente al azar
• Prueba de Ardenson Darling
• Prueba de Homogeneidad de Varianzas de Bartlett
Objetivos del curso:
• Identificar un experimento en diseño completamente al azar.
• Analizar los resultados de un experimento en diseño completamente al azar.
Diseño Completamente al Azar
Los tratamientos son asignados aleatoriamente a las unidades
experimentales sin ninguna restricción.
Cada unidad experimental tiene la misma probabilidad de recibir
cualquier tratamiento.
Conocido como experimento con un factor (One way)
Ventajas y desventajas
Ventajas:
- Es flexible
- No requiere que sea balanceado, aunque se prefiere.
- El número de grados de libertad para el error es máximo.

Desventajas:
- Se requiere de material homogéneo.
-Toda la variabilidad entre las unidades estarán incluidas en el
error.
Croquis experimental

Asignación al azar
Cuadro de datos
Suponga que se desea comparar t tratamientos. El i-ésimo tratamiento cuenta
con ni repeticiones y cada unidad experimental (u.e.) genera una observación
Yij. Luego, cuadro de datos sería el siguiente:
𝑛𝑖

𝑌𝑖. = ෍ 𝑌𝑖𝑗
𝑗=1

𝑌𝑖.
𝑌ത𝑖. =
𝑛𝑖
n= σ𝑡𝑖=1 𝑛𝑖

Si 𝑛𝑖 = 𝑛𝑗 ∀𝑖 ≠ 𝑗 𝑖, 𝑗 = 1, 2, … , 𝑡 se dice que es un experimento balanceado dado


que se tiene igual cantidad de repeticiones y los 𝑛𝑖 pueden ser denotados por 𝑟
lo tanto el número total de unidades experimentales sería 𝑛 = 𝑟𝑡
Modelo Aditivo Lineal
El Modelo Aditivo Lineal para un Diseño Completamente al Azar es el siguiente:

Donde:
𝑌𝑖𝑗 : valor observado en el i-ésimo tratamiento y la j-ésima repetición.

𝜇: efecto de la media general.

𝜏𝑖 : efecto del i-ésimo tratamiento.

𝜀𝑖𝑗 : efecto del error experimental en el i-ésimo tratamiento y la j-ésima


repetición.
Para las pruebas de hipótesis se asume que 𝜀𝑖𝑗 es una variable independiente
distribuida normalmente, es decir: 𝜀𝑖𝑗 ~𝑁 𝜇 = 0, 𝜎 2

Cálculo de los efectos estimados:


Y Y
Y
ˆ = Y •• = •• ˆi = Y i• − Y •• = i• − •• ˆij = Yij − Y i•
n ni n
Análisis de Varianza
En este modelo la variabilidad total se descompone en dos fuentes de variación: la
explicada por los tratamientos y la explicada por el error. Por lo tanto, el modelo de
descomposición de la variabilidad total será el siguiente:
Variabilidad (Total) = Variabilidad (Tratamientos) + Variabilidad (Error)

Estos elementos se resumen en el siguiente cuadro de Análisis de Varianza.


Fuente de Grados de Suma de Cuadrados Fcal
Variación Libertad Cuadrados Medios
Tratamientos t-1 SC(Trat) SC(Trat)/(t-1) CM(Trat)/CM(Error)
Error n-t SC(Error) SC(Error)/(n-t)
Total n-1 SC(Total)

Donde:
( )
ni ni
t t
Y••2
SC (Total ) = SC (Y ) =  Yij − Y •• = Y −
2
2
ij
i =1 j =1 i =1 j =1 n

( ) Yi•2 Y· 2·
t t
SC (Trat ) =  ni Yi• − Y •• =  − TC
2
TC =
i =1 i =1 ni n
SC(Error) = SC(Total) – SC(Trat)
Procedimiento para la prueba
P1) Para el Modelo I (Efectos fijos) P4) Regla de decisión:
a) Los efectos de los tratamientos: Rechazar H0 si: 𝐹𝑐𝑎𝑙 > 𝐹 1−𝛼 ;(𝑡−1,𝑛−𝑡)

𝐻0 : 𝜏𝑖 = 0 ∀𝑖 = 1, 2, … , 𝑡 Cálculos de la regla de decisión.


Gráfica:
𝐻1 : 𝜏𝑖 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑎𝑙𝑔ú𝑛 𝑖
b) las medias de los tratamientos:
𝐻0 : 𝜇𝑖 = 0 ∀𝑖 = 1, 2, … , 𝑡
1- 
𝐻1 : 𝜇𝑖 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑎𝑙𝑔ú𝑛 𝑖
0 𝐹 1−𝛼 ;(𝑡−1,𝑛−𝑡)

Para el Modelo II (Efectos aleatorios) 𝑅𝐴𝐻0 𝑅𝑅𝐻0

c) La varianza de los tratamientos: P5) Decisión: Rechazar o no rechazar H0


𝐻0 : 𝜎𝑖2 = 0 ∀𝑖 = 1, 2, … , 𝑡
𝐻1 : 𝜎𝑖2 > 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑎𝑙𝑔ú𝑛 𝑖 P6) Conclusión

P2) Nivel de significancia: 


P3) Prueba estadística: 𝐶𝑀 (𝑇𝑟𝑎𝑡)
𝐹𝑐𝑎𝑙 =
𝐶𝑀 (𝐸𝑟𝑟𝑜𝑟)
Coeficiente de variabilidad
Es una medida usada para evaluar el grado de homogeneidad de los resultados de un
experimento. Para saber si un coeficiente de variabilidad es grande o pequeño, es
preciso tener experiencia con datos similares.

𝐶𝑀(𝐸𝑟𝑟𝑜𝑟)
𝐶𝑉% = ∗ 100%
𝑌ത..
Prueba de Ardenson Darling (AD)
Se debe verificar el supuesto que la variable y los errores se distribuyen normalmente:
Procedimiento:
P1) H0: La variable se distribuye normalmente.
H1: La variable no se distribuye normalmente.

P2) Nivel de significancia: 

P3) Prueba estadística: AD

P4) Regla de decisión: Rechazar H0 si: P value < 

P5) Decisión: Rechazar o no H0

P6) Conclusión
Prueba de Homogeneidad de Varianzas de Bartlett
Se debe verificar el supuesto de varianzas homogéneas
Procedimiento:
P1) H : 𝜎 2 = 𝜎 2 = 𝜎 2 = ⋯ = 𝜎 2 = 𝜎 2 ; i = 1, 2, 3, …, t
0 1 2 3 𝑖
2
H1: Al menos un 𝜎𝑖 es diferente i = 1, 2, 3, …, t
P2) Nivel de significancia: 

P3) Prueba estadística: Bartlett

P4) Regla de decisión: Rechazar H0 si: P value < 

P5) Decisión: Rechazar o no H0

P6) Conclusión
Ejemplo 1:
Para estudiar el efecto de la temperatura sobre el rendimiento de un proceso químico
se produjeron cinco lotes con cada uno de tres valores de temperatura. Los resultados
aparecen en la tabla siguiente. Usando un nivel de significación de 0.05 y con los
siguientes datos:
Temperatura
50 °C 60 °C 70 °C
34 30 23
24 31 28
36 34 28
39 23 30
32 27 31
a. Verificar los supuestos de normalidad de datos y homogeneidad de varianzas
b. Definir el modelo aditivo lineal y sus componentes.
c. ¿Se puede afirmar que, el nivel de temperatura tiene efecto sobre la media del
rendimiento del proceso?
d. Calcule el coeficiente de variabilidad.
Ejemplo 1: minitab
Test for Equal Variances: Rendimiento vs Nivel de Temperatura
Multiple comparison intervals for the standard deviation, α = 0.05

Multiple Comparisons
P-Value 0.554
50 C Levene’s Test
P-Value 0.649
Nivel de Temperatura

60 C

70 C

2 4 6 8 10 12 14 16

If intervals do not overlap, the corresponding stdevs are significantly different.


Ejemplo 1: solución
a. Verificar los supuestos de normalidad de datos y homogeneidad de varianzas
Use 𝛼 = 0.05
Normalidad de la variable
H0: El rendimiento del proceso químico se distribuye
normalmente
H1: El rendimiento del proceso químico no se
Salida de la prueba en Minitab
distribuye normalmente

 = 0.05
Rechazar H0 si p – valor < 
Como el p-valor = 0.858 > 0.05 ==> No se
Rechaza H0.

Conclusión
A un nivel de significación de 0.05, no existe evidencia
estadística para rechazar H0, es decir, no se puede
afirmar que el rendimiento del proceso químico no se
distribuye normalmente.

Se cumple el supuesto de normalidad de la


variable.
Ejemplo 1: solución
a. Verificar los supuestos de normalidad de datos y homogeneidad de varianzas
Use 𝛼 = 0.05

Homogeneidad de varianzas
H0: 𝜎12 = 𝜎22 = 𝜎32 = 𝜎 2
H1: Al menos un 𝜎𝑖2 es diferente i = 1, 2, 3
Salida de la prueba en Minitab
Test for Equal Variances: Rendimiento vs Nivel de Temperatura
 = 0.05 Multiple comparison intervals for the standard deviation, α = 0.05

Rechazar H0 si p – valor <  Multiple Comparisons


P-Value 0.554
Como el p-valor = 0.554 > 0.05 ==> No se 50 C Levene’s Test
P-Value 0.649
Rechaza H0.

Nivel de Temperatura
Conclusión 60 C

A un nivel de significación de 0.05, no existe evidencia


estadística para rechazar H0, es decir, no se puede
afirmar que las varianzas el rendimiento del proceso
70 C
químico sean diferentes.

Se cumple el supuesto de homogeneidad de 2 4 6 8 10 12 14 16

varianzas. If intervals do not overlap, the corresponding stdevs are significantly different.
Ejemplo 1: solución
b. Definir el modelo aditivo lineal y sus componentes

𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 𝑖 = 1, 2, 3; 𝑗 = 1, 2, 3, 4, 5

Donde:
𝑌𝑖𝑗 : Rendimiento del proceso químico usando el i-ésimo nivel de temperatura
en el j-ésimo lote de estudio
𝜇: Efecto de la media general del rendimiento del proceso.

𝜏𝑖 : Efecto del i-ésimo nivel de temperatura.


𝜀𝑖𝑗 : Efecto del error experimental en el i-ésimo nivel de temperatura y el j-
ésimo lote de estudio
Ejemplo 1: solución
Dado que se cumplen los supuestos de normalidad de la variable y homogeneidad
de varianzas se puede proceder a realizar el Análisis de Varianza (ANVA).
Ejemplo 1: solución
Elaboramos en cuadro ANVA:
Cálculos:
𝑌..2 64 + 67 + 62 + 64 + 66 + 59 + ⋯ + 59 + 62 + 60 2
1242 2
𝑇𝐶 = = = = 77128.2
𝑛 20 20
𝑡 𝑛𝑖

𝑆𝐶 𝑇𝑜𝑡𝑎𝑙 = ෍ ෍ 𝑌𝑖𝑗2 − 𝑇𝐶 = 642 + 672 + 622 + 642 + ⋯ + 592 + 622 + 602 − 77128.2 = 191.8
𝑖=1 𝑗=1
𝑡
𝑌𝑖2 3232 2952 3252 2992
𝑆𝐶 𝑇𝑟𝑎𝑡 = ෍ − 𝑇𝐶 = + + + − 77128.2 = 147.8
𝑛𝑖 5 5 5 5
𝑖=1
𝑆𝐶 𝐸𝑟𝑟𝑜𝑟 = 𝑆𝐶 𝑇𝑜𝑡𝑎𝑙 − 𝑆𝐶 𝑇𝑟𝑎𝑡 = 191.8 − 147.8 = 44

El ANVA es:
Fuente de Grados de Suma de
Cuadrados Medios: CM Fcal
Variación: FV Libertad: GL Cuadrados: SC

Programas t-1=4-1=3 SC(Trat)=147.8 CM(Trat)=SC(Trat)/(t-1)=49.27 𝐶𝑀(𝑇𝑟𝑎𝑡)/𝐶𝑀(𝐸𝑟𝑟𝑜𝑟)


= 49.27/2.75 = 17.92
Error n-t=20-4=16 SC(Error)=44 CM(Error)=SC(Error)/(n-t)=2.75
Total n-1=20-1=19 SC(Total)=191.8
Ejemplo 1: solución
P1) a) Los efectos de los tratamientos:
𝐻0 : 𝜏𝑖 = 0 ∀𝑖 = 1, 2, … , 4
𝐻1 : 𝜏𝑖 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑎𝑙𝑔ú𝑛 𝑖
b) las medias de los tratamientos:
𝐻0 : 𝜇𝑖 = 𝜇 ∀𝑖 = 1, 2, … , 4
𝐻1 : 𝜇𝑖 ≠ 𝜇𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑎𝑙𝑔ú𝑛 𝑖

P2) Nivel de significancia:  = 0.05


P3) Prueba Estadística:
𝐶𝑀 (𝑇𝑟𝑎𝑡)
𝐹𝑐𝑎𝑙 =
𝐶𝑀 (𝐸𝑟𝑟𝑜𝑟)
P4) Regla de decisión: Rechazar H0 si: 𝐹𝑐𝑎𝑙 > 𝐹 1−𝛼 ;(𝑡−1,𝑛−𝑡)
Cálculos de la regla de decisión.
*) Prueba estadística: 𝐹𝑐𝑎𝑙 = 17.92
*) Valor crítico: =0.05, t = 4, n = 20 ==> 𝐹 1−𝛼 ;(𝑡−1,𝑛−𝑡) = 𝐹(0.95),(3,19) = 3.24
Ejemplo 1: solución
Gráfica:

=0.05
1- = 0.95
0 3.24
17.92

𝑅𝐴𝐻0 𝑅𝑅𝐻0

P5) Decisión: Se rechaza H0

P6) Conclusión
Con un nivel de significación del 5% existe suficiente evidencia estadística para
rechazar H0, es decir, se puede afirmar que al menos uno de los programas de
motivación difiere del resto al analizar el tiempo medio de ensamblaje.
Ejemplo 1: solución
c. Calcule el coeficiente de variabilidad.

𝐶𝑀(𝐸𝑟𝑟𝑜𝑟)
𝐶𝑉% = ∗ 100%
𝑌ത..
CM(Error) = 2.75

𝑌.. 1242
𝑌ത.. = = = 62.1
𝑛 20

Luego:
2.75
CV% = ∗ 100% = 2.67%
62.1

También podría gustarte