Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Facultad de Ciencias
Departamento de Estadı́stica
Carrera de Estadı́stica
Diseño de experimentos
Bogotá, febrero de 2018
1
Conceptos básicos del diseño experimental 2
d) Unidad experimental
Son los elementos a los cuales les puedo asignar un tratamiento aleatoria e idependientemente.
En los casos anteriores como las plantaciones de cacao.
En el ejemplo de las bebidas las unidades experimentales serı́an los individuos que tomaran
las bebidas.
e) Aleatorización de tratamientos
Proceso fı́sico donde cada tratamiento tiene igual probabilidad de ser asignado a cualquier unidad
experimental.
Con una lista de nuestras UE realizamos el procedimiento coordenado negativo para asignar
los tratamiento aleatoriamente.
Con ayuda de un dado con la cantidad de caras de los tratamientos ir asignandolos.
3. Se investiga la morfometrı́a de J.Lamprotaenia (sardina azul) en las islas del Rosario (Bolivar). Entre
otras caracterı́sticas, midieron la longitud estándar de sardinas hembras en tres estaciones de muestreo:
fondo arenoso, manglar y pasto marino.
a) Describa los factores, niveles, unidades experimentales, unidades observacionales, tratamientos y
la variable respuesta.
Factores:Tipo de ecosistema
Niveles: Fondo arenoso, Manglar y Pasto marino (Para experimento tendrı́an que recrear
ecosistemas artificiales o estaciones de muestreo dentro del ecosistema natural que aislé a las
sardinas).
Unidades experimentales: Sardinas azules hembras seleccionadas desde alevines para el estu-
dio.
Unidades observacionales: Sardinas azules hembras pasada la etapa de crecimiento en los
ambientes controlados.
Tratamiento: Tipo de estación (Ecosistema) a la que fue asignado los alevines.
Variable respuesta: Longitud de las Sardinas
b) Diseñe una aleatorización correcta para este experimento y proponga el modelo lineal asociado.
Tenemos un grupo de n alevines de sardinas azules para usar en le experimento, nacieron en
ambientes neutros controlados desde el huevo. Para asignar a que ecosistema serán introducidos
lo hacemos de la siguiente forma: tenemos numerados los alevines de 1:n luego generamos n nú-
meros aleatorios de una distribución U (0, 2), si numero esta en intervalo (0,0.5] asignamos Fondo
arenoso,en (0.5,1] asignamos Manglar, en (1,1.5] Pasto marino y los demás (1.5,2] pertenecen a
un grupo control.
5. Suponga que se planea investigar el efecto del salario y el tiempo de la jornada de trabajo sobre
la producción de los trabajadores en una empresa manufacturera. Tanto el salario como el tiempo
de la jornada de trabajo se establecerán en tres niveles y se observa la productividad en todas las
combinaciones de estos factores.
a) Lleve a cabo una descripción completa del experimento especificando: objetivos, población, facto-
res, unidades experimentales, unidades observacionales y variables respuesta.
b) Identifique los tratamientos y el tipo de experimento que se trata.
Objetivos:
Factores:
Niveles:
Unidades experimentales:
Unidades observacionales:
Tratamiento:
Variable respuesta:
Tipo de experimento:
c) Indique un método de aleatorización apropiado para el experimento. Aquı́ podemos aplicar fá-
cilmente (Ya tenemos una lista) el método de coordenado negativo para asignar los tratamiento
aleatoriamente.
6. Un grupo de investigadores trabaja para producir huevos de gallina con alto contenido de omega 3.
Para ello se consideraron: cuatro razas de gallina en cinco fincas seleccionadas aleatoriamente, tres
tipos de alimentos (uno de ellos es un placebo). Como parte del estudio se toman tres huevos de cada
gallina y cada uno de estos es evaluado por dos expertos que miden el contenido de omega 3 en el
huevo.
a) Defina la unidad experimental, la unidad muestral (si la hay), los factores, los niveles, los trata-
mientos y la variable respuesta en este estudio.
b) Proponga y haga los supuestos necesarios sobre el modelo para llevar a cabo el análisis de ésta in-
formación. Enmárquelo dentro de los tres principios básicos del diseño de experimentos propuestos
por Fisher.
7. Una salida de una muestra aleatoria se muestra a continuación. Algunas cantidades están faltando.
Calcule los valores de las cantidades faltantes.
PN
xi 399.851
La media se encuentra como x̄ = i=1
N = 16
[1] 24.99069
[1] 0.636
8. Suponga que estamos probando H0 : µ1 = µ2 versus H1 : µ1 6= µ2 , donde los dos tamaños de muestra
son n1 = n2 = 12. Ambos varianzas muestrales son desconocidas pero asumidas iguales. Encuentre los
limites del p-valor para los siguientes valores observados de la estadı́stica de prueba.
El p-valor para una prueba de dos colas se encuentra como 2 · P (|T (X)| > t0 ) en este caso el T(X)
es una estadı́stico que tiene distribución t-student con 12 + 12 − 2 = 22 grados de libertad. Ası́ los
p-valores son
a) t0 = 2.30
[1] 0.03130869
b) t0 = 3.41
[1] 0.002510658
c) t0 = 1.95
[1] 0.06403353
d) t0 = −2.45
[1] 0.02270774
9. Un programa de computador a producido la siguiente salida por un problema de prueba de hipótesis
X̄1 − X̄2
|T (X)| = q 2
s1 s22
n1 + n2
11.5
| − 1.88| = q
s21 s22
n1 + n2
s
s21 s2
+ 2 = 6.1170
n1 n2
s
s21 s2
X̄1 − X̄2 ± t22;0.025 + 2
n1 n2
11.5 ± 2.064 · 6.117
LI LS
1 24.12487 -1.124868
One-Sample T: Y
Test of mu=25 vs >25
[1] 2.029167
11. El diámetro de los ejes de acero producidos por cierto proceso manufacturero deberı́an tener diámetro
de 0.255 pulgadas. Se sabe que el diámetro tiene una desviación estándar de σ = 0.0001 pulgadas. Una
muestra aleatoria de 10 ejes tiene un diámetro medio de 0.2545 pulgadas.
a) Haga una hipótesis apropiada de la media µ
H0 : µ = 0.255 H1 : µ 6= 0.255
[1] -15.81139
Como el estadı́stico pertence a RR se rechaza H0 , es decir hay evidencia estadı́stica para decir
que la media del diámetro de los ejes de acero no es 0.255.
c) Encuentre el p-valor para este test
Se calcula como 2 · P (|T (X)| > t0 )
[1] 2.596807e-56
d) Construya un intervalo de confianza del 95 % para la media del diámetro del eje.
0.2545 ± z α2 · 0.0001
√
10
LI LS
1 0.254438 0.254562
Se esperaria con un 95 % de confianza la media de los diámetros del eje este ente 0.25444 y 0.25456
pulgadas.
12. El tiempo para reparar un instrumentos electrónico tiene una distribución normal medida en horas.
Los tiempos de reparación para 16 de esos instrumentos escogidos aleatoriamente son como siguen
a) Se desea saber si el tiempo medio de reparacipon excede 225 horas. Desarrolle una hipótesis
apropiada para investigar este problema.
Horas
159 280 101 212
224 379 179 264
222 362 168 250
149 260 485 170
b) Pruebe la hipótesis que se formuló en la parte (a). ¿Cuáles son sus conclusiones? Use α = 0.05
RR = {t0 : t0 > tn−1;1− α2 } donde t0 = x̄−µ √s
. En este caso RR = {t0 : t0 > 1.7530}, ası́ t0 es
n
0.6685. Como t0 no está en RR se acepta H0 , es decir hay evidencia estadı́stica que indique que
el tiempo medio de reparación no excede las 225 horas.
c) Encuentre el p-valor de la prueba.
p-valor= P (T (X) > t0 )
[1] 0.2569801
d) Construya un intervalo de confianza del 95 % para la media del tiempo de reparación.
Se calcula x̄ ± tn−1;1− α2 · √sn
LI LS
1 188.8927 294.1073
Se espera con un 95 % que el tiempo medio de reparación de los instrumentos este entre 188.89 y
294.11 horas.
13. Los siguientes datos corresponde al tiempo (en minutos) en que unas bengalas quı́micas demoran en
quemarse con dos diferentes formulas. Los ingenieros de diseño están interesados en ambas la media y
la varianza de los tiempos de quemarse.
Tipo 1 Tipo 2
65 82 64 56
81 67 71 69
57 59 83 74
66 75 59 82
82 70 65 79
a) Pruebe la hipótesis que las dos varianzas son iguales. Use α = 0.05
RR = {t0 : t0 < Fnn21; α o t0 > Fnn21;1− α }, para este caso RR = {t0 : t0 < 0.248 o t0 > 4.026} y
2 2
s21
t0 = s22
[1] 0.9782168
Como t0 ∈/ RR se acepta H0 , es decir hay evidencia estadı́stica que soporte que las varianzas son
iguales.
b) Usando el resultado de (a). pruebe la hipótesis que la media de los tiempos de quemado son
iguales. Use α = 0.05. ¿Cuál es el p-valor para esta prueba?
Con el resultado de la parte (a) podemos realizar una prueba t para la diferencia de medias, donde
x̄1 − x̄2
el estadı́stico es t0 = q y la región de rechazo está dada por RR = {t0 : |t0 | > 2.1}. Ası́
S n11 + n12
el estadı́stico es
[1] 0.04800768
Por lo tanto se acepta H0 es decir hay evidencia estadı́stica para decir que la media de los dos
tiempo de quemado son iguales. Y además el p-valor es de
[1] 0.9622388
80
75
75
Fórmula 1
Fórmula 2
70
70
65
65
60
60
55
−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5
Una forma de probar normalidad es mediante Q-Qplot que compara los datos con los cuantiles de
una distribucion normal, luego si exite normalidad esperarı́amos encontrar una superposiciones de
los puntos sobre la recta y=x. En este caso para los datos de la bengala Tipo 2 se podrı́a asegurar
que es posible que provengan de una distribución normal, lo que no sucede con los datos de las
bengalas Tipo 2, luego nuestras estadı́sticas de prueba podrı́an estar afectándose por este hecho.
14. Las carcasas para celulares son manufacturadas en un proceso de moldeado por inyección. El tiempo
que la parte se enfrı́a en el molde antes de ser removido está influenciado por la ocurrencia de algunos
problemas cosméticos, lineas de flujo en la carcasa finalizada. Después de su manufactura, las carcasas se
inspeccionan visualmente y reciben un puntaje de 1 a 10 basado en su apariencia, donde 10 corresponte
a una parte perfecta y 1 a completamente defectuosa. Un experimento se llevó a cabo usando dos tiempo
de enfriado, 10 y 20 segundo, 20 carcasas fueron evaluadas en cada nivel de tiempo de enfriado. Todas
las 40 observaciones en el experimentos fueron obtenidas en un orden aleatorio. Los datos son los
siguiente.
10 segundos 20 segundos
1 3 7 6
2 6 8 9
1 5 5 5
3 3 9 7
5 2 5 4
1 1 8 6
5 6 6 8
2 8 4 5
3 2 6 8
5 3 7 7
a) ¿Hay evidencia que soporte la afirmación que el tiempo de enfriado más largo resulta en menor
defectos de apariencia? Use α = 0.05
Para poder realizar la prueba diferencia de medias primero probamos la hipótesis:
H0 : σ2 = σ1 vs H1 : σ2 6= σ1
X̄1 − X̄2
T (X) = q 2 ∼ tν
S1 S22
n1 + n2
2
S12 S22
n1 + n2
ν= 22
S1 22
S2
n1 n2
n1 −1 + n2 −1
De igual forma como no se cumple la hipótesis H0 : σ2 = σ1 tenemos que calcular nuestro intervalo
de confianza con un estadı́stico que no dependa de este supuesto usando.
s
S12 S2
X̄1 − X̄2 ± tν;0.025 + 2
n1 n2
LI LS
1 2.002527 4.297473
Con un 95 % de confianza podemos afirmar que la diferencia entre los puntajes obtenidos entre
los tiempos de enfriado de 20 y 10 segundos esta entre 2 y 4 puntos de calificación.
d) Dibuje los diagramas de puntos para ayudar a la interpretación de los resultados de este experi-
mento.
20s
10s
2 4 6 8
El grafico 2 muestra que los dos tiempos de enfriamiento pueden diferir en el puntaje medio, ade-
mas el tiempo de enfriamiento de 10 segundos precenta mayor variabilidad que el de 20 segundos.
9
7
8
6
7
5
10s
20s
4
6
3
5
2
1
−2 −1 0 1 2 −2 −1 0 1 2
Como se hizo en un punto anterior, evaluaremos la normalidad de los datos por medio de los
qqplot. En la figura 3 para los datos que tienen un tiempo de enfriado de 10 segundos existen
problemas en la parte central de la distribución luego podrı́a afectar el supuesto de normalidad y
por lo tanto la prueba de hipótesis, por el contrario para el tiempo de enfriado de 20 segundos los
datos parecen seguir una tendencia lineal con presencia de algunos valores atı́picos.
15. Un artı́culo en Journal of Strain Analysis (vol. 18,no. 2, 1983) compara varios procedimientos para
predecir la resistencia al corte para vigas de chapa de acero. Los datos de nueve vigas en la forma
del radio y de la carga observada y de la pronosticada para dos de estos procedimientos, los metodos
Karlsruhe y Lehigh son como siguen:
a) ¿Hay evidencia que soporte la afirmación que existe una diferencia en la media del procedimiento
entre los dos métodos? Use α = 0.05
De igual manera probamos primero la hipotesis H0 : σ2 = σ1 vs H1 : σ2 6= σ1
data: dK and dL
F = 8.7454, num df = 8, denom df = 8, p-value = 0.006008
alternative hypothesis: true ratio of variances is not equal to 1
Para investigar los supuestos de normalidad contamos con los qqplot, en la figura 4 vemos que
los datos del método de Karlsruhe tienden a seguir la tendecia a pesar de algunos datos, por el
contrario para los datos del método de Lehigh se ve que viola este supuesto.
e) Investigue el supuesto de normalidad para la diferencia de radios de los dos métodos.
En el caso de la diferencia de los radios de los dos métodos la gráfica 5 muestra valores atı́picos que
pueden resultar en colas pesadas, por su parte en la parte central se encuentra los datos cercanos
a la recta.
f) Discuta el papel que tiene el supuesto de normalidad en la prueba t. Solo si los datos provienen
de una distribución normal podemos crear el estadı́stico T(X) con distribución t, ası́ cuando no se
tiene el supuesto las conclusiones que demos no tendran el nivel de confianza establecido y llevan
a conclusiones erradas.
16. Dos populares medicamentos para el dolor están siendo comparados en base a la velocidad de absorción
por el cuerpo. Especificamente, se afirma que la tableta 1 se absorbe el doble de rapido que la tableta
2. Asuma que σ12 y σ22 son conocidos. Desarrolle la estadı́stica de prueba para:
H0 : 2µ1 = µ2
H1 : 2µ1 6= µ2
σ2 4σ12
Suponiendo que son independiente se demostrar que si t̃1 ∼ N (µ1 , n11 ) entonces 2t̃1 ∼ N (2µ1 , n1 ).
Usando esta tenemos que:
4σ 2 σ2
2t̃1 − t̃2 ∼ N (2µ1 − µ2 , n11 + n22 )
Luego bajo la hipótesis H0 tenemos nuestro estadı́stico de prueba como:
17. Considere el experimento de los tiempos en que se quema la bengala para dos diferentes fórmulas quı́micas
(ejercicio 13). Si el tiempo medio en que se queman dos bengalas difiere como mucho en 2 minutos, encuentre
la potencia de la prueba. ¿Qué tamaño de muestra podrı́a requerise para detectar una diferencia de un minuto
en el tiempo medio de quemarse con una potencia al menos de 0.90?
Tenemos la prueba H0 : µ1 − µ2 = 0 vs H1 : µ1 − µ2 = µk ; µk > 0. consideremos la función potencia
β(µk ) = Pµk [Rechazar H]
x̄ 1 − x̄ 2
β(µk ) = Pµk q > t2n−2;α
2
s n
x̄1 − x̄2 − µk µk
β(µk ) = Pµk q > t2n−2;α − q
2
s n s n2
x̄1 − x̄2 − µk H1
T = q ∼ t2n−2
s n2
µk
β(µk ) = Pµk T > t2n−2;α − q
s n2
Ahora para el valor dado α = 0.05 y de que difieren como mucho
2 minutos se tiene µk = 2 entonces la
2√
potencia de la prueba es de β(2) = Pµk T > t18;α − 2
0.315 10
[1] 0.1129443
Ası́ se requiere una muestra de al menos 1629.84 bengalas por cada tipo de fórmula.