Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ciencias económicas
Estadística
En este caso con cinco medias tenemos diez posibles pares de medias, y si la probabilidad
de aceptar la H 0 para cada prueba individual es de (1−∝) = 0.95, entonces la probabilidad
de aceptar las diez H0 es de 0.95110 = 0.5987, lo cual representa un aumento considerable
del error tipo I. Aunque se utilice un nivel de confianza tal que (1−∝)10=0.95, el
procedimiento resulta inapropiado porque se pueden producir sesgos por parte del
experimentador.
3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento?
Es la suma de cuadrados divididos entre sus respectivos grados de libertad
4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de
varianza?
Representa el número de piezas de información independientes en la suma de cuadrados. En
general, es el número de observaciones menos el número de parámetros estimados de los
datos
5. A continuación, se muestra parte del ANOVA para comparar cinco tratamientos
con cuatro réplicas cada uno.
FUENTE DE SUMA DE G. DE C.MEDIO RAZÓN VALOR-p
VARIACIÓN CUADRADOS LIBERTAD F
𝟐𝟎𝟎
𝑭𝑶 = 𝟐𝟔.𝟔𝟔 = 𝟕. 𝟓
a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para
cada una de las fuentes de variación.
b) Explique de manera esquemática cómo calcularía el valor-p o la significancia
observada, para ver si hay diferencia entre tratamientos.
Valor-p es el área bajo la distribución 𝐹𝑘−1,𝑁−𝑘 a la derecha del estadístico 𝐹𝑜, es decir, el
valor-p=P(F>Fo).
c) ¿Con la información disponible se pueden hacer conjeturas sobre si hay diferencias
significativas entre tratamientos? Argumente su respuesta.
Es posible determinar la diferencia entre los tratamientos, mediante la información
presentada en la tabla ANOVA con el valor obtenido del estadístico Fo que sigue una
distribución F con (k-1) grados de libertad en el numerador y (N-k) grados de libertad en el
denominador y el valor obtenido de la tabla de la distribución F para probar la hipótesis de
igualdad de los tratamientos con respecto a la media de la correspondiente variable de
respuesta. Ya que en caso de rechazar la hipótesis anterior se estaría asumiendo que las
medias de los tratamientos son diferentes
d) Anote el modelo estadístico y formule la hipótesis pertinente.
𝐻𝑜: 𝜇1 = 𝜇2 =. . . = 𝜇𝐾 = 𝜇
𝐻𝐴 = 𝜇𝑖 ≠ 𝜇𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔𝑢𝑛 𝑖 ≠ 𝑗
6. Se desea investigar el efecto del pH en el crecimiento de cierto microorganismo en un
medio específico. Para ello se realiza un experimento, teniendo como punto de partida
la misma cantidad de microorganismos. Se hacen cuatro repeticiones y se obtienen los
siguientes resultados. ¿Estos datos son evidencia suficiente para afirmar que los niveles
de pH donde se logra menor y mayor crecimiento son e1 3 y el 2, respectivamente?
Explique su respuesta.
Estos datos no son suficientes, pues requerimos conocer los datos de cada tratamiento para
poder llevar a cabo el método de diferencia mínima significativa
Método Tukey: Este método consiste en, si se rechaza la hipótesis nula básica de
igualdad de todas las medidas, llevar a cabo todos los test posibles para comparar
todas las parejas de medias entre sí. Se trata, por tanto, de realizar los contrastes de
todos los test.
Método de Duncan: Se utiliza para comparar todos los pares de medias. Esta prueba
no requiere de una prueba previa de F, como sucede con la DMS o sea que aún sin
ser significativa la prueba F puede llevarse a cabo.
Método Dunnet (Control): Procedimiento que requiere una simple diferencia para
juzgar la significancia de las diferencias observadas y tablas para efectuar este tipo
de comparaciones.
10. En una industria química se prueban diferentes mezclas para ver si difieren en
cuanto al peso molecular final. Se prueban cuatro diferentes mezclas, con cinco
repeticiones cada una. A continuación, se muestra una parte de la tabla del análisis de
varianza y los promedios obtenidos para cada mezcla.
b) Con el análisis de varianza y de acuerdo al promedio, ¿se puede asegurar que con la
mezcla B se logra un menor peso molecular? Argumente su respuesta.
No, debemos de saber que ocurrió en cada uno de los tratamientos y sus repeticiones.
c) Si al verificar los supuestos de varianza constante (igual varianza entre las mezclas),
éstos no se cumplen, ¿qué significa eso? ¿Se puede seguir apoyando la conclusión del
inciso a)?
Si, pues desde un principio se dijo que existía una diferencia grande entre cada tratamiento,
esto debido a una diferencia notable de las varianzas
Hipótesis: Ho: µ1 = µ2 = µ3 = µ4 = µ5
H1: µ1 ≠ µ2 ≠ µ3 ≠ µ4 ≠ µ5
Total 95528,9642 27
9
De acuerdo al criterio:
P-valor< nivel de significancia H0 Se rechaza, H1 se acepta
P-valor>nivel de significancia H0 Se acepta, H1 se rechaza
De acuerdo al análisis de varianza tenemos que P-valor < Nivel de significancia (0.05), por lo que la
hipótesis nula se rechaza, es decir existe significancia en el promedio de la cocción de los frijoles
debido a la aplicación de los tratamientos 1, 2, 3 y el tratamiento de control.
Gráfico de medias
e) ¿Hay algún tratamiento mejor? ¿Cuál es el tiempo de cocción esperado para el mejor
tratamiento?
El asterisco que se encuentra al lado de los 3 pares indica que estos pares muestran diferencias
estadísticamente significativas con un nivel del 95,0%de confianza. No existen diferencias
estadísticamente significativas entre aquellos niveles que compartan una misma columna de X's.;
pero (con el método de Fisher) hay un riesgo del 5% al decir que en cada par de medias hay
diferencias significativas
f) Algo importante a cuidar en un experimento es que no haya efectos colaterales no deseados,
causados por el tratamiento ganador; en este caso, piense en los posibles efectos colaterales
que podría causar el mejor tratamiento.
Los posibles efectos colaterales que podría causar el mejor tratamiento es que el cloruro de sodio
puede causar daños severos a la salud, así como también al medio ambiente.
g) ¿Se cumplen los supuestos del modelo? Verifique gráficamente.
Supuesto de normalidad
La dispersión de los datos se encuentra dentro del rango esperado para datos provenientes de una
distribución normal.
Supuesto de homogeneidad
Q calculado:
σ 2 (Más grande) 26,24 0,3228
Sumatoria de todas las varianzas 81,29
Q tabla: 0.5365
Ho: σ 21 = σ 22 = σ 23 = σ 24
H1: σ 21 ≠ σ 22 ≠ σ 23 ≠ σ 24
De acuerdo al criterio:
Si el Q calculado < estadístico Q; H0 Acepto, H1 Se rechaza
Si el Q calculado > estadístico Q; H0 Rechazo, H1 Se acepta
De acuerdo al análisis de varianza tenemos que el Q calculado es < estadístico Q por lo que la
hipótesis nula se acepta, es decir hay homogeneidad en las varianzas.
Supuesto de residuos
Los datos presentan independencia, lo que indica que la probabilidad de cada uno de ellos no está
influida porque el otro suceso, es decir, que los sucesos no están relacionados.
13. Para estudiar la confiabilidad de ciertos tableros electrónicos para carros, se someten a un
envejecimiento acelerado durante 100 horas a determinada temperatura, y como variable de
interés se mide la intensidad de corriente que circula entre dos puntos, cuyos valores
aumentan con el deterioro. Se probaron 20 módulos repartidos de manera equitativamente en
cinco temperaturas y los resultados obtenidos fueron los siguientes:
Hipótesis:
Ho: µ1 = µ2 = µ3 = µ4 = µ5
H1: µ1 ≠ µ2 ≠ µ3 ≠µ4 ≠ µ5
b) b) Realice el análisis de varianza para estos datos, a fin de estudiar si la temperatura afecta
la intensidad de corriente promedio.
Total 3599,8 19
De acuerdo al criterio:
P-valor< nivel de significancia H0 Se rechaza, H1 se acepta
P-valor>nivel de significancia H0 Se acepta, H1 se rechaza
De acuerdo al análisis de varianza tenemos que P-valor < Nivel de significancia (0.05), por lo que la
hipótesis nula se rechaza, es decir existe significancia en el promedio de la intensidad de corriente
que circula entre los puntos debido a la aplicación de los tratamientos dadas diferentes
temperaturas.
c) ¿La temperatura afecta la variabilidad de las intensidades? Es decir, verifique si hay igual
varianza entre los diferentes tratamientos.
Q calculado:
σ 2 (Más grande) 26,250 0,4189
Sumatoria de todas las varianzas 62,667
Q tabla: 0.5895
Ho: σ 21 = σ 22 = σ 23 = σ 24
H1: σ 21 ≠ σ 22 ≠ σ 23 ≠ σ 24
De acuerdo al criterio:
Si el Q calculado < estadístico Q; H0 Acepto, H1 Se rechaza
De acuerdo al análisis de varianza tenemos que el Q calculado es < estadístico Q por lo que la
hipótesis nula se acepta, es decir hay homogeneidad en las varianzas.
Total 773,4272 49
De acuerdo al criterio:
P-valor< nivel de significancia H0 Se rechaza, H1 se acepta
P-valor>nivel de significancia H0 Se acepta, H1 se rechaza
De acuerdo al análisis de varianza tenemos que P-valor < Nivel de significancia (0.05), por lo que la
hipótesis nula se rechaza, es decir existe significancia en el promedio de porcentajes de productos
defectuosos dada la aplicación de un tratamiento y sin este.
b) ¿Cuál es el porcentaje de defectos que se espera con el nuevo tratamiento?
Suma ST 79
Suma CT 231,8
Diferencia CT-ST 152,80
% 65,9188956
a) ¿Hay evidencia suficiente de que el almidón influye en la dureza en las tabletas? Halle el
ANOVA.
Total 27,9466667 11
De acuerdo al criterio:
P-valor< nivel de significancia H0 Se rechaza, H1 se acepta
De acuerdo al análisis de varianza tenemos que P-valor < Nivel de significancia (0.05), por lo que la
hipótesis nula se rechaza, es decir existe significancia en el promedio de porcentajes de productos
defectuosos dada la aplicación de un tratamiento y sin este.
Diagrama de caja
Se observa que las cajas no se traslapan, otra muestra visual de que el algodón influye
considerablemente en la dureza de las tabletas, en donde con el 10% se obtiene más dureza.
En la gráfica de normalidad, los residuos tienden a ajustarse a la línea recta, por lo cual se determina
que las observaciones proceden de poblaciones normales y por ende se cumple el supuesto de
normalidad.
Y en la gráfica del supuesto de independencia o aleatoriedad no se presentan patrones anormales
por lo tanto las muestras son aleatorias e independientes y se cumple con el supuesto de
aleatoriedad.
16. Los datos que se presentan enseguida son rendimientos en toneladas por hectárea de un
pasto con tres niveles de fertilización nitrogenada. El diseño fue completamente aleatorizado,
con cinco repeticiones por tratamiento.
Niveles de Nitrógeno
1 2 3
Número 1 14,823 25,151 32,605
de réplicas 2 14,676 25,401 32,460
3 14,720 25,131 32,256
4 14,5141 25,031 32,669
5 15,065 25,276 32,111
RESUMEN
Grupos Cuenta Suma Promedio Varian
za
Columna 1 5 73,7981 14,75962 0,0415
2902
Columna 2 5 125,99 25,198 0,0204
7
Columna 3 5 162,101 32,4202 0,0550
507
ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los F Probab Valor
variaciones cuadrados libertad cuadrados ilidad crítico para
F
Entre grupos 788,36006 2 394,18003 10102, 4,3720 3,88529383
8868 7E-20 5
Dentro de los 0,46819889 12 0,03901657
grupos
Total 788,828259 14
De acuerdo al criterio:
Fcalculada ≥ Ftablas H0 Se rechaza, Ha se acepta
Fcalculada ≤ Ftablas H0 Se acepta, Ha se rechaza
De acuerdo al análisis de varianza tenemos que Fcalculada ≥ Ftablas .
Por lo que la hipótesis se rechaza, por lo que se deduce que el factor de la fertilización nitrogenada
afecta el rendimiento del pasto
c) Analice los residuos, ¿hay algún problema?
Supuesto de Normalidad:
Ho: X = N (µ, σ2)
H1: X ≠ N (µ, σ2)
Sw cal 0,813
Sw tab 0,881
Niveles de Nitrogeno
1.2
0.8
0.6
0.4
0.2
0
0.0000 5.0000 10.0000 15.0000 20.0000 25.0000 30.0000 35.0000
No se cumple ya que los datos están muy dispersos, y no tienden aparecer una línea recta.
Supuesto de Homogeneidad:
Ho: σ2= σ2= σ2 Q calculado 0,47031893
H1: σ2 ≠ σ2 ≠ σ2 Q tabla 0,5012
Acepto la Ho
varianzas
0,03322322
0,016376
0,04404056
Supuesto de Independencia:
10.0000 Niveles de Nitrogeno
8.0000
6.0000
4.0000
2.0000
0.0000
-2.00000.0000 5.0000 10.0000 15.0000 20.0000 25.0000 30.0000 35.0000
-4.0000
-6.0000
-8.0000
-10.0000
-12.0000
No cumple ya que se puede observar en la gráfica que todos los datos siguen un patrón
Si, ya que la F calculada es mucho mayor que la F de tablas por lo que se va a encontrar una gran
significancia en las medias
c) Escriba las hipótesis para probar la igualdad de medias y el modelo estadístico.
Ho: µ1= µ2= µ3
H1: µ1 ≠ µ2 ≠ µ3
Modelo estadístico: Yij = µ + ti +Eij
d) Realice el análisis adecuado para probar las hipótesis e interprete los resultados.
Variable respuesta: porcentaje de friabilidad
Tratamiento: tipos de aglutinantes
Unidad experimental: tabletas de ampicilina de 500 mg
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Fila 1 5 1,174 0,2348 0,0238362
Fila 2 5 48,19 9,638 0,03897
Fila 3 5 1,465 0,293 0,0365795
ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los F Probabilidad Valor
variaciones cuadrados libertad cuadrados crítico para
F
Entre grupos 292,920971 2 146,460485 4420,9726 6,1982E-18 3,88529383
Dentro de los 0,3975428 12 0,03312857
grupos
Total 293,318514 14
Sw cal 7,519
Sw tab 0,881
Aglutinantes
1.2
0.8
0.6
0.4
0.2
0
0 2 4 6 8 10 12
No se cumple ya que los datos están muy dispersos, y no tienden aparecer una línea recta.
Supuesto de Homogeneidad:
Ho: σ2= σ2= σ2 Q calculado 0,39210872
H1: σ2 ≠ σ2 ≠ σ2 Q tabla 0,5012
Acepto la Ho
varianzas
0,01906896
0,031176
0,0292636
Se cumple ya que no existe una varianza muy marcada en los datos
Supuesto de Independencia:
Aglutinante
8.0000
6.0000
4.0000
2.0000
0.0000
0 2 4 6 8 10 12
-2.0000
-4.0000
No cumple ya que se puede observar en la gráfica que todos los datos siguen un patrón
18. Se cultivaron cuatro diferentes clonas de agave tequilana bajo un mismo esquema de
manejo. Se quiere saber qué clona es la que responde mejor a dicho manejo, evaluando el
nivel de respuesta con el porcentaje de azúcares reductores totales en base húmeda. Los datos
se muestran a continuación:
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 5 38,93 7,786 2,77833
Columna 2 5 63,36 12,672 11,71402
Columna 3 5 79,21 15,842 2,13587
Columna 4 5 42,44 8,488 6,10327
ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los F Probabilidad Valor
variaciones cuadrados libertad cuadrados crítico para
F
Entre grupos 213,62626 3 71,2087533 12,5304154 0,00018059 3,23887152
Dentro de los 90,92596 16 5,6828725
grupos
Total 304,55222 19
H0 = µ1 = µ2 = µ3 = µ4
Ha = µ1 ≠ µ2 ≠ µ3 ≠ µ4
Fo>F tablas
Al compararse las medias de las clonas se concluye que al menos una de ellas difiere de las de más
en cuanto a contenido de azucares, debido a que se rechaza la hipótesis nula de igualdad de medias.
b) ¿Hay una clona que haya respondido mejor al esquema de manejo? Argumente su respuesta.
La clona 3 responde mejor a dicho manejo ya que se puede evidencia que tiene una varianza menor
y al observar los datos se evidencia valores mayores a las otras clonas.
c) En caso de que exista un empate estadístico entre dos o más clonas, ¿qué propondría para
desempatar?
Para desempatar habría que considerar otros factores como el costo de producción, costo de las
clonas.
19. Uno de los defectos que causan mayor desperdicio en la manufactura de discos ópticos
compactos son los llamados “cometas”. Típicamente, se trata de una partícula que opone
resistencia al fluido en la etapa de entintado. Se quiere comprobar de manera experimental la
efectividad de un tratamiento de limpieza de partículas que está basado en fuerza centrípeta y
aire ionizado. A 12 lotes de 50 CD se les aplica el tratamiento y a otros 12 lotes no se les aplica;
en cada caso se mide el porcentaje de discos que presentan cometas, los resultados son los
siguientes:
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Con 12 40,42 3,36833333 1,76257879
tratamiento
Sin tratamiento 12 112,16 9,34666667 9,11880606
ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los F Probabilidad Valor
variaciones cuadrados libertad cuadrados crítico
para F
Entre grupos 214,442817 1 214,442817 39,4146186 2,5595E-06 4,3009495
Dentro de los 119,695233 22 5,44069242
grupos
Total 334,13805 23
Si se debería implementar ya que nos da una menor cantidad de CD en mal estado de igual forma se
evidencia una varianza menor.
b) ¿Es razonable suponer en el inciso a) que las varianzas son iguales?
No es razonable ya que si se supone que los dos tratamientos tengan un valor igual de varianzas no
importaría si se aplica o no el tratamiento ya que se tendrá el mismo número de CD en mal estado
en los dos tratamientos
c) ¿En qué porcentaje se reducen los discos con cometas?
Se reduce aproximadamente en un 60% si se aplica el tratamiento