Está en la página 1de 14

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)

Ejercicio 1
La Dra. Bslavi es una investigadora que intenta aislar el virus del SIDA. Planea realizar un experimento usando cuatro catalizadores (C1, C2, C3 y C4) durante la produccin de una sustancia qumica para ver sus efectos en las clulas de un paciente infectado con el virus. Durante el desarrollo de la investigacin la Dra. Bslavi decide estudiar el efecto de cada uno de estos catalizadores en tres niveles de temperaturas diferentes (T1, T2 y T3). Los datos recogidos en porcentaje de concentracin se muestran en la siguiente tabla.

Replicacin I C1 73 T1 T2 T3 71 72 79 81 76 83 84 82 C2 68 C3 74

II C4 C1 81 67 71 76 C2 73 79 78 C3 76 82 81 C4 84 85 84

III C1 75 74 76 C2 77 78 83 C3 79 76 85 C4 81 84 81

Realice un anlisis de varianza para este experimento. Solucin Deberemos probar las siguientes hiptesis: Para los tratamientos(tipos de Catalizador): H0: No hay diferencia significativa entre el catalizador y la concentracin H1: Si hay diferencia significativa entre el catalizador y la concentracin Para los bloques(Niveles de Temperatura): H0: No hay diferencia significativa en la concentracin por niveles de temperatura H0: Si hay diferencia significativa en la concentracin por niveles de temperatura Para las interacciones entre Catalizador y Temperatura(interacciones) H0: No hay ninguna relacin entre los catalizadores y los niveles de temperaturas

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)


H0: Si hay ninguna relacin entre los catalizadores y los niveles de temperaturas Hagamos algunas transformaciones con este cuadro: Vamos a colocar como columna a los cuatro catalizadores: (C1, C2, C3 y C4) y como fila o bloques a los tres niveles de temperaturas: (T1, T2 y T3). El resultado es el siguiente:

C1 T1 T1 T1 T2 T2 T2 T3 T3 T3 73 67 75 71 71 74 72 76 76

C2 68 73 77 79 79 78 81 78 83

C3 74 76 79 76 82 76 83 81 85

C4 81 84 81 84 85 84 82 84 81

Las columnas constituyen los tratamientos (k = 4) con [(k-1,rk(l-1)] grados de libertad Las filas constituyen los bloques (r = 3) con [(r-1, rk(l-1)] grados de libertad Las interacciones (l=3) entre Tratamiento y Bloque tiene [(k-1)(r-1), rk(l-1)] gdos. lib. Ingrese los datos de acuerdo a la siguiente hoja: Temp. Cat. 1 Cat. 2 Cat. 3 Cat. 4 T1 T1 T1 T2 T2 T2 T3 T3 T3 73 67 75 71 71 74 72 76 76 68 73 77 79 79 78 81 78 83 74 76 79 76 82 76 83 81 85 81 84 81 84 85 84 82 84 81 Concent. 73 67 75 71 71 74 72 76 76 68 73 77 79 Temperat. T1 T1 T1 T2 T2 T2 T3 T3 T3 T1 T1 T1 T2 Cataliz. 1 1 1 1 1 1 1 1 1 2 2 2 2

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)


79 78 81 78 83 74 76 79 76 82 76 83 81 85 81 84 81 84 85 84 82 84 81 Al usar la secuencia de comandos: < Stat > - < ANOVA > - < Two Way > En < Response > ingresamos Concent. o la columna C7 En < Row factor > ingresamos Temperat. o la columna C8 En < Column factor > ingresamos Cataliz. o la columna C9 Los resultados son los siguientes: Two-way Analysis of Variance T2 T2 T3 T3 T3 T1 T1 T1 T2 T2 T2 T3 T3 T3 T1 T1 T1 T2 T2 T2 T3 T3 T3 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)


Analysis of Variance for Concent. Source Temperat Cataliz. Interaction Error Total 3 6 24 35 DF 2 SS 122.39 475.64 79.61 161.33 838.97 Individual 95% CI Temperat T1 T2 T3 Mean ----------+---------+---------+---------+75.67 78.25 80.17 76.00 78.00 (------*-------) (------*-------) (-------*-------) 80.00 82.00 MS 61.19 158.55 13.27 6.72 F 9.10 23.59 1.97 P 0.001 0.000 0.109

----------+---------+---------+---------+-

Individual 95% CI Cataliz. 1 2 3 4 Mean --------+---------+---------+---------+--72.78 77.33 79.11 82.89 73.50 77.00 (----*----) (----*----) (----*----) (----*----) 80.50 84.00

--------+---------+---------+---------+---

De acuerdo al valor del p-value se puede comprobar que las dos hiptesis nulas sern rechazadas; es decir, hay diferencia en el porcentaje de la concentracin tanto debido al uso de los catalizadores como el sometimiento a una determinada temperatura; sin embargo, la interaccin entre los niveles de temperatura y los catalizadores es insignificante, lo que implica que no se rechaza la hiptesis nula.

Ejercicio 2
El siguiente problema, que nada tiene de particular respecto a los anteriores, ser resuelto utilizando la opcin < Balanced ANOVA...> del Anlisis de Varianza, ANOVA, del comando < Stat > del Minitab.

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)

Se realiz un experimento que consista en tomar el tiempo que tardaban 6 empleados de una financiera para resolver un determinado problema mediante la hoja de clculo Excel y una calculadora. Los problemas a resolver eran de dos tipos: Financieros (F) y Estadsticos (E). Los tiempos obtenidos se muestran en el siguiente cuadro.

Empleados de la financiera

5
Carlos F Excel Calculadora E Pablo F 3.8 8.1 E 2.8 5.3 Jos F 3.0 7.6 E 2.0 4.9 Lucas F 3.4 7.8 E 2.7 5.5 Manuel F 3.3 6.9 E 2.5 5.4 Luis F 3.6 7.8 E 2.4 4.8

3.1 2.5 7.5 5.1

Hay diferencia en los tiempos promedio de clculo entre el tipo de problema y la forma de resolverlo? Solucin Sin duda este tipo de problema nos sugiere que los tiempos de clculo deben ser la variable de respuesta (Response), los empleados deben ser tomados como factores, as como el tipo de clculo y la forma de resolverlo. Por ello este es un caso especial del ANOVA que es posible resolverlo por la opcin antes mencionada. Los datos deben ser ingresados a la hoja de trabajo segn se indica, en C1, C2, C3, C4

Particip.

Tpo. Rpta.

Tipo prob.

Modelo

Carlos Carlos Carlos Carlos Pablo

3.1 7.5 2.5 5.1 3.8

Estad Estad Matem Matem Estad

Nuevo Antiguo Nuevo Antiguo Nuevo

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)


Pablo Pablo Pablo Jose Jose Jose Jose Lucas Lucas Lucas Lucas Manuel 3.3 Manuel 6.9 Manuel 2.5 Manuel 5.4 Luis Luis Luis Luis 3.6 7.8 2.4 4.8 8.1 2.8 5.3 3.0 7.6 2.0 4.9 3.4 7.8 2.7 5.5 Estad Estad Matem Matem Estad Estad Matem Matem Estad Matem Matem Estad Estad Matem Matem Estad Estad Matem Matem Nuevo Antiguo Nuevo Antiguo Nuevo Antiguo Nuevo Antiguo Antiguo Nuevo Antiguo Nuevo Antiguo Nuevo Antiguo Nuevo Antiguo Nuevo Antiguo

Usando la secuencia de comandos:

< Stat > - < ANOVA > - < Balanced ANOVA ... > . En la siguiente ventana

En < Response > ingresar Tpo. Rpta.

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)

En < Model > ingresar 'Particip.' 'Tipo prob. ' Modelo

Los resultados se muestran a continuacin:

Analysis of Variance (Balanced Designs)

Factor Type Levels Values Particip random 6 Carlos Jose Lucas Luis Manuel Pablo Tipo pro fixed 2 Estad Matem

Modelo fixed 2 Antiguo Nuevo

Analysis of Variance for Tpo. Rpt

Source Particip Tipo pro Modelo Error Total

DF 5 1 1 16 23

SS 1.053 16.667 72.107 4.692 94.518

MS

0.211 0.72 0.619 16.667 56.84 0.000 72.107 245.91 0.000 0.293

Por el valor del p value podemos decir que s hay diferencia en el tiempo de respuesta debido a los participantes; mientras que los tiempos de respuesta promedio no difieren por el tipo de problema, as como tampoco por el modelo de clculo usado

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)

Ejercicio 3
En The Wall Street Journal Almanac 1998 aparecieron datos sobre el desempeo de las aerolneas estadounidenses. A continuacin vemos los datos sobre el porcentaje de vuelos que llegan puntuales y la cantidad de quejas por 10,000 pasajeros.

Aerolneas Southwest Continental NorthWest US Airways United American Delta America West TWA

% de puntualidad 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 68.5

% de Quejas 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25

Ajuste una relacin lineal, cuadrtica o cbica para el diagrama de dispersin de estos datos. Indique la variable dependiente y la independiente.

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)


Solucin

Sin duda las quejas dependern de cun puntuales fueron las aerolneas. Por ello la variable Quejas ser la variable dependiente y la variable Puntualidad ser la independiente.

El modelo es entonces

9
Queja = F (Puntualidad) + E

Que debe ser estimada mediante la ecuacin

Hagamos uso del programa Minitab para seleccionar una adecuada estimacin de estos parmetros. Antes de ajustar el problema a un modelo lineal, convendra disponer del diagrama de dispersin para ver si la hiptesis de formular un modelo lineal se adecua. Trace un diagrama de dispersin usando <Graph> - <ScatterPlot> Como variable X: Puntualidad y variable Y: % de quejas. El siguiente es el grfico

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)

10

Creemos que un modelo lineal puede ser un ajuste adecuado para estos datos, aunque habra que medir la relacin entre las dos variables pues parece que el porcentaje de dependencia es algo conservador.

Paso 1: Ingresamos los datos de la tabla en las columnas C1, C2 y C3 de una hoja de trabajo del Minitab. Paso 2: Tratemos de ajustar los datos a una lnea de ploteo usando la secuencia: < Stat > - < Regression > - < Fitted line Plot >. En la ventana que se obtenga

ingresar C3 como variable endgena(dependiente) y C2 como variable predictora o independiente( % de Puntualidad). Seleccionemos primero la opcin < Linear > y con el mismo procedimiento seleccione despus la opcin < Cubic >.

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)


Los resultados obtenidos son Regression Analysis: % de Quejas versus % de puntualidad The regression equation is % de Quejas = 6.018 - 0.07041 % de puntualidad S = 0.160818 R-Sq = 77.9% R-Sq(adj) = 74.7%

11

Analysis of Variance Source Error Total DF SS MS F P

Regression 1 0.638119 0.638119 24.67 0.002 7 0.181037 0.025862 8 0.819156

Mientras que al usar la opcin < Cubic >, la ecuacin de estimacin obtenida es Y = 414.437 - 16.4312X + 0.218026X**2 - 9.67E-04X**3 R-Sq = 81.1 % Con un diagrama de dispersin y recta de ajuste dada en la siguiente figura

Con slo observar el r podemos afirmar que los datos se ajustan mejor a una funcin cbica y no a una lineal. Para mayor detalle veamos qu sucede con la varianza de los errores, lo que lo conseguiremos tomando en cuenta los residuales.

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)


Para ello es suficiente hacer clic en la opcin < Storage> de la ventana anterior y activar < Resduals > (se puede almacenar tambin los valores ajustados <Fits> que los almacenaremos en la columnas C4 y C5. Puesto que queremos comparar las varianzas de los residuales con ambos modelos (lineal y cbico) hagamos lo mismo con el modelo cbico, cuyos residuales y fits los almacenaremos en las columnas C6 y C7.

12
Los datos y resultados de este ejemplo lo encontramos en el archivo Regre02.mtw. All encontramos que las columnas C8 y C9 contienen el cuadrado de los residuales y las celdas de las columnas C10 y C11 contienen las varianzas y las desviaciones estndares para los dos modelos. Se puede apreciar que el modelo cbico tiene menor dispersin que el modelo lineal. Ahora vamos a realizar el anlisis de regresin correspondiente al problema. Para ello usemos la siguiente secuencia: < Stat > - < Regression ... > - < Regression >. Obtendremos la siguiente ventana:

En ella ingresemos en < Response > la variable dependiente C3 y en < Predictors > se ingresar todas las variables predictoras o independientes; en este caso, C2. Ingresando por <Options> active < Durbin Watson >

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)


Los resultados que se obtienen son los que se muestra a continuacin: Regression Analysis The regression equation is % de Quejas = 6.02 - 0.0704 % de puntualidad Predictor Constant % de pun S = 0.1608 Coef 6.018 -0.07041 StDev 1.052 0.01418 T 5.72 -4.97 P 0.001 0.002

13

R-Sq = 77.9%

R-Sq(adj) = 74.7%

Analysis of Variance Source Regression Total 8 DF 1 SS 0.63812 0.18104 MS F P 24.67 0.002

0.63812 0.02586

Residual Error 7

0.81916

Durbin-Watson statistic = 2.526987 Interpretacin de estos resultados:

a) El trmino independiente llamado tambin intercepto E = 6.02, representa el valor inicial de Y; es decir, el 6.02% de quejas se recibira si ninguna aerolnea fuera puntual. En muchos casos esta constante no es lgicamente significativa. b)

El coeficiente de regresin F = - 0.07401; representa el cambio que experimentara la variable Y (%

Ejercicios Diseos de Experimentos (Anova y Regresin Lineal)


de quejas) por cada unidad de cambio en la variable X ( % de puntualidad). Si se incrementa la puntualidad, el porcentaje de quejas se reducir, como es lgico. La grfica anterior fue obtenida con el MS Excel. Tomando en cuenta la ecuacin resultante de los modelos lineal y cbico se han obtenido estimaciones para porcentajes de puntualidad de 0 a 20. Se puede apreciar en ambos casos que, a mayor puntualidad el porcentaje de quejas disminuye.

14