Está en la página 1de 38

EXPERIMENTOS CON UN SOLO FACTOR: ANALISIS DE VARIANZA 1. DEFINICIONES y CONCEPTOS 1.1.

- EXPERIMENTO Definicin El trmino "Experimento" se refiere a la creacin y preparacin de lotes de prueba que verifiquen la validez de las hiptesis establecidas sobre las causas de un determinado problema o defecto, objeto de estudio. Concepto En un Experimento, el experimentador escoge ciertos factores para su estudio, los altera deliberadamente de forma controlada y despus, observa el efecto resultante. El Experimento puede realizarse bien en laboratorio o bien en el exterior: En la fbrica, en unos almacenes, en los locales del usuario, etc. 1.2.- DISEO DE EXPERIMENTOS Definicin Metodologa estadstica destinada a la planificacin y anlisis de un Experimento. Concepto El Diseo de un Experimento debe garantizar que este cumpla ciertos requisitos mnimos: - Debe poder comprobar las hiptesis objeto de estudio, no dejndose confundir por variables insospechadas (=ruido), como errores de medida desproporcionados, etc. - Debe poder revelar la existencia de cualquier causa importante de variacin, aunque no haya sido adelantada como hiptesis. - Debe mantener los costes de experimentacin a un nivel razonable, en comparacin con el problema objeto de estudio. - Debe tener un alto grado de seguridad en las respuestas. - Si el Experimento se realiza en un laboratorio, ste ha de ser, respecto a las variables estudiadas, un buen indicador de las pruebas que se obtendran en el taller o "in situ".
1

- Si el Experimento se realiza durante el desarrollo normal del proceso en estudio, se tendr adems cuidado de interferir lo menos posible en el trabajo normal y protegerse de las interferencias no autorizadas o involuntarias en la prueba por parte del personal adepto. 1.3.- VARIABLE Definicin Caracterstica de un objeto que puede ser observada y que puede tomar diferentes valores, tanto en el mismo objeto como entre diferentes objetos. Concepto En base a la posibilidad de medida se distinguen dos tipos fundamentales de variables: Variables cualitativas: Son aquellas cuyos valores, de carcter nominal, slo pueden ser comparados como diferentes entre s. Ejemplos: La variable "color" puede tomar los valores rojo, azul, amarillo, etc. La variable "empleado" puede tomar los valores Juan, Jos, Cristina, etc. Variables continas: Son aquellas cuyos valores, de carcter numrico, permiten realizar un mayor nmero de comparaciones. Una variable continua permite tericamente, un infinito nmero de valores entre dos valores consecutivos. (En la realidad la precisin de los instrumentos de medida pone un lmite operativo). Ejemplos: La variable "peso de la tableta de chocolate" puede tomar cualquier valor entre 95 y 110 gr. La variable "consumo de gasolina por 100 Km" puede tomar cualquier valor entre 9 y 15 litros etc. 1.4.- SUJETO O UNIDAD EXPERIMENTAL Definicin El sujeto o unidad experimental es la unidad bsica sobre la que se efecta el proceso de medida. Ejemplo: El contenido de azcar en el zumo de naranja producido se medir recogiendo cada hora una unidad experimental de 1 litro de zumo.
2

1.5.- OBSERVACIN Definicin Una observacin es una toma de medida de una variable y consta entonces de un valor de la misma. Dependiendo del tipo de Diseo, las observaciones pueden tomarse a diferentes sujetos o al mismo sujeto de manera secuencial. 1.6.- DIFERENTES TIPOS EXPERIMENTO DE VARIABLES EN EL DISEO DE UN

En un Diseo de Experimento se distinguen los siguientes tipos de variables, segn el contenido conceptual, o papel que tienen en el mismo. Variable independiente. Es el factor (causa) que suponemos influye sobre la caracterstica que medimos (defecto, error, etc). Para comprobar su influencia, el investigador la manipular durante el Experimento, en el sentido que le asignar valores diferentes a cada observacin. Esta variable se llama tambin "tratamiento" y cada uno de los valores que se le asignarn "nivel de tratamiento". En este Procedimiento se consideran slo Experimentos con una nica variable independiente. Si se quiere o necesita manipular ms de una variable independiente, ser necesaria la colaboracin de un experto en estadstica, puesto que el Diseo del Experimento y la interpretacin de los resultados se complican notablemente. Variable dependiente. Es aquella variable que se mide en cada observacin del Experimento, para establecer si la variable independiente efectivamente influye sobre sus valores. Variables extraas. Son todas aquellas que el investigador no puede manipular, pero influyen en la variable dependiente. Son la causa de que las observaciones en un mismo nivel de tratamiento no necesariamente arrojen el mismo valor de medida. El conjunto de variables extraas se denomina generalmente en el Diseo y Anlisis de Experimentos "ruido" o "error experimental".

Variable de bloqueo. Es una variable que sabemos puede intervenir en los niveles de la variable dependiente y decidimos eliminar su influencia mediante el control de la misma, creando bloques de observaciones, en los que esta variable, asume respectivamente un valor constante. A cada bloque se asignarn todos los niveles de tratamiento. Con la creacin de bloques se persiguen dos objetivos: - Aislar el efecto de los tratamientos, eliminando la influencia de la variable de bloqueo. - Estimar los efectos de los bloques. 1.7.- REPETICIN Definicin Reiteracin de una observacin o medida al mismo nivel de tratamiento. Proporciona una oportunidad para que los efectos de las variables extraas, incontroladas se compensen y permite, adems, medir el error experimental. 1.8.- ALEATORIZACIN Definicin Tcnica utilizada para reducir la influencia no predeterminable de variables extraas sobre los resultados del Experimento. Concepto La aleatorizacin consiste en asignar los sujetos a los distintos niveles de tratamiento al azar, con la esperanza de que los efectos extraos se contrarresten entre los distintos sujetos y observaciones que componen cada nivel de tratamiento (condicin experimental). La aleatorizacin es fundamental en el Diseo de Experimentos ya que: a) Previene la existencia de sesgo. b) Evita la dependencia entre observaciones. c) Confirma la adecuacin de los procedimientos estadsticos para el anlisis de los resultados del Experimento.

2. REALIZACIN
2.1. REALIZACIN DEL DISEO PROPIAMENTE DICHO
Paso 1: Definir claramente la hiptesis a comprobar Es de importancia fundamental identificar de forma muy especfica el objetivo del Experimento, es decir, la pregunta exacta que se quiere contestar o la hiptesis que se necesita contrastar. Esta pregunta bsica se formular por escrito. Paso 2: Identificar la variable independiente La variable independiente representa la caracterstica que, suponemos, influye sobre los valores de la variable dependiente. Puesto que, para la realizacin del Experimento, se le asignarn diferentes valores, hay que asegurarse que est en nuestro poder manipularla. Paso 3: Establecer los tratamientos En base a la naturaleza de la variable, las condiciones reales del proceso o situacin y la pregunta especfica que se quiere contestar, se identificarn los valores o el recorrido de valores de la variable independiente, relevantes para el Experimento y se establecern los tratamientos a efectuar. Paso 4: Decidir el nmero de repeticiones para cada tratamiento Es absolutamente aconsejable realizar varias observaciones para cada nivel de tratamiento (condicin experimental), para que los errores de medida e influencias no controladas de variables extraas puedan contrarrestarse entre s. Ejemplo: Se desea hacer un estudio de transporte de mercancas. La idea que se tiene en la cabeza es que el tamao de los paquetes afecta al tiempo necesario para la carga del volumen disponible en un remolque. La variables independiente estar relacionada entonces con el tamao de los paquetes a transportar. Se distinguirn dos tipos de paquetes, los que exceden el tamao de 60x60x60 cm, a los que llamarn grandes, y los menores de estas dimensiones, a los que se llamarn pequeos.
5

Hiptesis: Hay diferencias entre el tiempo necesario para la carga de un remolque slo con mercancas pequeas, o slo con mercancas grandes, o la mezcla de ambas. Se tiene entonces tres niveles de tratamiento; grande (1), pequeo (2) y mixto (3). Se decide realizar cuatro observaciones (repeticiones) para cada tratamiento. Paso 5: Definir los sujetos sobre los que se va a realizar la medida Paso 6: Determinar la variable dependiente Slo puede existir una nica variable dependiente. Esta deber tener, necesariamente, un nivel de medida continuo, o lo ms prximo a ese extremo que sea posible. Cuantas ms posibilidades de apreciar diferencias entre distintas observaciones ofrezca la variable dependiente, ms se favorecer la sensibilidad de la misma a los distintos tratamientos. Ejemplo: En el ejemplo de transporte de mercancas, los sujetos de medicin deberan ser diferentes remolques, pero utilizar varios remolques para cada tratamiento exigir una facturacin por encima de la normal. Lo que se puede hacer es dividir un remolque en varias parcelas de igual tamao y determinar como sujeto cada una de las parcelas. Se divide entonces un remolque en 12 cajoneras aprovechables de igual tamao. A cada condicin experimental se le asignan cuatro cajoneras. La variable dependiente va ser el tiempo necesario para completar la carga de una cajonera.

Paso 7: Explicitar el procedimiento de aleatorizacin Esta es una parte muy importante del Diseo, ya que asegurar que las diferencias que se encuentren entre los tratamientos son debidas a ellos mismos y no a efectos laterales no deseados. Un procedimiento muy fcil y comn para asignar los sujetos a los diferentes tratamientos al azar es el siguiente:
6

Numerar los sujetos y hacer para cada sujeto un papel con el nmero correspondiente. Poner todos los papeles en una bolsa y mezclarlos. Extraer, para cada tratamiento, tantos papeles "a ciegas", cuantas son las observaciones planificadas para el mismo. Ejemplo: Volviendo al ejemplo: se ha dividido el remolque en 12 cajoneras. Se trata ahora de asignar a cada tratamiento 4 cajoneras. Se asigna primero un nmero a cada cajonera y se escribe un papel para cada nmero. Luego se extraen 4 nmeros aciegas: las cajoneras correspondientes se utilizarn para el tratamiento 1 (paquetes grandes). Los prximos 4 papelitos que se extraigan indicarn las cajoneras destinadas al tratamiento 2 (paquetes pequeos), y las 4 cajoneras restantes servirn para el tratamiento 3 (paquetes mixtos).

Tr 1 Tratamientos

11

Tr 2

10

Tr 3

12

Paso 8: Identificar posibles factores de "ruido" y/o variables de bloqueo Analizar la futura situacin experimental e identificar los factores que puedan, adems de la variable independiente, influir sobre los valores de la variable dependiente. Segn su relevancia y las posibilidades tcnicas, la decisin a adoptar respecto a los factores de ruido y/o variables de bloqueo, ser la siguiente: - O bien tenerlos bajo control (constantes), a lo largo de todas las observaciones. - O bien integrarlos en el Diseo, como variable de bloqueo. - O bien transformarlos en una variable independiente. Esto ser necesario, aunque se complique notablemente el Diseo de Experimento desde el punto de vista estadstico, cuando su influencia sobre la variable dependiente resulte ser relevante. - O bien se espera que la aleatorizacin sea suficiente para que sus efectos se contrarresten en las repeticiones de cada tratamiento. Esta posibilidad ser aceptable slo si la variable en cuestin est fuera de nuestro control y se considera que su influencia es bastante limitada. Su efecto se englobar dentro del "error experimental", o "ruido". Ejemplo: Un posible factor de ruido influye en el tiempo necesario para la carga de los paquetes, mezclndose al efecto del tamao de los paquetes, puede ser el cansancio del personal de carga. Se intenta entonces mantener esta variable lo ms constante posible a lo largo del experimento, realizando siempre solo una observacin (= carga de una cajonera) por da, y siempre a primera hora.

Paso 9: Asegurarse de la aptitud del Diseo del Experimento para contestar la pregunta inicial Comprobar que el tipo de resultados que obtendremos del Experimento tal y como lo hemos planificado, nos proporcionar efectivamente la informacin que necesitamos. El resultado de este paso ser el Diseo, propiamente dicho, del Experimento.

Paso 10: Realizacin del Experimento Se crearn las condiciones experimentales (tratamientos) y se efectuarn las observaciones segn el plan establecido, teniendo un cuidado particular en evitar posibles influencias extraas sobre los valores de la variable dependiente. Se registrarn los resultados del Experimento, anotando adems toda la informacin posiblemente relevante sobre las circunstancias prcticas de cada observacin. (Persona que realiza la medicin, hora, temperatura, etc...). Ejemplo: Resultados de las mediciones realizadas sobre los tiempos de carga Tratamiento Tr 1 Tr 2 Tr 3 6,10 10,90 6,70 Tiempos de carga 5,40 6,80 10,20 9,20 6,08 7,10 5,68 11,90 5,93

2.2. REALIZACIN DE LA TCNICA DE ANLISIS DE VARIANZA


Una vez se ha realizado el experimento, los datos obtenidos debern ser procesados mediante tcnicas estadsticas apropiadas para la comprobacin de hiptesis. Cuando el objetivo es juzgar sobre la validez de hiptesis estadsticas relacionadas con las medias de tratamientos el anlisis de varianza es la herramienta apropiada para ello, se presentan a continuacin los elementos metodolgicos de aplicacin de esta tcnica: Sean son los valores de la variable dependiente evaluada en el tratamiento y la observacin . Se consideran tratamientos y observaciones (replicas).

Bajo estos supuestos los valores de la variable dependiente pueden ser presentados en la siguiente tabla:

Tabla 1. Datos tpicos de un experimento de un solo factor Tratamientos (niveles) 1 2 . . .


a

Observaciones

Totales

Promedios . . .

. . .

. . .

. . .

Los valores anteriores se presentan de manera recurrente as:

Modelos Estadsticos lineales: a) Modelo de las medias

10

Se considera

b) Modelo de los efectos

Requisito: que el experimento se lleve a cabo en orden aleatorio para que el ambiente en el que se apliquen los tratamientos sea lo ms uniforme posible. Objetivos: Probar las hiptesis apropiadas acerca de las medias de los tratamientos y estimarlas. Supuestos: Tipos de modelos de efectos: a) Fijos: El experimentador escoge los niveles en los que va a realizar los experimentos. b) Aleatorios: Los de tratamientos. tratamientos son una muestra de una poblacin ms grande ( ), es decir ( )

ANALISIS DEL MODELO CON EFECTOS FIJOS En la tabla N1

11

El objetivo operativo que se persigue al aplicar la tcnica del ANOVA es conjeturar sobre las hiptesis estadsticas abajo planteadas, es decir:

Probar

Por lo general,

se considera como media global, as:

Esto implica que

Se quiere:

Probar

Por ello, se habla de probar la igualdad de las medias o probar que los efectos de los tratamientos son cero. Una consideracin importante para establecer un criterio sobre el cual juzgar la veracidad o no de las hiptesis formuladas en la prueba se demuestra a continuacin: Teorema 1. ( ) ( ) ( )

12

Demostracin. ( ) [( ) ) ) ) ( ( )] )( ) )( ) ( ) ) + ( )

*( ( ( Ya que (

( (

Es frecuente encontrar en la literatura la denominacin siguiente para las expresiones utilizadas: - Variacin total de los datos es la combinacin de: Suma de cuadrados de los errores - Variacin debida al azar (Variacin dentro de las muestras) y Suma de cuadrados debida a los tratamientos -Variacin debida al azar cuando la hiptesis nula es verdadera (Variacin entre los tratamientos). Tiene

grados de libertad - Tiene grados de libertad grados de libertad

- Tiene

- Varianza muestral del tratamiento

13

La suma de las varianzas de los tratamientos ponderadas puede ser expresada no solo mediante , sino tambin mediante , esto se evidencia de la siguiente manera: ( ( ) ) ( ( ) ) ( ( ) ) * ( ( ) ) + ( )

Es decir, ( tratamientos. Ahora,

es un estimador de la varianza comn de cada uno de los

Es una estimacin de

si las medias de los tratamientos son iguales.

A las expresiones obtenidas se les denomina Cuadrados Medios, as:

Los cuadrados medios son variables aleatorias con las siguientes propiedades: Teorema 2. ( ( ) )

14

Demostracin ( ) [ ] * ( ) +

* (

)+

[ (

) ]

* [(

)) +

15

* [

]+

)+

[ [

)]

Las anteriores consideraciones sirven para formular el teorema que explicita el anlisis estadstico seguido en la aplicacin de ANOVA para comprobar la media de tratamientos.

Teorema 3 Suponga que tiene lugar el esquema de efectos lineales descrito con anterioridad, es decir,

( (

) )

( ( (

) ) )

16

Entonces deber rechazarse y concluirse que hay diferencias en las medias de los tratamientos.

OJO. Tambin:

Ejemplo 3.1: Un ingeniero de desarrollo de productos tiene inters en investigar la resistencia a la tensin de una fibra sinttica nueva que se usar para hacer telas de camisas para caballero. El ingeniero sabe por experiencia previa que la resistencia a la tensin se afecta por el peso porcentual del algodn utilizado en la mezcla de materiales de la fibra. Adems, sospecha que al aumentar el contenido de algodn deber variar ente 10 y 40 por ciento para que el producto final tenga otras caractersticas de calidad que se desean (como la capacidad de ser sometido a un tratamiento de planchado permanente). El ingeniero decide probar ejemplares en cinco niveles del peso porcentual del algodn: 15, 20, 25, 30 y 35 por ciento. Tambin decide probar cinco ejemplares en cada nivel del contenido de algodn. Se trata de un experimento con un solo factor con a=5 niveles del factor y n=5 rplicas. Las 25 corridas debern realizarse de manera aleatoria. Para ilustrar como puede aleatorizarse el orden de las corridas suponga que las corridas se enumeran de la siguiente manera:

Tabla 2. Peso porcentual del algodn 15 20 25 30 35 Nmero de corrida experimental 2 3 4 7 8 9 12 13 14 17 18 19 22 23 24

1 6 11 16 21

5 10 15 20 25

17

Ahora se selecciona un nmero aleatorio entre 1 y 25. Suponga que este nmero es 8. Entonces la observacin numero 8 (20% de algodn) se corre primero. Este proceso se repetir hasta que las 25 observaciones tengan asignada una posicin en la secuencia de la prueba. La nica restriccin sobre la aleatorizacin en este caso, es que si se saca de nuevo el mismo nmero (es decir 8), se descarta Suponga que la secuencia de la prueba es: Tabla 3. Secuencia de prueba 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Nmero de corrida (cod) 8 18 10 23 17 5 14 6 15 20 9 4 12 7 1 24 21 11 2 13 22 16 25 19 3 Peso porcentual del algodn 20 30 20 35 30 15 25 20 25 30 20 15 25 20 15 35 35 25 15 25 35 30 35 30 15

Supongamos que el ingeniero corre la prueba en el orden aleatorio que se ha determinado. En la siguiente tabla se muestran las observaciones que se obtienen para la resistencia a la tensin.

18

Resultados de la variable resistencia a la tensin segn porcentaje de algodn de la fibra Tabla 4. Datos del experimento de la resistencia a la Tensin Peso porcentual del algodn 15 20 25 30 35 Observaciones 4 5 Total 11 9 49 18 18 77 19 19 88 19 23 108 15 11 54

1 7 12 14 19 7

2 7 17 18 25 10

3 15 12 18 22 11

promedio 9.8 15.4 17.6 21.6 10.8

Se usar el anlisis de varianza para probar:

Probar:{

Para resolver este interrogante, primero se calculan las sumas de cuadrados como sigue:

( )

( )

) (

19

Tabla 5. Anlisis de varianza de la resistencia a la tensin Fuente de variacin Peso porcentual del algodn Error Total Suma de cuadrados 475.76 161.20 636.96 Grados de libertad 4 20 24 Cuadrado medio 118.94. 8.06 14.76 Valor p <0.01

Observ que el cuadrado medio entre los tratamientos (118.94) es varias veces mayor que el cuadrado medio del error (8.06). Esto indica que no es posible que las medias de los tratamientos sean iguales. En trminos formales se puede calcular el cociente entre y comparar este valor con un punto porcentual apropiado de la cola superior de la distribucin Suponga que el investigador ha seleccionado por tanto . Puesto que se rechaza y se concluye que por lo menos una de las medias es diferente, es decir que el peso porcentual del algodn en la fibra afecta de manera significativa la resistencia a la tensin media. Ejemplo 3.2: Codificacin de Observaciones Los clculos del anlisis de Varianza pueden hacerse con frecuencia de manera ms precisa o simplificada codificando las observaciones. Por ejemplo, considere los datos de la resistencia a la tensin del ejemplo Tabla 6. Datos Codificados de la resistencia a la tensin del ejemplo 3-2 Peso porcentual del algodn 15 20 25 30 35

Observaciones 1 -8 -3 -1 4 -8 2 -8 2 3 10 -5 3 0 -3 3 7 -4
20

4 -4 3 4 4 0

5 -6 3 4 8 -4

Totales ( ) -26 2 13 33 -21

3-1. Suponga que se resta 15 de cada observacion. Los datos codificados se muestran en la tabla 8. Es sencillo verificar que ( ) ( y ( ) ) ( ) ( ) ( ( ) ) ( )

Al comparar estas sumas de cuadrados con las que se obtuvieron en el ejemplo 31, se observa que al restar una constante de los datos originales las sumas de cuadrados no se modifican. Suponga ahora que cada una de las observaciones del ejemplo 3-1 se multiplica por 2. Es sencillo verificar que las sumas de cuadrados de los datos transformados son . Estas sumas de cuadrados parecen diferir considerablemente de las que se obtuvieron en el ejemplo 3-1. Sin embargo, si se dividen por 4 (es decir, ), los resultados son idnticos. Por ejemplo, para la suma de cuadrados de los tratamientos, Asimismo, para los datos codificados, el cociente es ( )( ) que es idntico al cociente de los datos originales. Por lo tanto, los anlisis de varianza son equivalentes. Adems, de comprobar la veracidad de las hiptesis sobre la igualdad de las medias el anlisis estadstico permite estimar los parmetros en los modelos que definen los valores de la variable dependiente, as:

2.3 ESTIMACIN DE LOS PARMETROS DEL MODELO


Un estimador puntual de sera . Ahora bien, si se supone que ). Por lo los errores siguen una distribucin normal, cada es una NID (( tanto, si fuera conocida, podra usarse la distribucin normal para definir el intervalo de confianza. Al utilizar como estimador de , el intervalo de confianza se basara en la distribucin . Por lo tanto, un intervalo de confianza de ( ) por ciento para la media del tratamiento es

21

( ) por ciento para la diferencia en las Un intervalo de confianza de medias de dos tratamientos cualesquiera, por ejemplo sera

Ejemplo 3.3: Utilizando los datos del ejemplo 3-1 pueden encontrarse las estimaciones de la media global y de los efectos de los tratamientos como

Un intervalo de confianza de 95% para la media del tratamiento 4 (30% de algodn) se calcula con la ecuacin 3-12 como o

Por

lo

tanto, .

el

intervalo

de

confianza

de

95%

deseado

es

22

2.4 VERIFICACIN DE LA ADECUACIN DEL MODELO


Si ( )

Entonces, la tcnica de ANOVA es una prueba exacta para la hiptesis de que no hay diferencias en las medias de los tratamientos. En la prctica estos supuestos no se cumplen siempre. Por ello, en todo anlisis deben realizarse acciones para verificar la adecuacin del modelo: 1. Examen de residuales. Definicin: El residual de la ( ) en el ( ) es. .

Los residuales debern estar sin estructura. 2. Supuesto de normalidad. Graficar el histograma de los residuales (la grfica debe aparecer como grfica normal con centro en cero). Graficar la probabilidad normal de los residuales (deber aparecer como una lnea recta). Shapiro- Wilks. .(Fig. 3-4).

Grfica Cuantil-Cuantil 7 5 Distribucin Normal

RESIDUOS

3 1 -1 -3 -5 -5 -3 -1 1 3 Distribucin Normal 5 7

Examen de puntos atpicos.


23

Para detectar puntos estandarizados:

atpicos

pueden

examinarse

los

residuales

( ) Cuando Si ( ), entonces es > 3 desviaciones estndar, entonces la observacin correspondiente es un punto atpico potencial. 3. Supuesto de independencia de las observaciones. Graficar los residuales en el orden temporal. (no debe haber tendencias). .(Fig. 3-5).

Grfico de Residuos para Resistencia 6 4 2

residuos

0 -2 -4 -6 0 5 10 15 20 25 nmero de fila

Graficar los residuales contra los valores ajustados.(Fig. 3-6).

24

Grfico de Residuos para Resistencia 6 4 2

residuos

0 -2 -4 -6 9 12 15 18 21 24 predichos

4. Supuesto de igualdad de la varianza. La prueba para probar igualdad de varianza se formula as:

El procedimiento utilizado es la prueba de Bartlett. El estadstico de prueba es.

( (

) )

25

La hiptesis nula se rechaza cuando:

Prueba de Levene modificada Utiliza las desviaciones absolutas de las observaciones con respecto a las medianas

El estadstico de Levene es el estadstico ANOVA usual para probar la igualdad de las medias que se aplica a las desviaciones absolutas. Ejemplo 3.4: Ya que el supuesto de normalidad no est en entredicho, la prueba de Barlett puede aplicarse a los datos de la resistencia a la tensin del experimento del peso porcentual de algodn del ejemplo 3-1. Se calculan primero las varianzas muestrales de cada tratamiento y se encuentra que Entonces ( ( ) ) ( ) ( ) ( ) ( )

( ) Y el estadstico de prueba es

( (

) )

Puesto que no puede rechazarse la hiptesis nula y se concluye que las cinco varianzas son iguales. Se trata de la misma conclusin a la que lleg al analizar la grfica de los residuales contra los valores ajustados.

26

Ejemplo 3.5: Un Ingeniero Civil est interesado en determinar si cuatro mtodos diferentes para estimar la frecuencia de las inundaciones producen estimaciones de la descarga pico cuando se aplican a la misma cuenca. Cada procedimiento se usa seis veces en la cuenca, y los datos de las descargas resultantes (en pies cbicos por segundo) se muestran en la parte superior de la tabla 7.

Tabla 7. Datos de la descarga pico


Mtodo de estimacin 1 2 3 4 Mtodo de estimacin 1 2 3 4 0.34 0.91 6.31 17.15 Observaciones 0.12 2.94 8.37 11.82 1.23 2.14 9.75 10.95 0.70 2.36 6.09 17.20 0.520 2.61 7.81 15.59 0.66 1.09 1.66 2.77

1.75 0.12 0.71 2.86 4.55 2.63 9.82 7.24 7.93 14.35 16.82 14.72

Desviaciones para la prueba de Levene modificada 0.18 1.70 1.495 1.56 0.40 0.33 0.565 3.77 0.71 0.47 1.975 4.64 0.18 0.25 1.715 1.61 1.23 0.40 0.25 1.94 2.015 0.565 1.24 1.23

El anlisis de varianza de los datos, el cual se resume en la tabla 8.

Tabla 8. Anlisis de Varianza de los datos de la descarga pico Fuente de variacin Mtodos Error Total Suma de cuadrados 708.3471 62.0811 770.4282 Grados de libertad 3 20 23 Cuadrado medio 236.1157 3.1041 Valor p 76.07 <0.001

Implica que hay una diferencia en las estimaciones de la descarga pico promedio obtenidas en los cuatro procedimientos. La grfica de los residuales contra los valores ajustados, la cual se muestra en la figura 1 es preocupante porque la forma de embudo con la boca hacia afuera indica que no se satisface el supuesto de la varianza constante.
27

Figura 1. Grfica de los residuales contra las medias de las observaciones para el ejemplo 3-5.

Se aplicar la prueba de Levene modificada a los datos de la descarga pico. La parte superior de la tabla 7 contiene las medianas de los tratamientos y la parte inferior contiene las desviaciones alrededor de las medianas. La prueba de Levene consiste en realizar un anlisis de varianza estndar en las El estadstico de prueba que resulta en este caso es , para el cual el valor es . Por lo tanto, la prueba de Levene rechaza la hiptesis nula de que las varianzas son iguales, coincidiendo en esencia con el diagnostico que se hizo a partir del examen visual de la figura 1. Los datos de la descarga pico son un buen candidato para una transformacin de datos. Seleccin emprica de una transformacin Si se conociera la relacin entre las observaciones y la media, podra usarse esta informacin para la seleccin de la forma de la transformacin. El objetivo es encontrar una Transformacin Estabilizadora de Varianza (TEV) de las observaciones. Esto es: Se supone que: ( ) Si la TEV tiene la forma: , entonces si se hace , los datos transformados por tienen varianza constante. En la tabla 9 varias TEV.
28

Tabla 9. TEV Relacin 0 0.5 1 1.5 2 1 0.5 0 -0.5 -1 TEV Sin transformar Raz Log Raz recproca Recproco Comentario

Datos de poisson

2.5 COMPARACIONES DE MEDIAS


Se supondr que al hacer el ANOVA se rechaza la hiptesis nula, es decir hay diferencias entre las medias de los tratamientos. Comparaciones grficas de medias Si las medias de los niveles del factor son idnticas, las medias muestrales observadas se comportaran como un conjunto de observaciones tomadas al azar de una distribucin normal con media Y desviacin estndar

Visualice una distribucin normal con la capacidad de ser deslizada sobre un eje abajo del cual estn graficadas . Si todas las medias de los son iguales, deber haber una posicin de esta distribucin que haga evidente que los valores se sacaron de la misma distribucin. La falla en esta lgica es que es desconocida. Contrastes DEFINICIN: La combinacin lineal de la forma: Se llaman contraste. La prueba de hiptesis sobre contraste se formula as.

29

Para juzgar esta prueba hay dos enfoques: Utilizando .

La hiptesis nula se rechaza si ( )

Utilizando F La hiptesis nula se rechaza si ( )

Determinando los intervalos de confianza para un contraste ( ) para el contraste es:

El intervalo de confianza del

Ejemplo 3.6: Considere los datos del ejemplo 3-1. Hay cinco medias de los tratamientos y cuatro grados de libertad entre estos tratamientos. Suponga que antes de correr el experimento se especific la siguiente serie de comparaciones entre las medias de los tratamientos y sus (contrastes asociados):
30

Hiptesis

Contraste

Observe que los coeficientes de los contrastes son ortogonales. Utilizando los datos de la tabla N1, se encuentra que los valores numricos de los contrastes y de la suma de cuadrados son los siguientes:

( ( ( (

)+1(54)=-54 )+1(88)-1(108)-1(54)=-25 ) ) ( ( ) ) ( ) ( ) ( )

) ( ) ( ) ( ) ( ) ( ) ( ) ( )

Tabla 9. Anlisis de varianza de la resistencia a la tensin Fuente de variacin Peso porcentual del algodn Suma de cuadrados 475.76 291.60 31.25 152.10 0.81 Error Total 161.20 636.96 G.L 4 1 1 1 1 20 24 C.m 118.94 291.60 31.25 152.10 0.81 8.06 F0 14.76 36.18 3.88 18.87 0.10 p <0.001 >0.001 0.06 <0.001 0.76

Por los valores p se concluye que hay diferencias significativas entre los niveles 4 y 5 ,1 y 3 del peso porcentual del algodn, pero que el promedio de los niveles 1 y 3 no difieren del promedio de los niveles 1 y 5 con el nivel de significancia y que el nivel 2 no difiere del promedio de los otros cuatros niveles.

31

Mtodo de Scheff para comparar todos los contrastes Prueba de Tukey

Ejemplo 3.7: Para ilustrar la prueba de Tukey, se usan los datos del experimento del peso porcentual del algodn del ejemplo 3-1. Con y grados de libertad ( ) para el error se obtiene que (estadstico del rango studentizado) Por tanto se tiene: ( )

Cualquier para de promedios del peso porcentual del algodn que difiera en valor absoluto por ms de 5.37 implicara que el par correspondiente de las medias poblacionales son significativamente diferentes. Las diferencias en los promedios son:

Los valores marcados con asteriscos indican pares de medias que son significativamente diferentes.

Ejemplo 3.8: Utilizando procedimiento LSD, si se usan los datos del experimento del ejemplo 31, la LSD con es ( )

32

Por tanto cualquier par de promedios de los tratamientos que difiera del valor absoluto por ms de 3.75 implicara que el par correspondiente de medias poblacionales es diferente. Las diferencias de los promedios son:

Los valores marcados con asteriscos indican pares de medias que son significativamente diferentes. Los nicos pares de medias que no difieren significativamente son 1 y 5 y 2 y 3 y el tratamiento 4 produce una resistencia a la tensin significativamente mayor que los otros tratamientos. Prueba de rango mltiple de Duncan

Ejemplo 3.9: La prueba del rango mltiple de Duncan puede aplicarse al experimento del ejemplo 3-1. Recuerde que y hay 20 grados de libertad del error. Al arreglar los promedios de los tratamientos en orden ascendente, se tiene

33

El error estndar de cada promedio es En el conjunto de rangos significativos de la tabla del estadstico del rango studentizado para 20 ( ) ( ) grados de libertad y , se obtiene ( ) ( ) Por lo tanto, los rangos de significacin mnima son ( ( ( ( ) ) ) )

( ( ( (

)( )( )( )(

) ) ) )

Los resultados de las comparaciones seran ( ( ( ( ( ( ( ( ( ( ) ) ) ) ) ) ) ) ) )

Por el anlisis se observa que hay diferencias significativas entre todos los pares de medias con excepcin de la 3 y la 2 y la 5 y la 1. Observe que en este ejemplo la prueba de rango mltiple de Duncan y el mtodo LSD llevan a conclusiones idnticas. Comparaciones de medias de tratamientos con un control

Ejemplo 3.10: Para ilustrar la prueba de Dunnett, considere el experimento del ejemplo 3-1, asumiendo que el tratamiento 5 es el control.
34

En este ejemplo, ( ( ) ) . Con el nivel de 5%, en la tabla IX del . Por lo tanto, la diferencia crtica es ( )

apndice se encuentra

Por lo tanto, cualquier media de los tratamientos que difiera del control por ms de 4.76 se declarara significativamente diferente. Las diferencias observadas son

Solo las diferencias y indican alguna diferencia significativa cuando se comparan con el control; por lo tanto, se concluye que y . Cuando se hace la comparacin de los tratamientos con un control, una buena idea es usar ms observaciones para el tratamiento de control (por ejemplo, ) que para los dems tratamientos, suponiendo un nmero igual de observaciones para los tratamientos restantes. El cociente deber elegirse de tal modo que sea aproximadamente igual a la raz cuadrada del nmero total de tratamientos. Es decir, se elige .

2.6 DETERMINACIN DEL TAMAO DE LA MUESTRA


DEFINICIN: Curva de operacin caracterstica es una grfica de la probabilidad del erros tipo II de una prueba estadstica para un tamao de la muestra particular contra un parmetro que refleja la medida en que la hiptesis nula es falsa. El parmetro usado es

La magnitud

est relacionada con el parmetro de no centralidad.

35

Ejemplo 3.11: Considere el experimento de la resistencia a la tensin descrito en el ejemplo 3-1. Supongamos que el experimentador est interesado en rechazar la hiptesis nula con una probabilidad de al menos 0.90, si la media de los cinco tratamientos es

Planea utilizar

en este caso, puesto que

Por lo tanto . Suponga que el investigador piensa que la desviacin estndar de la resistencia a la tensin con cualquier nivel particular del peso porcentual del algodn no ser mayor que . Entonces se tiene que: ( ) ( )

Se usa la curva de operacin caracterstica para con ( ) ( )grados de libertad del error y como primera conjetura para el tamao de la muestra requerido, se prueba con rplicas. Esto ( ) produce y (5) (3) grados de libertad del error. Por consiguiente en encuentra que por lo tanto la potencia de la prueba es aproximadamente , que es menor que el 0.90 requerido, por lo que se concluye que no son suficientes procediendo de manera similar se construye la siguiente tabla: Tabla 10. ( 4 5 6 4.44 5.55 6.66 2.11 2.36 2.58 15 20 25 ) 0.30 0.15 0.04 Potencia ( 0.70 0.85 0.96

Por tanto, deben realizarse al menos la potencia requerida.


36

replicas para obtener una prueba con

2.7 MTODOS NO PARAMTRICOS EN EL ANLISIS DE VARIANZA


Prueba de Kruskal Wallis. Si el supuesto de normalidad no est justificado. El procedimiento alternativo al ANOVA es: El estadstico de prueba [ Aqu, Si ( ] .

es la suma de los rangos del tratamiento

La hiptesis nula se rechaza.

Ejemplo 3.12: En la tabla 11 se muestran los datos del ejemplo 3-1 y sus rangos correspondiente. * ( ) ( ( ) +

37

Tabla 11. Datos y rangos para el experimento de la resistencia a la tensin del ejemplo 3-1 15 7 7 15 11 9 2.0 2.0 12.5 7.0 4.0 27.5 12 17 12 18 18 20 Peso porcentual del algodn 25 30 9.5 14.0 9.5 16.5 16.5 66.0 14 18 18 19 19 11.0 16.5 16.5 20.5 20.5 85.0 19 25 22 19 23 20.5 25.0 23.0 20.5 24.0 113.0 7 10 11 15 11 35 2.0 5.0 7.0 12.5 7.0 33.5

Y el estadstico de prueba es [ ( ) ]

Puesto que que los tratamientos difieren.

, se rechazara la hiptesis nula y se concluira

38