Está en la página 1de 15

CAPÍTULO 13

Diseño de experimentos
y análisis de varianza
CONTENIDO
LA ESTADÍSTICA
EN LA PRÁCTICA:
BURKE MARKETING
SERVICES, INC.
13.1 INTRODUCCIÓN AL DISEÑO
DE EXPERIMENTOS Y AL
ANÁLISIS DE VARIANZA
Obtención de datos
Suposiciones para el análisis
de varianza
Análisis de varianza: una visión
conceptual general
13.2 ANÁLISIS DE VARIANZA
Y EL DISEÑO
COMPLETAMENTE
ALEATORIZADO
Estimación de la varianza
poblacional entre tratamientos
Estimación de la varianza
poblacional dentro de
los tratamientos
Comparación de las estimaciones
de las varianzas: la prueba F
La estadística en la práctica

LA ESTADÍSTICA en LA PRÁCTICA
BURKE MARKETING SERVICES, INC.*
CINCINNATI, OHIO
Burke Marketing Services, Inc., es una de las empresas de
investigación de mercado con más experiencia. Cada día
Burke presenta más propuestas, sobre más proyectos, que
cualquier otra empresa de investigación de mercado en el
mundo. Apoyada con la última tecnología, Burke ofrece
una amplia variedad de posibilidades de investigación, con
lo que da solución a casi cualquier problema de marketing.
En un estudio reciente una empresa solicitó los servi-
cios de Burke para evaluar una nueva versión de un cereal
para niños. Por razones de confidencialidad aquí se nom-
brará a ésta como empresa Anon. La empresa Anon consi-
deraba que los cuatro factores principales que intervenían
en el sabor del cereal eran Burke emplea pruebas de degustación para obtener
información de lo que los clientes esperan de un pro-
1. La proporción entre trigo y maíz en el cereal. ducto. ©JLP/Sylvia Torres/CORBIS.
2. El tipo de edulcorante: azúcar, miel o edulcorante
artificial.
3. La presencia o ausencia de trocitos con sabor a fruta. varianza. De los resultados de los análisis se concluyó lo
4. El tiempo de cocción, largo o corto. siguiente:

Burke diseñó un experimento para determinar el efecto de • La relación entre trigo y maíz y el tipo de
estos cuatro factores en el sabor del cereal. Por ejemplo, edulcorante influyeron de manera importante en la
hizo una prueba con una determinada proporción de trigo evaluación del sabor.
y maíz, con azúcar como edulcorante, trocitos de sabor a • Los trocitos con sabor a fruta, en realidad tuvieron
fruta y tiempo corto de cocción; hizo otra prueba en la cual un efecto negativo sobre el sabor del cereal.
varió únicamente la proporción de trigo y maíz y dejó igual • El tiempo de cocción no tuvo ninguna influencia
todos los demás factores, y así sucesivamente. Después un sobre el sabor.
grupo de niños probó los cereales y dio su opinión acerca
Con esta información Anon pudo identificar los factores
del sabor de cada uno.
que intervenían en la obtención del sabor del cereal.
El método estadístico empleado para estudiar los datos
El diseño experimental empleado por Burke y el
obtenidos de las pruebas de degustación fue el análisis de
posterior análisis de varianza sirvieron para hacer una
*. recomendación en el diseño del producto. En este capítulo
se verá cómo se realizan estos procedimientos.

Los estudios estadísticos se clasifican como experimentales u observacionales. En un estudio


estadístico experimental se realiza un experimento para obtener los datos. Un experimento
empieza por la identificación de la variable de interés. Después se identifican y controlan una o
más variables que se consideran relacionadas con la variable de interés, para después recoger datos
de la influencia de estas variables sobre la variable de interés.
En un estudio observacional, los datos suelen obtenerse mediante inspección de una muestra
y no mediante un experimento controlado. En estos estudios, aunque también se emplean los
principios para un buen estudio, no es posible tener el control riguroso que se tiene en un estu-
dio experimental. Por ejemplo, en un estudio para entender la relación entre fumar y el cáncer de
pulmón, el investigador no puede asignarle a un sujeto el hábito de fumar. El investigador sólo
puede observar los efectos de fumar en las personas que ya tienen este hábito y los efectos de no
fumar en las personas que no lo tienen.
Capítulo 13 Diseño de experimentos y análisis de varianza

A sir Ronald Alymer Fisher En este capítulo se presentan dos tipos de diseños de experimentos: un diseño completamente
(1890-1962) se le atribuye aleatorizado y un diseño de bloques aleatorizado. Para cada tipo de diseño se indica cómo usar
la invención de la rama de
la estadística conocida co-
el procedimiento estadístico conocido como análisis de varianza (ANOVA, por sus siglas en
mo diseño de experimentos. inglés) para analizar los datos de una variable. El ANOVA también se usa para analizar los datos
Además de sus aportacio- obtenidos mediante un estudio observacional. Por ejemplo, se verá que el ANOVA también se usa
nes a la estadística, fue un en los diseños completamente aleatorizados para probar la igualdad de tres o más medias
científico sobresaliente en poblacionales de datos obtenidos mediante un estudio observacional.
el campo de la genética.
En la primera sección se presentan los principios de un estudio experimental y cómo
emplearlos en un diseño completamente aleatorizado. En la segunda sección se muestra cómo usar
el ANOVA para analizar los datos de un diseño de experimentos completamente aleatorizado.
En la última sección se estudia el diseño de bloques aleatorizado.

13.1 Introducción al diseño de experimentos


y al análisis de varianza
Las relaciones de causa y Un ejemplo de un estudio estadístico experimental es el problema que se le presentó a la empresa
efecto son difíciles de esta- Chemitech, Inc.; dicha empresa elaboró un sistema de filtración para los suministros de aguas
blecer en estudios observa-
municipales. Los componentes del sistema de filtración se comprarían a varios proveedores y
cionales, pero fáciles de
establecer en estudios expe- Chemitech armaría el sistema de filtración en su fábrica en Columbia, Carolina del Sur. El grupo
rimentales. de ingenieros industriales era el encargado de determinar el mejor método para armar el sistema
de filtración. Después de considerar varios métodos, quedaron sólo tres alternativas: el método
A, el método B y el método C. La diferencia entre estos métodos era el orden en los pasos para
armar el sistema. Los administradores de Chemitech, querían saber con qué método se podían
producir más sistemas en una semana.
En el experimento de Chemitech, el método para armar el sistema es la variable independiente
o factor. Como a este factor le corresponden tres métodos para armar el sistema, se dice que en
este experimento hay tres tratamientos; cada tratamiento corresponde a uno de los tres métodos
para armar el sistema. El problema de Chemitech es un ejemplo de un experimento de un solo
factor; interviene sólo un factor cualitativo (el método para armar el sistema). En experimentos
más complejos caben múltiples factores; los factores pueden ser cualitativos o cuantitativos.
Los tres tratamientos o métodos para armar el sistema constituyen las tres poblaciones de
Aleatorización es el proce- interés del experimento de Chemitech. Una población está formada por todos los trabajadores que
dimiento por el cual se emplean el método A, otra población es la de todos los trabajadores que emplean el método B y
asignan al azar los trata-
otra población es la de todos los trabajadores que emplean el método C. Observe que en cada
mientos a las unidades ex-
perimentales. población la variable dependiente o variable de respuesta es el número de sistemas de filtración
Antes del trabajo de sir R. que se arman por semana, y el objetivo estadístico del experimento es determinar si el número
A. Fisher, los tratamientos medio producido por semana es el mismo en las tres poblaciones (con los tres métodos).
se asignaban de manera Suponga una muestra aleatoria de tres trabajadores de la empresa Chemitech. En el lenguaje del
sistemática o subjetiva.
diseño de experimentos, estos tres trabajadores son las unidades experimentales. Al diseño de
experimentos que se usará para el problema de Chemitech se le llama diseño completamente
aleatorizado. En este tipo de diseño se requiere que cada uno de los tratamientos o métodos para
armar el sistema se asigne de manera aleatoria a cada una de las unidades experimentales o
trabajadores. Así, el método A le puede ser asignado aleatoriamente al segundo trabajador, el
método B al primer trabajador y el método C al tercer trabajador. El concepto de aleatorización,
como se ha ilustrado en este ejemplo, es importante en el diseño de experimentos.
13.1 Introducción al diseño de experimentos y al análisis de varianza

FIGURA 13.1 DISEÑO COMPLETAMENTE ALEATORIZADO PARA EVALUAR EL MÉTODO


EXPERIMENTAL DE ARMAR EL SISTEMA DE CHEMITECH

Todos los empleados


en la fabrica de Columbia,
Carolina del Sur

Muestra aleatoria de 15 empleados


tomada para el experimento

Cada uno de los métodos para armar el sistema


de filtración se asigna a 5 empleados.

Método A Método B Método C


n1 = 5 n2 = 5 n3 = 5

Observe que en este experimento sólo se obtendrá una medición (un dato) para cada método
de armar el sistema de filtración. Para obtener más datos para cada método, se necesita repetir o
replicar el proceso experimental básico. Considere que en lugar de tomar al azar sólo a tres tra-
bajadores, se toman 15 trabajadores, y a cada cinco trabajadores se les asigna en forma aleatoria
uno de los métodos para armar el sistema de filtración. Como cada uno de estos métodos es
asignado a cinco trabajadores, se dice que se obtienen cinco réplicas. El proceso de replicación
es otro principio importante en el diseño de experimentos. En la figura 13.1 se presenta el diseño
completamente aleatorizado para el experimento de Chemitech.

Obtención de datos
Una vez satisfechos con el diseño del experimento, se procede a obtener y analizar los datos. En
el caso de Chemitech, se les explicará a los trabajadores cómo emplear el método que les ha sido
asignado y empezarán a armar los sistemas de filtración con ese método. En la tabla 13.1 se
presenta el número de unidades armadas por cada empleado en una semana. En esta tabla se
dan también la media muestral, la varianza muestral y la desviación estándar muestral obtenidas
con cada método de ensamblado. Así, la media muestral del número de unidades producidas con
el método A es 62; la media muestral con el método B es 66 y la media muestral usando el método
C es 52. De acuerdo con estos datos, parece que con el método B se obtienen más unidades por
semana que con los otros dos métodos.
Lo que importa es si las tres medias muestrales observadas difieren lo suficiente para poder
concluir que las medias de las poblaciones correspondientes a estos tres métodos son diferentes.
Para expresar esto en términos estadísticos se introduce la notación siguiente.

μ 1 = número promedio de unidades producidas por semana con el método A


μ 2 = número promedio de unidades producidas por semana con el método B
μ 3 = número promedio de unidades producidas por semana con el método C
Capítulo 13 Diseño de experimentos y análisis de varianza

TABLA 13.1 NÚMERO DE UNIDADES PRODUCIDA POR 15 TRABAJADORES

Método
archivo A B C

en CD
Chemitech
58
64
58
69
48
57
55 71 59
66 64 47
67 68 49
Media muestral 62 66 52
Varianza muestral 27.5 26.5 31.0
Desviación estándar muestral 5.244 5.148 5.568

Aunque nunca se podrá saber cuáles son los verdaderos valores de μ1, μ2 y μ3, se van a usar las
medias muestrales para probar las hipótesis siguientes.

Si se rechaza H0, no se pue- H0: μ 1 = μ 2 = μ 3


de concluir que todas las 𝐻1 : No todas las medias poblacionales son iguales
medias poblacionales sean
diferentes. Rechazar H0 sig-
nifica que por lo menos dos Como se demostrará más adelante, el análisis de varianza (ANOVA) es el procedimiento
de las medias poblaciona-
estadístico que se emplea para determinar si las diferencias observadas entre las tres medias
les tienen un valor
diferente. muestrales son lo suficientemente grandes para rechazar H0.

Suposiciones para el análisis de varianza


Si los tamaños de las mues- Son tres las suposiciones para emplear el análisis de varianza.
tras son iguales, el análisis
de varianza no es sensible a 1. En cada población, la variable de respuesta tiene una distribución normal. Por tanto:
desviaciones de la suposi-
en el experimento de Chemitech el número de unidades producida por semana (variable
ción de que las poblaciones
están distribuidas de mane- de respuesta) con cada uno de los métodos debe estar distribuida en forma normal.
ra normal. 2. La varianza de la variable de respuesta, que se denota σ 2, es la misma en todas las
poblaciones. Por tanto: en el experimento de Chemitech, con los tres métodos, la
varianza en el número de unidades producida por semana debe ser la misma.
3. Las observaciones deben ser independientes. Por tanto: en el experimento de
Chemitech la cantidad de unidades producida por semana por un empleado debe ser
independiente el número de unidades producidas por semana por cualquier otro empleado.

Análisis de varianza: una visión conceptual general


Si las medias de las tres poblaciones son iguales, se esperaría que las tres medias muestrales fueran
muy parecidas. En efecto, entre más parecidas sean las medias muestrales, mayor será la evidencia
para concluir que las medias poblacionales son iguales, o entre mayor sea la diferencia entre las
medias muestrales, mayor será la evidencia para concluir que las medias poblacionales no son
iguales. En otras palabras, si la variabilidad entre las medias muestrales es “pequeña”, esto
favorece a H0; si la variabilidad entre las medias muestrales es “grande”, esto favorece a H1.

Si la hipótesis nula es verdadera, H0: μ1 = μ 2 = μ3, se usa la variabilidad entre las medias
muestrales para estimar σ 2. Primero, observe que si se satisfacen las suposiciones para el
13.1 Introducción al diseño de experimentos y al análisis de varianza

FIGURA 13.2 DISTRIBUCIÓN MUESTRAL DE x̄ SI H0 ES VERDADERA

2
σ2 =σ
x n

x3 μ x2 x1

Las medias muestrales se


encuentran todas “muy cerca”
porque sólo existe una distribución
muestral cuando H0 es verdadera.

Si la hipótesis nula es verdadera, H0: μ1 = μ2 = μ3, se usa la variabilidad entre las medias
muestrales para estimar σ 2. Primero, observe que, si se satisfacen las suposiciones para el análisis
de varianza, cada una de las muestras provendrá de la misma distribución normal con media μ y
varianza σ 2. Recuerde que la distribución muestral de la media muestral x̄ de una muestra
aleatoria simple de tamaño n tomada de una población normal tendrá una distribución normal con
media μ y desviación estándar σ 2/n. En la figura 13.2 se ilustra una distribución muestral.
Por tanto, si la hipótesis nula es verdadera, se considera cada una de las tres medias muestrales,
x̄ 1 = 62, x̄ 2 = 66 y x̄ 3 = 52 como valores obtenidos aleatoriamente de la distribución muestral que
aparece en la figura 13.2. En este caso la media y la varianza de los tres valores x̄ se usa para
estimar la media y la varianza de la distribución muestral. Si los tamaños de las muestras son iguales,
como en el caso de Chemitech, la mejor estimación de la media de la distribución muestral de
x̄ es la media o el promedio de las medias muestrales. Por tanto, en el experimento de Chemitech,
una estimación de la media de la distribución muestral de x̄ es

A esta estimación se le conoce como media muestral general. Una estimación de la varianza de
la distribución muestral de x̄ , σ 2, se obtiene de la varianza de las tres medias
muestrales.
Capítulo 13 Diseño de experimentos y análisis de varianza

FIGURA 13.3 DISTRIBUCIONES MUESTRALES DE x̄ SI H0 ES FALSA

x3 μ3 μ1 x1 x2 μ 2

Las medias muestrales


provienen de distribuciones
muestrales diferentes y no son
semejantes cuando H0 es falsa.

distribución muestral de x̄ . Para ilustrar lo que ocurre cuando H0 es falsa, suponga que las medias
poblacionales son diferentes. Observe que como las tres muestras provienen de poblaciones
normales con medias diferentes, darán tres distribuciones muestrales diferentes. En la figura 13.3
se muestra que en este caso las medias muestrales no están tan cerca unas de otras, como cuan-
do la H0 es verdadera. Entonces, sx̄2 será mayor, haciendo que la estimación de σ 2 sea mayor. En
general, cuando las medias poblacionales no son iguales, la estimación entre tratamientos
sobreestimará la varianza poblacional σ 2.
La variación dentro de cada una de las muestras también tiene efecto sobre la conclusión a
la que se arriba con el análisis de varianza. Cuando se toma una muestra aleatoria simple de cada
población, cada una de las varianzas muestrales proporciona un estimador insesgado de σ 2. Por
tanto, se combinan o juntan las estimaciones individuales de σ 2 en una estimación general. A la
estimación de σ 2 obtenida de esta manera se le conoce como estimación conjunta o dentro de los
tratamientos de σ 2. Como cada varianza muestral proporciona una estimación de σ 2 que se basa
sólo en la variación dentro de cada muestra, a la estimación de σ 2 dentro de los tratamientos no
le afecta que las medias poblacionales sean o no iguales.
13.1 Introducción al diseño de experimentos y al análisis de varianza

Si los tamaños de las muestras son iguales, la estimación dentro de los tratamientos de σ 2 se
obtiene del promedio de las varianzas muestrales. En el experimento de Chemitech se obtiene

En el experimento de Chemitech, la estimación de σ 2 entre los tratamientos (260) es mucho


mayor que la estimación de σ 2 dentro de los tratamientos (28.33). El cociente entre estas dos
estimaciones es 260/28.33 = 9.18. Pero debe recordarse que el método entre tratamientos sólo
proporciona una buena estimación de σ 2 si la hipótesis nula es verdadera. Si la hipótesis nula
es falsa, el método entre tratamientos sobreestima σ 2. El método dentro de los tratamientos
proporciona una buena estimación de σ 2 en cualquiera de los casos. Por tanto, si la hipótesis nula
es ver- dadera, las dos estimaciones serán semejantes y su cociente será cercano a 1. Si la hipótesis
nula es falsa, la estimación entre tratamientos será mayor que la estimación dentro de los
tratamientos y su cociente será grande. En la sección siguiente se muestra cuán grande debe ser
este cociente para que se rechace H0.
En resumen, la idea detrás del ANOVA se basa en la obtención de dos estimaciones independientes
de la varianza poblacional común σ 2. Una estimación de σ 2 se basa en la variabilidad entre las
medias muestrales mismas y la otra estimación de σ 2 se basa en la variabilidad entre los datos
dentro de cada muestra. Al comparar estas dos estimaciones de σ 2, se determina si las medias
poblacionales son iguales.
498 Capítulo 13 Diseño de experimentos y análisis de varianza

13.2 Análisis de varianza y el diseño completamente


aleatorizado
En esta sección se muestra el uso del análisis de varianza para probar la igualdad de k medias
poblacionales en un diseño completamente aleatorizado. La forma general de esta prueba de hipó-
tesis es

H0: μ1 = μ2 = . . . = μk
Ha: No todas las medias poblacionales son iguales

donde

μj = media de la j-ésima población

Se supone que de cada una de las k poblaciones o tratamientos se toma una muestra aleatoria sim-
ple de tamaño nj. Para los datos muestrales, sean

x ij = valor de la observación i del tratamiento j


nj = número de observaciones en el tratamiento j
x̄ j = media muestral del tratamiento j
s 2j = varianza muestral del tratamiento j
sj = desviación estándar muestral del tratamiento j

Las fórmulas para la


media y la varianza
muestrales del
tratamiento j son las
siguientes:

(
La media muestral general que se denota x̄ , es la suma de todas las observaciones dividida entre
la cantidad total de todas las observaciones. Es decir,

donde

nT = n1 + n2 + . . . + nk (13.4)

Si todas las muestras son de tamaño n, n T = kn; en este caso, la ecuación 13.3 se reduce a
13.2 Análisis de varianza y el diseño completamente aleatorizado

En otras palabras, si todas las muestras son del mismo tamaño, la media muestral general es el
promedio de las k medias muestrales.
En el experimento de Chemitech, como todas las muestras constaban de n = 5 observaciones, la
media muestral general se puede calcular empleando la fórmula 13.5. De acuerdo con los datos de
la tabla 13.1 se tiene lo siguiente.

62 + 66 + 52
x̄ = = 60
3

Si la hipótesis nula es verdadera (μ1 = μ 2 = μ3 = μ), la media muestral general, 60, es la mejor
estimación de la media poblacional μ.

Estimación de la varianza poblacional


entre tratamientos
En la sección anterior se presentó el concepto de estimación de σ 2 entre tratamientos y se mostró
cómo calcular esta estimación cuando todas las muestras eran del mismo tamaño. A esta
estimación de σ 2 se le llama cuadrado medio debido a los tratamientos y se denota SMTR. La
fórmula general para calcular el SMTR es

(13.6)
500 Capítulo 13 Diseño de experimentos y análisis de varianza

Estimación de la varianza poblacional


dentro de los tratamientos
En párrafos anteriores ya se presentó el concepto de estimación de σ 2 dentro de los tratamientos
y se mostró cómo calcular esta estimación cuando todas las muestras son del mismo tamaño. A
esta estimación de σ 2 se le llama cuadrado medio debido al error y se denota SSE. La fórmula
general para calcular el SME es
k
(n j 1) sj2
j 1
SME (13.9)
nT k
500 Capítulo 13 Diseño de experimentos y análisis de varianza

Comparación de las estimaciones


de las varianzas: la prueba F
. Si la hipótesis nula es verdadera, el CMTR y el CME proporcionan dos estimaciones insesgadas
e independientes de σ 2. De acuerdo con lo visto en el capítulo 11, cuando se tienen poblaciones
normales, la distribución muestral del cociente de dos estimaciones independientes de σ 2 sigue
una distribución F. Por tanto, si la hipótesis nula es verdadera y si se satisfacen las suposiciones
del ANOVA, la distribución muestral de CMTR/CME será una distribución F con k - 1 grados
de libertad en el numerador y n T - k grados de libertad en el denominador. En otras palabras, si
la hipótesis nula es verdadera, el valor de CMTR/CME parecerá ser un valor tomado de esta dis-
tribución F.
Pero, si la hipótesis nula es falsa, el valor de CMTR/CME será muy grande debido a que
CMTR sobreestima σ 2. Por tanto, si el valor de CMTR/CME resulta ser demasiado grande para
haber sido tomado de la distribución F con k - 1 grados de libertad en el numerador y n T - k
grados de libertad en el denominador, se rechazará H0. Como la decisión de rechazar H0 está
basada en el valor de CMTR/CME, el estadístico de prueba que se usa para probar la igualdad
de k poblaciones es el siguiente.

Este estadístico de prueba sigue una distribución F con k - 1 grados de libertad en el


numerador y nT - k grados de libertad en el denominador.

Ahora recuerde el experimento de Chemitech, se usará α = 0.05 para realizar la prueba de


hipótesis. El valor del estadístico de prueba es

𝐶𝑀𝑇𝑅 260
𝐹= = = 9.18
𝐶𝑀𝐸 28.33

Los grados de libertad para el numerador son k - 1 = 3 - 1 = 2 y los grados de libertad para el
denominador son nT - k = 15 - 3 = 12. Como la hipótesis nula sólo se rechazará si se obtiene
un valor grande para el estadístico de prueba, el valor-p será el área en la cola superior de la
distribución F a la derecha del estadístico de prueba F = 9.18. En la figura se muestra la
distribución muestral de F = CMTR/CME, el valor del estadístico de prueba y el área en la
cola superior de esta prueba de hipótesis.

Área en la cola superior (Alpha) 0.10 0.05 0.025 0.01


Valor F (gl1 = 2, gl2 = 12) 2.81 3.89 5.10 6.93

F = 9.18
13.2 Análisis de varianza y el diseño completamente aleatorizado 501

En la tabla F se encuentran las áreas siguientes en la cola superior de la distribución F con 2


grados de libertad en el numerador y 12 grados de libertad en el denominador. Como F = 9.18 es
mayor que 6.93, el área en la cola superior, correspondiente a F = 9.18.
Se rechaza H0. La prueba proporciona evidencias suficientes para concluir que las medias de
las tres poblaciones no son iguales. En otras palabras, el análisis de varianza favorece la
conclusión de que las medias poblacionales del número de unidades producidas por semana, con
cada uno de los tres métodos para armar los sistemas de filtración, no son iguales.

Si el valor de Alpha es 0.01 F Alpha=F tabla=6.93

Se Rechaza ya que el valor de F calculado es mayor que el valor de F encontrado en la tabla. Por
lo que se concluye que las medias no son iguales.

A continuación, se presenta un resumen del procedimiento para probar la igualdad de k medias


poblacionales.
502 Capítulo 13 Diseño de experimentos y análisis de varianza

Tabla de ANOVA
Para presentar de manera adecuada los cálculos anteriores se usa una tabla conocida como tabla
para el análisis de varianza o tabla ANOVA. En la tabla 13.2 se muestra la forma general de una
tabla ANOVA para un diseño completamente aleatorizado. En la tabla 13.3 se presenta la tabla
ANOVA correspondiente al experimento de Chemitech. A la suma de los cuadrados de la fuente
de variación que se indica como “Total” se le conoce como suma de cuadrados del total (STC).
Observe que los resultados del experimento de Chemitech indican que STC = SCTR + SCE y
que los grados de libertad que corresponden a esta suma total de cuadrados es la suma de los gra-
dos de libertad correspondientes a la suma de cuadrados debidos a los tratamientos más la suma
de cuadrados debidas al error.
Cabe hacer notar que la STC dividida entre los grados de libertad nT - 1 no es otra cosa que
la varianza muestral general que se obtendría si se considerara la muestra de las 15 observaciones
como un solo conjunto de datos. Si se considera todo el conjunto de datos como una sola
muestra, la fórmula para calcular la suma de cuadrados del total, STC, es

Se puede demostrar que estos resultados observados para el análisis de varianza en el caso
del experimento de Chemitech aplican también a otros problemas. Es decir,

STC = SCTR + SCE (13.14)

El análisis de varianza pue- En otras palabras, STC se parte en dos sumas de cuadrados: la suma de cuadrados debidas a los
de entenderse como un tratamientos y la suma de cuadrados debidas al error. Observe, además, que los grados de
procedimiento estadístico libertad que corresponden a la STC, nT - 1, se pueden partir en grados de libertad
de partición de la suma
total de los cuadrados en correspondientes a SCTR, k - 1 y en grados de libertad correspondientes a SCE, nT - k. El
componentes separados. análisis de varianza se puede ver como el proceso de partición de la suma total de cuadrados
y los grados de libertad en sus fuentes correspondientes: tratamiento y error. Al dividir las
sumas de cuadrados entre los correspondientes grados de libertad, se obtienen las estimaciones
de la varianza, el valor de F y el F tabla empleados en la prueba de hipótesis de igualdad entre
las medias poblacionales.
13.2 Análisis de varianza y el diseño completamente aleatorizado 503
.
Ejercicios

Métodos
1. Los datos siguientes se obtuvieron de un diseño completamente aleatorizado.

TRATAMIENTO

A B C
162 142 126
142 156 122
165 124 138
145 142 140
148 136 150
174 152 128
Media muestral 156 142 134

Varianza muestral 164.4 131.2 110.4

a. Calcule la suma de cuadrados entre tratamientos.


b. Calcule el cuadrado medio entre tratamientos.
c. Calcule la suma de cuadrados debida al error.
d. Calcule el cuadrado medio debido al error.
e. Dé la tabla de ANOVA para este problema.
f. Con α = 0.05 pruebe si las medias de los tres tratamientos son iguales.

2. En un diseño completamente aleatorizado, para cada uno de los cinco niveles del factor se usa-
ron siete unidades experimentales. Complete la tabla ANOVA siguiente.

Fuente de Suma de Grados de Cuadrado


variación cuadrados libertad medio F Ft
Tratamientos 300
Error
Total 460

a. ¿Cuáles son las hipótesis en este problema?


b. Utilice el nivel de significancia α = 0.05, ¿ la hipótesis nula del inciso a se puede rechazar?
Explique.
3. En un experimento diseñado para probar los niveles de tres tratamientos diferentes, se
obtuvieron los resultados siguientes: STC = 400, SCTR = 150, nT = 19. Dé la tabla ANOVA y
pruebe si hay alguna diferencia significativa entre las medias de los resultados de los tres
tratamientos. Use α = 0.05.
4. En un diseño completamente aleatorizado se usaron 12 unidades experimentales para el primer
tratamiento, 15 para el segundo y 20 para el tercero. Complete el análisis de varianza siguiente.
Emplee 0.05 como nivel de significancia, ¿hay diferencia significativa entre los tres
tratamientos?

Fuente de Suma de Grados de Cuadrado


variación cuadrados libertad medio F Ft
Tratamientos 1200
Error
Total 1800

También podría gustarte