Documentos de Académico
Documentos de Profesional
Documentos de Cultura
9.1. Introducción
Veíamos cómo contrastar la igualdad de medias en dos poblaciones normales e indepen-
dientes. En ocasiones necesitamos contrastar la igualdad de medias de un número mayor de
poblaciones para detectar posibles diferencias significativas entre ellas en cuanto a una variable
o característica:
H0 : µ1 = µ2 = .... = µI
H1 : Alguna distinta,
141
142 Capítulo 9. Análisis de la varianza (un factor): ANOVA
de los componentes, etc. A esta característica se le llama variable respuesta. Nuestro objetivo
será conocer si existe o no relación entre la variable respuesta y el factor: ¿habrá diferencias en
las notas de los distintos grupos de Estadística?, ¿tendrán coches similares de distintas marcas
el mismo consumo de gasolina?, ¿tendrán los componentes fabricados por las distintas máquinas
la misma duración?.
Vamos a centrarnos en este ejemplo de las máquinas para ver y desarrollar el modelo inmerso
en un problema del análisis de la varianza.
Supongamos que se desea comprobar si la duración de piezas fabricadas por un grupo de I
máquinas es la misma, es decir, la duración no depende de la máquina. Supongamos además que
la duración de las piezas producidas por una misma máquina varía debido a muchos factores
no controlables como por ejemplo la pureza de la materia prima, desajustes aleatorios de la
máquina, la habilidad del operario, etc. Es decir, la duración de las piezas producidas por cada
máquina será una variable aleatoria. Denotamos por yij la duración de la pieza j producida
por la máquina i. Si para cada máquina i medimos la duración a una muestra de ni piezas,
PI
tendremos un total de n = i=1 ni observaciones:
9.2. El modelo
Vamos a ajustar a nuestras observaciones un modelo matemático de la forma yij = µi +
uij , con el fin de poder tratarlas estadísticamente. Según este modelo vamos a admitir que la
duración de las piezas fabricadas por una misma máquina i oscila aleatoriamente alrededor de
un valor desconocido µi que caracteriza a la máquina i (duración media de sus piezas) y que las
diferencias entre los valores observados para esta máquina, yij , y su media, µi , son el resultado
de múltiples factores que no controlamos y que influyen en la variable respuesta, en este caso
en la duración. Las englobamos en un término uij llamado error experimental o perturbación,
uij = yij − µi .
9.3. Contraste de igualdad de medias 143
En resumen: la variable respuesta en cada grupo sigue una distribución Normal, la varianza
es la misma en todos los grupos y los grupos son independientes.
El paso siguiente sería estimar los parámetros del modelo.
Xni
ˆ −
yij
j=1
µi = yi. = , i = 1, .., I,
ni
XI Xni ³ − 2
´
ˆ yij − yi.
i=1 j=1
σ2 = ,
n
ˆ −
Los residuos del modelo son uij = eij = yij − yi. , y se utilizan sobre todo a la hora de
comprobar si se verifican o no las hipótesis del modelo. Si no se verifican, este modelo no sería
el adecuado.
H0 : µ1 = µ2 = .... = µI
H1 : Alguna distinta
V T = V E + V NE
V T : Variabilidad total
VE
La medida R2 = VT indica la variabilidad que explica el modelo de entre toda la presente
en el experimento. Toma valores entre 0 y 1. Un valor próximo a 0 indicaría que el modelo no
es válido.
Tabla ANOVA:
−
siendo yi. y σ2ni respectivamente la media y varianza de los datos de la muestra del grupo
−
i , y y.. y σ 2n la media y varianza del total de las observaciones.
Contraste de la F :
H0 : µ1 = µ2 = .... = µI
H1 : Alguna distinta,
Rechazamos H0 cuando F > F1−α,I−1,n−I . En tal caso, podremos decir que no se han
detectado diferencias significativas entre los grupos en cuanto a la variable respuesta, para
un nivel del significación del αx100 %.
Si rechazamos en el contraste anterior H0 estamos diciendo que no todas las medias de los
diferentes grupos son iguales simultáneamente, sin embargo puede ocurrir que algunas de las
medias sí coincidan.
Ejemplo 9.1: Un ingeniero de electrónica está interesado en estudiar el efecto sobre la
conductividad de una válvula electrónica que tienen tres tipos diferentes de recubrimiento para
los tubos de rayos catódicos utilizados en un dispositivo de visualización de un sistema de
telecomunicaciones. Se obtienen los siguientes datos:
Contrastar con un nivel de significación del 5 % si el tipo de recubrimiento tiene algún efecto
sobre la conductividad.
Se supone que las muestras proceden de poblaciones normales e independientes con la misma
varianza.
Solución: Queremos comprobar si la conductividad media de la válvula será la misma con
los tres tipos de recubrimiento, en cuyo caso el tipo de recubrimiento no tendría ningún efecto
sobre la conductividad.
Planteamos el contraste:
H0 : µ1 = µ2 = µ3
H1 : Alguna distinta
y seguidamente realizamos todos los cálculos necesarios para rellenar la tabla Anova y concluir
en el contraste. Comenzamos con el cálculo de las medias y varianzas en las muestras:
−
Muestra Media (yi. ) Varianza (σ 2ni ) Tamaño (ni )
Tipo 1 145 11.5 4
,
Tipo 2 145.25 33.188 4
Tipo 3 131.5 7.25 4
−
y la media y varianza totales resultan: y.. = 140,583 y σ2n = 58,576
Calculamos ahora las variabilidades explicada, no explicada y total.
X
V NE = ni σ 2ni = 4(11,5 + 33,188 + 7,25) = 207,752
i
V T = nσ 2n = 12(58,576) = 702,912
V E = V T − V N E = 495,160
9.6. Ejercicios
1. Un fabricante está interesado en estudiar la resistencia a la tensión de una fibra sintética,
y sospecha que puede estar relacionada con el porcentaje de algodón en su composición.
Con este fin, estudia la resistencia de la fibra considerando 5 niveles de porcentaje de
algodón en su composición. Los datos observados se muestran en la siguiente tabla.
tabla siguiente.
Suponer que las muestras proceden de poblaciones normales, independientes, con la misma
varianza.
4. La tabla muestra las medidas hechas por Heyl de la constante G gravitatoria con bolas
hechas de oro, platino y vidrio. Contrastar la hipótesis de que los tres materiales tienen
la misma constante G. Tomar un nivel de significación del 5 %.
6. Tres profesores dan clases teóricas en una misma autoescuela. Se desea contrastar, si
existen diferencias significativas en la forma de enseñanza de los tres profesores. Para ello
se seleccionan tres muestras de alumnos y se anota el número de preguntas correctas en
el examen.
43 48 29
35 47 31
44 44 28
46 46 42
39 39 31
44 45 36
38 49 35
42 48 36
45 45 39
Diámetro 1 80 83 83 84 85 84 81
Diámetro 2 74 75 76 74 75 78 76
Diámetro 3 60 62 59 61 62 63 64
En base a los datos obtenidos, ¿podemos afirmar que el tamaño del orificio afecta el
porcentaje de radón liberado?. Realizar el contraste con un nivel de significación del 5 %.
Nota: Suponer para todos los ejercicios normalidad, independencia, e igualdad de varian-
zas en las poblaciones.