Está en la página 1de 10

TECNOLÓGICO NACIONAL DE MÉXICO

Instituto Tecnológico de Parral

Estadística para la administración

Unidad I

“Conceptos básicos del ANOVA”

Sindy Nayeli Escobedo Cano

No. De Control 19410666

Maestra: Ana Guadalupe Quiñones Flores

13/11/2020
Conceptos básicos de la ANOVA
Análisis de la varianza

Permite probar la significancia de las diferencias entre más de dos medias


muestrales. Usando el análisis de varianza, podremos hacer inferencias acerca de
si nuestras muestras se tomaron de poblaciones que tienen la misma media. El
análisis de varianza será útil en situaciones tales como la comparación del
kilometraje logrado por cinco clases diferentes de gasolina; la prueba de cuál de
cuatro métodos de capacitación produce el aprendizaje más rápido; o en la
comparación de los ingresos del primer año de los graduados de una media
docena de escuelas de administración. En cada caso, se pueden comparar las
medias de más de dos muestras.

Planteamiento de las hipótesis

En este caso, la razón para utilizar análisis de varianza es decidir si estas tres
muestras (una muestra es el pequeño grupo de empleados capacitados por
cualquier método) se tomaron de poblaciones (una población es el número total de
empleados que pudieron ser capacitados por ese método) que tienen las mismas
medias. Debido a que estamos probando la efectividad de los tres métodos de
capacitación, debemos determinar si las tres muestras, representadas por las
medias muestrales, x 1 17, x 2 21 y x 3 19, pudieron haberse tomado de
poblaciones con la misma media, Un planteamiento formal de las hipótesis nula y
alternativa que deseamos probar sería:
Podemos inferir que la selección del método de capacitación no influye en la
productividad del empleado. Por otro lado, si encontramos entre las medias
muestrales diferencias demasiado grandes para atribuirlas al error aleatorio de
muestreo, podemos inferir que el método utilizado para capacitar a los
trabajadores sí influye en su productividad. En ese caso, ajustaríamos nuestro
programa de capacitación de acuerdo con los resultados .

Análisis de varianza: conceptos básicos

Con el fin de utilizar el análisis de varianza, debemos suponer que cada una de
las muestras se toma de una población normal y que cada una de estas
poblaciones tiene la misma varianza, 2.

Sin embargo, si los tamaños de muestra son lo suficientemente grandes, no


necesitamos la suposición de normalidad. En el problema de los métodos de
capacitación, la hipótesis nula establece que las tres poblaciones tienen la misma
media. Si esta hipótesis es verdadera, no es necesario clasificar los datos en tres
columnas, como en la tabla 11-12, y el conjunto entero de 16 mediciones de
productividad puede considerarse como una muestra de una sola población. Esta
población total tiene también una varianza 2.

El análisis de varianza está basado en una comparación de dos estimaciones


diferentes de la varianza, 2, de nuestra población total. En este caso, podemos
calcular una de esas estimaciones examinando la varianza entre las tres medias
muestrales, que son 17, 21 y 19. La otra estimación de la varianza de la población
está determinada por la variación dentro de las tres muestras mismas, esto es (15,
18, 19, 22, 1l), (22, 27, 18, 21, 17) y (18, 24, 19, 16, 22, 15). Entonces
comparamos estas dos estimaciones de la varianza de la población. Como ambas
son estimaciones de 2, deben tener un valor aproximadamente igual cuando la
hipótesis nula sea verdadera. Si la hipótesis nula no es verdadera, estas dos
estimaciones diferirán de manera considerable. Entonces, los tres pasos del
análisis de varianza son:
1. Determinar una estimación de la varianza de la población a partir de la varianza
entre las medias de las muestras.

2. Determinar una segunda estimación de la varianza de la población a partir de la


varianza dentro de las muestras.

3. Comparar estas dos estimaciones. Si su valor es aproximadamente igual, se


acepta la hipótesis nula.

Cálculo de la varianza entre las medias muestrales

El paso 1 en el análisis de varianza indica que debemos obtener una estimación


de la varianza de la población a partir de la varianza entre las tres medias de las
muestras. En lenguaje estadístico, esta estimación se conoce como varianza entre
columnas. En el capítulo 3 utilizamos la ecuación 3-17 para calcular la varianza de
la muestra:

Ahora bien, como estamos trabajando con tres medias muestrales y una gran
media, sustituyamos x por x, x por x, y k (el número de muestras) por n, para
obtener una fórmula para la varianza entre las medias de las muestras:
Donde:

Cálculo de la varianza dentro de las muestras

Estimación de la varianza de la población, basada en la varianza dentro de las


muestras. En términos estadísticos, se le puede llamar varianza dentro de
columnas. El problema de capacitación tiene tres muestras de cinco o seis
elementos cada una. Podemos calcular la varianza dentro de estas tres muestras
usando la ecuación.
Donde:

Prueba de hipótesis F

Cálculo e interpretación del estadístico F En el paso 3 de ANOVA se comparan


estas dos estimaciones de la varianza de la población mediante el cálculo de su
cociente como sigue:

primera estimación de la varianza de la


F= población basada en la varianza entre las medias muestrales
segunda estimación de la varianza de la población
basada en las varianzas dentro de las muestras
Si sustituimos con la terminología estadística, en el numerador y el denominador
de este cociente, la ecuación se convierte en:
La distribución F

Como otros estadísticos que hemos estudiado, si la hipótesis nula es verdadera,


entonces el estadístico F tiene una distribución de muestreo específica. Al igual
que las distribuciones t y ji-cuadrada, la distribución F es en realidad una familia
completa de distribuciones, tres de las cuales se observan en la figura 11-8. Note
que cada una está identificada por un par de grados de libertad, a diferencia de las
distribuciones t y ji-cuadrada, que solamente tienen un valor para el número de
grados de libertad. La primera cantidad se refiere a los grados de libertad del
numerador del cociente F; la segunda, a los grados de libertad del denominador.
Como podemos ver en la figura 11-8, la distribución F tiene una sola moda. La
forma específica de una distribución F depende del número de grados de libertad
tanto del numerador como del denominador del cociente F. Pero, en general, la
distribución está sesgada a la derecha y tiende a hace ser más simétrica conforme
aumenta el número de grados de libertad en el numerador y el denominador.

Uso de la distribución F

Cada distribución F tiene un par de grados de libertad, uno para el numerador del
cociente F y el otro para el denominador. ¿Cómo podemos calcularlos? Primero,
piense en el numerador, la varianza entre columnas. En la tabla 11-13 utilizamos
tres valores de x x, uno para cada muestra, para calcular nj (xj x) 2 . Una vez
conocidos dos de estos valores de x x, el tercero queda automáticamente
determinado y no se puede determinar libremente. Así, se pierde un grado de
libertad cuando calculamos la varianza entre columnas, y el número de grados de
libertad para el numerador del cociente F siempre es una unidad menor que el
número de muestras. La regla, entonces, es:
¿Qué pasa con el denominador? Cuando tenemos todos los valores de (x - xj),
excepto uno, el último queda determinado automáticamente y no se podría
especificar libremente. En consecuencia, perdimos un grado de libertad en los
cálculos de cada muestra, lo que deja 4, 4 y 5 grados de libertad en las muestras.
Como tenemos tres muestras, nos quedamos con 4 + 4 + 5 = 13 grados de
libertad (que también pueden calcularse como 5 + 5 + 6 - 3 = 13). Podemos
establecer la regla de la siguiente manera:

Para llevar a cabo pruebas de hipótesis F debemos utilizar una tabla F, en la cual
las columnas representan el número de grados de libertad del numerador y los
renglones el número de grados de libertad del denominador. Existen tablas
separadas para cada nivel de significancia. Suponga que estamos probando una
hipótesis al nivel de significancia de 0.01, usando la distribución F. Nuestros
grados de libertad son 8 para el numerador y 11 para el denominador. En este
caso, vamos a la tabla 6(b) del apéndice. En el cuerpo de dicha tabla, el valor
apropiado para 8 y 11 grados de libertad es 4.74. Si nuestro valor calculado de F
excede este valor de la tabla, rechazamos la hipótesis nula. Si no es mayor, la
aceptamos.

Prueba de hipótesis

Ahora podemos probar nuestra hipótesis de que los tres métodos de capacitación
producen resultados idénticos, utilizando el material desarrollado hasta este punto.
Empecemos por revisar cómo calcular el cociente F:
primera estimación de la varianza de
F= _población basada en la varianza entre las medias muestrales_
segunda estimación de la varianza de la población basada en
las varianzas dentro de las muestras

= __20__
14.769
= 1.354 -------Estadístico F

->Tres distribuciones F (el primer valor entre paréntesis es igual al número de


grados de libertad del numerador del cociente F; el segundo, al número de grados
de libertad del denominador)

Precauciones acerca del uso de la prueba F

Como se estableció, nuestros tamaños de muestra en este problema son


demasiado pequeños para poder llegar a inferencias válidas con respecto a la
efectividad de los métodos de capacitación. Escogimos muestras pequeñas para
explicar la lógica del análisis de varianza sin tener que efectuar cálculos tediosos.
En la práctica real, nuestra metodología sería la misma, pero las muestras serían
más grandes.
En nuestro ejemplo, hemos supuesto la ausencia de muchos factores que podrían
haber afectado nuestras conclusiones. Por ejemplo, aceptamos como un hecho
que todos los empleados nuevos de la muestra demostraron la misma aptitud para
el aprendizaje, lo cual puede ser o no cierto. Supusimos que todos los instructores
de los tres métodos tienen la misma habilidad para enseñar y manejar a las
personas, lo cual puede no ser cierto. Y supusimos que el personal de estadística
de la compañía reunió los datos de productividad durante periodos de trabajo
similares en cuanto a la hora del día, el día de la semana, la época del año, etc.

Para poder tomar decisiones significativas basadas en el análisis de varianza,


necesitamos tener la certeza de que todos los factores mencionados están
controlados de manera efectiva. Por último, note que solamente estudiamos el
análisis de varianza en un sentido, o de un factor. El problema examinó el efecto
del tipo de método de capacitación sobre la productividad de los empleados y
nada más. Si deseáramos medir el efecto de dos factores, como el programa de
capacitación y la edad del empleado, necesitaríamos usar análisis de varianza en
dos sentidos, un método estadístico que se estudia en textos más avanzados.

->Prueba de hipótesis al nivel de significancia de 0.05, utilizando la distribución F;


indica la región de aceptación y el valor F de la muestra:

También podría gustarte