Está en la página 1de 17

ANÁLISIS DE LA VARIANZA

utilizamos la prueba ji-cuadrada para examinar las diferencias entre más de dos proporciones
muestrales y para hacer inferencias acerca de si las muestras se tomaron de poblaciones que
contenían la misma proporción. En esta sección, aprenderemos una técnica conocida como
análisis de varianza (a menudo abreviada ANOVA: analysis of variance), que permite probar la
significancia de las diferencias entre más de dos medias muestrales. Usando el análisis de
varianza, podremos hacer inferencias acerca de si nuestras muestras se tomaron de poblaciones
que tienen la misma media.
El análisis de varianza será útil en situaciones tales como la comparación del kilometraje logrando
por cinco clases diferentes de gasolina; la prueba de cuál de cuatro métodos de capacitación
produce el aprendizaje más rápido; o en la comparación de los ingresos del primer año de los
graduados de una media docena de escuelas de administración. En cada caso, se pueden
comparar las medias de más de dos muestras

Planteamiento de un problema

El director de capacitación de una compañía está evaluando tres métodos de capacitación para
empleados nuevos. El primero consiste en asignar un empleado nuevo a un trabajador
experimentado para que éste le ayude en la fábrica; el segundo, en ubicar a todos los empleados
nuevos en un salón de capacitación separado de la fábrica; el tercer método utiliza películas y
materiales de aprendizaje programados. El director de capacitación escoge al azar 16 empleados
nuevos asignados al azar a los tres métodos, registra su producción diaria después de terminar
los programas de capacitación, use un nivel de significancia de 5%

Modelo 1 15 18 19 22 11
Modelo 2 22 27 18 21 17
Modelo 3 18 24 19 16 22 15

PASO 1.
1.1 Plantear hipótesis nula y alternativa: Debido a que estamos probando la efectividad de los
tres métodos de capacitación, debemos determinar si las tres muestras, representadas por las
medias muestrales, pudieron haberse tomado de poblaciones con la misma media poblacional.

H0: µ1 = µ2 = µ3, Es igual

H1: µ1 ≠µ2 ≠µ3, No son iguales


1.2 Calcular la media

Modelo 1 15 18 19 22 11
Modelo 2 22 27 18 21 17
Modelo 3 18 24 19 16 22 15

1
PASO 2. Análisis de Varianza: El análisis de varianza está basado en una comparación de dos
estimaciones diferentes de la varianza de nuestra población total. En este caso, podemos
calcular una de esas estimaciones la varianza entre las tres medias muestrales, o la variación
dentro de las tres muestras mismas, Como ambas son estimaciones de varianza, deben tener
un valor aproximadamente igual cuando la hipótesis nula sea verdadera, Si la hipótesis nula
no es verdadera, estas dos estimaciones diferirán de manera considerable. Entonces, los tres
pasos del análisis de varianza son:

1. Determinar una estimación de la varianza de la población a partir de la varianza entre las


medias de las muestras.
2. Determinar una segunda estimación de la varianza de la población a partir de la varianza
dentro de las muestras.
2. Comparar estas dos estimaciones. Si su valor es aproximadamente igual, se acepta la
hipótesis nula.

2.1 Cálculo de la varianza entre las medias muestrales

El paso 1 en el análisis de varianza indica que debemos obtener una estimación de la varianza
de la población a partir de la varianza entre las tres medias de las muestras. En lenguaje
estadístico, esta estimación se conoce como varianza entre columnas.

FORMULA DE LA VARIANZA DE LA MUESTRA FORMULA ENTRE MEDIAS MUESTRALES

FORMULA ERROR ESTANDAR DE LA MEDIA

FORMULA VARIANZA POBLACIÓN

2
¿qué tamaño de muestra debemos usar cuando las diferentes muestras tienen diferentes
tamaños? Resolvemos este problema con la ecuación: FORMULA ESTIMACIÓN DE LA
VARIANZA ENTRE COLUMNAS

Cálculo de varianza entre columna:

n ( - ) ( - )² N( - - )²

Media de medias

2.2 Cálculo de la varianza dentro de las columnas

El paso 2: En ANOVA requiere una segunda estimación de la varianza de la población, basada


en la varianza dentro de las muestras. En términos estadísticos, se le puede llamar varianza
dentro de columnas. El problema de capacitación tiene tres muestras de cinco o seis elementos
cada una.

3
MÉTODO 1 MÉTODO 2 MÉTODO 3
Nj X- (X- )² n X- (X- )² n X- (X- )²

Media Media Media


S² Varianza Varianza Varianza

4
2.3 Comparar estimaciones cálculo de su cociente F

En el paso 3 de ANOVA se comparan estas dos estimaciones de la varianza de la población


mediante el cálculo de su cociente F.
La distribución F, la cual debe su nombre a sir Ronald Fisher, uno de los pioneros de la
estadística actual. Esta distribución de probabilidad sirve como la distribución del estadístico de
prueba en varias situaciones.

Como resultado, el denominador y el numerador deben ser aproximadamente iguales si la


hipótesis nula es verdadera. Cuanto más cercano a 1 esté el cociente F, más nos inclinamos
a aceptar la hipótesis nula. Al contrario, conforme el cociente F crece, nos inclinaremos más a
rechazar la hipótesis nula y a aceptar la alternativa (de que existe una diferencia en los efectos
sobre la producción de los tres métodos de capacitación).

La distribución F ¿Cuáles son las características de la distribución F?

1. Existe una familia de distribuciones F. Cada miembro de la familia se determina mediante


dos parámetros: los grados de libertad del numerador y los grados de libertad del
denominador. La forma de la distribución se ilustra en la siguiente gráfica.
2. La distribución F es continua. Esto significa que se supone un número infinito de valores
entre cero y el infinito positivo.
3. La distribución F no puede ser negativa. El menor valor que F puede tomar es 0.
4. Tiene sesgo positivo. La cola larga de la distribución es hacia el lado derecho.
5. Es asintótica. Cuando los valores de X aumentan, la curva F se aproxima al eje X pero nunca
lo toca. Este caso es similar al comportamiento de la distribución de probabilidad normal

Paso 3. Calculo de punto crítico

5
Calculamos el número de grados de libertad del numerador del cociente F,
Número de grados de libertad
en el numerador del cociente F =

calcular los grados de libertad del denominador del cociente F, utilizando la ecuación

Número de grados de libertad


En el denominador del cociente F

Con el nivel de significancia de 0.05 y los grados de libertad de numerador y denominador


buscamos PC (usar la tabla 6(a) del apéndice) PUNTO CRITICO =

Paso 4. Graficar (Punto crítico y Factor F)

Paso 5. Conclusión:

6
Precauciones acerca del uso de la prueba F
El análisis de varianza es importante en investigaciones como la evaluación de nuevos
medicamentos, donde deben medirse, en un solo estudio, los efectos de dosis, la frecuencia de
medicación, los efectos de otras drogas y las diferencias entre pacientes. Una estimación se
obtiene de la varianza entre las medias de las muestras la otra de la varianza dentro de las
muestras mismas. Si son aproximadamente iguales, se tienen altas posibilidades de que las
muestras vengan de la misma población. Advertencia: es vital no hacer a un lado el sentido
común al interpretar los resultados. Mientras que quizá sea cierto que un estudio puede identificar
diferencias en las preferencias de marca del café instantáneo que se aplican a la compra de café
entre semana en la mañana, es difícil decir qué debe hacer la compañía de café con esta
información.
.
Ejercicio No. 2: Un estudio compara los efectos sobre las ventas de cuatro promociones de
un mes en el punto de venta. Presentamos las ventas unitarias de 5 tiendas que utilizaron las
cuatro promociones en meses distintos:
1. Calcule las ventas unitarias medias para cada promoción y luego determine la gran media.
2. Estime la varianza de la población utilizando la varianza entre columnas
3. Estime la varianza de la población utilizando la varianza dentro de columnas calculada a
partir de la varianza dentro de muestras.
4. Calcule el cociente F. Al nivel de significancia de 0.01, ¿las promociones producen diferentes
efectos sobre las ventas?

DATOS Paso 1. Calculo de medias

Gratis 78 87 81 89 85
Regalo 94 91 87 90 88
Descuento 73 78 69 83 76
Reembolso 79 83 78 69 81
• Paso 1, Calcule las medias
• Cálculo de gran media / media de medias

Paso 2. ANOVA

2.1 Estimación de la varianza de la población utilizando la varianza entre columnas

n - ( - )² n( - )²

7
2.2 Estimación de la varianza de la población utilizando la varianza dentro de columnas
calculada a partir de la varianza dentro de muestras.

GRATIS REGALO DESCUENTO REEMBOLSO


n X- (X- ) ² n X- (X- ) ² n X- (X- ) ² n X- (X- ) ²

Calcular
= = = =
S² = S² = S² = S² =

2.3 Cálculo de el cociente F.

Al nivel de significancia de 0.01, ¿las promociones producen diferentes efectos sobre las ventas?

Paso 3. Buscamos valor critico

Calculamos el número de grados de libertad del numerador del cociente F,


Número de grados de libertad
en el numerador del cociente F =

calcular los grados de libertad del denominador del cociente F, utilizando la ecuación

Número de grados de libertad en


el denominador del cociente F

Con el nivel de significancia de 0.01 y los grados de libertad de numerador y denominador


buscamos PC (usar la tabla 6(a) del apéndice) PUNTO CRITICO =

8
Paso 4. Graficar

Paso 5. Conclusiones:

2. INFERENCIAS ACERCA DE UNA VARIANZA DE POBLACIÓN

Con el fin de programar la fuerza de trabajo en la temporada de cosecha, un cultivador de


duraznos necesita conocer no sólo el tiempo medio que tardan los duraznos en madurar, sino
también su varianza alrededor de ese tiempo medio.
La distribución de la varianza de la muestra (Varianza de población desconocida)

Ejercicio de aplicación: En respuesta a muchas quejas respecto a la tardanza del correo, el


director general del servicio postal inicia una investigación preliminar. Un investigador da
seguimiento a nueve cartas desde Nueva York hasta Chicago, para estimar la desviación
estándar del tiempo de entrega. Los tiempos en horas 50,45,27, 66,43,96,45,90,69

X X- (X- )²

OJO: Revisar datos, no dan varianza


de población solo datos de muestra,
calcular media de muestra, varianza
∑= y desviación de la muestra
=

9
Paso 2. Intervalos de confianza para la varianza de población

Queremos construir un intervalo de confianza para una varianza con un nivel de confianza de
95% para el problema de entrega de correo

Localizamos dos puntos en la distribución, el superior en el área en la cola superior de la


distribución y el inferior en el área en la cola inferior de la distribución. (Los puntos críticos)

Grados de libertad =
Nivel confianza =

Se busca valor de X² (Ji Cuadrada) =

• σ: la desviación estándar de la población 𝝈² = varianza de la población


• s: desviación estándar de la muestra S² = varianza de la muestra

10
Ahora, Para obtener un intervalo de confianza para 𝜎² despejamos

Así que un intervalo del 95% de confianza para 𝜎 seria


• Límite inferior =
• Limite Superior =

CONCLUSIÓN: El tiempo de entrega de las cartas esta entre

Ejercicio: Dado que 127 es la varianza de la muestra para un conjunto de nueve


observaciones, construya un intervalo de confianza del 95% para la varianza de la
población. / Usar dos colas

Buscar Puntos Críticos: usar tabla y buscar JI CUADRADA inferior y superior


Grados de libertad=
Nivel confianza=
Se busca valor de X² (Ji Cuadrada) =

Buscar límites de Confianza/ intervalo de confianza

Así que un intervalo del 95% de confianza para 𝜎 seria


• Límite inferior =
• Limite Superior =

11
Prueba de dos colas de una varianza
Un profesor de administración ha diseñado meticulosamente sus exámenes. Con el fin de estar
razonablemente seguro de que un examen distingue bien las diferencias en el logro de los
estudiantes, la desviación estándar de los resultados del examen no puede ser demasiado
pequeña. Por el otro lado, si la desviación estándar es muy grande, habrá una tendencia a tener
muchas calificaciones muy bajas, lo cual es deprimente para el ánimo de los estudiantes.
Experiencias pasadas han hecho que el profesor crea que hay una desviación estándar de
aproximadamente 13 puntos para un examen de 100 puntos, indica que el examen logra un buen
equilibrio de estos dos objetivos. El profesor acaba de hacer un examen a su grupo de 31
estudiantes de primero y segundo año. La calificación promedio fue 72.7 y la desviación estándar
de la muestra fue 15.9. ¿Este examen cumple con el criterio del profesor de un buen examen?

Si el profesor utiliza un nivel de significancia de 0.10 en la prueba de su hipótesis, podemos


plantear el problema en símbolos:

Definición de hipótesis

H0 : 𝜎 = 13 hipotesis nula la desviación estándar es 13 puntos


H1: 𝜎 ≠ 13 Hipótesis alternativa la desviación estándar no es 13 puntos
α = 0.10 Nivel de significancia para probar hipótesis

Calcular el estadístico para X² ( Revisar datos y ver con que datos contamos)

Buscar puntos críticos

Grados de libertad=
Nivel confianza =

Se busca valor de X² (Ji Cuadrada) =

12
Graficar

Conclusión:
.

Prueba de una cola para la varianza


La empresa Precisión Analytics fabrica una amplia línea de instrumentos de precisión y tiene una
buena reputación en el mercado por la calidad de sus instrumentos. Con el fin de conservar su
reputación, mantiene un estricto control de calidad en todos sus productos. No pone a la venta
una balanza analítica, por ejemplo, a menos que muestre una variabilidad significativamente
menor que un microgramo (para α= 0.01) cuando se pesan cantidades de aproximadamente
500 gramos. La línea de producción acaba de entregar una nueva balanza a la división de control
de la calidad

Se prueba la nueva balanza utilizándola para pesar el mismo peso estándar de 500 gramos, 30
veces. La desviación estándar de la muestra fue 0.73 microgramos. ¿Se deberá vender la
balanza?

H0 : 𝜎 1 hipótesis nula la desviación estándar verdadera es 1 microgramo


H1: 𝜎 1 Hipótesis alternativa la desviación estándar es menor que un microgramo
α = 0.01 Nivel de significancia para probar hipótesis

Calcular el estadístico para X²

13
Calcular Punto Critico
De la tabla 5 del apéndice,
• Grados de libertad =
• Calculo Nivel una cola =
• Interpolar y sacar PC =

Graficar

Formular Conclusión

Observaciones: Hasta ahora, se ha visto cómo hacer inferencias acerca de una, dos o varias
medias o proporciones. Pero también es interesante hacer inferencias acerca de la variabilidad
de la población. Para una población, esto se logra con la varianza de la muestra y la distribución
ji-cuadrada. Advertencia: la prueba de ji-cuadrada puede ser de una o dos colas. Sugerencia: si
la pregunta que debe contestarse incluye las palabras, menor que, mayor que, menor o
igual que o mayor o igual que, se usa la prueba de una cola; si la pregunta se refiere a
diferente de o cambio de, se usa la prueba de dos colas.

14
3. INFERENCIAS ACERCA DE LAS VARIANZAS DE DOS POBLACIONES
Prueba de una cola de dos varianzas
Una prominente socióloga cree que los ingresos de los graduados de la universidad tienen una
variabilidad mucho mayor que los ingresos de las personas que no cursaron la universidad. Con
el fin de probar esta teoría, envía a dos ayudantes de investigación a Chicago a investigar los
ingresos de estas dos poblaciones. El primer ayudante toma una muestra aleatoria de 21
graduados de la universidad y encuentra que sus ingresos tienen una desviación estándar de la
muestra S1= $17,000. El segundo ayudante toma una muestra de 25 no graduados y obtiene una
desviación estándar en los ingresos S2= $7,500. Debido a que la socióloga tiene la teoría de que
los ingresos de los egresados de la universidad son más variables que los ingresos de las
personas que no cursaron la universidad, una prueba de una cola es apropiada. La socióloga
desea verificar su teoría al nivel de significancia de 0.01. Podemos establecer de manera formal
sus hipótesis

Ho: = Hipótesis nula las dos varianzas son iguales


H1: > = hipótesis alternativa los ingresos de los egresados de la U, tienen
una varianza grande: Usamos coeficiente F para inferencias acerca de dos varianzas

= (17,000) ²/ (7,500) ² = 5.14

Calculo Punto Crítico


• Grados de libertad numerador:
• Grados de libertad denominador:
• Interpolar buscando en tabla con nivel de significancia 0.01. PC=

Graficar

Conclusión:

15
Una prueba de dos colas de dos varianzas
El procedimiento para la prueba de dos colas de dos varianzas es parecido al de la prueba de
una cola. El único problema surge en la búsqueda del valor crítico de la cola inferior. Este se
relaciona con pruebas de cola inferior y se resuelven de la manera siguiente.

Un criterio para la evaluación de anestésicos orales odontológicos es la variabilidad de la


cantidad de tiempo entre la inyección y la pérdida completa de sensibilidad en el paciente. (Esto
se conoce como tiempo de demora del efecto.) Una compañía farmacéutica grande ha
desarrollado dos nuevos anestésicos orales, que comercializará con los nombres de Oralcaine y
Novasthetic. A partir de similitudes en la estructura química de los dos compuestos, se ha
predicho que deben mostrar la misma varianza en el tiempo de demora del efecto. En la tabla
siguiente tabla se presentan los datos para las pruebas sobre los dos compuestos (en las que
se controlaron otras variables como la edad y el peso del paciente).

La compañía desea probar a un nivel de significancia del 2% si los dos anestésicos tienen la
misma varianza en el tiempo de demora del efecto. En símbolos, las
Varianza de la
Anestésico Muestra (n) Muestra Seg²
Oralcaine 31 1,296
Novasthetic 41 784

hipótesis son:

Probamos hipótesis

Calculo Punto Critico


Calculo grados de Libertad:
• Grados numerador =
• Grados denominador =

Calcular zona de aceptación


Usamos la notación: para denotar el valor de F con n grados de libertad en el numerador, d
grados de libertad en el denominador y un área α en la cola superior. F (n, d, α)

16
Calculo de zona de aceptación (usamos el nivel de significancia dado y reciproco)
Al ser dos colas dividir nivel de significancia entre dos y usamos tabla 6.
• F( ) = Podemos obtener el valor directamente de la tabla 6 del apéndice;
éste es =
• F( )= Sin embargo, ,corresponde a un valor pequeño y aplicamos la
formula siguiente:

Graficar

Decisión:

17

También podría gustarte