Está en la página 1de 13

Unidad 4

1 //Escenario
Escenario27
Lectura fundamental
Fundamental

Análisisde
Etapas deun
varianza
plan de comunicación
estratégica

Contenido

1 Introducción

2 Análisis de varianza

Palabras clave: análisis de varianza, suma de cuadrados, valor F.


1. Introducción
En los Escenarios anteriores, aprendimos como probar hipótesis en una o dos muestras, ahora se
quiere comparar tres o más muestras con la prueba de igualdad entre sus medias. Para establecer si
tres o más medias son iguales el método estadístico que se debe emplear es el análisis de varianza.

2. Análisis de varianza
Las variables que se manejan al analizar un conjunto de datos pueden ser cualitativas o cuantitativas.
De un lado, las cuantitativas, como su nombre lo indican, son aquellas que pueden medirse, por lo
tanto, el volumen mensual de ventas, el ingreso anual, el número de empleados, la producción diaria,
constituyen ejemplos de este tipo de variables. Por otro lado, el fabricante de neumáticos para
automóvil es una variable que, posiblemente, está relacionada con sus características de desgaste,
pero es imposible ordenar o hacer un arreglo continuo de cinco fabricantes. En forma similar, se
podría establecer si el rendimiento promedio de determinada sustancia química en una operación de
producción depende del supervisor que dirige el proceso y, también, si varía en el turno de trabajo.
El experimento completo constituye, por lo tanto, un estudio del efecto de dos variables cualitativas
independientes, supervisores y turnos, sobre el rendimiento de la sustancia química.

2.1. Supuestos del modelo

El análisis de varianza parte de algunos supuestos o hipótesis que deben cumplirse:

• La variable dependiente debe medirse al menos a nivel de intervalo

• Independencia de las observaciones

• La distribución de los residuales debe ser normal

• Homogeneidad de las varianzas, supuesto que se conoce como homocedasticidad.

POLITÉCNICO GRANCOLOMBIANO 2
2.2. Diseño completamente aleatorizado de un factor

En este diseño las unidades experimentales se asignan al azar a los diferentes tratamientos y a los
resultados obtenidos en las pruebas de hipótesis; en el caso de diferencia de dos medias, se generaliza
cuando se quieren comparar tres o más niveles de un tratamiento o factor.

Consideremos la siguiente terminología.

• Variable independiente o factor: en un experimento, la variable independiente es aquella que el


investigador puede tener bajo control. Un factor es uno de los aspectos sometidos a estudio en
un experimento.

• Nivel de un factor: es cualquier valor que toma el factor analizado; en el caso de un factor
cuantitativo, si en el experimento se prueban tres valores para la dosis de una droga (1 mg,
2 mg, 3 mg), se dice que el factor tiene tres niveles. En el caso del factor cualitativo, si en el
experimento se consideran como métodos de enseñanza, exposición en clase, y exposición y
trabajo en grupo en clase, se dice que el factor tiene dos niveles.

• Tratamiento: es una combinación de niveles de distintos factores analizados en un experimento;


por ejemplo, si en la calificación de una prueba se quiere analizar los factores de método de
enseñanza, con dos niveles de exposición y con exposición de trabajo individual; la jornada en
la que se realiza la prueba con dos niveles, mañana y tarde. Un tratamiento sería exposición
solamente en la jornada de la mañana.

• Variable dependiente: en un experimento, la variable dependiente refleja cualquier efecto que


pueda acompañar el manejo de los tratamientos. En los métodos de enseñanza, el rendimiento
de los alumnos es la variable dependiente, conocida como variable de respuesta.

• Variable exógena: en todo experimento, además de las variables independiente y dependiente,


el investigador tiene que enfrentarse a una o más variables exógenas, se denominan así por su
posible efecto sobre la variable dependiente. En el ejemplo mencionado, las variables exógenas
pueden ser los profesores, la capacidad de los alumnos o la jornada de estudio.

• Unidad experimental: es la cantidad más pequeña a la que se puede aplicar un tratamiento. En


el ejemplo de los métodos de enseñanza, los alumnos son las unidades experimentales.

• Medida: es un valor de la variable dependiente mediante la cual se determina el efecto del


tratamiento sobre una unidad experimental. Las medidas con frecuencia reciben el nombre de
observaciones; en el ejemplo, una calificación de 4.0 en el rendimiento de un alumno es una medida.

POLITÉCNICO GRANCOLOMBIANO 3
• Error experimental: las unidades experimentales que se exponen al mismo tratamiento
presentan generalmente una respuesta diferente, es decir, las unidades experimentales
expuestas al mismo nivel del tratamiento producen generalmente diferentes medidas. En el
ejemplo, a todos los alumnos se les enseña con el mismo método, pero las calificaciones son
diferentes. La medida de esta variabilidad de respuesta se denomina error experimental.

• Repetición: esto significa que las pruebas se pueden repetir bajo las mismas condiciones en
más de una ocasión, es decir, cuando en un experimento un nivel determinado de tratamiento
se aplica a más de una unidad experimental, se dice que el nivel se repite. La repetición es
conveniente porque hace posible el cálculo de un error experimental y aumenta la posibilidad de
generalizar los resultados experimentales.

• Aleatorización: es la designación al azar de las unidades experimentales para los niveles


de tratamiento. La aleatorización se puede referir a la selección inicial de las unidades
experimentales como a la selección de los tratamientos.

La aleatorización consiste, entonces, en realizar distintos ensayos de un experimento en un orden


determinado por el azar, de esta forma se anula el efecto que el mismo experimento pueda aportar a
la característica estudiada. Por ejemplo, en la producción de un producto, una condición importante
es la homogeneidad de la materia prima, pero puede ocurrir que las características no están bien
homogenizadas o presenten un cambio a través del tiempo, de tal forma que pueda afectar las
características finales del producto. Para contrarrestar estos efectos se deben realizar los distintos
ensayos del experimento en un orden aleatorio.

2.3. Procedimiento ANOVA

Para decidir si las medias de dos o más poblaciones son iguales, se utiliza una técnica estadística
conocida como análisis de varianza. Esta prueba se basa en una muestra única, seleccionada de
cada población.

Ejemplo 1.

Suponga, que cuatro grupos de vendedores de una compañía fueron sometidos a diferentes
programas de entrenamiento, el número de personas fue diferente para cada grupo.

POLITÉCNICO GRANCOLOMBIANO 4
Al final del programa de entrenamiento, a cada vendedor le fue asignada aleatoriamente una zona de
ventas de un grupo de zonas, que tienen, aproximadamente, el mismo potencial y se registra el número
de ventas efectuadas por cada uno de los vendedores de cada grupo, durante la primera semana
posterior al entrenamiento. Para determinar si las diferencias entre las medias muestrales revelan las
verdaderas diferencias entre los cuatro programas de entrenamiento, se utiliza el análisis de varianza.

Tabla 1. Número de ventas efectuadas por cada grupo de entrenamiento

Grupo de entrenamiento

1 2 3 4

65 75 59 94

87 69 78 89

73 83 67 80

79 81 62 88

81 72 83 87

69 79 76 88

Total Tj 454 459 425 526

nj 6 6 6 6

Fuente: elaboración propia

GT: gran total = 454 + 459 + 425 + 526 = 1864

n = 6 + 6 + 6 + 6 = 24

k = 4 número de grupos.

Las hipótesis nula y alternativa se pueden enunciar como:

H0: μ1 = μ2 = μ3 = μ4

H1: Alguna media es diferente

POLITÉCNICO GRANCOLOMBIANO 5
O lo que es equivalente en este caso:

H0: Los cuatro programas de entrenamiento tienen el mismo efecto sobre las ventas

H1: Algún programa de entrenamiento tiene un efecto diferente sobre las ventas.

La técnica utilizada para analizar los datos de este tipo de experimentos es conocida como
Análisis de varianza.

Un criterio para establecer si los promedios no se pueden considerar como iguales se basa en la
comparación entre mediciones de la dispersión externa y la dispersión interna. Las dispersiones se
pueden medir con varianzas, las cuales se llamarían varianzas internas o varianza dentro de los grupos,
y externas o varianzas entre grupos, respectivamente. Vale la pena destacar el hecho de que una
comparación de promedios (medidas de tendencia central) se realiza utilizando como criterio una
comparación de varianzas (medida de dispersión).

La dispersión interna se define como aquella variación propia de cada grupo teniendo en cuenta las
distancias que separan a los datos del promedio del grupo.

La dispersión externa es la variación existente entre los promedios de los diferentes grupos.

Para relacionarlo con el experimento en cuestión, digamos que la variación interna se puede deber
a las características inherentes a cada unidad experimental o al mismo instrumento de medida
que se esté utilizando, mientras que la variación externa está asociada a los diversos programas de
entrenamiento a la que fueron sometidos los trabajadores en esa empresa.

La suma de estas dos varianzas nos da una varianza total y los resultados se resumen en una 'tabla de
Análisis de varianza' (ver tabla 2).
VARIANZA ENTRE VARIANZA DENTRO
VARIANZA TOTAL = +
GRUPOS GRUPOS

El numerador de la varianza es una suma de cuadrados, entonces, se dice que:

SCT = SCTR + SCE

SCT: suma de cuadrados totales

SCTR: suma de cuadrados entre grupos o de tratamientos

SCE: suma de cuadrados dentro de grupos o del error

Las fórmulas para la obtención de estas variaciones son las que se exponen a continuación.

POLITÉCNICO GRANCOLOMBIANO 6
Tabla 2. Análisis de varianza

Fuente de Grados de Razón de


Suma de cuadrados Media de cuadrados
variación libertad varianza f

Tratamientos
k-1
Between

Dentro de grupos
n-k
Within

Total n-1

Fuente: elaboración propia

La comparación de estas varianzas tiene una distribución asociada conocida como la distribución F, la
cual trabaja con dos tipos de grados de libertad: uno con el numerador y otro con el denominador. El
valor F permite establecer si existe un efecto significativo del factor sobre la característica estudiada.

La tabla de análisis de varianza se presenta en la siguiente forma.

Tabla 3. Análisis de varianza ANAVA

Fuente de Suma de Grados de libertad Cuadrado medio Razón F


variación cuadrados

Entre grupos SCTR k-1 MCTR

Dentro de grupos o MCTR/MCE


SCE n-k MCE
del Error

Total SCT n-1

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 7
Tabla 4. Análisis de varianza para el caso de las ventas

Fuente de Suma de Grados de libertad Cuadrado medio Razón F


variación cuadrados

Dentro de grupos 912,3333 3 304,1111

Dentro de
1041 20 52,05 5,8426
grupos Error

Total 1953,3333 23

Fuente: elaboración propia

El valor de la tabla con un nivel de significancia del 5% y grados de libertad 3 en el numerador y 20 en


el denominador es de 3,10

Tabla 5. Distribución F

Fuente: Freund, y Miller (2000)

POLITÉCNICO GRANCOLOMBIANO 8
Grados de libertad
V1 = 3
V2 = 20

0,05

F
5,84
3,10

Figura 1. Distribución F para 3 y 20 grados de libertad


Fuente: elaboración propia

Al comparar el valor de la tabla de análisis de varianza (5,84) con respecto al valor de la tabla F (3,10) cae
en la zona de rechazo, por lo tanto, con un nivel de significancia del 5% se puede decir que hay diferencias
significativas en el efecto que tienen los diferentes programas de entrenamiento, en las ventas.

Los resultados se pueden calcular utilizando el procedimiento de análisis de datos en Excel

Figura 2. Función Excel para Análisis de varianza


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 9
Los resultados obtenidos se muestran en la siguiente forma:

Figura 3. Salida resultados Excel análisis de varianza


Fuente: elaboración propia

Ejemplo 2:

Supongamos que se desea experimentar si tres dispositivos especiales en los carburadores para
automóviles tienen el mismo efecto con relación al ahorro en consumo de gasolina. La variable
respuesta es el kilometraje recorrido por galón. Para el experimento se seleccionaron 3 dispositivos y
un carburador estándar sin dispositivo.

La unidad de experimentación es un automóvil, se escogieron 5 autos entre los disponibles. Los datos
obtenidos como kilometraje por galón se muestran en la siguiente tabla.

Tabla 6. Ejemplo carburador

Carburador
Estándar A B C
29.12 30.24 30.56 32.64
43.84 44.64 44.96 47.84
56.96 55.84 57.28 61.12
23.68 24.32 23.84 27.68
40.64 39.68 40.96 43.04

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 10
Las hipótesis correspondientes son:

Ho: No existen diferencias significativas en el consumo de gasolina con los tres dispositivos especiales
en los carburadores.

H1: Si existen diferencias significativas en el consumo de gasolina con los tres dispositivos especiales
en los carburadores.

La tabla de análisis de varianza para esta hipótesis, queda en la forma que se muestra a continuación.

Tabla 7. Análisis de varianza (ANOVA)

Comparación dispositivo en carburadores

Fuente de Suma de Grados de Cuadrado medio Razón F


variación cuadrados libertad
Dentro de
43.657 3 14.55232 F= 0.088
tratamientos

Error 2654.5459 16 165.90912

Total 2698.2029 19

Fuente: elaboración propia

Con un nivel de significancia del 5%, ¿qué se puede concluir, con base en los resultados del análisis de
varianza?

Obtenga la tabla de análisis de varianza utilizando las herramientas de Excel y compare los resultados.

El análisis de varianza se constituye entonces en la estadística de prueba que permite encontrar un


valor calculado para tomar decisiones sobre la comparación de tres o más medias siguiendo los pasos
definidos en las pruebas de hipótesis.

Esta técnica estadística también está asociada con el análisis de una variable dependiente y una o más
variables independientes como se verá en el siguiente Escenario con el análisis de regresión.

POLITÉCNICO GRANCOLOMBIANO 11
Referencia de tablas
Freund, J., Miller, M. y Miller, I. (2000). Estadística Matemática con aplicaciones. México. D.F.: Ed.
Prentice Hall

POLITÉCNICO GRANCOLOMBIANO 12
INFORMACIÓN TÉCNICA

Módulo: Estadística Inferencial


Unidad 4: Análisis de varianza y análisis de regresión
Escenario 7: Análisis de varianza

Autor: Patricia Castillo Garzón

Asesor Pedagógico: Manuel Fernando Guevara


Diseñador Gráfico: Julieth Rodríguez
Asistente: Ginna Quiroga

Este material pertenece al Politécnico Grancolombiano.


Prohibida su reproducción total o parcial.

POLITÉCNICO GRANCOLOMBIANO 13

También podría gustarte