Está en la página 1de 19

Anlisis de la Varianza

Integrantes
Aleska Caicedo
Fairu Lzaro
Leonela Solano
Katerin Vanegas
Andrea Zorro

Marlon Cormane Medina


Docente

Universidad del Magdalena


Programa de Psicologa

Estadstica Inferencial
4 de Septiembre del 2015

Introduccin
El anlisis de la varianza (ANOVA) es una tcnica estadstica de gran utilidad tanto en la
industria, para el control de procesos, como en el laboratorio de anlisis para el control de
mtodos analticos. Los ejemplos de aplicacin son mltiples, pudindose agrupar, segn el
objetivo que persiguen, en dos principalmente: la comparacin de mltiples columnas de
datos y la estimacin de los componentes de variacin de un proceso.
Un anlisis de la varianza permite determinar si diferentes tratamientos muestran
diferencias significativas o por el contrario puede suponerse que sus medias poblacionales
no difieren. Esta tcnica permite superar las limitaciones de hacer contrastes bilaterales por
parejas, lo cual es un mal mtodo para determinar si un conjunto de variables con n > 2
difieren entre s.
Lo planteado anteriormente se resume en que esta es una prueba que permite contrastar de
forma global si existen o no diferencias significativas entre las medias de los diferentes
grupos, en caso de que la variable cualitativa tenga dos o ms categoras (grupos), y as
evitar hacer comparaciones de dos grupos en dos grupos.
La mejor manera de estudiar y organizar un conjunto de datos es formar una tabla de
distribucin, con el fin de obtener una serie de elementos descriptivos, tales como lo son
media, varianza, desviacin estndar.
Durante el Anlisis de la Varianza (ANOVA), se utilizarn tablas, que son ideales para
colocar u organizar valores que sern resultados de la aplicacin de frmulas.

Adems la tabla que d como resultado, permitir y facilitar de forma adecuada la


interpretacin del ANOVA.

Objetivos

Determinar qu es el Anlisis de la Varianza (ANOVA), y porque es til su

aplicacin.
Conocer cules son y cmo se resuelven las frmulas para poder aplicar el Anlisis

de la Varianza (ANOVA).
Aprender a interpretar los valores que se ubican en la tabla para poder generar un
conclusin adecuada.

Justificacin
El anlisis de un experimento est basado por lo general en un modelo matemtico para las
observaciones, y este modelo matemtico est relacionado y justificado por el diseo. Se
puede asegurar que la aleatorizacin es el paso que introduce los modelos probabilsticos
para las observaciones. Este hecho fue observado inicialmente por Fisher y es considerado
actualmente como una de sus mayores contribuciones al desarrollo de la ciencia.
El objetivo principal de muchos experimentos consiste en determinar el efecto que sobre
alguna variable dependiente Y tienen distintos niveles de algn factor X (variable
independiente y discreta). El factor puede ser la temperatura, la empresa que ha producido
el bien, el da de la semana, etc. Esencialmente, el diseo para el anlisis simple de la
varianza consistir en obtener muestras aleatorias e independientes del valor de Y asociado
a cada uno de los distintos niveles del factor X1, X2,..., Xn . Entonces podremos determinar
si los diferentes niveles del factor tienen un efecto significativo sobre el valor de la variable
dependiente.

Anlisis de la Varianza (ANOVA)


Segn Hernndez, (2001) el Anlisis de la Varianza (ANOVA) fue un procedimiento
ideado por Fisher a principios del siglo XX para analizar las variaciones de un proceso o

experimento en componentes independientes susceptibles de asignarse a causas de


variacin.
Se puede considerar como una generalizacin de la prueba de la diferencia de las medias,
dado que cuando en una investigacin social se tienen varios estratos, para conocer si la
variacin es o no significativa, haba que hacer todas las comparaciones y anlisis
pertinentes entre cada dos estratos o grupos (E, E).
Se usa cuando se dispone de ms de una variable nominal u ordinal y otra de intervalo.
El anlisis de la varianza es una de las principales aplicaciones de la Estadstica, en la
sociedad, la empresa o la fabricacin de artculos, y sirve como herramienta fundamental en
la toma de decisiones.
Principios del Anlisis de la Varianza (ANOVA)
El anlisis est basado en comparar estadsticamente la variabilidad o las diferencias que se
dan entre los grupos (Gi) con las diferencias que pudieran existir dentro de cada grupo (Gi).
Si estas son significativas hay que concluir que se trata de poblaciones distintas en relacin
a la caracterstica estudiada.
La hiptesis de investigacin (H0) que se emplea es la del mtodo cientfico en su punto de
partida. Si sta se rechaza, deja el campo a la hiptesis alternativa (H1).

Clases de Anlisis de la Varianza (ANOVA)


El anlisis paramtrico (AP): Puede clasificarse en :
*Anlisis de la simple en el que se tiene adems de la en intervalo una variable
nominal.
*Anlisis de la bomidal en el que las variables nominales son dos, como las diseos
experimentales.
*Anlisis de la con tres o ms variables nominales: anlisis multivariante.

Anlisis no paramtrico(ANP): Los ms importantes tipos son:


*Anlisis de la basado en un solo factor por rangos: prueba de Kruskal- Wallis.
*Anlisis de la basado en dos factores por rangos: prueba de Friedman.

PROCEDIMIENTO
El anlisis de la varianza se puede usar para probar diferencias entre varias medias
poblacionales en donde la hiptesis nula es que todas las medias poblacionales son iguales
entre s. El procedimiento de muestreo consiste en tomar varias muestras aleatorias
independientes, una para cada categora de datos (niveles de tratamiento).
La suposicin detrs del empleo de anlisis de la varianza, es que las medias mustrales de
poblaciones con distribucin muestral tienen todas las mismas varianzas.
Sin embargo, se ha encontrado que en el procedimiento de prueba no se ve afectado por
violaciones a la suspensin de normalidad siempre que las poblaciones sean unimodales y
los tamaos de las muestras sean aproximadamente iguales.
Dado a que la hiptesis nula es que las medias poblaciones son iguales.
La idea bsica detrs del anlisis de la varianza fue desarrollada por el britnico Ronald, A.
Fisher, con el objetivo de disear experimentos e interpretar datos experimentales, en la
cual se describe a continuacin:
1. Calcular la media de cada grupo muestral y despus determinar el error estndar de
la media, basndose nicamente en estas medias muestrales. Desde el punto de vista
de los clculos, esta es la desviacin estndar de estos valores medios.

x 1=

x
n

Error estndar de la media:


2

xx t

S x =

2. Estimar la varianza poblacional (comn) de la cual se tomaran la muestra, esta


estimacin de la varianza poblacional se llama cuadrado medio entre grupo de
tratamientos (CMGT)
Fisher llamaba a todas las estimaciones de la varianza, cuadrado medio porque
desde el punto de vista de los clculos, una varianza es la media del cuadrado de las
desviaciones respecto a la media del grupo.
CMGT: S 2 = nsx
3. Calcular por separado la varianza de cada grupo muestral respecto de la media de
cada grupo. Despus combinar estos valores de la varianza, ponderndolos de
acuerdo con el n-1 de la muestra. A la estimacin resultante de la varianza se le
llama Error Cuadrado Medio (ECM) y se basa nicamente en la diferencia de cada
uno.
De nuevo se llama cuadrado medio porque es una estimacin de la varianza. Este
valor se debe al error ya que las desviaciones dentro de cada grupo muestral solo
puede deberse al error del muestreo aleatorio y no a alguna diferencia entre las
medias de los grupos poblacionales.
2
xx t

S x =

ECM =

( n1 ) S 1 + ( n21 ) S2 + ( n3 1 ) S 3 +...(nx 1)S x


n1n2 n3 +... nk k
2

4. Si la hiptesis nula es verdadera entonces se deduce que cada uno de los cuadrados
(CMGT y ECM) es un estimador independiente e insesgado de la misma varianza
poblacional. Pero si la hiptesis nula es falsa, entonces el valor del cuadrado medio
del tratamiento es mayor

que el error cuadrado medio y por ende cualquier

diferencia entre las medias implara el cuadrado medio del grupo de tratamiento,

mientras que el no tendr ningn efecto sobre el ECM, el cual est basado solo en
las diferencias dentro del grupo.
H o :1=2=3=...= x
(CMGT y ECM)

CMGT > ECM

5. Usar la distribucin Fisher entre las dos varianzas


CMGT
F l 1 l 2 =
ECM
En la tabla
F l 1 l 2 l 1=k 1
K= numero de tratamientos.
l 2= Kn1
kn = # de observaciones de cada tratamiento

Ejercicios
2. Un psiclogo dividi aleatoriamente a 9 estudiantes en tres grupos de 3 unidades
cada uno, para la aplicacin de una prueba que mide el estrs en poca de parciales
A continuacin, se presenta las puntuaciones obtenidas por los estudiantes en cada
grupo.
Nivel de significancia 5%

Grupos de estudiantes
Grupo 1
Grupo 2
Grupo 3

Puntajes obtenidos
15,6 17,1
15,9
16,4 16,3 15,8
17,2 15,8 16,4

Grupo1
Varianza muestra l0,63

0,09

Desviacin estndar muestral 0,725

48,6
49,9
49,4

Grupo2

Grupo3

16,2
16,16
16,46

=147,9

0,48
0,423

0,335

3. Un estudiante de psicologa decidi realizar su tesis de grado basndose en la


relacin que existe entre el mtodo de enseanza y el aprendizaje de una materia.
Para ello, aplic 3 mtodos distintos (enseanza presencial, por internet y
autodidacta) a grupos diferentes de sujetos; para ello, seleccion 18 estudiantes de
manera aleatoria y los ubic en los tres grupos que conform, quedando 6 alumnos
en cada grupo. Se calcul la nota de cada estudiante mediante un examen y se
obtuvieron los siguientes datos:
Mtodo utilizado
Enseanza
Presencial
Enseanza por
Internet
Enseanza
Autodidacta

Nota obtenida por los


participantes (estudiantes)
4,
7,
5,
6,
8,
6,
8
1
4
8
6
2
4,
6,
5,
3,
4,
2,
9
1
4
6
2
4
1,
6,
3,
5,
2,
3,
5
4
9
3
4
1

38,9

6,4

26,6

4,4

22,6

3,7

88,1

Contrastar con un nivel de significacin del 5 % si el tipo de enseanza utilizado posee


algn efecto en el aprendizaje de una materia.
Datos
Media muestral:
6,4 (presencial)
4,4 (por internet)
3,7 (autodidacta)
Media poblacional : 4,8
Varianza muestral: 31,2
Desviacin muestral: 5,5
4. Se est estudiando el efecto de cmo un espacio o lugar disminuye o
favorece el estrs en las personas que se encuentran inmersas en ese
lugar. Se crean varios espacios con caractersticas diferentes y se toman
21 individuos y se reparten en 3 grupos distintos. El objetivo es ver si el
espacio influye o no, en la aparicin o disminucin del estrs.
(=0,01)

ESPACIOS

Media muestral
Varianza muestral
Desviacin estndar muestral

A
25
21
32
24
19
22
26

B
14
16
18
15
14
17
15

24,14
17,80
4,22

15.57
2,28
1,51

C
21
19
16
18
22
17
20
19
4,66
2,16

5. Se han aplicado cuatro mtodos distintos para el aprendizaje del concepto de


nmero primo a cuatro grupos de alumnos y alumnas elegidos aleatoriamente.
Posteriormente se les ha pasado la misma prueba para valorar la adquisicin del
concepto, con los siguientes resultados:

Mtodo A
8
12
11
15
7
9
10
11
17
12

Mtodo B
16
12
13
15
19
16
13
10
6
11

Mtodo C
16
15
13
17
13
9
19
16
14
13

Mtodo D
11
9
8
8
9
12
10
9
5
10

Media muestral

11,2

13,1

14,5

9,1

Varianza muestral

9,28

13,43

7,61

3,65

Desviacin estndar muestral

3,04

3,66

2,75

1,91

Se supone poblacin normal y que las muestras son independientes entre s. Hay alguna
evidencia, al 95% de Nivel de Confianza, de que exista un efecto en la aplicacin de los
distintos mtodos?
6. Tenemos una muestra aleatoria de 15 sujetos que puntan alto en ansiedad y los
distribuimos aleatoriamente en tres grupos a los cuales se les aplico distinto tipo de
medicamento. El objetivo del estudio es observar si la droga influye en el estado de
ansiedad de los individuos. Los resultados fueron.

Media muestral
Varianza muestral
Desviacin estndar muestral

A
57
48
47
59
49

B
64
55
58
66
67

52
31.0
5.568

62
27.5
5.244

C
69
71
58
64
68
66
26.5
5.148

Conclusin
En conclusin podemos afirmar que el ANOVA puede utilizarse para comparar entre s las
medias de los resultados obtenidos por

diversos laboratorios, analistas, mtodos de

anlisis, etc. En el anterior artculo mostramos como el ANOVA se puede utilizar para
descomponer la variacin total de un proceso en las fuentes de variacin parciales. Esto
nos puede resultar muy til para, por ejemplo, determinar cules son los factores que
afectan ms a un determinado procedimiento analtico. Desde el punto de vista prctico,
existen mltiples paquetes estadsticos que permiten ejecutar rpidamente los clculos del
ANOVA.

REFERENCIA
Hernndez, B. (2001). Tcnicas estadsticas de investigacin social. Recuperado de
https://books.google.com.co/books?
id=vpfVgmaR5qUC&printsec=frontcover#v=onepage&q&f=false