Está en la página 1de 21

Anlisis de la varianza

Magdalena Cladera Munar


mcladera@uib.es
Departamento de Economa Aplicada
Universitat de les Illes Balears
CONTENIDOS
Anlisis de la varianza de un factor.
Anlisis de la varianza con ms de
un factor.
Anlisis de la covarianza.
Bibliografa:

LVY, J.P. Y VARELA, J. (2003). Anlisis multivariable para


las ciencias sociales. Ed. Pearson Prentice Hall. Madrid.

NEWBOLD, P. (1997). Estadstica para los Negocios y la


Economa. Prentice Hall. Madrid.

PARDO, A. RUZ, M. A. (2001). SPSS 10.0. Gua para el


anlisis de datos. Accesible en:
http://www.uca.es/serv/ai/formacion/spss/Inicio.pdf

PEA, D. (2001) ESTADSTICA. Modelos y Mtodos. Tomo II:


Fundamentos. Ed. Alianza Universidad Textos.Madrid.

PREZ, C. (2001). Tcnicas estadsticas con SPSS. Ed.


Pearson Prentice Hall. Madrid.

PERZ, C. (2004). Tcnicas de Anlisis Multivariante de


Datos. Aplicaciones con SPSS. Pearson Educacin, S. A.
Madrid.

URIEL, E. Y ALDS, J. (2005). Anlisis Multivariante Aplicado.


Thomson. Madrid.
Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor

El Anlisis de la Varianza (ANOVA) permite contrastar la igualdad de


medias en k poblaciones.

En cada una de las poblaciones, la variable cuantitativa X tiene la


siguiente distribucin:

Xj N(j, 2) para j = 1, 2, , k

Hiptesis a contrastar:

H0: 1 = 2 = = k =

HA: al menos una media es diferente

La causa de la posible heterogeneidad de las poblaciones se


denomina factor.

Los factores son variables cualitativas cuyas categoras determinan


las diferentes poblaciones que se comparan.
Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor

Supuestos:
Las varianzas de todas las poblaciones son iguales
(homocedasticidad).

La variable analizada se distribuye normalmente en


todas las poblaciones.

Incumplimiento de los supuestos:


El ANOVA es una tcnica robusta a la presencia de
heterocedasticidad si el nmero de observaciones de
cada grupo es similar.

El ANOVA es una tcnica robusta al incumplimiento del


supuesto de normalidad si las muestras son grandes.
Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor

Informacin muestral:

POBLACIN

1 2 k

x11 x21 xk1

x12 x22 xk2


Observaciones
muestrales

x1n x2n xkn

Medias x1 x2
xk

Media global x
Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor

Informacin muestral: Medidas de variabilidad:

POBLACIN - Variabilidad intragrupos:


1 2 k
(x xj )
2
ij
x11 x21 xk1
Observaciones
x12 x22 xk2
muestrales
- Variabilidad entre grupos:
(x x)
2
x1n x2n xkn j
Medias
x1 x2 xk
Media global x
- Variabilidad total:
(x x)
2
ij
Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor

Estadstico de contraste: Medidas de variabilidad:

(x x ) (k 1)
2 - Variabilidad intragrupos:
(x xj )
F= Fk 1,n k
j

(x x ) (n k )
2
2
ij
ij j Ho cierta

- Variabilidad entre grupos:

(x x)
2
Rho si F > Fk-1, n-k; j

- Variabilidad total:

(x x)
2
ij
Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor

Tabla ANOVA:

Fuentes de Sumas de Grados de Medias de F p-valor


variacin cuadrados libertad cuadrados

(x x) (x x)
Entre F p-valor
grupos j
2
k 1 j
2
(k 1)

(x xj ) nk (x xj ) (n k )
2 2
Intragrupos ij ij

(x x) n 1
2
Total ij
Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor

Ejemplo. Coste en farmacia por CA.

Descriptivos

Costes totales por habitante (poblacin total) en euros


Intervalo de confianza para
la media al 95%
Desviacin Lmite
N Media tpica Error tpico Lmite inferior superior Mnimo Mximo
Asturias 75 147,1725 20,10973 2,32207 142,5457 151,7993 99,43 201,90
Cantabria 32 137,7320 24,41170 4,31542 128,9306 146,5333 90,88 206,35
La Rioja 18 142,1683 27,18609 6,40782 128,6489 155,6876 95,34 185,37
Murcia 71 142,0445 14,08061 1,67106 138,7117 145,3773 116,21 187,43
Aragn 112 158,8742 35,62395 3,36615 152,2040 165,5445 73,30 252,25
Castilla La Mancha 187 161,9665 32,19195 2,35411 157,3223 166,6106 90,72 290,77
Extremadura 97 146,9971 26,83451 2,72463 141,5888 152,4055 89,96 214,83
Illes Balears 41 119,8415 26,98319 4,21407 111,3245 128,3584 68,96 178,99
Madrid 289 102,2012 28,72670 1,68981 98,8753 105,5271 10,60 226,11
Castilla y Len 232 143,2552 32,54685 2,13681 139,0451 147,4653 59,51 230,20
Total 1154 137,0145 36,66620 1,07935 134,8968 139,1322 10,60 290,77
Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor

Ejemplo. Coste en farmacia por CA.

ANOVA

Costes totales por habitante (poblacin total) en euros


Suma de Media
cuadrados gl cuadrtica F Sig.
Inter-grupos 561026,249 9 62336,250 72,100 ,000
Intra-grupos 989078,878 1144 864,579
Total 1550105,1 1153
Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor


Permite evaluar el efecto individual y conjunto de dos o ms
variables categricas sobre una variable dependiente
cuantitativa.
Hiptesis. Existe una hiptesis nula por cada factor y una por
cada posible combinacin de factores:
La hiptesis nula referida a un factor afirma que las medias de
las poblaciones definidas por los niveles del factor son iguales.
La hiptesis referida al efecto de una interaccin afirma que su
efecto es nulo.
Para contrastar cada hiptesis se utiliza un estadstico F
siguiendo la misma lgica que en el caso del ANOVA de un
factor.
Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor


Supuestos:
Se trabaja con tantas poblaciones como casillas resultan de la
combinacin de todas las categoras de los factores.
Todas las poblaciones son normales.
Igualdad de varianzas en todas las poblaciones.
Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor

Ejemplo. Coste en farmacia por acreditacin docente y


porcentaje de MIR

Pruebas de los efectos inter-sujetos

Variable dependiente: Costes totales por habitante (poblacin total) en euros


Suma de
cuadrados Media
Fuente tipo III gl cuadrtica F Significacin
Modelo corregido 194018,582a 6 32336,430 36,775 ,000
Interseccin 2240345,702 1 2240345,7 2547,870 ,000
porc_mir 67997,830 3 22665,943 25,777 ,000
docencia 6403,169 1 6403,169 7,282 ,007
porc_mir * docencia 11677,475 2 5838,737 6,640 ,001
Error 378099,655 430 879,302
Total 8778802,089 437
Total corregida 572118,238 436
a. R cuadrado = ,339 (R cuadrado corregida = ,330)
Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor

Ejemplo. Coste en farmacia por acreditacin docente y


porcentaje de MIR
Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor

Ejemplo. Coste en farmacia por acreditacin docente y


porcentaje de MIR
Estadsticos descriptivos

Variable dependiente: Costes totales por habitante (poblacin total) en euros


Formacin de mdicos Existencia de Media Desv. tp. N
0 No 182,0577 26,40935 11
Total 182,0577 26,40935 11
inferior al 34% No 151,1011 30,76412 263
S 118,1513 28,14032 19
Total 148,8811 31,64848 282
entre el 34% y el 66% No 118,2273 29,65015 68
S 112,2300 24,77521 24
Total 116,6628 28,45036 92
superior al 66% No 97,1619 28,11215 24
S 101,2119 25,61119 28
Total 99,3427 26,60492 52
Total No 142,3868 35,42615 366
S 109,4694 26,62058 71
Total 137,0387 36,22427 437
Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor

Ejemplo. Coste en farmacia por acreditacin docente y


porcentaje de MIR
Estimaciones de los parmetros

Variable dependiente: Costes totales por habitante (poblacin total) en euros


Intervalo de confianza al
95%.
Lmite
Parmetro B Error tp. t Significacin Lmite inferior superior
Interseccin 101,212 5,604 18,061 ,000 90,197 112,226
[porc_mir=0] 84,896 10,797 7,863 ,000 63,675 106,117
[porc_mir=1] 16,939 8,814 1,922 ,055 -,384 34,263
[porc_mir=2] 11,018 8,249 1,336 ,182 -5,195 27,231
[porc_mir=3] 0a . . . . .
[docencia=0] -4,050 8,249 -,491 ,624 -20,263 12,163
[docencia=1] 0a . . . . .
[porc_mir=0] * a
0 . . . . .
[docencia=0]
[porc_mir=1] *
37,000 10,847 3,411 ,001 15,680 58,320
[docencia=0]
[porc_mir=1] * a
0 . . . . .
[docencia=1]
[porc_mir=2] *
10,047 10,845 ,926 ,355 -11,268 31,363
[docencia=0]
[porc_mir=2] * a
0 . . . . .
[docencia=1]
[porc_mir=3] * a
0 . . . . .
[docencia=0]
[porc_mir=3] * a
0 . . . . .
[docencia=1]
a. Al parmetro se le ha asignado el valor cero porque es redundante.
Anlisis de la varianza y la covarianza

Anlisis de la Covarianza

El ANCOVA permite eliminar de la variable dependiente el


efecto atribuible a variables no incluidas como factores.

El inters sigue siendo analizar los efectos de los factores,


contrastndose las mismas hiptesis que en el ANOVA.

Adems, se contrasta la hiptesis nula de que el efecto de la


covariable sobre la dependiente es cero.
Anlisis de la varianza y la covarianza

Anlisis de la Covarianza

Ejemplo. Coste en farmacia por acreditacin docente,


porcentaje de MIR, frecuentacin y calidad de la prescripcin.
Pruebas de los efectos inter-sujetos

Variable dependiente: Costes totales por habitante (poblacin total) en euros


Suma de
cuadrados Media
Fuente tipo III gl cuadrtica F Significacin
Modelo corregido 272291,773a 8 34036,472 52,640 ,000
Interseccin 269226,479 1 269226,479 416,382 ,000
porc_mir 15153,080 3 5051,027 7,812 ,000
docencia 3586,459 1 3586,459 5,547 ,019
porc_mir * docencia 4616,142 2 2308,071 3,570 ,029
frecuent 17504,011 1 17504,011 27,071 ,000
utb_1998 61532,367 1 61532,367 95,165 ,000
Error 265099,886 410 646,585
Total 8562645,903 419
Total corregida 537391,659 418
a. R cuadrado = ,507 (R cuadrado corregida = ,497)
Anlisis de la varianza y la covarianza

Anlisis de la Covarianza

Ejemplo. Coste en farmacia por acreditacin docente,


porcentaje de MIR, frecuentacin y calidad de la prescripcin.
Estimaciones de los parmetros

Variable dependiente: Costes totales por habitante (poblacin total) en euros


Intervalo de confianza al
95%.
Lmite
Parmetro B Error tp. t Significacin Lmite inferior superior
Interseccin 72,248 5,599 12,903 ,000 61,241 83,254
[porc_mir=0] 47,377 10,175 4,656 ,000 27,376 67,379
[porc_mir=1] 5,390 8,116 ,664 ,507 -10,564 21,344
[porc_mir=2] 2,050 7,318 ,280 ,779 -12,334 16,435
[porc_mir=3] 0a . . . . .
[docencia=0] -4,135 7,680 -,538 ,591 -19,233 10,963
[docencia=1] 0a . . . . .
[porc_mir=0] * a
0 . . . . .
[docencia=0]
[porc_mir=1] *
27,064 10,179 2,659 ,008 7,055 47,074
[docencia=0]
[porc_mir=1] * a
0 . . . . .
[docencia=1]
[porc_mir=2] *
13,291 9,848 1,350 ,178 -6,068 32,649
[docencia=0]
[porc_mir=2] * a
0 . . . . .
[docencia=1]
[porc_mir=3] * a
0 . . . . .
[docencia=0]
[porc_mir=3] * a
0 . . . . .
[docencia=1]
frecuent 1,349 ,259 5,203 ,000 ,840 1,859
utb_1998 3,163 ,324 9,755 ,000 2,526 3,801
a. Al parmetro se le ha asignado el valor cero porque es redundante.
Anlisis de la varianza y la covarianza

Anlisis de la Covarianza

Ejemplo. Coste en farmacia por acreditacin docente,


porcentaje de MIR, frecuentacin y calidad de la prescripcin.

ANOVA ANCOVA

También podría gustarte