Está en la página 1de 28

Anlisis de datos II

Por Ivn Pereda Jimnez


Esquema del segundo cuatrimestre del curso 2.009-2010
TEMA 12: CONTRASTE PARA MS DE DOS
MUES TRAS INDEPENDIENTES
1. Conceptos bsicos
La variablidad: el factor estudaido y el error experimental
Objetivo del anlisis de varianza
Terminologa: Factores y niveles
Distintos diseos: efectos o modelo aleatorio, y efectos o modelo jo
Modelo no equilibrado y modelo equilibrado
2. Fundamento del anlisis de varianza
Varianza intergrupos y varianza intragrupos
3. Anlisis de la varianza de un factor
3.1. Efectos jos
Hiptesis estadstico:
1
H
0
:
1
=
2
= . . . =
n
H
1
:
1
=
2
= . . . =
n
Estadstico de contraste: F =
MC
inter
MC
intra
SC
total
= SC
inter
+ SC
intra
3.2. Efectos aleatorios
4. Comparaciones mltiples
Comparaciones planicadas o a priori y comparacioes no planica-
das o a posteriori
4.1. Comparaciones planicadas o a priori
Comparaciones planicadas ortogonales y no ortogonales
4.1.1. No ortogonales
T =

i
S

i
4.1.2. Ortogonales
F =
MC

i
MC
error
4.2. Comparaciones planicadas a posteriori
4.2.1. La prueba de Tukey
HSD
tuckey
= q

, g
l,k
_
MC
error
/n
2
4.2.2. La prueba de Sche
CR
scheffe
=
_
(k 1)f
k1,gl
error

_
MC
error
(
k

j=1
(c
2
j
/n
j
))
5. Supuestos del anlisis de varianza
Las 3 condiciones de este supuesto
5.1. Independencia de las observaciones
5.1.1. Test de Rachas
Hiptesis nula y alternativa
5.2. Normalidad de las distribuciones
5.3. Homogeneidad de las varianzas
La homocedasticidad
5.3.1. Test de Cochran
Estadstico de contraste R =
maxS
2
i
P
i
=i
k
S
2
i
5.3.2. Test de Bartlett
5.4. Consecuencia del no cumplimiento de los supuestos
6. F <1
3
TEMA 13: ANLISIS DE VARIANZA
CON FACTORES
1. Modelo bifactorial
Denicin de modelo bifactorial
Modelo aleatorio, modelo jo y modelo mixto
1.1. Modelo bifactorial sin interaccin. Efectos jos
Y
tij
= + A
t
+ B
i
+
tij
: constante

tij
: componente error
Modelos aditivos y modelos equilibrados
Hiptesis estadsticas:
Factor A:
H
0
:
1
=
2
=
3
. . . =
T.
H
1
:
1
=
2
=
3
= . . .
T.
Factor B:
H
0
:
1
=
2
=
3
. . . =
.I
H
1
:
1
=
2
=
3
= . . .
.I
Estadstico de contraste: F =
MC
filas
MC
error
(Factor A)
F =
MC
columnas
MC
error
(Factor B)
Variabilidad del sistema:
SC
total
= SC
filas
+ SC
columnas
+ SC
error
4
1.2. Modelo bifactorial con interaccin. Efectos jos
Justicacin de este modelo
Y
tij
= + A
t
+ B
i
+ (AB)
ti
+
tij
Hiptesis estadsticas:
Factor A: H
0
:
1
=
2
=
3
. . . =
T.
H
1
:
1
=
2
=
3
= . . .
T.
Factor B: H
0
:
1
=
2
=
3
. . . =
.I
H
1
:
1
=
2
=
3
= . . .
.I
Factor de interaccin: H
0
:
1
=
2
=
3
. . . =
TI
H
1
:
1
=
2
=
3
=
. . .
TI
Estadstico de contraste:
Factor A: F =
MC
filas
MC
error
Factor B: F =
MC
columnas
MC
error
Factor de interaccin: F =
MC
interaccin
MC
error
Variabilidad del sistema: SC
total
= SC
filas
+ SC
columnas
+ SC
interaccin
+
SC
error
1.3. Efectos fjos, aleatorios y modelo mixto
Diferencias entre estos 3 modelos
1.3.1. Efectos aleatorios
H
0
=
2
b
= 0 H
1
=
2
b
= 0
H
0
=
2
a
= 0 H
1
=
2
a
= 0
F
filas
=
MC
filas
MC
error
F
columnas
=
MC
columnas
MC
error
5
1.3.2. Modelo mixto
1.3.3. Efectos aleatorios
F
filas
=
MC
filas
MC
interaccion
F
columnas
=
MC
columnas
MC
interaccion
F
interaccion
=
MC
interaccion
MC
error
2. Modelo con clasicacin subordinada o jerr-
quica
Estructura de la observacin: Y
tij
= + A
ti
+ B
i
+
tij
Hiptesis estadsticas:
Para el factor principal: H
0
:
1
=
2
=
3
. . . =
.I
H
1
:
1
=
2
=
3
=
. . .
.I
Para el factor secundario: H
0
:
1
=
2
=
3
. . . =
T.
H
1
:
1
=
2
=
3
=
. . .
T.
Estadstico de contraste: F =
MC
principal
MC
error
(Factor principal)
F =
MC
secundario
MC
error
(Factor secundario)
SC
total
= SC
principal
+ SC
secundario
+ SC
error
6
TEMA 14: ANLISIS DE VARIANZA CON
MEDIDAS REPETITIVAS(UN FACTOR)
1. Introduccin
Justicacin de ste procedimiento
El diseo de bloques homogneos
2. Estructura de los datos
Los parmetros Y
i.
, Y
ij
e Y
j.
3. Modelos y supuestos
Y
ij
= + B
i
+ P
j
+
ij
Condicin de aditividad
4. Variabilidad del sistema
SC
total
= SC
intersujeto
+ SC
intrasujeto
5. Estadstico de contraste
F =
MC
trat
MC
error
7
6. Clculos
7. Supuesto de aditividad, simetra compuesta
y circularidad
7.1. El mtodo de ajuste de Box de los grados de libertad
8. Comparaciones mltiples
8.1. Asumiendo el supuesto de circularidad
Operaciones a realizar
8.1.1. Test de Tukey
|Y
i.
Y
g.
| HSD
HSD = q
_
MC
error
/n
8.1.2. Test de She
|Y
i.
Y
g.
|
_
MC
error
(1/n
i
+ 1/n
g
)
S
8.2. Sin asumir el supesto de cicularidad
MC
error
=
SC
G
w
g
(n 1)n
8.2.1. Test de Tukey
|Y
i.
Y
g.
| HSD
HSD = q
_
MC
errorg
/n
8
8.2.2. Test de Sche
F =
SC(
g
)
MC
errorg
SC(
g
) =

2
g
w
g
TEMA 15: ANLISIS DE VARIANZA CON
MEDIDAS REPETIDAS (DOS FACTORES)
1. Introduccin
Justicacin de este anlisis
2. Anlisis de varianza de dos factores con me-
didas repetidas en ambos
2.1. Escritura de los datos
2.2. Modelos y supuestos
Y
tij
= + A
t
+ B
i
+ (AB)
oi
, P
i
+
ji
Condicin: (AP)
tj
= (BP)
ij
= (ABP)
tij
= 0
2.3. Variabilidad del sistema
SC
total
= SC
intertrat.
+ SC
sujetos
+ SC
error
2.4. Estadstico de contraste
SC
error
= SC
Axsuj
+ SC
B+suj
+ SC
ABxsuj
F
sujetos
=
MC
sujetos
MC
error
2.5. Comparaciones mltiples
Segn el test de tukey:
9
Factor A: |Y
i.
Y
g.
| q
_
MC
error
N/T
Factor B: |Y
i.
Y
g.
| q
_
MC
error
N/I
Casillas de interaccin AB: |Y
i.
Y
g.
| q
_
MC
error
N/TI
Segn el test de She;
Niveles de fator A:
|Y
i.
Y
g.
|

2CM
error
/n

_
(T 1)f
1;(T1),(n1),(TI1)
Niveles de fator B:
|Y
i.
Y
g.
|

2CM
error
/n

_
(I 1)f
1;(I1),(n1),(TI1)
Interaccin AB:
|Y
i.
Y
g.
|

2CM
error
/n

_
(TI 1)f
1;(TI1),(n1),(TI1)
3. Anlisis de varianza de dos factores con me-
didas repetidas en una de ellas
Descripcin de este modelo
3.1. Estructura de datos
3.2. Modelo y supuestos
Y
tij
= mu + A
t
+ B
i
+ (AB)
t
i + P
jt
+ (BP)
ijt
+
tij
3.3. Variablidad del sistema
SC
total
= SC
intersujetos
+ SC
intrasujetos
3.4. Estadstico de contraste
3.5. Comparaciones mltiples
3.6. Clculos
10
TEMA 16: CONTRASTE NO PARAMTRICO PARA
MS DE DOS MUESTRAS
1. Introduccin
Justicacin de este procedimiento
2. Contraste no paramtrico para ms de dos
muestras dependientes
2.1. Test de Kruskal-Wallis
Hiptesis estadsticas: H
0
=
1
=
2
= . . . =
k
H
1
=
1
==
2
= . . . =
k
Estadstico de contraste:
H =
_
12
n(n + 1)
k

i=1
R
2
i
n
i
_
3(n 1)
Comparaciones a posteriori:
muestras no equilibradas y n 5

R
i
n
i

R
j
n
j

z
a
_
n(n + 1)
12
(1/n
i
+ 1/n
j
)
muestras no equilibradas y n 5

R
i
n
i

R
j
n
j

_
H
n(n + 1)
12
(1/n
i
+ 1/n
j
)
muestras equilibradas
|R
i
R
j
r
11
2.2. Test de Jonkckheere
Semejanzas y diferencias con el test de Kruskal-Wallis
Hiptesis estadsticas: H
0
=
1
=
2
= . . . =
k
H
1
=
1
=
2
. . .

k
Estadstico de contraste: S = P Q
Aproximacin a la normal: k 3 U n 5
Media = 0
Varianza
2(n
3

P
k
i=1
n
3
i
)+3(n
2

P
k
i=1
n
2
i
)
18
3. Contrastes no paramtricos para ms de dos
muestras relacionadas
3.1. Test de Friedman
Hiptesis estadstica: H
0
=
1
=
2
= . . . =
k
H
1
=
1
==
2
= . . . =
k
Estadstico de contraste: X
2
r
=
_
12
nk(k+1)

k
i=1
R
2
i
_
3n(k + 1)
3.1.1. Comparaciones mltiples
Aceptamos hiptesis alternativa
B no grande (n 15) |R
i
R
j
| c
B grande |R
i
R
j
| q
_
nk(k1)
12
3.2. Test de Cochran
Uso de este test
Hiptesis estadsticas:
H
0
: resultados en k muestras son semejantes
H
1
: resultados al menos en dos muestras son distintas
Estadstico de contraste:
12
=
(k 1)
_
k

k
i=1
C
2
i
(

k
i=1
C
i
)
2
_
j

j=1
nF
j

n
j=1
F
2
j
Para muestras grandes:

C
i
n

C
j
n

wq
,,k
TEMA 17: REGRESIN LINEAL Y
CORRELACIN SIMPLE
1. Introduccin
2. Objetivos del tema
La regresin lineal simple
3. Regresin lienal simple
3.1. Introduccin a la regresin
La regresin lineal mltiple
El coeciente de determinacin r
2
xy
y la varianza residual

S
2
e
3.1.1. El coeciente de determinacin
(Y
i
Y ) = (Y

i
Y ) + (Y
i
Y

i
)
r
2
xy
= B
2 SC
x
SC
y
[0, 1]
Las interpretaciones de r
2
xy

S
2
e
=
1
n 2

(Y
i
Y

i
)
2

S
2
y
=
1
n 1

(Y
i
Y )
2
13

S
2
e
= (1 r
2
xy
)S
2
y
3.2. El modelo de regresin lineal simple
Y
i
= + X
i
+
i
3.2.1. Supuesto
Y
ij
= +
xj
+
ij
3.2.2. Estimacin de los parmetros del modelo
Y

i
= A + BX
i
A = 0 ; B =
P
x
i
y
i
P
x
i
3.2.3. Propiedades de los estimadores A y B
E(A) =
E(B) =
var(B) =

2
P
(XX)
2
var(A) =

2
P
X
2
n
P
(XX)
2
4. Contraste de hiptesis para los parmetros
de la regresin lineal simple
4.1. Contraste de hiptesis para el parmetro
4.1.1. Conocida la varianza,
2
H
0
: =
0
; H
1
: =
0
Z =
A
0

A
14
4.1.2. Desconocida la varianza
T =
A
0

S
a
4.2. Contraste de hiptesis para el parmetro
4.2.1. Conocida la varianza
2
Z =
B
0

L
4.2.2. Desconocida la varianza
T =
B
0

S
b
4.3. Contraste de hiptesis para el parmetro
2
X
2
=
(n 2)

S
0

2
0
4.4. Contraste de hiptesis para e lparmtro
y
/x
j
(me-
dia condiconada)
4.4.1. Conocida la varianza
2
Z =
M
y
/x
j

_
1/n +
(X
j
X)
2
P
n
i=1
(X
i
X)
2
4.4.2. Desconocida la varianza
Z =
M
y
/x
j

S
e
_
1/n +
(X
j
X)
2
P
n
i=1
(X
i
X)
2
15
4.5. Determinacin de intervalos de conanza para valo-
res concretos y
ij
El error pronstico
p
5. Contraste de hiptesis para la ecuacin de
regresin
SC
resid
= SC
total
SC
reg
=

y
2
B

sy
F =
MC
reg
MC
resid
5.1. Relacin entre los estadsticos F y T
F = T
2
6. El modelo de la correlacin lineal simple
6.1. Modelo
Y
i
= + X +
i

xy
=

xy

y
=

y
6.2. Supuestos
Los 5 supuestos

y/x
= + X
i

x/y
= + Y
j
6.3. El esmitador de
r
xy
B = r
xy
S
y
S
x

S
2
e
=

n
i=1
(Y
i
Y

i
)
2
16
7. Contraste de hiptesis para el coeciente de
correlacion de Pearson
7.1. Contraste de hiptesis para un nico coeciente de
correlacin
7.1.1. Bajo la hiptesis nula,
xy
= 0
T =
r
xy

n 2
_
1 r
2
xy
7.1.2. Bajo la hiptesis nula
xy
= 0
Z =
Z
r
Z
a
1

n3
7.2. Contraste de hiptesis para dos coecientes de co-
rrelacin
7.2.1. Contraste de hiptesis
1
=
2
con muestras independientes
Z =
Z
r1
Z
r2
_
1/(n
1
3) 1/(n
2
3)
7.2.2. Contraste de hiptesis de
xy
=
xz
con muestras relacionadas
T =
(r
xy
r
xz
_
(n 3(1 + r
xy
2
_
(1 r
2
xy
r
2
xz
r
2
yz
+ 2r
xy
r
xz
r
yz
)
17
8. Contraste de hiptesis para otros coecientes
de correlacin
8.1. Coeciente de correlacin biserial puntual
bp
r
bp
=
X
1
X
D
S
x

pq
T =
r
bp
_
(n 2)
_
1 r
2
bp
8.2. Coeciente de correlacin de Spearman,
x
T =
r
x
_
(n 2)
_
1 r
2
s
n 20 Z =
r
s
1/

n 1
Condicin para su uso
8.3. Coeciente de correlacin phi,
Condicin de uso
=
ad bc
_
a + b)(c + d)(a + c)(b + d)
Z =

nr

18
TEMA 18: REGRESIN Y CORRELACIN
LINEAL MLTIPLE
1. Objetivos del tema
2. Introduccin
Justicacin de este proceso
y

1
= A + B
1
x
i1
+ B
2
x
i2
+ . . . + B
n
x
in
3. Modelos y supuestos
Condiciones y objetivos
: altura

1
,
2
, . . . ,
k
: coecientes de regresin parcial poblacional
Y
1
= +
1
X
1
+
2
X
2
+ . . . +
k
X
k
+
i
4. Obtencin del hiperplano de regresin de Y
sobre X
1
, X
2
, . . . , X
k
5. Procedimiento de clculo
6. Interpretacin de la ecuacin de regresin
6.1. Coecientes de regresin parcial
B
j
= coeciente de regresin parcial
19
6.2. Coecientes de regresin tipicados o coecientes
Beta
Puntuaciones tpicas: z
xj
=
(X
j
X
j
)
S
xj
; z
y
=
(Y Y )
S
y
Beta1, Beta2, . . . , Betak = coecientes de regresin parcial tipica-
dos
Beta
j
= B
j
_

x
2
j
/

y
2
7. Coeciente de determinacin mltiple y co-
rrelacin mltiple
Introduccin de un plano

n
i=1
(Y
i
Y )
2
=

n
i=1
(Y
2
i
Y )
2
+

n
i=1
(Y
i
Y
i

)
2
SC
total
= SC
reg
+ SC
resid.
Coeciente de determinacin mltiple:
R
2
y,123...k
=
SC
reg
SC
total
= 1
SC
resid
SC
total
Coeciente de correlacin mltiple:
R
y,12
=
_
R
2
y,12
7.1. Coeciente de determinacin mltiple corregido

R
2
y,12...k
= 1
_
SC
resid
SC
total
n 1
n k 1
_
20
8. Contraste de hiptesis n regresin mltiple
8.1. Contraste de hiptesis para los parmetros de la re-
gresin lineal mltiple

S
2
e
=

n
i=1
(Y
i
Y

i
)
2
n k 1
8.1.1. Contraste de hiptesis para el parmetro
=
y

x1

x2
. . .
x

xk
T =
A

S
a
8.1.2. Contraste de hiptesis para los coecientes de la regresin

j
Conocida varianza
2
Z =
B
j
B
0
_
c
jj

2
Desconocida varianza
2
T =
B
j
B
0

S
bj
=
B
j
B
0
_
c
jj

S
2
e
8.1.3. Contraste de hiptesis para
2
X
2
=
(n k 1)

S
2
e

2
0
8.1.4. Contraste de hiptesis para el parmetro
y/x1,x1,...,x
k
(media
condicionada)
T =
M
y/x1,x1,...,x
k

y/x
1
,x
2
,...,x
k
_

S
2
e
_
1
n
+ c
11
x
1
+ . . . + c
kk
x
k
_
21
8.2. Contraste de hiptesis para la ecuacin de regresin
lineal mltiple
SC
total
=
n

i=1
(Y
i
Y )
2
SC
reg
=
n

i=1
(Y

i
Y )
2
SC
resid
=
n

i=1
(Y
i
Y

i
)
2
SC
resid
= SC
total
SC
reg
=

y
2
B
I

x
1
y . . . B
k

x
k
y
9. Coecientes de correlacin parcial y correla-
cin mltiple
La correlacin parcial
El coeciente de correlacin mltple: R
123
=
_
1
|R|
R
11
r
12,3...k
=
R
12

R
11
R
22
10. Contrastes de hiptesis para los coecientes
de correlacin con tres variables
10.1. Contraste para el coeciente de correlacin parcial,

12,3
T =
r
xy,z

n 3
_
1 r
2
xy.z
22
10.2. Contraste para el coeciente de correlacin mlti-
ple
1,23
F

=
R
2
1,23
/2
(1 R
2
1,23
)/(n 3)
TEMA 19: ANLISIS DE VARIANZA Y ANLISIS
DE REGRESIN
1. El modelo lineal general
Y = f(, X) + 6
Descripcin de cada uno de los factores
1.1. El modelo de regresin lineal
Y
i
=
0
+
i
X
i
+
i
Los 4 supuestos bsicos
La heterocedasticidad y la correlacin serial o autocorrelacin
El mtodo de mnimos cuadrados

Y
i
= nB
o
+ B
i

X
i

X
i
Y
i
= B
0

X
i
+ B
i

X
2
i
B
0
= Y B
1
X
1.2. Los modelos de diseo experimental: el modelo de
anlisis de varianza
Y
i
=
o
+
1
X
11
+
2
X12 + m
i
23
Y
ij
= + B
i
+
ij
Supuestos en los que se basa
1.3. Conclusin
y = Xb + e
2. Anlisis de regresin con variables indepen-
dientes categricas
2.1. Introduccin
Uso de este anlisis
2.2. Variables categricas en la ecuacin de regresin
2.2.1. La razn de correlacin o de determinacin,
2
yx

2
yx
= 1
SC
intra
SC
total
Diferencia entre r
2
xy
y xy
2
Estadstico de contraste: F =

2
yx
/(I1)
(1
2
yx
/(N1)
2.2.2. Uso de las variables mudas en la ecuacin de regresin
Denicin de variable muda
2.2.3. Clculo de R
2
y,12
R
2
y,12
=
SC
reg
SC
total
B
u
= Beta
j

S
y

S
j
24
TEMA 20:ANLISIS DE COVARIANZA (UN FACTOR)
1. Objetivos del tema
2. Introduccin
El control estastico indirecto o ANCOVA
La variables B,I,X e Y
Variablesconcominantes o covariantes y variables dependientes
3. Estructura de los datos
4. Modelos y supuestos
Los dos modelos diferentes
Y
ij
= + B
i
+ (X
ij
X) +
ij
5. Fuentes de covariablidad
SP
total(xy)
= SP
intra(xy)
+ SP
inter(xy)
SC
inter(x)
= SC
total(x)
SC
intra(x)
SC
inter(y)
= SC
total(y)
SC
intra(y)
6. Suma de cuadrados corregida
B
t
=

n
i=1

n
j=1
(x
ij
x)(y
ij
overliney)

n
i=1

n
j=1
(x
ij
x)
2
25
SC

inter
= SC

total
SC

intra
7. Estadstico de contraste
F =
MC

inter
MC

intra
MC

inter
=
SC
inter

I 1
MC

intra
=
SC
intra

I(N 1) 1
8. Clculos
9. Comparaciones mltiples
Y

j
= Y
j
B
intro
(X
j
X
total
)
9.1. Test de Tukey
9.2. Test de Shee
10. Comparacin de supuestos
Los 5 supuestos especcos
F =
S
2
/(I 1)
S
1
(I(n 2)
26
11. Obtencin de los estimadores de los coe-
cientes de la regresin y correlaciones X e
Y
B
xyi
=
SP
intra(xy)i
SC
intra(xy)i
B
intra
=
SP
intra(xy)i
SC
intra(x)
B
inter
=
SP
inter(xy)
SC
inter(x)
B
total
=
SP
total(xy)
SC
total(x)
TEMA 21: ANLISIS DE COVARIANZA(DOS FACTORES)
1. Objetivos del tema
2. Introduccin
3. Estructura de los datos
4. Modelos y suuestos
Y
tij
= + A
t
+ B
i
+ (AB)
ti
+ (X
tij
X) +
tij
5. Fuentes de variablidad y sumas de cuadrados
corregidas
SC

total
= SC

inter
+ SC

intra
27
6. Estadstico de contraste
Las 3 hiptesis
1. F
a
=
MC

A
MC

intra
2. F
b
=
MC

B
MC

intra
3. F
a
b =
MC

AB
MC

intra
7. Clculos
8. Comparaciones mltiples
Y

h
= Y
h
B
intra
(X
h
X)
8.1. Test de Tukey
8.2. Test de Shee
8.3. Clculos
9. Comparacin de supuestos
Los 3 supuestos propios
28

También podría gustarte