Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Vibraciones/seg.
20.0
16.0
19.8
18.4
17.1
15.5
14.7
17.1
15.4
16.2
15.0
17.2
16.0
17.0
14.1
Temp.
88.6
71.6
93.3
84.3
80.6
75.2
69.7
82.0
69.4
83.3
78.6
82.6
80.6
83.5
76.3
30
35
Arganda
25
20
15
10
% fracaso escolar
10
12
14
16
18
Torrelodones
20
22
Covarianza
Se dispone de un conjunto de n pares de observaciones
(x1 , y1 ), . . . , (xn , yn ).
i=1
Propiedades:
covxy = covyx .
covxy depende de las unidades en que se miden x e y .
covxx = vx , es decir, la covarianza de x con x es la varianza de x.
Interpretacion de la covarianza
y
0
0
Covarianza aprox. cero
0
Covarianza negativa
Covarianza positiva
0
Covarianza aprox. cero
Coeficiente de correlacion
Resulta conveniente disponer de una medida de relaci
on lineal que no
dependa de las unidades. Para ello, se normaliza covxy dividiendo por el
producto de desviaciones tpicas, lo que lleva al coeficiente de
correlaci
on:
covxy
rxy = .
vx vy
Propiedades:
No depende de las unidades
Siempre toma valores entre -1 y 1.
Su signo se interpreta igual que el de la covarianza
Solo vale 1 o -1 cuando los puntos estan perfectamente alineados.
Aunque rxy 0, las variables x e y no son necesariamente
independientes.
Desviacin
tpica
1,7319
Media
Vibraciones
16,633
Estadsticos descriptivos
Temperatura
79,973
N
15
Correlaciones
Vibraciones
Media
16,633
Desviacin
Vibraciones
1
tpicaCorrelacin de PearsonN
Sig. (bilateral)
N
1,7319
15 15
Vibraciones
Temperatura
Temperatura
79,973
Correlacin de Pearson
Sig. (bilateral)
6,7170
N
Correlaciones
15
6,7170
Vibraciones
Correlacin de Pearson
Temperatura
,836
Sig. (bilateral)
,000
Temperatura
15
,836
15
,000
15
Correlaciones
19,0
Correlacin de Pearson
15
,836
Sig. (bilateral)
,000
15
Temperatura
20,0
Vibraciones Temperatura
1
,836
19,0
18,0
,000
15
17,0
Correlacin de Pearson
Sig. (bilateral)
N
18,0
,836
16,0
Vibraciones
Vibraciones
Sig. (bilateral)
,000
15
15,0
15
1
17,0
15
16,0
14,0
65,0
20,0
70,0
75,0
80,0
Temperatura
85,0
15,0
,000
Correlacin de Pearson
20,0
Vibraciones
Temperatura
,836
15
15
Vibraciones
1
90,0
95,0
15
Problema de regresion
Recta de regresion
Frecuentemente, existe entre las variables una relaci
on aproximadamente
lineal:
Yi 0 + 1 xi .
11
12
10
y3
y1
10
10
12
14
x1
14
10
y4
7
5
y2
12
10
12
x3
10
x2
12
14
10
12
14
x4
16
18
58
STATISTICAL INFERENCE
Figure 3.4 Joint density functions (shown symbolically) of the bivariate normal distributions of the form
(3.9) with varying m.
30
20
y3
y1
10
10
y4
y2
15
20
25
10
2
x2
4
x
[Yi (0 + 1 xi )]2
0
x
0
x
vy
Sy
covxy
=r =r .
1 =
vx
vx
Sx
T
ermino independiente:
0 = Y 1 x
19,0
Vibraciones
18,0
17,0
16,0
15,0
R2 Lineal = 0,7
14,0
65,0
70,0
75,0
80,0
Temperatura
85,0
90,0
95,0
Observaciones
La varianza residual
Una simulacion
Supongamos que = 1, 0 = 0 y 1 = 1.
Entonces el modelo es
Yi = xi + ui ,
donde los errores ui tienen distribuci
on normal estandar y son
independientes.
Fijamos xi = 1, 2, . . . , 10 (n = 10) y generamos las respuestas
correspondientes de acuerdo con este modelo.
Posteriormente calculamos la recta de mnimos cuadrados y la
representamos junto con la verdadera recta y = x.
10
10
10
10
10
10
10
10
6
x
10
6
x
10
6
x
10
10
10
10
10
beta1=
1.11
10
beta1=
0.84
10
10
beta1=
0.9
10
6
beta1=
0.95
10
6
beta1=
1.01
10
6
beta1=
0.99
10
100
250
50
150
0.6
0.8
1.0
1.2
1.4
Estas f
ormulas son
las que se utilizan
para calcular IC y
llevar a cabo
contrastes en lo que
sigue.
SR
error tpico de 1 = pPn
= SR
)2
i=1 (xi x
1
nvx
s
error tpico de 0 = SR
1
x2
+
n nvx
Intervalos de confianza
Los intervalos de confianza de nivel 1 para los parametros i (i = 0, 1)
tienen la estructura habitual:
h
i
IC1 (i ) i tn2,/2 error tpico de i
En comparacion con los intervalos de confianza para la media:
Los grados de libertad son n 2 en lugar de n 1.
La formula del error tpico es mas complicada.
El intervalo de confianza para 2 tambien tiene la estructura que ya hemos
visto en los modelos de los temas anteriores:
#
"
2 (n 2)S 2
(n
2)S
R
R
IC1 ( 2 )
,
2n2;/2 2n2;1/2
Contraste bilateral:
Hip
otesis: H0 : i = 0 frente a H1 : i 6= 0
Regi
on crtica:
(
)
|i |
R=
> tn2,/2 .
error tpico de i
Contrastes unilaterales:
Hip
otesis: H0 : i 0 frente a H1 : i > 0
Regi
on crtica:
(
)
i
R=
> tn2, .
error tpico de i
Hip
otesis: H0 : i 0 frente a H1 : i < 0
Regi
on crtica:
(
)
i
R=
< tn2, .
error tpico de i
Modelo
1
R cuadrado
corregida
,677
R cuadrado
,700
Error tp. de la
estimacin
,9849
Modelo
1
Regresin
Suma de
cuadrados
29,383
Media
cuadrtica
29,383
,970
gl
Residual
12,611
13
Total
41,993
14
F
30,290
Sig.
,000 a
Coeficientes no estandarizados
Modelo
1
(Constante)
Temperatura
B
-,615
Error tp.
3,144
,216
,039
Coeficientes
tipificados
Beta
,836
t
-,196
Sig.
,848
5,504
,000
Error tp. de la
estimacin
4,7566
ANOVAb
Suma de
cuadrados
gl
Regresin
580,516
1
Residual
475,133
21
Total
1055,649
22
a. Variables predictoras: (Constante), Renta
b. Variable dependiente: Fracaso
Modelo
1
Media
cuadrtica
580,516
22,625
F
25,658
Sig.
,000a
t
10,562
-5,065
Sig.
,000
,000
Coeficientesa
Coeficientes no
estandarizados
Modelo
B
Error tp.
1
(Constante)
38,494
3,645
Renta
-1,347
,266
a. Variable dependiente: Fracaso
Coeficientes
estandarizad
os
Beta
-,742
Cuestiones
Escribe la ecuacion de la recta de mnimos cuadrados que describe el
nivel de fracaso escolar como funci
on de la renta.
Calcula intervalos de confianza de nivel 95% para la pendiente y el
termino independiente de la recta de regresi
on.
Podemos afirmar, a nivel = 0.05 que niveles mas altos de renta
estan asociados a niveles mas bajos de fracaso escolar?
Cuanto vale el coeficiente de correlaci
on entre el nivel de renta y el
porcentaje de fracaso escolar?
Que porcentaje de fracaso escolar se predice en una poblacion cuya
renta es x0 = 13000 euros?
Cual es el residuo correspondiente a Colmenar Viejo?
Yi
Yi Y
= Yi + ei
= (Yi Y ) + ei
n
n
n
X
X
X
(Yi Y )2 =
(Yi Y )2 +
ei2
i=1
i=1
i=1
Suma de cuadrados
Pn
2
i=1 (Yi Y )
Pn
e2
Pn i=1 i 2
(Y
Y)
i
i=1
gl
1
n2
n1
cuadrados medios
Pn
2
i=1 (Yi Y )
SR2 =
estadstico
F
Pn
2
i=1 ei
n2
Variabilidad explicada
SCE
=
Variabilidad total
SCT
En el modelo de regresi
on simple R 2 = r 2 , el coeficiente de
determinacion coincide con el coeficiente de correlacion al cuadrado.
El error cuadr
atico medio:
Pn
Pn
e2
(Yi Yi )2
= i=1 i .
ECM = i=1
n
n
Puede comprobarse que ECM = Vy (1 r 2 ).
Cuestiones
s
2
Y0 tn2;/2 SR 1 + (x0 x)
n
nVx
Intervalo de predicci
on para Y0 de nivel 1 :
s
2
Y0 tn2;/2 SR 1 + 1 + (x0 x)
n
nVx
% Fracaso
Renta
Medias
20.73
13.19
Cuasidesviaciones tpicas
6.92
3.81
Bandas de
confianza
media
&[PageTitle]
Intervalos de confianza para la media
Intervalos de confianza
40,0
Fracaso
30,0
20,0
10,0
Sq r lineal = 0,55
7,500
10,000
12,500
15,000
Renta
17,500
20,000
22,500
Renta
Fracaso
30,0
20,0
10,0
Sq r lineal = 0,55
7,500
10,000
12,500
15,000
Renta
17,500
20,000
22,500
15
3.0
logFracaso
2.5
25
30
20
Fracaso
3.5
35
10
10
12
14
16
18
20
22
10
12
14
16
Renta
3.5
35
15
3.0
logFracaso
2.5
30
25
2.4
2.6
logRenta
10
Fracaso
20
22
2.2
20
18
Renta
2.8
3.0
2.2
2.4
2.6
logRenta
2.8
3.0
Ecuacin
gl1
Sig.
Constante
b1
Lineal
,550
25,658
21
,000
38,494
-1,347
Logartmica
,572
28,032
21
,000
70,584
-19,600
Potencia
,610
32,809
21
,000
293,923
-1,066
Exponencial
,594
30,691
21
,000
51,642
-,074
5
2
5
y4
y3
4
20
y2
10
15
5
4
y1
25
4
Ajustados
10
Ajustados
15
Residuos
Residuos
Residuos
Residuos
20
25
4
Ajustados
4
Ajustados
Datos atpicos
Datos atpicos
Datos atpicos
Datos atpicos
6.0
5.0
4.5
4.0
log(Intensidad)
5.5
3.6
3.8
4.0
4.2
log(Temperatura)
4.4
4.6
6.0
5.0
4.5
4.0
log(Intensidad)
5.5
3.6
3.8
4.0
4.2
log(Temperatura)
4.4
4.6
Extrapolacion
Verdadera
relacin
Ybuena
Yprediccin
Recta de
regresin
estimada
xprediccin
Mezcla de poblaciones
Regresin con
todos los datos