Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresion Simple
Regresion Simple
Examen
1
1
Prueba 1
donde
y E (Y ) x es la respuesta promedio para cada x.
representa el intercepto de la funcin lineal que usa todos los valores de la poblacin y
representa la pendiente de la funcin lineal que usa todos los valores de la poblacin.
parmetros
son
El modelo estadstico de regresin lineal simple asume que para cada valor de x, los valores de la
respuesta y son normales con media (que depende de x) y desviacin estndar que no depende de x.
Esta desviacin estndar es la desviacin estndar de todos los valores de y en la poblacin para un
mismo valor de x.
Estos supuestos se pueden resumir como: Para cada x, Y ~ N ( y , )
donde y E (Y ) x
SCRes
donde SCRes es la suma de cuadrados de los residuos
n2
y i = ei 2
2
EE (b)
b0
~ t ( n 2)
EE (b)
n2
donde t1-
Modelo
(Constante)
Test 1
B
.800
1.100
Error tp.
2.135
.173
Coeficientes
estandarizados
Sig.
Beta
.965
.375
6.351
.733
.008
Lmite
superior
7.596
1.651
y- y
y-y
y
y
-y
y y
y
E (Y ) y a bx
xi
2
La variacin total est dada por SCT ( yi y ) .
i 1
La variacin explicada por la inclinacin de la recta, o en otras palabras, explicada por la relacin entre las
2
variables y y x, es SC Re g ( y y ) .
n
2
Por ltimo, la variacin no explicada, o residual es SC Re s ( y i y i ) .
i 1
Podemos hacer una tabla, llamada tabla de anlisis de varianza, para la regresin lineal simple y es la
siguiente:
Fuente de variacin
Regresin
gl
Grados de libertad
1
SC
Suma de Cuadrados
SC Re g
( y y )
n
Residuo
n2
SC Re s ( y i y i ) 2
i 1
Total
n 1
SCT yi y
CM
Cuadrados Medios
SC Re g
SC Re s
n2
i 1
Regresin
Residual
Suma de
cuadrados
48.400
3.600
gl
Total
52.000
a Variables predictoras: (Constante), Test 1
b Variable dependiente: Test 2
1
3
Media
cuadrtica
48.400
1.200
F
40.333
Sig.
.008(a)
SCTotal yi y 2
este coeficiente se llama coeficiente de determinacin, y representa la proporcin de la variacin total
de y que es explicada por la relacin lineal entre x e y.
A este coeficiente se le usa entonces como medida de bondad de ajuste, es decir que tan buena es la
variable explicativa x para explicar la respuesta y. El rango del coeficiente de determinacin es
naturalmente entre cero y uno ( 0 r 2 1 ), lo que nos indica que mientras ms cercano a uno sea el
coeficiente de determinacin (r2) mejor es el ajuste de la regresin.
En el caso del ejemplo del test 1 y test 2, el r 2 (0,965) 2 0,931 , que nos indica que el test 1 explica
el 93,1% de la variacin total del test 2.
Verificando supuestos en la Regresin lineal simple
1.
Examine el grfico de dispersin de y versus x para decidir si el modelo lineal parece razonable.
2.
Examine los residuos para verificar los supuestos acerca del trmino del error. Los residuos deben
ser una muestra aleatoria de una poblacin normal con media 0 y desviacin estndar .
A veces es posible detectar falta de independencia cuando los datos recogidos en el tiempo. Para
verificar este supuesto grafique los residuos versus el tiempo y los puntos no deben mostrar una
distribucin definida.
b) Normalidad
Para verificar normalidad haga el histograma de los residuos, este debera aparecer como normal
sin valores extremos si tenemos un nmero grande de observaciones. En el caso de tener pocas
observaciones puede hacer un grfico de tallo y hoja y verificar que no haya observaciones
extremas.
Ejemplo:
Se conduce un experimento en 12 sujetos para analizar si la dosis de cierta droga (en ml) est
relacionada con el tiempo de reaccin a un estmulo en segundos.
Droga (ml)
Tiempo (segs)
1,0
1,0
1,5
0,8
2,0
1,8
2,5
1,4
3,0
2,1
3,5
1,8
4,0
2,2
6,0
4,1
6,5
4,9
R = 0.8824
0
Estadsticos descriptivos
Media
2.4042
3.750
Desviacin
tp.
1.21925
1.8028
N
12
12
Correlaciones
Correlacin de Pearson
Sig. (unilateral)
N
Tiempo de
reaccin
(seg)
1.000
.939
.
.000
12
12
Dosis de
droga (ml)
.939
1.000
.000
.
12
12
Coeficientesa
Modelo
1
(Constante)
Dosis de droga (ml)
Coeficientes
estandarizad
os
Beta
Coeficientes no
estandarizados
B
Error tp.
2.174E-02
.303
.635
.073
.939
.072
8.663
Sig.
.944
.000
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
14.430
1.923
16.352
Media
cuadrtica
14.430
.192
gl
1
10
11
F
75.048
Sig.
.000a
.6
.4
Unstandardized Residual
.2
-.0
-.2
-.4
-.6
0
a312yb =
negativo
positivo
0
Histograma
Variable dependiente: Tiempo de reaccin (seg)
5
Frecuencia
0
-1.00
-.50
0.00
.50
1.00
1.50
Stem &
Leaf
-0
-0
0
0
5
12344
1123
57
.
.
.
.
1.00000
1 case(s)