Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Metodologa
de la Investigacin II
Domingo Lancellotti
Contenido
Anlisis de Regresin
Anlisis de Correlacin
Prueba de Significancia para el Coeficiente de
Regresin y el Coeficiente de Correlacin
Anlisis de
Regresin & Correlacin
Anlisis de Regresin
Regresin Lineal Simple
y
a + bx
variable y
12
10
8
6
4
2
0
0
variable x
10
Anlisis de Regresin
Donde la magnitud de una variable, y (variable
dependiente), tiene una dependencia funcional de la
magnitud de una segunda variable, x (variable
independiente).
(la
la situacin inversa no es verdadera)
verdadera
Anlisis de Regresin
Por ejemplo,
la presin sangunea (variable dependiente) puede
ser una funcin de la edad (variable independiente);
sin embargo, la edad no es una funcin de la presin
sangunea
variable y
12
10
2
0
0
variable x
10
b=
X iY i
X
X
n
b se encuentra en el rango - y +
+, incluyendo el
valor cero.
b>0
b=0
b<0
Intercepto (a)
Representa el punto de partida de la lnea.
Corresponde al intercepto del eje y cuando x = 0
variable y
12
10
8
6
4
2
0
variable x
10
Intercepto (a)
Representa el punto de partida de la lnea.
Corresponde al intercepto del eje y cuando x = 0
a>0
a=0
a<0
Intercepto (a)
Representa el punto de partida de la lnea.
Corresponde al intercepto del eje y cuando x = 0
a = Y bX
Caso 7.1
En un programa de acondicionamiento orgnico para
la conservacin de la salud de hombres de 40 a 60
aos se mide, al cabo de tres meses, la relacin que
existe entre la cantidad de cido rico en la sangre
(mg100 ml-1) (variable independiente) y el tiempo
(en minutos) empleado en recorrer 2,5 km (variable
dependiente). Los datos de una muestra aleatoria de
16 varones son los siguientes:
Caso 7.1
Lecturas de cido rico en mg*100 ml-1 (eje X) y Tiempo en
minutos en recorrer 2,5 km (eje Y)
_
( X)
( Y)
( X)
( Y)
43
12,2
69
11,3
55
12,3
50
12,0
78
10,3
65
11,2
73
10,2
59
10,2
71
11,0
76
10,5
69
11,1
40
13,4
67
12,0
70
11,4
45
11,5
63
12,5
Caso 7.1
Procedimiento
i)
ii)
iii)
iv)
v)
Calcular b
Calcular a
Escribir la ecuacin
Graficar los puntos
Trazar la lnea de mejor ajuste con
(0,a) y ( X , Y )
Caso 7.1
b=
X iY i
X
X
n
a = Y bX
cantidades requeridas
X ; X2 ; Y ; XY ; X ; Y
Caso 7.1
Cantidades requeridas
X2
XY
993,00
183,10
63.815,00
11.246,50
X = 62,0625
Y = 11,4438
Caso 7.1
i) Calcular b
993,00 *183,10
11.246,50
16
b=
993,00
63.815,00
16
-1
Caso 7.1
ii) Calcular a
a = Y bX
a = 11,4438 ( 0,0536) 62,0625
a = 14,770 minutos
Caso 7.1
iii) Escribir la ecuacin
y = 14,770 0,0536 x
iv) y v) Graficar
Tiempo (min)
17
14
11
5
30
40
50
60
70
80
-1
90
Caso 7.1
Conclusin:
Para b:
La disminucin observada en el tiempo de recorrido
respuesta , en promedio, corresponde a 0,0536 min
por cada aumento en 1 mg*100 ml-1 de cido rico.
Anlisis de Correlacin
Correlacin Lineal Simple
Tambin considera una relacin lineal entre dos
variables, pero ninguna variable se asume como
funcionalmente dependiente de la otra
Mide el grado de asociacin existente entre las dos
variables
r=
X iY i
X
n
n
2
Y i
2
Y
n
( X)
( Y)
( X)
( Y)
43
12,2
69
11,3
55
12,3
50
12,0
78
10,3
65
11,2
73
10,2
59
10,2
71
11,0
76
10,5
69
11,1
40
13,4
67
12,0
70
11,4
45
11,5
63
12,5
r=
X iY i
X
n
n
2
cantidades requeridas
X ; X2 ; Y ; Y2 ; XY
Y
n
X2
Y2
XY
r=
11.246,50 993,00183,10
16
63.815,00 993,00
16
2.107,91 183,10
16
r = 0,707
= 0,500
b
t=
Sb
(Prueba t de Student)
SY X
Sb =
(
)
X
i
Xi
(
)(
)
X
Y
i
i
X iY i
Yi
n
Y i
n
2
Xi
Xi
SY X =
n2
=n-2
son los grados de libertad (n = nmero de pares de
datos)
=n-2
|t0,05(2),
0,05(2),| =
Caso 7.1.1
Prueba de significancia para el coeficiente de
regresin (referido al Caso 7.1)
Prueba t de Student
b
t=
Sb
Caso 7.1.1
Procedimiento:
HA: 0
i) H0 : = 0
(prueba de 22-cola)
= n - 2 = 16 2 = 14
|t0,05(2),14| = 2,145
Caso 7.1.1
Clculo del error estndar del coeficiente de regresin
SY X
Sb =
(
)
X
i
Xi
Caso 7.1.1
Clculo de la varianza de los residuos
(
)(
)
X
Y
i
i
2
X iY i
Y
n
Y i
2
n
2
Xi
Xi
SY X =
n2
Caso 7.1.1
Clculo de la varianza de los residuos
(
183,10 )
2107,91
2 =
S YX
2
SYX = 0, 4489
16
11246,50
993,00 183,10
16
(993,00 )
63815,00
16
16 2
Caso 7.1.1
Clculo del error estndar del coeficiente de regresin
Sb =
0, 4489
(
993,00)
6.3815,00
16
S b = 0, 0143
Caso 7.1.1
Clculo de t
b
t=
Sb
t=
0,0536
0,0143
t = 3,748
Caso 7.1.1
Prueba de significancia para el coeficiente de
regresin (referido al Caso 7.1)
|t0,05(2),14| = 2,145
|tcalculado| = 3,748
Conclusin:
como |tcalculado| > |t0,05(2),14| se rechaza H0. Entonces, el
coeficiente de regresin es significativamente distinto a
cero.
t=
sr
(prueba t de Student)
r2
1
Sr =
n 2
=n-2
son los grados de libertad (n = nmero de pares de datos)
=n-2
|t0,05(2),
0,05(2),| =
Caso 7.1.2
Prueba de significancia para el Coeficiente de
Correlacin (referido al Caso 7.1)
Prueba t de Student
t=
sr
Caso 7.1.2
Procedimiento:
HA: 0
i) H0 : = 0
(prueba de 22-cola)
= n - 2 = 16 2 = 14
|t0,05(2),14| = 2,145
Caso 7.1.2
Clculo del error estndar del coeficiente de correlacin
1
r
Sr =
n 2
2
Caso 7.1.2
Clculo del error estndar del coeficiente de correlacin
0,500
Sr =
14
S r = 0,1890
Caso 7.1.2
Clculo de t
t=
sr
0,707
t = 0,1890
t = 3,741
Caso 7.1.2
Prueba de significancia para el Coeficiente de
Correlacin (referido al Caso 7.1)
|t0,05(2),14| = 2,145
|tcalculado| = 3,741
Conclusin:
como |tcalculado| > |t0,05(2),14| se rechaza H0, por lo que el
grado de asociacin entre las variables (coeficiente de
correlacin) es significativamente diferente a cero.