Está en la página 1de 59

Facultad de Medicina

Universidad Catlica del Norte


Coquimbo, 2012

Metodologa
de la Investigacin II
Domingo Lancellotti

Contenido
Anlisis de Regresin
Anlisis de Correlacin
Prueba de Significancia para el Coeficiente de
Regresin y el Coeficiente de Correlacin

Anlisis de
Regresin & Correlacin

Anlisis de Regresin
Regresin Lineal Simple
y

a + bx

variable y

12
10
8
6
4
2
0
0

variable x

10

Anlisis de Regresin
Donde la magnitud de una variable, y (variable
dependiente), tiene una dependencia funcional de la
magnitud de una segunda variable, x (variable
independiente).
(la
la situacin inversa no es verdadera)
verdadera

Anlisis de Regresin
Por ejemplo,
la presin sangunea (variable dependiente) puede
ser una funcin de la edad (variable independiente);
sin embargo, la edad no es una funcin de la presin
sangunea

Coeficiente de Regresin (b)


- Pendiente Expresa, en promedio, cunto del cambio de y se
asocia al cambio de x

variable y

12
10

2
0
0

variable x

10

Coeficiente de Regresin (b)


- Pendiente -

b=

X iY i
X

X
n

el denominador siempre es positivo,


el numerador puede ser positivo, negativo o cero

Coeficiente de Regresin (b)


- Pendiente -

b se encuentra en el rango - y +
+, incluyendo el
valor cero.

b>0
b=0
b<0

Intercepto (a)
Representa el punto de partida de la lnea.
Corresponde al intercepto del eje y cuando x = 0

variable y

12
10
8
6
4
2
0

variable x

10

Intercepto (a)
Representa el punto de partida de la lnea.
Corresponde al intercepto del eje y cuando x = 0

a>0
a=0
a<0

Intercepto (a)
Representa el punto de partida de la lnea.
Corresponde al intercepto del eje y cuando x = 0

a = Y bX

Caso 7.1
En un programa de acondicionamiento orgnico para
la conservacin de la salud de hombres de 40 a 60
aos se mide, al cabo de tres meses, la relacin que
existe entre la cantidad de cido rico en la sangre
(mg100 ml-1) (variable independiente) y el tiempo
(en minutos) empleado en recorrer 2,5 km (variable
dependiente). Los datos de una muestra aleatoria de
16 varones son los siguientes:

Caso 7.1
Lecturas de cido rico en mg*100 ml-1 (eje X) y Tiempo en
minutos en recorrer 2,5 km (eje Y)
_

( X)

( Y)

( X)

( Y)

43

12,2

69

11,3

55

12,3

50

12,0

78

10,3

65

11,2

73

10,2

59

10,2

71

11,0

76

10,5

69

11,1

40

13,4

67

12,0

70

11,4

45

11,5

63

12,5

Caso 7.1
Procedimiento

i)
ii)
iii)
iv)
v)

Calcular b
Calcular a
Escribir la ecuacin
Graficar los puntos
Trazar la lnea de mejor ajuste con
(0,a) y ( X , Y )

Caso 7.1

b=

X iY i
X

X
n

a = Y bX
cantidades requeridas

X ; X2 ; Y ; XY ; X ; Y

Caso 7.1
Cantidades requeridas

X2

XY

993,00

183,10

63.815,00

11.246,50

X = 62,0625
Y = 11,4438

Caso 7.1
i) Calcular b

993,00 *183,10
11.246,50
16
b=
993,00
63.815,00
16

b = 0,0536 minutos/mg *100ml

-1

Caso 7.1
ii) Calcular a

a = Y bX
a = 11,4438 ( 0,0536) 62,0625

a = 14,770 minutos

Caso 7.1
iii) Escribir la ecuacin

y = 14,770 0,0536 x
iv) y v) Graficar
Tiempo (min)

17

14

11

5
30

40

50

60

70

80

-1

cido rico (mg*100ml )

90

Caso 7.1
Conclusin:
Para b:
La disminucin observada en el tiempo de recorrido
respuesta , en promedio, corresponde a 0,0536 min
por cada aumento en 1 mg*100 ml-1 de cido rico.

Anlisis de Correlacin
Correlacin Lineal Simple
Tambin considera una relacin lineal entre dos
variables, pero ninguna variable se asume como
funcionalmente dependiente de la otra
Mide el grado de asociacin existente entre las dos
variables

Coeficiente de Correlacin de Pearson (r)

r=

X iY i

X
n

n
2




Y i
2

Y
n

Coeficiente de Correlacin de Pearson (r)


r toma valores entre +1 y -1
un valor positivo indica que el aumento de una variable
se asocia con el aumento de la otra

Coeficiente de Correlacin de Pearson (r)


r toma valores entre +1 y -1
un valor negativo indica que el aumento de una de
ellas se asocia con la disminucin de la otra.

Coeficiente de Correlacin de Pearson (r)


r toma valores entre +1 y -1
un valor cero (o cercano a cero) indica ninguna
asociacin entre las variables.

Coeficiente de Correlacin de Pearson (r)


r toma valores entre +1 y -1

Coeficiente de Determinacin (r2)


El coeficiente de determinacin indica qu proporcin
(o porcentaje) de la variabilidad en y est siendo
explicada por la variable x

r2 toma valores entre 0 y +1

Caso 7.1 (continuacin)


En un programa de acondicionamiento orgnico para
la conservacin de la salud de hombres de 40 a 60
aos se mide, al cabo de tres meses, la relacin que
existe entre la cantidad de cido rico en la sangre
(mg*100 ml-1) (variable independiente) y el tiempo
(en minutos) empleado en recorrer 2,5 km (variable
dependiente). Los datos de una muestra aleatoria de
16 varones son los siguientes:

Caso 7.1 (continuacin)


Lecturas de cido rico en mg*100 ml-1 (eje X) y Tiempo en
minutos en recorrer 2,5 km (eje Y)
_

( X)

( Y)

( X)

( Y)

43

12,2

69

11,3

55

12,3

50

12,0

78

10,3

65

11,2

73

10,2

59

10,2

71

11,0

76

10,5

69

11,1

40

13,4

67

12,0

70

11,4

45

11,5

63

12,5

Caso 7.1 (continuacin)


Procedimiento

vi) Calcular r (y r2)

r=

X iY i

X
n

n
2

cantidades requeridas
X ; X2 ; Y ; Y2 ; XY

Y
n

Caso 7.1 (continuacin)


Cantidades requeridas

X2

Y2

XY

993,00 183,10 63.815,00 2.107,91 11.246,50

Caso 7.1 (continuacin)


vi) Calcular r (y r2)

r=

11.246,50 993,00183,10
16

63.815,00 993,00
16

2.107,91 183,10
16

r = 0,707

= 0,500

Caso 7.1 (continuacin)


Conclusin:
Para r:
ambas variables se relacionan inversamente en un
70,7%.

Caso 7.1 (continuacin)


Conclusin:
Para r2:
la magnitud de variabilidad de la respuesta (tiempo
en minutos) es explicada en un 50,0% por la variable
cantidad de cido rico.

Prueba de Significancia para el


Coeficiente de Regresin
Para = 0

b
t=
Sb
(Prueba t de Student)

Prueba de Significancia para el


Coeficiente de Regresin
Siendo
2

SY X

Sb =

(
)

X
i

Xi

el error estndar del coeficiente de regresin

Prueba de Significancia para el


Coeficiente de Regresin
donde

(
)(
)

X
Y
i
i

X iY i

Yi
n

Y i

n
2

Xi

Xi

SY X =

n2

la varianza de los residuos

Prueba de Significancia para el


Coeficiente de Regresin
... y

=n-2
son los grados de libertad (n = nmero de pares de
datos)

Prueba de Significancia para el


Coeficiente de Regresin
Procedimiento:
HA: 0
i) H0 : = 0
(prueba de 22-cola)

ii) Nivel de significancia, = 0,05


iii) Valor crtico para :

=n-2

|t0,05(2),
0,05(2),| =

iv) Calcular la probabilidad de |t |

Caso 7.1.1
Prueba de significancia para el coeficiente de
regresin (referido al Caso 7.1)
Prueba t de Student

b
t=
Sb

Caso 7.1.1
Procedimiento:
HA: 0
i) H0 : = 0
(prueba de 22-cola)

ii) Nivel de significancia, = 0,05


iii) Valor crtico para :

= n - 2 = 16 2 = 14

|t0,05(2),14| = 2,145

iv) Calcular la probabilidad de |t |

Caso 7.1.1
Clculo del error estndar del coeficiente de regresin

SY X

Sb =

(
)

X
i

Xi

Caso 7.1.1
Clculo de la varianza de los residuos

(
)(
)

X
Y
i
i

2
X iY i

Y
n

Y i
2

n
2
Xi

Xi

SY X =

n2

Caso 7.1.1
Clculo de la varianza de los residuos

(
183,10 )
2107,91

2 =
S YX
2

SYX = 0, 4489

16

11246,50

993,00 183,10
16

(993,00 )

63815,00

16

16 2

Caso 7.1.1
Clculo del error estndar del coeficiente de regresin

Sb =

0, 4489

(
993,00)
6.3815,00

16

S b = 0, 0143

Caso 7.1.1
Clculo de t

b
t=
Sb

t=

0,0536

0,0143

t = 3,748

Caso 7.1.1
Prueba de significancia para el coeficiente de
regresin (referido al Caso 7.1)
|t0,05(2),14| = 2,145
|tcalculado| = 3,748

Conclusin:
como |tcalculado| > |t0,05(2),14| se rechaza H0. Entonces, el
coeficiente de regresin es significativamente distinto a
cero.

Prueba de Significancia para el


Coeficiente de Correlacin
Para = 0

t=

sr
(prueba t de Student)

Prueba de Significancia para el


Coeficiente de Correlacin
Siendo

r2
1
Sr =
n 2

el error estndar del coeficiente de correlacin

Prueba de Significancia para el


Coeficiente de Correlacin
... y

=n-2
son los grados de libertad (n = nmero de pares de datos)

Prueba de Significancia para el


Coeficiente de Correlacin
Procedimiento:
HA: 0
i) H0 : = 0
(prueba de 22-cola)

ii) nivel de significancia, = 0,05


iii) valor crtico para :

=n-2

|t0,05(2),
0,05(2),| =

iv) calcular la probabilidad de |t |

Caso 7.1.2
Prueba de significancia para el Coeficiente de
Correlacin (referido al Caso 7.1)

Prueba t de Student

t=

sr

Caso 7.1.2
Procedimiento:
HA: 0
i) H0 : = 0
(prueba de 22-cola)

ii) nivel de significancia, = 0,05


iii) valor crtico para :

= n - 2 = 16 2 = 14
|t0,05(2),14| = 2,145

iv) calcular la probabilidad de |t |

Caso 7.1.2
Clculo del error estndar del coeficiente de correlacin

1
r
Sr =
n 2
2

Caso 7.1.2
Clculo del error estndar del coeficiente de correlacin

0,500
Sr =
14

S r = 0,1890

Caso 7.1.2
Clculo de t

t=

sr

0,707

t = 0,1890

t = 3,741

Caso 7.1.2
Prueba de significancia para el Coeficiente de
Correlacin (referido al Caso 7.1)
|t0,05(2),14| = 2,145
|tcalculado| = 3,741

Conclusin:
como |tcalculado| > |t0,05(2),14| se rechaza H0, por lo que el
grado de asociacin entre las variables (coeficiente de
correlacin) es significativamente diferente a cero.

También podría gustarte