Está en la página 1de 3

Universidad Peruana Cayetano Heredia

Unidad de Epidemiología Clínica

TALLER DE STATA N° 16-C

REGRESIÓN LINEAL SIMPLE

1.- Se tiene el siguiente estudio: se trata de evaluar si la edad influye sobre la presión
arterial Diastólica
Se tiene los siguientes datos

Paciente Edad PAD


1 0 52
2 10 55
3 20 60
4 20 60
5 30 63
6 30 63
7 40 70
8 50 75
9 50 75
10 60 82

Manualmente DEBE calcular:

a) Coeficiente de correlación de Pearson:


n n n
1 n  xi  x  yi  y  n  xy   x  y
r   
n  1 j 1  S x  S y  ˆ1  i 1 i 1 i 1
2
n
  n
n x 2    x 
1 i 1 xi  x  yi  y 
n

r i 1  i 1 
n  1 SxS y ˆ 0  y  ˆ1 x

b) la covarianza de x e y
c) Hacer un gráfico de dispersión (tenga en cuenta la métrica)
d) Gráficamente estimar los valores de b0 y b1
e) Use los gráficos previos para su interpretación
f) Haga los cálculos que nos permitan estimar los valores de b0 y b1 por medio de los
mínimos cuadrados ordinarios. Verifique sus cálculos. Puede hacer uso del Excel.

1
Universidad Peruana Cayetano Heredia
Unidad de Epidemiología Clínica

y 1 x
2

se(b)  x se(a)   y  n
n  ( xi  x ) 2
 (x  x)
n 2 x
i i 1
i 1
r
 y  y 
n 2
tr 
sy  i 1 i
1 r2
n2
x
n2
g) Haga las pruebas estadísticas para evaluar si r, b0 y b1 son diferentes de cero, debe
hacer uso de la t de student
h) Calcule el r2
i) Introduzca los datos al STATA, haga el diagrama de dispersión, que se parezca al
que hizo manualmente
j) Realice la regresión,
k) Compare con lo calculado, ¿hay discrepancias ? ¿por qué?
l) Grafique los residuos

Ayúdese de la formulas del libro

Los parámetros b0 y b1 se estiman por medio de el método de los mínimos cuadrados.

Sxy
b1 = ----------- b0 = Y0 - b1 X0
S x²
Y es S x y es la cov (x,y )= (x-x)(y - ŷ)/n-1

S x² es la varianza de X

Ordenes al stata para la regresión lineal


Regress , nos permite utilizar la regresión lineal simple y la múltiples
El Stata 17, tiene ventana de ayuda
Despliege: Statistics
Lineal Regression and related
Lineal regresión

De igual manera puede realizar los gráficos

A modo de ejemplo de las siguientes ordenes al STATA

 regress PAD edad

 twoway (scatter PAD edad), ytitle (Presion Arterial


Diastolica) xtitle(Edad em años) || lfit PAD edad

2
Universidad Peruana Cayetano Heredia
Unidad de Epidemiología Clínica

2.- Se desea evaluar la relación entre vacunaciones y mortalidad de niños. Se dispone de


los datos de 1992, por un lado, el porcentaje de inmunización con DTT (Difteria, Tétano
y Tos ferina) en diversos países así mismo se dispone de datos de mortalidad en niños
menores de 5 años.

PAIS % de Niños Inmu. Mort. 5años


1. Bolivia 77 118
2. Brazil 69 65
3. Cambodia 32 184
4. Canada 85 8
5. China 94 43
6. Czech Republic 99 12
7. Egypt 89 55
8. Ethiopia 13 208
9. Finland 95 7
10. France 95 9
11. Greece 54 9
12. India 89 124
13. Italy 95 10
14. Japan 87 6
15. Mexico 91 33
16. Poland 98 16
17. Russian Federation 73 32
18. Senegal 47 145
19. Turkey 76 87
20. United Kingdom 90 9

a) Confeccione un gráfico de dispersión


b) ¿Cómo se relacionan ambas variables? ¿Qué tipos de relación existe?
c) ¿Cuál es el coeficiente de correlación?

También podría gustarte