Está en la página 1de 2

Ejercicio N°1.- El conjunto de datos representa grupos de trabajadoras de Inglaterra-Francia en el periodo 1970-1972.

Cada grupo
está formado por trabajadores de la misma profesión (médicos, trabajadores textiles, decoradores, etc.) y en cada uno de los
veinticinco grupos muestrales se han observado dos variables: el índice estandarizado de consumo de cigarrillos (x) y el índice
de muertes por cáncer de pulmón (y):

a) Diagrama de dispersión inicial

Diagrama de Dispersion inicial


180
160
140
120
100
80
60
40
20
0
60 70 80 90 100 110 120 130 140 150

Solución:

𝑦 = 𝑏0 + 𝑏1 𝑥

Covarianza de x*y
1
𝑆𝑥𝑦 = ∗ ∑ 𝑥𝑖 ∗ 𝑦𝑖 − 𝑥̅ ∗ 𝑦̅
𝑛
Desviación estándar en función de “x”
2
∑ 𝑥𝑖 2 ∑ 𝑥𝑖
𝑆𝑥 2 = −( )
𝑛 𝑛

Expresión “𝒃𝟏 ”
𝑆𝑥𝑦
𝑏1 =
𝑆𝑥 2
Expresión “𝒃𝟎 ”

𝑏0 = 𝑦̅ − 𝑏1 𝑥̅
Cálculo de la media aritmética
∑ 𝑥𝑖 2572
𝑥̅ = = = 102,88
𝑛 25

∑ 𝑦𝑖 2725
𝑦̅ = = = 109
𝑛 25
Covarianza de x*y
1 1
𝑆𝑥𝑦 = ∗ ∑ 𝑥𝑖 ∗ 𝑦𝑖 − 𝑥̅ ∗ 𝑦̅ = ∗ 288068 − (102,88) ∗ (109) = 308,8
𝑛 25
Desviación estándar en función de “x”
2
2 ∑ 𝑥𝑖 2 ∑ 𝑥𝑖 271706 2572 2
𝑆𝑥 = −( ) = −( ) = 283,9456
𝑛 𝑛 25 25

Expresión “𝒃𝟏 ”
𝑆𝑥𝑦 308,8
𝑏1 = 2 = = 1,0875322597 = 1,0875
𝑆𝑥 283,9456

Expresión “𝒃𝟎 ”

𝑏0 = 𝑦̅ − 𝑏1 𝑥̅ = 109 − (1,0875) ∗ 102,88 = −2,882


b) Reemplazando los datos tenemos la ecuación de la línea recta.

𝒚 = −𝟐, 𝟖𝟖𝟐 + 𝟏, 𝟎𝟖𝟕𝟓𝒙


Interpretación: Esta es la ecuación permite pronosticar las muertes por cáncer a partir del consumo de cigarrillos.

c) Coeficiente de correlación

𝑆𝑥𝑦 = 308,8

𝑆𝑥 = √283,9456 = 16,8507

Desviación estándar en función de “y”


2
∑ 𝑦𝑖 2 ∑ 𝑦𝑖 313391 2725 2
𝑆𝑦 2 = −( ) = −( ) = 654,65
𝑛 𝑛 25 25

𝑆𝑦 = √654,64 = 25,5859

𝑆𝑥𝑦 308,8
𝑟= = = 0,7162
𝑆𝑥 ∗ 𝑆𝑦 16,8507 ∗ 25,5859
Interpretación: La correlación de los datos entre el consumo de cigarrillos y las muertes por cáncer al pulmón son de buenas a
regulares.

También podría gustarte