Está en la página 1de 12

Curso: Estadística General

Profesor: Alfredo Salinas Moreno

PRÁCTICA: Lección 14.1


(REGRESIÓN Y CORRELACIÓN LINEAL
SIMPLE)

1. En un estudio de 8 pacientes se miden las cantidades


antropométricas del peso y la edad obteniéndose los
siguientes resultados:

Edad ( años ) 12 8 10 11 7 7 10 14
Peso ( kg ) 56 42 51 54 40 39 49 58

a) Calcule el coeficiente de correlación lineal

n ∑ xy −∑ x ∑ y
r = [ n ∑ x −(∑ x ) ][ n ∑ y −( ∑ y ) ]
√ 2 2 2 2

Cálculos
8 8 8
∑ X i=79 ∑ Y i =389 ∑ X i Y i=3967
i=1 i =1 i=1

8 8

∑ X 2i =823 ∑ Y 2i =19303
i=1 i=1

Edad: X Peso: Y X*Y X**2 Y**2


12 56 672 144 3136
8 42 336 64 1764
10 51 510 100 2601
11 54 594 121 2916
7 40 280 49 1600
7 39 273 49 1521
10 49 490 100 2401
14 58 812 196 3364
79 389 3967 823 19303

Reemplazando en la fórmula obtenemos un r = 0.974


Interpretación: Existe una correlación lineal positiva, lo cual
significa que al aumentar la edad entonces el peso también
tiende a aumentar.

b) Obtención de la ecuación de regresión lineal:

Reemplazando en las fórmulas tenemos:


a
 X Y   X  X
i
2
i i i Yi
n  X   X  2 2
i i

a = 823 (389) – 79 (3967) = 19.691


2
8(823) – (79)

n  X i Yi   X Y i i
b 
 X i2   X 
2
n i

b = 8(3967) – 79 (389) = 2.93


8(823) – (79)2

La ecuación de regresión será: Yˆ = 19.691 +2.93 X


Interpretación: Al aumentar la edad en un año, entonces el
peso aumentará en 2.93 kg.

c) Se desea estimar el peso, para un niño de diez años


de edad.

Yˆ = 19.691 + 2.93 (10) = 48.99 aproximadamente 49kg

d) Determine e interprete el Coeficiente de


Determinación

2
En este caso r = 0.949
Interpretación.- El 94.9 % de las variaciones que se observa
en los pesos; se debe o se explica por la variación de la edad
y el 5.1 % restante se debería o se explicaría por el efecto o
influencia de alguna otra variable no tomada en cuenta en el
presente estudio.

2.- Se efectúa un experimento médico para determinar el


efecto de la droga efedrina sobre las pulsaciones del corazón.
Un paciente recibe diversas dosis diarias de la droga durante
seis días. La siguiente tabla resume los resultados del
experimento.
Dosis diaria total Nº de pulsaciones
de efedrina (granos) por minuto
3 70
2 60
1 50
3 80
5 100
4 90
Nota. 1 grano = 0.06 gramos
a) Halle la ecuación de regresión lineal. Interprete el
coeficiente de regresión.
b) Interprete el coeficiente de determinación

3.- Un investigador interesado en la relación entre el índice de masa


corporal (IMC) y el colesterol sérico; desea ajustar un modelo de
Regresión Lineal Simple en el que el colesterol sérico total pueda
predecirse a partir del IMC con los siguientes datos:
Colesterol Total: 165 155 141 228 190 155 132
IMC: 25.9 20.1 22.2 30.7 28.0 29.4 20.2

170 188 150


20.7 26.3 18.2

a) Determine la ecuación de regresión lineal. Interprete


b) Determine e interprete el coeficiente de determinación.

4.- La siguiente tabla ilustra los valores del consumo de metil


mercurio y la cantidad total de mercurio en la sangre de 12
individuos expuestos a la primera sustancia por haber
consumido peces contaminados.

Consumo de 180 200 230 410 600 550 275 580 105 250 460 650
metil
Mercurio
(µgHg/día)
Mercurio en la 90 120 125 290 310 290 170 375 70 105 205 480
sangre
( ng/g )

a) Calcule el coeficiente de correlación lineal.


b) Estimar la ecuación regresión lineal de la cantidad de
mercurio en la sangre sobre el consumo de metil
mercurio
c) Estime la cantidad de mercurio en la sangre,
considerando una ingesta de 300 µg de mercurio.

5.- Los siguientes datos corresponden a los pesos (kg) y los


niveles de glucosa en la sangre (mg/100mL) de 16 varones
adultos aparentemente sanos.
Peso 64.0 75.3 73.0 82.1 76.2
Glucosa 108 109 104 102 105

95.7 59.4 93.4 82.1 78.9 76.7


121 79 107 101 85 99

82.1 83.9 73.0 64.4 77.6


100 108 104 102 87
a) Encuentre la ecuación de regresión lineal
b) Halle el coeficiente de determinación
c) ¿Cuál es el nivel de glucosa pronosticado para un hombre
que pesa 95 kg?
6.- Una investigación de la relación entre el flujo de tránsito
(en miles de automóviles por 24 horas) y el contenido de
plomo de la corteza de árboles cerca de la autopista (µg/g de
peso en seco) produjo los datos siguientes:

Flujo de 8.3 8.3 12. 12.1 17 17 17 24. 24.3 24.3 33.6


tránsito 1 3

Contenido 22 31 362 521 64 539 728 945 738 759 1263


de plomo 7 2 0

a) Determine la ecuación de regresión lineal. Interprete


b) Calcule e interprete el coeficiente de correlación
c) Determine e interprete el coeficiente de determinación
7.- Para estudiar el efecto de las aguas residuales de las
alcantarillas que afluyen a un lago, se toman medidas de la
concentración de nitrato en el agua. Para monitorizar la
variable se ha utilizado un antiguo método manual. Se idea
un nuevo método automático. Si se pone de manifiesto una
alta correlación positiva entre las medidas tomadas
empleando los dos métodos, entonces se hará uso habitual
del método automático. Los datos obtenidos son los
siguientes:

X: Manual 25 40 120 75 150 300 270 400 450 575


Y: Automático 30 80 150 80 200 350 240 320 470 583

a) Halle la ecuación de regresión lineal.


b) Hallar el coeficiente de correlación lineal
c) Qué lectura se obtendrá empleando la técnica
automática, con una muestra de agua cuya lectura
manual es de 100
PRÁCTICA: Lección 14.2
PRUEBA DE INDEPENDENCIA

1.- Se desea determinar si hay dependencia entre la


arterioesclerosis y el uso del tabaco en los diabéticos que
fuman. Sobre un total de 301 diabéticos examinados; los
resultados fueron:
Fumadores No fumadores Total
Con 126 113.71 31 43.29 157
arterioesclerosis
Sin arterioesclerosis 92 104.29 52 39.71 144
Total 218 83 301

¿Se puede concluir que existe relación entre la


arterioesclerosis y el uso de tabaco? Use α = 0.05
Solución

Ho: No existe relación entre la arterioesclerosis y el uso de


tabaco
H1: Si existe relación entre la arterioesclerosis y el uso de
tabaco

2 (126−113 .71)2 (52−39 . 71)2


χ= +. .. ... .. ... .. .... . .. .. . ..+ =10 .1
113 .71 39 . 71

Según la tabla
Conclusión.- Los datos de la muestra evidencian que existe
relación entre la arterioesclerosis y el uso del tabaco.
2.- En un establecimiento ganadero se quiere establecer si la
condición corporal de las vacas (medida en una escala de 1 a
5) afecta el éxito de la inseminación. Para evaluar la relación
entre CC y éxito de la inseminación, 160 vacas fueron
inseminadas y se registró su CC. Sólo se consideraron vacas
con CC 2, 3 y 4. Posteriormente se estableció, si las vacas
habían quedado preñadas o no. Los datos generados por
este ensayo de muestran en la siguiente tabla:

Condició Preñada
n
NO SI Total
corporal
2 7 23 30
3 4 76 80
4 4 46 50
Total 15 145 160

Asuma como hipótesis nula que la condición corporal no se


vincula con el éxito de la inseminación.

PRUEBA DE HOMOGENEIDAD

1.- En un estudio de la contaminación del aire, se obtuvieron


a partir de dos comunidades, dos muestras aleatorias de 200
familias cada una. Se preguntó a cada una de las familias si
la contaminación del aire afectaba a alguno de sus miembros
familiares. Las respuestas fueron las siguientes:

¿Algún miembro de la familia es afectado por la contaminación?

Comunidad SI NO Total
I 43 62 157 138 200
II 81 62 119 138 200
Total 124 276 400

¿Se puede concluir que las dos comunidades difieren


respecto a la variable de interés? Use α = 0.05
Solución

Ho: Las dos comunidades no difieren respecto a la variable


de interés (contaminación del aire)
H1: Las dos comunidades si difieren respecto a la variable de
interés (contaminación del aire)

Según la tabla

Conclusión.- Las dos comunidades difieren respecto al daño,


sobre alguno de sus miembros ocasionado por la
contaminación del aire
2.- Un investigador estudia el nivel de efectividad de tres
remedios R1, R2 y R3 para aliviar cierta enfermedad. Para
esto escogió tres muestras aleatorias de tamaños 50, 70 y 60
pacientes con la enfermedad, suministrando a la primera el
remedio R1, a la segunda muestra el remedio R2 y a la tercera el
remedio R3; y midiendo la efectividad de los remedios en tres niveles:
Sin alivio, cierto alivio y alivio total. Los resultados del
experimento se dan en la tabla que sigue:

Efectividad Remedios para la alergia


R1 R2 R3
Sin alivio 10 20 15
Cierto alivio 30 20 20
Alivio total 10 30 25

Con α = 0.05 ¿Puede inferir que los tres remedios para la


alergia son igualmente efectivos?
Solución
Ho: Los tres remedios para la alergia son igualmente
efectivos
H1: Los tres remedios para la alergia no son igualmente
efectivos
Nivel de significancia: α = 0.05

Remedios Remedios para la alergia Total


R1 R2 R3
Sin alivio 10 12.50 20 17.5 15 15.00 45
Cierto 30 19.44 20 20 23.33 70
alivio 27.22
Alivio total 10 18.06 30 25 21.67 65
25.28
Total 50 70 60 180
2 2
2 (10. 25−12. 5) (25−21 . 67)
χ= +. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .+ =13. 97
12. 5 21. 67

2
Según la tabla para α = 0.05 y G.L = 4 se tiene   9.488
Valor P = 0,007
Por lo tanto, rechazaremos la hipótesis y concluimos que los
remedios no son igualmente efectivos

3.- Se probó un suero que se suponía tenía algún efecto para


evitar resfriados, en 500 individuos se encontró que 252 de
ellos no se resfriaron, 144 tuvieron un resfriado y 104 más de
un resfriado en ese año. Igualmente, entre las 500 personas
que no fueron tratadas se encontraron 224 que no se
resfriaron, 136 tuvieron un solo resfrío y 140 tuvieron más de
un resfriado. Probar con α = 0.05 si el suero tuvo eficacia o no
para evitar resfriados.

También podría gustarte