Está en la página 1de 10

_____________________________________________________________________________________________

Guía Nº 3: Regresión lineal simple.

Ejercicio Nº 1
En un estudio para determinar la relación entre la satisfacción en el trabajo a partir de las
aptitudes, los investigadores recolectaron datos de 10 profesionales, los cuales fueron:

Satisfacción 58 54 67 64 66 73 70 85 90 95
Aptitud 50 55 60 65 70 75 80 85 90 95
(a) Determinar variable dependiente e independiente.
(b) Construir un diagrama de dispersión. Comente.
(c) Calcular el coeficiente de correlación lineal entre las variables en estudio.
(d) Encontrar la ecuación de regresión lineal simple. Comente.
(e) ¿Cuál será la satisfacción promedio por el trabajo de un profesional que obtiene una
aptitud de 72 ptos.

Rpta:
(a) X: Aptitud Y: Satisfacción. (c) r = 0,94
(d) Yi = 10,6848 + 0,84 · Xi (e) 71,776

Ejercicio Nº 2
Los siguientes datos muestran el peso de 11 ovejas (hijas) y el peso de sus ovejas (madres), a la
misma edad:

Peso oveja hija 68 63 70 66 81 74 82 76 81 92 85


Peso oveja madre 60 64 68 72 76 80 84 88 92 96 100

(a) Determinar variable dependiente e independiente.


(b) Construir un diagrama de dispersión. Comente.
(c) Calcular el coeficiente de correlación lineal entre las variables en estudio.
(d) Encontrar la ecuación de regresión lineal simple. Comente.

Rpta:
(a) X: Peso oveja madre Y: Peso oveja hija (c) r = 0,86
(d) Yi = 29,81 + 0,57954 · Xi

Profesor: Rodrigo Marió F


_____________________________________________________________________________________________

Ejercicio Nº 3
La siguiente tabla, entrega información de los resultados de 10 pruebas de laboratorio que se
realizaron para medir: "la carga de ruptura de una lámina de acero" y "el contenido de carbono"
de esta.
Pruebas 1 2 3 4 5 6 7 8 9 10
Contenido de carbono 72 60 68 66 64 62 64 70 62 74
Carga de ruptura de lamina 90 70 80 80 75 75 80 85 70 100
(a) Determinar variable dependiente e independiente.
(b) Construir un diagrama de dispersión. Comente.
(c) Calcular el coeficiente de correlación lineal entre las variables en estudio.
(d) Encontrar la ecuación de regresión lineal simple. Comente.

Rpta:
(a) X: Contenido de carbono Y: Carga de ruptura de la lámina.
(c) r = 0,94 (d) Yi = -44,3865 + 1,8865 · Xi

Ejercicio Nº 4
El propietario de una Gasolinería se propone estudiar si existe relación entre el número de litros
de gasolina comprados por un automovilista y el número de caballos de fuerza de su vehículo.
Para ello recopilan los siguientes datos:

Caballos de fuerza 4 4 5 6 7 6 10 8 5 5
Nº litros de gasolina 10 13 20 25 10 15 38 30 12 15
(a) Determinar variable dependiente e independiente.
(b) Construir un diagrama de dispersión. Comente.
(c) Calcular el coeficiente de correlación lineal entre las variables en estudio.
(d) Encontrar la ecuación de regresión lineal simple. Comente.
(e) ¿Cuál será el número de litros de gasolina comprados por un automovilista que tiene un
vehículo con 9 caballos de fuerza?

Rpta:
(a) X: Caballos de fuerza Y: Nº de litros de gasolina. (c) r = 0,80
(d) Yi = -5,3875 + 4,03125 · Xi (e) 30,89

Profesor: Rodrigo Marió F


_____________________________________________________________________________________________

Ejercicio Nº 5
Los siguientes datos muestran el número de horas semanales en que 10 estudiantes ocuparon en
estudiar y su promedio de notas:

Promedio de notas 2,1 2,7 2,6 2,5 3,5 3,0 3,5 2,9 4,0 3,7
Nº horas de estudio 5 6 7 8 9 10 11 13 14 12
(a) Determinar variable dependiente e independiente.
(b) Construir un diagrama de dispersión. Comente.
(c) Calcular el coeficiente de correlación lineal entre las variables en estudio.
(d) Encontrar la ecuación de regresión lineal simple. Comente.
(e) ¿Cuál será el promedio de notas que obtendrá un estudiante si estudia 8,5 horas?

Rpta:
(a) X: Nº de horas de estudio Y: Promedio de notas.
(c) r = 0,8048 (d) Yi = 1,524 + 0,160 · Xi (e) 2,889

Ejercicio Nº 6
Supongamos que los siguientes datos corresponden a 10 pacientes con hábito de fumar. A los
cuales se les preguntó el número de años que ha fumado, y se les midió el daño sufrido por los
pulmones mediante un test de esfuerzo físico:

Paciente 1 2 3 4 5 6 7 8 9 10
Nº de años que ha fumado 25 36 22 15 48 39 42 31 28 33
Daño en los pulmones 55 60 50 30 75 70 70 55 30 35

(a) Determinar variable dependiente e independiente.


(b) Construir un diagrama de dispersión. Comente.
(c) Calcular el coeficiente de correlación lineal entre las variables en estudio.
(d) Encontrar la ecuación de regresión lineal simple. Comente.
(e) ¿Cuál será el daño sufrido en los pulmones para un paciente que ha fumado durante 26
años?
(f) ¿Cuál será el daño sufrido en los pulmones para un paciente que ha fumado durante 62
años?

Rpta:
(a) X: Nº de años que ha fumado Y: Daño en los pulmones.
(c) r = 0,7738 (d) Yi = 11,2378 + 1,3091 · Xi
(e) 45,2744 (f) 92,402 si la tendencia lineal se mantiene.

Profesor: Rodrigo Marió F


_____________________________________________________________________________________________

Ejercicio Nº 7
Algunas variedades de lombrices viven en la tierra y se alimentan de las raíces del césped y de
las plantas de los jardines. Esta plaga, que es particularmente problemática en los climas cálidos,
se puede combatir con la aplicación de pesticidas. Los siguientes datos corresponden al
porcentaje de lombrices eliminadas para varias tasas de aplicación de dicho pesticida, medida en
kilos de ingrediente activo por cada 4000 metros2:

Tasas de aplicación 2 2 2 3 3 3 4 4 4 5 5 5
Porcentaje eliminado 50 56 48 63 69 71 86 82 76 94 99 97
(a) Determinar variable dependiente e independiente.
(b) Construir un diagrama de dispersión. Comente.
(c) Calcular el coeficiente de correlación lineal entre las variables en estudio.
(d) Encontrar la ecuación de regresión lineal simple. Comente.
(e) ¿Cuál será el porcentaje de lombrices eliminadas si se utiliza una tasa de aplicación de
3,5 kilos de ingrediente activo por cada 4000 metros2?
(f) ¿Cuál será el porcentaje de lombrices eliminadas si se utiliza una tasa de aplicación de
8,5 kilos de ingrediente activo por cada 4000 metros2?

Rpta:
(a) X: Tasas de aplicación Y: Porcentaje eliminado.
(c) r = 0,98 (d) Yi = 21,86 + 14,96 · Xi
(e) 74,25 (f) 149,083 si la tendencia lineal se mantiene.

Ejercicio Nº 8
Los siguientes datos corresponden a la utilidad (miles de U$) obtenida por la producción de
tomates (en toneladas), en 8 fundos de la zona:

Fundo 1 2 3 4 5 6 7 8
Producción 15 22 27 34 22 32 18 15
Utilidad 360 410 444 600 400 580 388 260

(a) Determinar variable dependiente e independiente.


(b) Construir un diagrama de dispersión. Comente.
(c) Calcular el coeficiente de correlación lineal entre las variables en estudio.
(d) Encontrar la ecuación de regresión lineal simple. Comente.
(e) ¿Cuál será la estimación de la utilidad, si un fundo produce 30 toneladas de

Rpta:
(a) X: Produción. Y: Utilidad. (c) r = 0,9499
(d) Yi = 91,894 + 14,63 · Xi (e) 530,794

Profesor: Rodrigo Marió F


_____________________________________________________________________________________________

Ejercicio Nº 9
Consideremos la siguiente serie de datos:
x 4 5 10 5 8
y 8 12 4 10 2
(a) Situar los datos en un diagrama de dispersión.

(b) Calcular el coeficiente de correlación r. Resp: r = −0,778


(c) Hallar L, la recta de regresión de y sobre x. Resp: y = 15,429 − 1,286 x
(d) Representar gráficamente L en el diagrama de dispersión del apartado (a)
Resp: (a) y (d)

Ejercicio Nº 10
Sea W el número de mujeres españolas que obtienen el doctorado en matemáticas en un año.
Supongamos que para cierto número de anos W tiene los siguientes valores:

Año 1980 1985 1990 1995


W 28 36 40 45
Asumiendo que el crecimiento año a año es aproximadamente lineal y que aumentara
linealmente en un futuro cercano, estimar W para los años 2000, 2003 y 2005.
Resp: Año 2000: W = 51
Año 2003: W = 54,3
Año 2005: W = 56,5

Ejercicio Nº 11
La siguiente tabla muestra el número de gérmenes patógenos por centímetro cúbico de un
determinado cultivo según el tiempo transcurrido:

N° de horas 0 1 2 3 4 5
N° de gérmenes 20 26 33 41 47 53

(a) Calcula la recta de regresión para predecir el número de gérmenes por cm3 en función del
tiempo. Resp: y = 19,81 + 6,74 x
(b) ¿Que cantidad de gérmenes por cm3 es predecible encontrar cuando hayan transcurrido 6
horas? ¿Es una buena predicción?
Resp: 60 gérmenes; sí es buena, porque r = 0,999

Profesor: Rodrigo Marió F


_____________________________________________________________________________________________

Ejercicio Nº 12
En un depósito cilíndrico, la altura del agua que contiene varía conforme pasa el tiempo según la
siguiente tabla:

Tiempo (h) 8 22 27 33 50
Altura (m) 17 14 12 11 6

(a) Halla el coeficiente de correlación lineal entre el tiempo y la altura e interprétalo.


Resp: r = – 0.997, a medida que pasa el tiempo, la altura baja
(b) ¿Cuál será la altura del agua cuando hayan transcurrido 40 h? Resp: 8,85 m
(c) Cuando la altura del agua es de 2 m, suena una alarma. ¿Que tiempo ha de pasar para que
avise la alarma? Resp:66,05 h

Ejercicio Nº 13
En una caleta de pescadores, las capturas registradas de cierta variedad de pescados, en
kilogramos, y el precio de subasta en lonja, en euros/Kg., fueron los siguientes:

x (kg) 2000 2400 2500 3000 2900 2800 3160


y (euros/kg) 1,8 1,68 1,65 1,32 1,44 1,5 1,2

(a) ¿Cuál es el precio medio registrado? Resp: 1,51 euros


(b) Halla el coeficiente de correlación lineal e interprétalo.
Resp: r = – 0,97, a mayor cantidad de pescado, menor precio por Kg.
(c) Estimar el precio promedio que alcanzará en lonja el kilo de esa especie si se pescasen
2600kg. Resp: 1,55 euros

Ejercicio Nº 14
Sobre un coche nos aseguraban un consumo medio de 6,5 litros por cada 100 Km. Durante 10
das realizamos mediciones (litros consumidos y kilómetros recorridos) según la tabla:

x (km) 100 80 50 100 10 100 70 120 150 220


y (lts) 6,5 6 3 6 1 7 5,5 7,5 10 15

(a) ¿Cuál es la diferencia entre el consumo medio según la tabla y el que nos anunciaron?
Resp: 0,25
(b) Halla el coeficiente de correlación lineal y la recta de regresión de Y sobre X.
Resp: r = 0,99; y = 0,158+ 0,066x
(c) Si queremos hacer un viaje de 500 Km., ¿que cantidad de combustible debemos poner?
Resp: 33,108 lts

Profesor: Rodrigo Marió F


_____________________________________________________________________________________________

Ejercicio Nº 15
En una zona de una ciudad se ha tomado una muestra para estudiar el número de habitaciones de
que dispone un piso y el de personas que viven en él, obteniéndose estos datos:

N° habitaciones 2 2 3 3 4 4 4 5 5 5
N° de personas 1 2 2 3 3 4 5 4 5 6

(a) Representa los puntos de la distribución bidimensional anterior.


Resp:

(b) Calcula e interpreta el coeficiente de correlación.


Resp: r = 0,88, a mayor número de habitaciones, mayor número de personas

Ejercicio Nº 16
El consumo de energía “per cápita" en miles de Kw./h y la renta per cápita" en miles de
euros de seis pases de la Unión.Europea. son las siguientes:

Alemania Bélgica Dinamarca España Francia Italia


Consumo (y) 5,7 5 5,1 2,7 2,6 3,1
Renta (x) 11,1 8,5 11,3 4,5 9,9 6,5

Calcula la recta de regresión del consumo de energía (y) sobre la renta (x).
Resp: y = 1,0698 + 0,3433 x
(a) Indica el coeficiente de correlación entre el consumo y la renta. Resp: 0,6705
(b) ¿Qué predicción podemos hacer sobre el consumo de energía “per cápita" de Grecia si su
renta es de 4,4 miles de euros? Resp: 2,58 Kw/h

Profesor: Rodrigo Marió F


_____________________________________________________________________________________________

Ejercicio Nº 17
La siguiente tabla relaciona el número atómico de varios metales de la misma fila en el sistema
periódico (período 4), con su densidad:

Elemento K Ca Ti V Mn Fe Co Ni
N° atómico 19 20 22 23 25 26 27 28
Densidad (gr/cm3) 0,86 1,54 4,5 5,6 7,11 7,88 8,7 8,8

(a) Representa los puntos de la distribución anterior, calcula el coeficiente de correlación y


halla la ecuación de la recta de regresión. A partir de ella, estima la densidad del Cromo (Cr),
cuyo número atómico es 24.
Resp:

r = 0,98; y = – 16,5 + 0,93x; densidad del Cr = 5,86

(b) Repite los cálculos anteriores para el Escandio (Sc), cuyo número atómico es 21.
Resp: densidad del Sc = 3,06

Ejercicio Nº 18
La evolución del IPC (índice de precios al consumo) y de la tasa de inflación en 1987 fue:

Enero Febrero Marzo Abril Mayo Junio


IPC 0,7 1,1 1,7 2 1,9 1,9
Tasa de inflación 6 6 6,3 6,2 5,8 4,9

(a) Representa los puntos de la distribución anterior.


Resp:

Profesor: Rodrigo Marió F


_____________________________________________________________________________________________

(b) Calcula el coeficiente de correlación entre el IPC y la tasa de inflación.


Resp: r = – 0,24
(c) ¿Se puede estimar la tasa de inflación a partir del IPC?
Resp: no, porque |r| es muy bajo

Ejercicio Nº 19
El coeficiente de correlación de una distribución bidimensional es 0,867. Si los valores de las
variables se multiplican por 10, ¿cual será el coeficiente de correlación de esta nueva
distribución? Resp: 0,867

Ejercicio Nº 20
Hemos calculado la covarianza de una cierta distribución y ha resultado ser un valor negativo.
Determinar el signo del: coeficiente de correlación y de las pendientes de las dos rectas de
regresión. Resp: Todos son negativos.

Ejercicio Nº 21
La estatura media de 100 escolares de cierto curso de E.S.O. es de 155 cm. con una desviación
típica de 15,5 cm. La recta de regresión de la estatura respecto al peso es y = 80 + 1,5x (x:
peso; y: estatura).
(a) ¿Cuál es el peso medio de esos escolares? Resp: x = 50
(b) ¿Cuál es el signo del coeficiente de correlación entre peso y estatura? Resp: Positivo

Ejercicio Nº 22
En una muestra de 64 familias se han estudiado el número de miembros en edad laboral, x, y el
número de ellos que están en activo, y. Los resultados son los de la tabla. Calcula el coeficiente
de correlación lineal entre ambas variables e interprétalo.

x y 1 2 3
1 6 0 0
2 10 2 0
3 12 5 1
4 16 8 4

Resp: r = 0,31; hay una relación bastante débil entre las variables

Profesor: Rodrigo Marió F


_____________________________________________________________________________________________

Ejercicio Nº 23
Una compañía discográfica ha recopilado la siguiente información sobre el número de conciertos
dados durante el verano por 15 grupos musicales y las ventas de discos de estos grupos
(expresados en miles de CDs):

CDs (x) Conciertos (y ) 10 – 30 30 – 40 40 – 80


1–5 3 0 0
5 – 10 1 4 1
10 – 20 0 1 5

(a) Calcula el número medio de CDs vendidos. Resp: x = 9,6 CDs ;


(b) ¿Cuál es el coeficiente de correlación? Resp: r = 0,814
(c) Obtén la recta de regresión de Y sobre X. Resp: y = 13,51 + 2,86 x
(d) Si un grupo musical vende 18.000 CDs, ¿qué número de conciertos se prevé que de?
Resp: Aprox 65 conciertos

Profesor: Rodrigo Marió F

También podría gustarte