Está en la página 1de 24

UNIVERSIDAD PERUANA LOS ANDES

FACULTAD DE INGENIERÍA
ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMAS Y
COMPUTACIÓN

alumno:
Hizarra Samaniego Percy
Docente:

Torres Lopez Casio Aurelio

HUANCAYO – PERÚ
202
Huancayo, 2023
UNIVERSIDAD PERUANA LOS ANDES
FACULTAD DE INGENIERIA
Escuela Profesional de Ingeniería de Sistemas y Computación

PRACTICA DE REGRESION LINEAL Y NO LINEAL


1. La siguiente información corresponde a una muestra de 20 estudiantes en un Curso de
ESTADISTICA donde X = Calificaciones del I Examen e Y = Calificaciones del Examen
Final.

I EXAMEN FINAL
EXAMEN
Estudian Y
te X
1 84 66
2 70 77
3 87 84
4 68 56
5 81 86
6 96 81
7 90 79
8 82 82
9 89 81
10 70 84
11 88 81
12 65 74
13 87 74
14 89 74
15 69 74
16 80 71
17 75 94
18 84 83
19 76 68
20 74 69
Se pide:
a) El modelo teórico de regresión lineal simple

Y= 54,65 + 0,28(x) + u
Y= 100%
b) El modelo estimado de regresión

Y= 54,65 + 0,28 (x)


Y= 8%

c) El coeficiente de correlación

r= 0.290, el 29 % de las notas sacadas dependen de las notas del parcial.

d) El coeficiente de determinación

𝑅2= 0.8, El 8% de las notas finales están explicadas respecto a los


parciales.

e) Si la calificación de las personas 21 y 22 son respectivamente 95 y 102, ¿cuáles son


las calificaciones finales?
• Y= 54,65 + 0,28 (95)
Y= 81,25
La calificación de las personas de 21 son 95 en el su examen, tendría como
resultado final 81,25

• Y= 54,65 + 0,28 (102)


Y= 83,21
La calificación de las personas de 22 son 102 en su examen, tendría como
resultado final 83,25

2. Ciertos investigadores mostraron una correlación de r = - 0.52 entre el salario promedio de


los maestros (X) y la proporción de estudiantes que abandonan la Escuela antes de
graduarse (Y) en 120 escuelas en un país. Concluyeron que incrementar los salarios de los
maestros reduciría la tasa de deserción. Comente esas conclusiones.

3. Los datos de la tabla siguiente muestran la relación entre los CI verbales y no verbales de
la prueba de inteligencia de Lorge-Thorndike (LT) y el aprovechamiento en lectura y
aritmética medido por la prueba de Iowa de habilidades básicas (ITBS). En cada grado, cada
correlación está basada en aproximadamente 2,500 alumnos representativos de la nación.
Nivel del grado CI verbal CI no verbal
3 5 7 3 5 7
Lectura .68 .76 .81 .53 .65 .67
Aritmética .66 .72 .74 .61 .68 .71

Basado en los datos anteriores, ¿las siguientes afirmaciones son verdaderas o falsas?

a) La correlación entre las medidas de inteligencia y aprovechamiento parece


incrementarse con el grado
VERDADERO
b) Los CI no verbales están correlacionados tan alto con el aprovechamiento como con los
CI verbales
VERDADERO
c) Los CI verbal y no verbal tienden a correlacionarse ligeramente más alto con lectura
que con aritmética
FALSO
d) La correlación entre ambas medidas de aprovechamiento y ambas medidas de
inteligencia es sustancial en cada uno de los tres grados
FALSO

4. Calcule “r” para los siguientes valores:

Identificación del estudiante


a b c d e f
Horas empleadas, 40 20 28 15 44 8
X
Horas de estudio, 20 24 16 30 18 28
Y
RPTA : Horas empleadas. r(x,y) = -0,803 ; r(x,y) = 0,343.

5. Calcule” r” para los siguientes pares de valores:

Identificación del estudiante


a b c d e f g
Valores de actitud, 9 4 6 2 8 4 2
X
Valores de actitud, 4 7 8 3 6 2 4
Y

Y= 3,55 + 0, 26 (x)

r= 0,329
R2 =0,108
• Nivel de correlación es: 0.329.
• No existe correlacion entres sus variables porque su grado es bajo.

6. Se seleccionó una muestra aleatoria de seis estudiantes para hacer un estudio piloto a fin de
investigar la relación entre velocidad de lectura y redacción (X) medida en minutos
requeridos para leer la composición y recordar en detalle el contenido (Y) medido por un
examen sobre el material presentado en la composición. Calcular la r de Pearson basada en
los datos registrados a continuación.
Identificación del estudiante
a b c d e f
Velocidad de lectura, X 10 8 15 12 14 16
Retención del contenido, Y 17 17 13 16 15 12

Y = 22,89 – 0,63 (x)

r = 0,928
R2 = 0,861

Existe un fuerte grado de correlacion entre la velocidad de la lectura X en minutos para leer
mas rapido el contendio Y .

7. Suponga que por observaciones solamente, estimó las estaturas (X) y pesos (Y) de cada
uno de sus compañeros de clase y que calculó el coeficiente de correlación (r1) entre
esas observaciones. ¿Cómo se compararía este coeficiente con el coeficiente (r2)
usando datos de una báscula y una cinta métrica para determinar X y Y? ¿Por qué?
El coeficiente de correlación (rₗ) nos muestra con que fuerza se
asocian las variables, estas variables se encuentran entre -1 y
1, cuanto más cercano a uno existe un alto grado de
correlación, en este caso la variable altura y peso son variables
relacionadas. El coeficiente de correlación (r₂) de la báscula
nos ayuda a calcular el peso de nuestros compañeros, y la cinta
métrica nos ayuda a medir la estatura, en este caso los
resultados deberían ser los mismos, ya que son instrumentos
necesarios para recolectar nuestros datos precisos. .
investigar.

8. En un estudio sobre gastos (Y) e ingresos (X) mensuales, una muestra de 10 familias dio los
siguientes datos (en nuevos soles):

Y X
500 560
400 500
640 700
740 800
800 900
800 1000
900 1000
600 700
1100 1400
1200 1600

a. Trazar el diagrama de dispersión e indicar la tendencia

b. Estimar la línea de regresión muestral


Y = 128 + 0,7 (x)
c. Interpretar el valor de los parámetros
• b0 = El gasto de las familias mensuales son 128 soles.
• b1 = Por S/1 sol que la familia recibe, logran gastar S/0,7 soles.
d. Predecir el gasto que correspondería a un ingreso de S/. 1800 y luego para S/. 2100
Y = 128 + 0,7 (1800)
Y = 1388
9. ¿Por qué son iguales los signos del coeficiente de correlación y de la pendiente de la recta de
regresión?

Porque los datos forman una recta lineal positiva, al ser que los variables sean
proporcionales tiene una pendiente positiva y logra asegurar que el coeficiente de la
relación sea positivo que logra medir la intensidad de la relación lineal que mide las
dos variables y así muestra la relación que tiene sus variables.

10. Un Promotor de un CEP encargó un estudio para determinar la relación entre los gastos de
publicidad mensual por televisión y los ingresos por pensiones de enseñanza de sus
estudiantes. En el estudio se obtuvieron los siguientes resultados:

Semana Gastos de Publicidad (S/.) Ingresos por Pensiones (S/.)


1 3000 30000
2 2000 25000
3 4000 40000
4 3000 32000
5 5000 -
6 7000 75000
7 6000 63000
8 8000 93000
9 7000 70000
10 8000 84000
11 8500 90000

En el quinto mes por diversos motivos no se pudo hacer el estudio.

a) Determine la ecuación de regresión del pago de pensiones de enseñanza sobre gastos


de publicidad
Y = 8530 + 11,31 (x)
b) ¿En cuánto estimaría el pago de pensiones del quinto mes?

Y = 10500 + 7370 (5)


Y = 47350

c) Hacer un análisis de la bondad del ajuste de la ecuación de regresión lineal utilizando el


coeficiente de determinación

R2= 0.72
BONDAD DE AJUSTE: 72%
El 72% de las predicciones son correctas.

d) A partir del análisis realizado en c) ¿qué puede Ud. concluir acerca de la correlación entre
pago de pensiones de enseñanza y gastos de publicidad?

Existe correlación lineal directa, si los gastos aumentan, la pensión también aumenta.

e) Determine los pagos de pensiones de enseñanza para los meses 12 y 13, para el efecto
proyecte los gastos de publicidad
Y = 10500 + 7370 (12)
Y = 98940
Se estima que para el 12vo mes las pensión seria S/98940 nuevos soles.
Y = 10500 + 7370 (13)
Y = 106310
Se estima que para el 13vo mes la pensión de la enseñanza sería S/ 106310 nuevos soles.
11. El número de horas de estudio invertidas y las calificaciones finales en un curso de
Matemáticas de una muestra de 8 alumnos ha dado los siguientes resultados:

Alumno Horas de estudio Calificación


A1 14 12
A2 16 13
A3 22 15
A4 20 15
A5 18 17
A6 16 11
A7 18 14
A8 22 16

a) Determine la recta de regresión de la calificación sobre el número de horas de estudios


invertidos

Y = 5 + 0,5(x)
b) Calcular el grado de asociación y determine si es significativo al nivel del 5% mediante
la significación de la pendiente de regresión
El grado de asociación es: 72%.
Pendiente de la regresión es: 0,5.
Si es significado al nivel es: 5%

12. En un estudio para determinar la relación entre la edad (X) y la presión sanguínea (Y) en una
muestra aleatoria de 9 mujeres ha dado los siguientes resultados:

X 54 40 70 35 62 45 55 50 38
Y 148 123 155 115 150 126 152 144 114

a) Encuentre la ecuación de regresión estimada de Y en X y estime la presión sanguínea


para una mujer de 75 años

Y = 69.96 + 1,33 (x)

La presion para una mujer de 75

Y = 69,96 + 1,33 (75)


Y = 169 71

b) Utilice un procedimiento de análisis para probar de que no hay asociación lineal entre
XeY

r = 0,929
R2= 0,862

Existe fuerte correlación entre la edad y la presion sanguinea.

13. La función de inversión neta total para la infraestructura de un CEP se supone presenta la
forma:
Y = AXβ
En donde Y equivale a la inversión neta (en miles de dólares), X a la tasa de interés, y A, β
son constantes desconocidas. Se tiene la siguiente muestra:
X 12 8 10 7 6 5 5
Y 80 100 120 140 160 180 200

a) Determine la ecuación de regresión estimada

Valores de X y Y.
Y = 2,906 – 0,909(x)

A = antlog(2,906) = 805,3784
b= -0,909
Curva de ajuste:
Y = 805,3784X-0,909

b) Predecir la inversión cuando la tasa de interés sea de 7.5


Y = 805,3784X-0,909

14. Ajustar los siguientes datos a una curva de la forma:


Y = AeβX
X 1 2 3 4 5 6
Y 2.40 3.21 4.12 4.30 4.90 5.40

Valores de X y Y.
Y = 0,829 + 0,153(x)
A= antlog(0,829) = 2,2910; b= 0,153
Y = 2,2910e0,153(x)
15. Ajustar la ecuación de la forma Y = a + b a los datos:
X

X 1 0.5 0.4 0.25 0.2 5 5


Y 2 4 7 8 10 9 10

Y = -2,298 + 9,870(x)

r = 0,991
R2 = 0,982

La recta de los ajuestes de X y Y es: y = -2,298 + 9,870(x)


A= 9,870; b= −2,298 / x
RPT: Y = 9,870 + (-2,298/X)

16. Se realiza un estudio de asociación entre las siguientes variables:

Y: gastos mensuales expresados en cientos de dólares


X1: ingreso mensual familiar en miles de dólares
X2: tamaño de la familia

En una muestra de 10 familias escogidas al azar se han encontrado los datos que se presentan
en la tabla que sigue:

Y X1 X2
45 10 8
40 9 8
38 8 6
35 7 6
32 7 5
30 6 4
28 6 3
27 4 2
25 3 2
22 2 1

a) Determinar la ecuación de regresión muestral de los datos mensuales con respecto a las
dos variables: Ingreso mensual y número de hijos

Y = 1,74 + 0,99(x)

b) Interpretar los coeficientes de la regresión

r = 0,965
R2= 0,931
El ingreso mensual y tamaño familiar tiene una relacion de 97%.
r = 0,964
R2= 0,929
El ingreso mensual tiene un grado de relacion de 96%.

r= 0,974
R2= 0,949
Los gastos mensuales y tamaño familiar tiene una relacion de 97%.

c) Estimar el gasto mensual para una familia de 8 hijos y cuyo ingreso mensual es $ 7,000

Y = 17,834 + 1,844(x1) + 0,978(x2)


Y = 17,834 + 1,844(7) + 0,978(8)
Y = 17854,732

17. Se realizó un estudio de las relaciones entre las notas obtenidas en 4 materias por 10
estudiantes de ingeniería de sistemas seleccionados aleatoriamente. Las 3 variables
independientes X1, X2, X3 y la variable dependiente Y son:

Y: notas en Estadística Aplicada


X1: nota en Matemática Básica
X2: nota en Lógica
X3: nota en Economía General
Los datos son los siguientes:

Y X1 X2 X3
13 12 10 18
15 14 12 15
17 16 10 18
16 15 11 20
13 11 13 15

17 15 16 18
19 16 10 19
14 14 14 16
18 17 13 15
11 11 11 13

a) Estimar el modelo de regresión

Y = -2,911 + 1,017 (x) + 0,048(x2) + 0,197(x3)

b) Probar la significación del modelo de regresión muestral

r = 0,949
R2 = 0,9

El grado de significación es un 96% existe correlación entre los 4 cursos de los 10 estudiantes
de Ingeniería de Sistemas.

18. Ajustar los pares de datos (x, y) que se indican en la siguiente tabla a un polinomio de la
forma Y = a + bX +cX2.

X Y
1 1 8
2 2 4
3 3 1
4 4 5
5 5 7
La curva de ajuste es: y=29,6−16,49 x+2,71
x 2 r=0,058
R2=0,003

19. Para los siguientes datos:

X 5 10 15 20 25 30 35 40 45 50
Y 19 16 15 5 15 9 11 13 8 10

Ajustar una curva de la forma:

Y = 1 / (A0 + A1X)
Y = 1 / (1 + 0.05 * 30)
Y = 1 / (1.5)
Y = 0.67

20. Los datos de la siguiente tabla recogen la inversión real (I) en educación, el rendimiento
académico (RA) en el sistema centesimal y la tasa de deserción media (r), correspondientes
al sistema educativo de un determinado país. Dichos datos corresponden al período 1981 -
2004 y está expresado en miles de unidades monetarias la primera variable y en tanto por
ciento la tasa de deserción.

AÑO I RA r
1981 80.2 10.2 9.2
1982 90.1 12.1 9.1
1983 92.3 14.4 9.0
1984 94.6 15.6 8.7
1985 110.2 18.2 9.0
1986 118.5 19.0 8.7
1987 131.6 21.7 8.3
1988 141.2 31.3 8.5
1989 147.5 34.6 8.7
1990 150.2 34.7 8.9
1991 152.3 33.5 9.1
1992 160.8 32.6 8.9
1993 182.3 41.5 8.3
1994 199.2 44.8 9.0
1995 221.4 46.7 9.1
1996 235.0 50.7 8.2
1997 248.9 56.8 8.1
1998 267.8 61.4 9.1
1999 301.2 72.5 8.7
2000 323.5 62.1 8.1
2001 345.7 61.1 8.6
2002 350.1 67.8 9.1
2003 352.8 68.9 8.5
2004 360.3 75.0 9.0

Con esta información se pide:

a) Formular un modelo teórico que permita saber los efectos que la tasa de deserción haya
tenido en el rendimiento académico

Y = 167 – 14,36(x)

b) Estime el modelo anterior, luego:


b.1) Interprete los coeficientes obtenidos

b.2) Dar una medida de la bondad de ajuste, interpretando su significado


R2= 0,057
Bondad de ajuste: 5,7%
El 5,7% de las prediccion son correctas.

c) Si en la ecuación del rendimiento académico de (a) introducimos la inversión en


educación,
c.1) Formule el modelo teórico

Y = 2,16 + 0,21(x)

c.2) Estime el modelo

Y = 167 – 14,36(x)

c.3) Compare la bondad de ajuste con el modelo dado en (b)

R2= 0,057
Bondad de ajuste: 5,7%.
R2= 0,942
Bondad de ajuste: 94%.
El 94% de los modelos son correctas.

c) Estime el rendimiento académico promedio para el 2005 en base a la proyección de la


inversión en educación y la tasa de deserción media que se mantiene constante e igual al
promedio del período.

Y = 1981,221 – 0,341(x1) + 0,032(x2) + 0,190(x3)


Y = 1981,221 – 0,341 + 0,032 (25) + 0,190
Y = 1981,87

21. Una empresa fabricante de cereales para el desayuno desea conocer la ecuación que permita
predecir las ventas (en miles de soles) en función de los gastos en publicidad infantil en
televisión (en miles de soles), la inversión en publicidad en radio (en miles de soles) y la
inversión en publicidad en los periódicos (en miles de soles). Se realiza un estudio en el que
se reúnen los datos mensuales correspondientes a los últimos 20 meses. Estos datos se
muestran en la siguiente tabla:

Ventas Publicidad - TV Publicidad - radio Publicidad - periódico


10.0 1.0 50.0 0.4
12.0 1.2 57.0 0.4
11.0 1.3 56.0 0.42
13.0 1.4 55.0 0.5
12.0 1.5 60.0 0.4
14.0 1.7 65.0 0.44
16.0 1.75 69.0 0.4
12.0 1.3 67.0 0.44
14.0 1.45 68.0 0.46
11.0 0.9 67.0 0.46
10.0 0.8 97.0 0.45
19.0 0.9 66.0 1.1
8.5 0.8 65.0 0.3
8.0 1.0 60.0 0.5
9.0 1.7 70.0 0.45
13.0 1.8 110.0 0.4
16.0 1.85 75.0 0.8
18.0 1.9 80.0 0.9
20.0 2.0 85.0 0.9
22.0 2.0 90.0 1.1

Se pide:

a. Ajustar un modelo de regresión lineal múltiple. Obtener una estimación de los parámetros
del modelo y su interpretación
VENTAS

Y = 2,108 + 11,347(x1) + 3,422(x2) + 0,001(x3)

b. ¿Puede eliminarse alguna variable del modelo? Realiza los contrastes de significación
individuales
Y = 4,87 + 6,05(x)

r = 0,632
R2 = 0,4

Y = 6,57 + 0,1(x)
r = 0,371
R2= 0,138

Y=

5,82 + 13,56(x)

r = 0,849
R2= 0,721

La empresa que utiliza la publicidad de la radio no es muy aprovechada ya que solo presenta el
37%.

c. Coeficiente de determinación y de determinación corregido

Huancayo, noviembre del 2023

También podría gustarte