Está en la página 1de 18

Datos del alumno Fecha

Nombres: Mayra Alexandra 02/02/2024


Apellidos: Landi Villa

Desarrollo de la Actividad
ESTADÍSTICA
UNIDAD 3:
TAREA 2
Para resolver los ejercicios de esta tarea se recomienda crear un proyecto llamado U3EST
T2
1. Los datos que se muestran en el archivo reg1.csv son rendimiento de kilometraje de
gasolina (en millas por galón) y desplazamiento del motor (em centímetros cúbicos) para
una muestra de 20 automóviles.

a) Cree una variable EngineDispIn3 que contenga el desplazamiento del motor en


pulgadas cúbicas. Una pulgada cubica es equivalente a 16.3871 centímetros cúbicos.
Redondee al entero más cercano.
Universidad Politécnica Salesiana

b) Construya el diagrama de dispersión para las dos variables mpg y EngineDispIn3

c) Calcule el coeficiente de correlación entre las dos variables mpg y EngineDispIn3

d) Ajuste un modelo lineal simple que relacione millas de carretera por galón (y) al
desplazamiento del motor (x) utilizando mínimos cuadrados.

Universidad Politécnica Salesiana


2
Universidad Politécnica Salesiana

e) Encuentre una estimación del rendimiento medio de kilometraje de gasolina en carretera


para un automóvil con un desplazamiento del motor de 150 pulgadas cúbicas.

f) Obtenga el valor ajustado de y el residuo correspondiente para un automóvil, el Ford


Escort, con un desplazamiento del motor de 114 pulgadas cúbicas.

g) ¿cómo interpreta el coeficiente de determinación de este modelo?

2. En el archivo reg2.csv presenta datos sobre el precio de venta y los impuestos anuales para
24 casas.

a) Suponiendo que un modelo de regresión lineal simple es apropiado, obtener el ajuste de


mínimos cuadrados relacionando el precio de venta con impuestos pagados.

Universidad Politécnica Salesiana


3
Universidad Politécnica Salesiana

b) Encuentre el precio de venta medio dado que los impuestos pagados son x = 7, 50.

c) Calcule el valor ajustado de y correspondiente a x = 5,8980. Encuentre el residuo


correspondiente.

d) Calcule el ˆy ajustado para cada valor de xi usado para ajustar el modelo. Luego
construya una gráfica de ˆy versus el correspondiente valor observado yi.

Universidad Politécnica Salesiana


4
Universidad Politécnica Salesiana

e) Encuentre los residuos para el modelo de mínimos cuadrados.

f) Elabore una gráfica de probabilidad normal de los residuales e interprete esta


presentación.

Universidad Politécnica Salesiana


5
Universidad Politécnica Salesiana

g) Grafique los residuos contra ˆy y contra x. ¿Parece que se cumple el supuesto de


varianza constante?

Grafica de y estimada Vs residuos

Universidad Politécnica Salesiana


6
Universidad Politécnica Salesiana

Universidad Politécnica Salesiana


7
Universidad Politécnica Salesiana

h) ¿Qué proporción de la variabilidad total se explica por el modelo de regresión?

3. Se cree que la cantidad de libras de vapor utilizadas por mes por una planta química está
relacionada con la temperatura ambiente promedio (en grados Farenheit) para ese mes. El
uso y la temperatura del año pasado se muestran en el archivo reg3.csv.

a) Suponiendo que un modelo de regresión lineal simple es apropiado, ajustar el modelo


de regresión que relaciona el uso de vapor (y) con la temperatura media (x).

Universidad Politécnica Salesiana


8
Universidad Politécnica Salesiana

b) ¿Cuál es la estimación del uso de vapor esperado cuando la temperatura promedio es de


55 ◦F?

c) ¿Qué cambio en el uso medio de vapor se espera cuando la temperatura promedio


mensual cambia en 1 ◦F?

d) Suponga que la temperatura promedio mensual es 47 ◦F. Calcule el valor ajustado de y


y el residuo correspondiente.

Universidad Politécnica Salesiana


9
Universidad Politécnica Salesiana

e) Calcule el ˆy ajustado para cada valor de xi usado para ajustar el modelo. Luego
construya una gráfica de ˆy versus el correspondiente valor observado yi.

f) Encuentre los residuos para el modelo de mínimos cuadrados.

g) Elabore una gráfica de probabilidad normal de los residuales e interprete esta


presentación.

Universidad Politécnica Salesiana


10
Universidad Politécnica Salesiana

h) Grafique los residuos contra ˆy y contra x. ¿Parece que se cumple el supuesto de


varianza constante?

Universidad Politécnica Salesiana


11
Universidad Politécnica Salesiana

Grafica de y estimada Vs residuos

i) ¿Qué proporción de la variabilidad total se explica por el modelo de regresión?


Grafica de y estimada Vs residuos

Universidad Politécnica Salesiana


12
Universidad Politécnica Salesiana

4. A partir del archivo “todas2018.csv¸construya el ranking de las 1000 mejores empresas


de acuerdo a las utilidades.
a) Realice un diagrama de dispersión del número de empleados contra la utilidad.

b) Determine la correlación entre el número de empleados y la utilidad

c) Establezca un modelo de regresión lineal simple donde la variable dependiente sea la


utilidad y la independiente sea el número de empleados. Interprete sus resultados.

Universidad Politécnica Salesiana


13
Universidad Politécnica Salesiana

d) Incluya en su modelo de regresión las ventas. Interprete sus resultados

e) Adicione en su modelo de regresión del literal anterior el sector productivo al que


pertenece la empresa. Interprete sus resultados.

Universidad Politécnica Salesiana


14
Universidad Politécnica Salesiana

5. Con el conjunto de datos tourism.csv realice los siguientes ejercicios. Para los ejercicios
b, c y d investigue sobre la regresión lineal múltiple. Adicionalmente investigue sobre los
supuestos de los modelos de regresión y como verificarlos en R.
a) Le gustaría saber si la edad de los huéspedes influye en la cantidad gastada por día
(conjunto de datos turismo.xlsx). Ejecute una regresión lineal con la edad como
independiente y los gastos como variable dependiente. Verifique el cumplimiento de los
supuestos.

Universidad Politécnica Salesiana


15
Universidad Politécnica Salesiana

b) Suponga que usted no está realmente satisfecho con su resultado, pensando que una
variable independiente puede no ser suficiente para explicar el gasto diario. Al entrar en
detalles se piensa que además de la edad, la satisfacción con la estación de esquí y la
duración de la estancia también pueden influir en el gasto diario. Ejecute el nuevo modelo
de regresión y verifique los supuestos.

Universidad Politécnica Salesiana


16
Universidad Politécnica Salesiana

c) Al modelo del ejercicio anterior añada la variable acomodación. Ejecute el modelo de


regresión y verifique los supuestos.

Universidad Politécnica Salesiana


17
Universidad Politécnica Salesiana

d) Finalmente añada la variable sexo. Ejecute el nuevo modelo de regresión y verifique los
supuestos.

Universidad Politécnica Salesiana


18

También podría gustarte