Está en la página 1de 23

UNIVERSIDAD POLITÉCNICA

SALESIANA
Estadística para las Ciencias de la Computación

Integrantes:
Lomas Alvaro
Mariño Daniel
Pillajo Jhony
Raza Sebastián
Romo Joel
Sarmiento Steven

Deber 2
Ejercicios 23 a 31
Estadística para Administración y Economía
Página 575-577

Periodo 58
2021
Ejercicio 23

A continuación, se presentan los datos del ejercicio


Xi 1 2 2 4 5
Yi 3 7 5 11 14

a. Usando la ecuación (14.15) calcule el error cuadrado medio.

𝑆𝐶𝐸
𝑬𝑪𝑴 =
𝑛−2
xi=c(1,2,3,4,5)
yi=c(3,7,5,11,14)
reg=lm(yi~xi)
anova=anova(reg)
ECM=anova$'Mean Sq'[2]

𝑬𝑪𝑴 = 4.13333
b. Usando la ecuación (14.16) calcule el error estándar de estimación.

𝑺𝑪𝑬
𝒔 = √𝑬𝑪𝑴 = √
𝒏−𝟐

anova=anova(reg)
ECM=anova$'Mean Sq'[2]
s=sqrt(ECM)

s=2.03306

c. Desviación estándar estimada de b1.

𝒔𝒃𝟏 = 𝟎. 𝟔𝟒𝟐𝟗
d. Use la prueba t para probar las hipótesis siguientes (α=0.05)

Gracias a la prueba T tenemos un valor de “4.044” con 3 grados de libertad, y con un pvalue
igual a “0.0272” y este es menor a 0.05 por lo que rechazamos la hipótesis nula y aceptamos la
hipótesis alternativa

e. Use la prueba F para probar las hipótesis del inciso d) empleando como nivel de
significancia 0.05. Presente los resultados en el formato de tabla de análisis de
varianza.

Fuente Suma de Grados de Cuadrado F Valor P


Variación Cuadrados Libertad Medio
Regresión 67.6 1 67.600 16.355 0.02721
Error 12.4 3 4.133
Total 80 4 71.733
Ejercicio 24.
A continuación, se presentan los datos del ejercicio 2.

Xi 3 12 6 20 14
Yi 55 40 55 10 15

a. Usando la ecuación (14.15) calcule el error cuadrado medio.


Utilizando el comando “summary” se puede ver el error cuadrado es 0.8757 que es mayor
al umbral de 0.7 por tanto posee una buena bondad de ajuste.
x=c(3,12,6,20,14)
y=c(55,40,55,10,15)

plot(x,y)
reg=lm(y~x)
summary(reg)

b. Usando la ecuación (14.16) calcule el error estándar de estimación.


x=c(3,12,6,20,14)
y=c(55,40,55,10,15)

plot(x,y)
reg=lm(y~x)
yest=reg$coefficients[1]+reg$coefficients[2]*x
error=y-yest
SCE=sum(error^2)

#Error estandar de estimacion S


n=length(x)
ECM=SCE/(n-2)
s=sqrt(ECM)

El error estándar de estimación S es 8.75595035770913

c. Usando la ecuación (14.18) calcule la desviación estándar estimada de b1.

DS=s*reg$coefficient[2]
DS
La desviación estándar estimada de b1 es -26.26785

d. Use la prueba t para probar las hipótesis siguientes (α = 0.05)


x=c(3,12,6,20,14)
y=c(55,40,55,10,15)

plot(x,y)
reg=lm(y~x)
yest=reg$coefficients[1]+reg$coefficients[2]*x
error=y-yest
SCE=sum(error^2)

#Error estandar de estimacion S


n=length(x)
ECM=SCE/(n-2)
s=sqrt(ECM)
summary(reg)

1. Se calcula prueba T en la cual el resultado es 0.01935 y el Treshold es 0.05, por lo


cual la prueba T es menor que el valor estimado.
2. Por tanto, rechazo la hipótesis nula y acepto la hipótesis alternativa.
Ejercicio 25
A continuación, se presentan los datos del ejercicio 3.
Xi 2 6 9 13 20
Yi 7 18 9 26 23

a. ¿Cuál es el valor del error estándar de estimación?

x=c(2,6,9,13,20)
y=c(7,18,9,26,23)
error=y-yest
SCE=sum(error^2)

#Error estandar de estimacion S


n=length(x)
ECM=SCE/(n-2)
s=sqrt(ECM)

El error estándar de estimación S es 6.51408729856557


b. Pruebe si existe una relación significante usando la prueba t. Use α = 0.05.
reg=lm(y~x)
summary(reg)

A través del comando “summary” encontramos el p-value de la Prueba T, señalada en la captura,


el cual es igual a 0.153, al compararlo con el α dado de 0.05, este último NO es mayor a 0.153 por
lo que acepto la hipótesis nula y rechazo la hipótesis alternativa.

No existe una relación significativa entre las variables.


c. Emplee la prueba F para ver si existe una relación significante. Use α = 0.05. ¿Cuál
es la conclusión?

A través del comando “summary” encontramos el p-value de la Prueba F, señalada en la captura,


el cual es igual a 0.153, al compararlo con el α dado de 0.05, este último NO es mayor a 0.153 por
lo que acepto la hipótesis nula y rechazo la hipótesis alternativa.

No existe una relación significativa entre las variables.


EJERCICIO 26
En el ejercicio 18 los datos sobre promedio obtenido en la licenciatura y salarios mensuales
fue-ron los siguientes.

Promedio Salario
mensual ($)
2.6 3300
3.4 3600
3.6 4000
3.2 3500
3.5 3900
2.9 3600
a. ¿Indica la prueba t que haya una relación significante entre promedio y salario
mensual?

La prueba T si indica que hay una relación entre el promedio y el salario porque entre el
promedio sea mayor el salario va a incrementar
b. Pruebe si la relación es significante usando la prueba F. ¿Cuál es la conclusión?
Useα0.05.

A través del comando “summary” encontramos el p-value de la Prueba F, señalada en la captura,


el cual es igual a 0.02663, al compararlo con el α dado de 0.05, este último SI es mayor a
0.02663 por lo que no acepto la hipótesis nula y ni tampoco acepto la hipótesis alternativa. ya
que existe una relación significativa entre las variables.
c. Dé la tabla ANOVA.
Ejercicio 27
La revista Outside Magazine probó 10 modelos de mochilas y botas para excursionismo.
En la tabla siguiente se presentan los datos de soporte superior y precio de cada modelo. El
soporte superior se midió con una escala del 1 al 5 en la que 1 significa aceptable y 5 denota
excelente soporte superior (Outside Magazine Buyer´s Guide 2001).
Soporte 2 3 3 3 3 5 5 4 4 5
Superior
Precio 120 125 130 135 150 189 190 195 200 220
($)

a. Use estos datos para obtener la ecuación de regresión estimada para estimar el precio de
las mochilas y las botas para excursionismo con base en el soporte superior.

Media de X= 3.7
Media de Y= 165.4
X - Media de X = (Resulta un vector con los errores)
Y - Media de Y = (Resulta un vector con los errores)
Multiplico los vectores con los errores
Realizo la Suma de los productos = 315.2
Realizo la Suma del vector al cuadrado = 10.1
Coeficiente de Regresión b0(división de S1 y S2) = 49.93069
Coeficiente de Regresión b1(media de Y – b1 * mediaX) = 31.20792

Ecuación de Regresión Estimada: ȳ= 49.93069 + 31.20792x


b. Empleando α = 0.05, determine si hay relación entre soporte superior y precio.

A través del comando “summary” encontramos el p-value de la Prueba T, señalada en la captura,


no es mayor a 0.05 por lo que se rechaza hipótesis Nula y acepta la Alternativa.
0.0004<0.05
c. Confiaría en usar la ecuación de regresión estimada obtenida en el inciso a) para estimar
el precio de las mochilas y botas para excursión con base en la evaluación del soporte
superior.
Si, ya que el coeficiente de determinación es 0.79, mayor a 0,60 por tanto la bondad de ajuste
diría que el 79% de la variabilidad en ventas se explica por la relación lineal que existe entre
soporte y precio.
d. Estime el precio de una mochila que tiene un 4 como evaluación del soporte superior.
ȳ = 49,93+31.20(4)
ȳ = $174.73
Ejercicio 28
En el ejercicio 10, con los datos de temperatura (°F) y precio ($) de 11 sacos de dormir de
Bergans de Norway se obtuvo la ecuación de regresión estimada ŷ = 359.2668 - 5. 2772x.
Empleando 0.05 como nivel de significancia, determine si temperatura y precio están
relacionados. Dé la tabla de ANOVA. ¿Cuál es la conclusión?

#Ejercicio 28
#28. En el ejercicio 10, con los datos de temperatura (°F) y precio ($) de 11
#sacos de dormir de Bergans de Norway se obtuvo la ecuación de regresión
#estimada ŷ = 359.2668 - 5. 2772x.
x = c(12,24,3,13,38,4,5,15,25,45,25) #Temperatura (Variable independiente)
y = c(319,289,389,239,149,289,359,259,229,129,199) #Precio (Variable dependiente)
a) Empleando 0.05 como nivel de significancia, determine si temperatura y precio
están relacionados.
#1. Empleando 0.05 como nivel de significancia, determine si temperatura y
#precio están relacionados.
reg = lm(y~x)
summary(reg)

Al emplear un nivel de significancia del 0.05, podemos determinar que sus datos si se encuentran
relacionados, puesto que el p-value obtenido es de 0.0001831 siendo menor al nivel de
significancia empleado:
0.0001831 ≤ 0.05
Con ello podemos concluir que rechazamos la hipótesis nula (H0) y aceptamos la hipótesis
alternativa (H1).
b) Dé la tabla de ANOVA. ¿Cuál es la conclusión?
#2. Dé la tabla de ANOVA. ¿Cuál es la conclusión?
#Tabla ANOVA: Regresion Lineal Simple
anova(reg)

Al analizar la tabla de ANOVA, se puede concluir que dentro de ella se encuentran los valores de
la prueba de hipótesis F. Dentro de esos valores podemos observar el mismo dato obtenido
anteriormente para el p-value. Con ello podemos llegar a la misma conclusión del apartado
anterior en el cual rechazábamos la hipótesis nula (H0) y aceptábamos la hipótesis alternativa
(H1).
Ejercicio 29
Vuelva al ejercicio 21, en el que se usaron los datos sobre volumen de producción y costos
para obtener una ecuación de regresión estimada que relacionaba el volumen de
producción y los costos de una determinada operación de producción. Use α
0.05 para determinar si el volumen de producción está relacionado de manera significativa
con los costos totales. Dé la tabla ANOVA. ¿Cuál es la conclusión?

A través del comando anova(reg) encontramos el p-value, señalada en la captura, no es mayor a


0.05 por lo que se rechaza hipótesis Nula y acepta la Alternativa.
0.000649<0.05
Tabla Anova
Aquí se indican:
Ejercicio 30
Vuelva al ejercicio 22, en el que se emplearon los datos siguientes para determinar si el
precio de una impresora estaba relacionado con su velocidad para imprimir un texto (PC
World, febrero 2003).

#Ejercicio 30
#Vuelva al ejercicio 22, en el que se emplearon los datos siguientes para
#determinar si el precio de una impresora estaba relacionado con su velocidad
#para imprimir un texto (PC World, febrero 2003).
x = c(12,10,12.2,10.3,11.7,17.8,16.1,11.8,19.8,28.2) #Velocidad (Variable
independiente)
y = c(199,499,299,299,399,1850,1000,1387,2089,2200) #Precio (Variable
dependiente)
¿Indican las evidencias que haya una relación significante entre velocidad de impresión y
precio? Realice la prueba estadística apropiada y dé su conclusión. Use α = 0.05.
#¿Indican las evidencias que haya una relacion significante entre velocidad de
impresion y #precio? Realice la prueba estadistica apropiada y de su conclusion. Use
a(alfa) = 0.05
reg = lm(y~x)
summary(reg)

Se puede afirmar que, si existe una relación significante entre las dos variables, puesto que al
realizar la prueba estadística F se obtuvo un p-value de 0.002303. El mismo que es menor al
valor α (nivel de significancia):
0.002303 ≤ 0.05
Por tanto, podemos concluir que se rechaza la hipótesis nula (H0) y se acepta la hipótesis
alternativa (H1).
Ejercicio 31

En el ejercicio 20 con los datos sobre x - precio ($) y y - evaluación general de 10 televisores
de plasma, de 42 pulgadas probadas por Consumer Reports se obtuvo la ecuación de
regresión estimada ý=12.0169 + 0.0127x. Con estos datos se obtuvieron SCE = 540.04 y
STC =982.40. Use la prueba F para determinar si el precio de los televisores de plasma, de
42 pulgadas y la evaluación general están relacionados. Use α = 0.05.
xi=c(2800,2800,2700,3500,3300,2000,4000,3000,2500,3000)#precio
yi=c(62,53,44,50,54,39,66,55,34,39)#puntuacion
.
.
.
reg=lm(yi~xi)
summary(reg)
ECM=SCE/(10-2) #Error cuadratico medio
#Prueba F
CMR = SCR/1
F= CMR/ECM
qf(0.05,1,8, lower.tail=FALSE)
anova=anova(reg)
Prueba F= 6.5529
Alfa de F=5.317655

Prueba F > Alfa de F


6.5529 > 5.317655

En este caso se rechaza la hipótesis nula y se acepta la hipótesis alternativa ya que se cumple con
la regla.

También podría gustarte