Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tabla 1. Gasto semanales en publicidad y la venta que cada uno produce.
Grafica 1. Grafica de dispersion de la tabla 1, costo vs ventas.
El gráfico indica una relación lineal positiva entre el costo de la publicidad y las
ventas. La magnitud de la relación esta indicada por el valor del coeficiente de
correlación lineal de Pearson, que para este caso es:
0.6348373
Ho: rho = 0
Ha: rho diferente de 0, dos colas.
De este valor se concluye que existe suficiente evidencia estadística para afirmar
con un 95% de confianza que la relación entre el costo de la publicidad y las
ventas en la población no es nula. Esto nos indica que es coherente buscar un
modelo de regresión lineal que modele la relación entre el costo de la publicidad y
las ventas.
b0 = y − b1x
B1=3.220812 B0=343.7056
ŷ 0 = 343.7056 + 3.2208x
Utilizando este resultado se procede a calcular la varianza para cada uno de los
betas obtenidos, estas variantes se calculan siguiendo las siguientes formulas.
( )
ˆ
v ar B1 = σ2
SXX
ˆ( )
v ar Bo = σ 2 [ 1n + x2
SXX
]
Se calculan también los intervalos de confianza para cada uno de los betas
siguiendo las siguientes formulas:
1 x2
B̂ o±t α ,n−2 σ √[ n
+ SXX
]
2
σ
B̂ 1 ± t α ,n−2 √SXX
2
Como ninguno de los dos intervalos obtenidos incluye al 0, se puede decir que en
ningún momento b1 o bo van a ser 0 en la población.
Y finalmente se realiza la prueba de hipótesis para cada uno de los betas, estas
pruebas de hipótesis se realizarán con un nivel de significancia del 5% siguiendo
la siguiente formula, que es igual para los dos betas.
Ho: B̂ = B
Ha: B̂ =/ B
ˆ
B−B
t= MS
√ SXY Y
Ho: B̂ o = 0
Ha: B̂ o =/ 0
t=7.677796
Valor p=8.423696e-06
Ho: B̂ 1 = 0
Ha: B̂ 1≠0
t=2.598256
Valor p=0.01328545
[1231.557 ≤ σ 2 ≤ 7769.146]
Este intervalo nos permite asegurar con un 95% que la varianza del modelo se
encuentra entre 1231.557 y 7769.146. Es evidente que este intervalo no contiene
a 0, es por esto quese afirma con el mismo nivel de confianza que la varianza en
ningun momento va a ser nula.
ŷ 0 = 456.434
Esto quiere decir que para un costo de publicidad de 35, el valor medio de ventas
esperado seria 456.434, si embargo este puede puede oscilar entre los valores
dados por el intervalo de confiaza hallado para este mismo valor, esto ultimo se
asegura con un 95% de confianza.
Se procede a calcular un estimado puntual para el valor de la respuesta y o (ventas
promedio esperadas), dado un valor de x ( x0 ) ( costo de publicidad), y un intervalo
de predicción para este estimado, esto se hace siguiendo las siguientes formulas:
ŷ 0 = B̂ 0 + B̂ 1 x0
2
1 (x0 −x)
ŷ 0 ± t α ,n−2 s √[ 1 + n
+ Sxx
]
2
ŷ 0 = 343.7056 + 3.2208 * 28
ŷ 0 = 433.8883
Esto quiere decir que para un costo de publicidad de 35, el estimado de ventas
seria de 433.8883, sin embargo este valor puede oscilar enter los valores dados
por el intervalo de confiaza hallado para este mismo valor, esto ultimo se asegura
con un 95% de confianza.
S CT = S CR + S CE
n n n
S CT = ∑ (yi − y i)2 = ∑ (yi
ˆ − y i)2 + ∑ (yi − ŷ i)2
i=1 i=1 i=1
Para este eje rcicio en particular tenemos que:
S CT = 42256.25
S CE = 25226.205584
S CR = 17030.044416
Los datos obtenidos evidencian que la Suma de los cuadrados total (SCT) esta
dada por la suma de las SCR y la SCE, sin embargo, se esperaba quea la SCR
fuera mayor a la SCE, es decir que la varianza explicada por el modelo fuera
mayor a la que este no explica, sin embargo esto no se cumple, de hecho es
mayor la varianza que el modelo no explica a la que si explica, esto es una alertal
en cuanto al modelo en cuestión pues indica que la regresion obtenida explica
menos de lo que debería.
Ho: B̂ o = 0
Ha: B̂ o =/ 0
f = 6.750934
v alor p = 0.0265709
De esto se concluye que se rechaza la hipotesis inicial con confiaza del 90%,
conclusion que coincide con la encontrada con la prueba de hipotesis hecha
previamente. Esto indica que eneste modelo la varianza tiene significancia para la
poblacion.
Modelo Regresíon Lineal 2
Tabla 2. Temperatura para la que sirve e producto y el precio del modelo respectivo.
Ho: rho = 0
Ha: rho diferente de 0, dos colas.
De este valor se concluye que existe suficiente evidencia estadística para afirmar
con un 95% de confianza que la relación entre la temperatura y el costo en la
población no es nula. Esto nos indica que es coherente buscar un modelo de
regresión lineal que modele la relación entre la temperatura y el costo.
b0 = y − b1x
B 1 = − 5.277197 B0 = 359.2667
ŷ 0 = 359.2667 − 5.277197x
Utilizando este resultado se procede a calcular la varianza para cada uno de los
betas obtenidos, estas variantes se calculan siguiendo las siguientes formulas.
( )
ˆ
v ar B1 = σ2
SXX
ˆ
v ar Bo ( )
= σ 2 [ 1n + x2
SXX
]
Se calculan también los intervalos de confianza para cada uno de los betas
siguiendo las siguientes formulas:
1 x2
B̂ o±t α ,n−2 σ √[ n
+ SXX
]
2
σ
B̂ 1 ± t α ,n−2 √SXX
2
Como ninguno de los dos intervalos obtenidos incluye al 0, se puede decir que en
ningún momento b1 o bo van a ser 0 en la población.
Y finalmente se realiza la prueba de hipótesis para cada uno de los betas, estas
pruebas de hipótesis se realizarán con un nivel de significancia del 5% siguiendo
la siguiente formula, que es igual para los dos betas.
Ho: B̂ = B
Ha: B̂ =/ B
ˆ
B−B
t= MS
√ SXY Y
En esta fórmula, el término de abajo corresponde al error estándar de cada uno de
los betas, término que ya fue calculado.
t=17.90575
Valor p=1.201471e-08
Ho: B̂ 1 = 0
Ha: B̂ 1≠0
t=-6.082496
Valor p=9.154785e-05
[680.9254 ≤ σ 2 ≤ 4796.747]
Este intervalo nos permite asegurar con un 95% que la varianza del modelo se
encuentra entre 680.9254 y 4796.747. Es evidente que este intervalo no contiene
a 0, es por esto quese afirma con el mismo nivel de confianza que la varianza en
ningun momento va a ser nula.
Se procede a calcular un estimado puntual para el valor de la respuesta y o (ventas
promedio esperadas), dado un valor de x ( x0 ) ( costo de publicidad), y un intervalo
de predicción para este estimado, esto se hace siguiendo las siguientes formulas:
ŷ 0 = B̂ 0 + B̂ 1 x0
2
1 (x0 −x)
ŷ 0 ± t α ,n−2 s √[ 1 + n
+ Sxx
]
2
ŷ 0 = 259
Esto quiere decir que para un costo de publicidad de 19, el estimado de ventas
seria de 259 , sin embargo este valor puede oscilar enter los valores dados por el
intervalo de confiaza hallado para este mismo valor, esto ultimo se asegura con un
95% de confianza.
S CT = S CR + S CE
n n n
S CT = ∑ (yi − y i)2 = ∑ (yi
ˆ − y i)2 + ∑ (yi − ŷ i)2
i=1 i=1 i=1
S CE = 12953, 08577
S CR = 53246.91423
Los datos obtenidos evidencian que la Suma de los cuadrados total (SCT) esta
dada por la suma de las SCR y la SCE, ademas como era de esperarse la SCR es
mayor a la SCE, es decir que la varianza explicada por el modelo es mayor a la
que este no explica, esto es una buena señal en cuanto al modelo en cuestión.
Ho: B̂ o = 0
Ha: B̂ o =/ 0
f = 36.99676
v alor p = 0.0001830957
De esto se concluye que se rechaza la hipotesis inicial con confiaza del 99%,
conclusion que coincide con la encontrada con la prueba de hipotesis hecha
previamente. Esto indica que en este modelo la varianza tiene significancia para la
poblacion.
ˆ
P rate = 83.0755 + 5.8611mrate
ˆ (3.5) = 103.5894
P rate
Esta estimación no tiene sentido debido a que los datos de la base de datos para
aportes de entre 4 son todos cercanos a 100, razon por la cual se esperaria que el
valor obtenido estuviera por debajo de 100 o tal vez llegara a ser qoo pero no que
sobrepasara a la tasa de participación cuando el aporte es mayor.
Base de datos sleep75
sleep = 3586.37695 − 0.15075totwork
x = 0.15075(120)
x = 18, 09
Es decir que el sueño disminuira en 18,09 minutos, no es una cifra grande pero
aun asi es un efecto significativo el tiempo de sueño para una persona.
Base de datos BWGHT.RAW
bwght = 119.77190 − 0.51377cigs
La variabilidad que tiene el modelo es 13060
Con un Alpha del 1% ser rechaza B0, esto quiere decir que existe una relación
estadística entre el peso de un bebé al nacer y el número de cigarrillos que una
madre fuma.
Respuestas: