Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Caso Practico
Caso Practico
GARCÍA GARCÍA
CASO PRÁCTICO I
CASO DE ESTUDIO
Tras la utilización de la fórmula MAX en Excel se ha determinado que la marca de vehículo más
cara en el listado de 193 coches clásicos es la marca Mercedes Benz, con un motor a gasolina, dos
puertas, 8 cilindros, que ofrece 184 caballos de potencia y una aceleración de 4500 revoluciones
por minuto con motor frontal y un precio ajustado a la inflación de 112.195 unidades monetarias
respectivamente.
Calcule un intervalo de confianza para la media del precio ajustado a la inflación para
cada marca.
Aunque dentro de las instrucciones no se indican el nivel de significancia (α), trabajaremos con el
más común de ellos que es el del 5% y teniendo en cuenta las distintos valores que puede tomar
(n) de acuerdo a las marcas de automóviles.
253.293
X= 5599328745
12 𝜎=√
12 − 1
X= 21.107.75
𝜎 = 4.794.63
Ya que la prueba es bilateral entonces el intervalo será desde 2.819 hasta 2.819 positivo,
dentro de la curva de distribución T de Student, procedemos a encontrar la T calculada
mediante las diferencias de medias y luego lo dividimos entre el error estándar.
d) Cálculo estadístico
𝜇𝑥 – 𝜇𝑦
𝑇 (Prueba) = (𝑚 − 1) 𝑆𝑦2 √1 1
√ (n− 1) 𝑆𝑥2 + +
m+n-2 n m
12 + 12 – 2 12 12
T= 0.9503
Contraste la hipótesis, para un nivel de significación del 95%, de que el precio de los
coches diésel de Mercedes-Benz es superior al de los coches de gasolina de la propia marca.
𝐻0: 𝜇𝑋 > 𝜇𝑌 El precio de los vehículos Mercedes Benz a diésel es superior a los de gasolina
𝐻𝑎: 𝜇𝑋 ≤ 𝜇𝑌 El precio de los vehículos Mercedes Benz a diésel es menor igual a los de gasolina
4.2 Hallamos la media y la desviación a ambas muestras que son independientes y tiene el
mismo número de elementos.
Prueba unilateral a la derecha, establecemos los parámetros para las variables y hallamos la
media y la desviación estándar.
𝜇 384.528 510.003.996
𝑥= 4 𝜎𝑥√
4
𝜇𝑥= 96.132
𝜎𝑥 = 13.038.46
𝜇 280.677 112.516.223
𝑦= 4 𝜎𝑦√
4
𝜇𝑥= 70.169.5
𝜎𝑦 = 6.124.15
T (Prueba) = 3.605
Decisión.- Se rechaza la hipótesis nula de que los vehículos de la marca Mercedes Benz a diésel
ya que es superior a los de gasolina, y la prueba unilateral a la derecha nos muestra, que el T
estimado es mayor a T crítico o de tabla y aceptar la hipótesis alternativa.
Para poder resolver este literal, observamos que la variable independiente (precio
inflación) y los predictores (capacidad del motor, caballos de potencia, longitud y peso).
Ya identificadas las variables y digitadas en el software, arroja como resultado los que se
muestran a continuación:
Variables entradas/eliminadas
Modelo Variables entradas Variables eliminadas Método
1
Peso, capacidad, motor, caballos de Introducir
potencia, longitud
ANOVA
Modelo Suma de cuadrados g.l. Media cuadrática F Sig.
1 Regresión 59334817465,247 4 14833704366,312 160,361 0,000
Residuo 17390401713,613 188 92502136,775
Total 76725219178,860 192
a. Variable dependiente: Precio inflación
b. Predictores: (constante), peso, capacidad del motor, caballos de potencia, longitud
Coeficientes
Coeficientes Coeficientes Estadísticas
Model no estandarizados t Sig. de
o estandarizado colinealida
s d
B Dev. Error Beta Tolerancia VIF
1 (Constante) -24993,511 16963,607 - 0,14
1,473 2
Capacidad de -2565,617 2246,455 -0,4 - 0,25 0,96 1,042
motor 1,142 5
Caballos de 215,117 29,434 408 7,309 0 0,386 2,591
potencia
Longitud -64,071 123,515 -0,04 - 0,60 0,203 4,931
0,519 5
Peso 21,498 3,682 -0,566 5,839 0 0,128 7,807
a. Variable dependiente: Precio inflación
De este modo la ecuación que se requiere estimar por medio del modelo de regresión
lineal múltiple tiene la siguiente forma funcional:
𝛽0 = 𝑅𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑒 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡𝑜
8
CASO PRÁCTICO
Es necesario elegir como medida de bondad de ajuste al R cuadrado ajustado (0.769) sobre el
R cuadrado, debido a que este; tiene un comportamiento optimista al ajuste de la regresión
lineal, es decir, a medida que se agreguen más variables explicativas al modelo, el estadístico
R cuadrado también se incrementa, sin importar las variables explicativas adicionales tengan
algún grado de correlación con la variable dependiente. En tal virtud, el R cuadrado ajustado
corrige la estimación excesiva producida por el R cuadrado.
Independencia. Para verificar que los errores son independientes entre observaciones, se aplica
el test Durbin-Watson. Este test puede variar entre 0 y 4, donde un valor cercano a 2 significa
que los residuos no están correlacionados, por lo tanto, un valor superior a 2 indica una
correlación positiva entre errores subyacentes, mientras que un valor menos a 2 representa una
correlación negativa entre errores. Revisando la información desplegada en la tabla se observa
que el valor del estadístico Durbin Watson es cercano a 2, información confirmada con el p-
valor de 0.735.
9
CASO PRÁCTICO
Dicho estadístico, indica si un predictor tiene una fuerte relación lineal con otro predictor. La
literatura especializada, considera que, si el valor del VIF es mayor a 10, probablemente exista
un problema de multicolinealidad, asimismo considerando el promedio de este indicador, si el
mismo es mayor que 1, la multicolinealidad posiblemente genera un problema de sesgo en el
modelo de regresión.
Una vez revisado la información de la tabla, se evidencia que tanto los valores VIF como del
estadístico de tolerancia cumple los parámetros establecidos, por lo cual concluye que no existe
multicolinealidad.
Residuos: Para finalizar con el análisis de los supuestos subyacentes al modelo de regresión
lineal múltiple, se deberá considerar el supuesto de la distribución normal de los residuos
(errores), Se deberá graficar los residuos estandarizados (en el eje y) versus los valores
ajustados (en el eje x), con esto se determinará si el supuesto de errores aleatorios y de
homocedasticidad se cumple. En el gráfico se puede observar la dispersión de los puntos
distribuidos uniformemente alrededor del cero, siendo esta una señal de que tanto los supuestos
de linealidad (la relación existe entre la variable dependiente e independiente son lineales) y
homocedasticidad (varianza de los errores constantes) se cumple.
10
CASO PRÁCTICO
Otro gráfico que nos permite visualizar y examinar si una variable tiene una distribución
normal, es el gráfico P-P, el cual grafica los valores acumulados de la variable versus la
probabilidad acumulada de la distribución normal. En este sentido, cada valor es contrastado
con el valor esperado de que el resultado sea una distribución normal.
En el caso del presente caso práctico, se analiza los residuos observados y se los grafica por
medio del diagrama P-P.
En esencial si los errores tienen una distribución normal, los mismos formaran una línea
diagonal recta, misma que se evidencia en el gráfico, por lo tanto, los errores tienen una
distribución normal.
11
CASO PRÁCTICO
Por otro lado, a pesar de que las variables, capacidad motor y longitud fueron estadísticamente
significativas, tuvieron un menor impacto en relación a las dos variables antes mencionadas.
Bibliografía:
12