Está en la página 1de 10

PROGRAMA DE ESTUDIOS

MAESTRIA EN INFRAESTRUCTURA E INGENIERIA CIVIL

CURSO:

DD118 – ESTADÍSTICA BÁSICA

CASO PRACTICO

PRESENTADO A:

DESARROLLADO POR: JUAN CLIMACO CCACCRO LAPA

LIMA – PERU
2022
Tabla de contenido
Exposición del Caso ....................................................................................................................... 3
Respuestas .................................................................................................................................... 4
Bibliografía .................................................................................................................................. 10

2
EXPOSICIÓN DEL CASO
En el fichero coches.xlsx se brindan las características de 193 coches clásicos de diversas
marcas según los datos publicados en el Anuario Automovilístico de Ward de 1985 con el
precio ajustado a la inflación en 2019.

Instrucciones para el desarrollo de la actividad

A partir de los datos que se brindan responda las siguientes cuestiones:

Investigue que marca de coche es la más cara. Justifique la respuesta.


Calcule un intervalo de confianza para la media del precio ajustado a la inflación
para cada marca.
Contraste la hipótesis, para un nivel de significación estadística del 99%, de que
el precio de los Mazda y los Subaru son distintos.
Contraste la hipótesis, para un nivel de significación del 95%, de que el precio
de los coches diésel de Mercedes-Benz es superior al de los coches de gasolina
de la propia marca.
Desarrolle un modelo de regresión lineal que permita estimar la variable
precio_inflacion a partir de las variables capacidad_motor, caballos_potencia,
longitud y peso. ¿Cuál de las variables analizadas explica mejor el precio?

Aclaración: Para realizar los cálculos solicitados se sugiere al alumnado que utilice algún
programa de cómputo. El propio Excel tiene una herramienta de análisis de datos que puede
ser empleada, pero podría utilizarse SPSS, SAS, R, etc.

Aunque se emplee un software de análisis estadístico para realizar los cálculos, la entrega se
realizará mediante un informe de resultados. En la respuesta a cada cuestión el/la alumno/a
deberá justificar teóricamente el método de solución elegido y posteriormente los cálculos
efectuados.

3
RESPUESTAS
PREGUNTA 1. Investigue que marca de coche es la más cara. Justifique la respuesta.
RESPUESTA P1.
Según los datos facilitados en el Excel, la respuesta de la marca del coche más cara es
jaguar, con precio promedio de $ 85,506.

PRECIO PROMEDIO DE MARCA DE COCHES


$85,506
$90,000
$83,151 $77,599
$80,000
$70,000 $64,546
$60,000
PRECIO

$50,000 $44,135 $44,639


$38,277 $37,621
$40,000
$30,000 $22,834 $19,680
$20,000
$10,000
$-
isuzu
jaguar

mercury

volvo
audi

dodge

plymouth
alfa-romero

chevrolet

mazda

porsche
honda

mercedes-benz

subaru
nissan
peugot

saab

toyota
bmw

mitsubishi

volkswagen
MARCA DE COCHES

Se detalla en la siguiente, se ordena de acuerdo con el precio promedio de cada marca de coche
de mayor a menor.
MARCA PRECIO PROMEDIO
jaguar $ 85,506.00
mercedes-benz $ 83,150.63
porsche $ 77,599.00
bmw $ 64,546.13
volvo $ 44,638.82
audi $ 44,135.00
mercury $ 40,783.00
alfa-romero $ 38,300.67
peugot $ 38,277.45
saab $ 37,620.83
nissan $ 25,739.83
volkswagen $ 24,904.33
toyota $ 24,430.41
mazda $ 24,346.83
mitsubishi $ 22,833.77
isuzu $ 22,035.00
subaru $ 21,107.75
honda $ 20,226.46
plymouth $ 19,679.71
dodge $ 19,251.50
chevrolet $ 14,844.67

4
PREGUNTA 2. Calcule un intervalo de confianza para la media del precio ajustado a la inflación para cada marca
RESPUESTA P2.
Continuando con los datos proporcionados, se calcula el intervalo de confianza para la media del precio ajustado a la inflación para cada marca.
Se estima a un nivel de confianza de 95% y un nivel de significancia de 5% como se muestra en la tabla.

Formula de desviación estándar:


FABRICANTE PRECIO n Desviación Nivel de Alfa Z Percentil T ó Z Límite Inferior de Limite Superior de
PROMEDIO Estándar (S) confianza T(α/2,n-1) ó Z(1- α/2) confianza (1- α=0.95) confianza (1- α=0.95)
alfa-romero 38.300,67 3 4.287,40 95% 5% 1,96 4,3027 27.650,17 48.951,17
audi 41.161,60 6 8.531,68 95% 5% 1,96 2,5706 35.181,55 53.088,45
bmw 60.747,00 8 22.893,32 95% 5% 1,96 2,3646 45.406,83 83.685,42
chevrolet 14.844,67 3 1.864,70 95% 5% 1,96 4,3027 10.212,50 19.476,83
dodge 19.251,50 8 5.808,09 95% 5% 1,96 2,3646 14.395,82 24.107,18
honda 20.226,46 13 5.094,99 95% 5% 1,96 2,1788 17.147,59 23.305,33
isuzu 22.035,00 2 7.450,08 95% 5% 1,96 2,0000 11.499,00 32.571,00
jaguar 85.506,00 3 5.059,71 95% 5% 1,96 4,3027 72.936,99 98.075,01
mazda 24.346,83 12 10.792,64 95% 5% 1,96 2,2010 17.489,52 31.204,15
mercedes-benz 83.150,63 8 16.778,60 95% 5% 1,96 2,3646 69.123,37 97.177,88
mercury 40.783,00 1 - 95% 5% 1,96 0,0000 - -
mitsubishi 22.833,77 13 7.520,07 95% 5% 1,96 2,1788 18.289,44 27.378,10
nissan 25.739,83 18 11.064,80 95% 5% 1,96 2,1098 20.237,44 31.242,23
peugot 38.277,45 11 5.552,19 95% 5% 1,96 2,2281 34.547,44 42.007,47
plymouth 19.679,71 7 5.919,95 95% 5% 1,96 2,4469 14.204,67 25.154,76
porsche 77.599,00 4 16.134,52 95% 5% 1,96 3,1824 51.925,38 103.272,62
saab 37.620,83 6 7.069,63 95% 5% 1,96 2,5706 30.201,71 45.039,96
subaru 21.107,75 12 4.794,73 95% 5% 1,96 2,201 18.061,33 24.154,17
toyota 24.430,41 32 7.920,37 95% 5% 1,96 1,9600 21.686,14 27.174,68
volkswagen 24.904,33 12 5.383,75 95% 5% 1,96 2,2010 21.483,66 28.325,01
volvo 44.638,82 11 8.191,36 95% 5% 1,96 2,2281 39.135,78 50.141,85
PREGUNTA 3. Contraste la hipótesis, para un nivel de significación estadística del 99%,
de que el precio de los Mazda y los Subaru son distintos.
RESPUESTA P3.

3.1. Se plantea la hipótesis de nula y alternativa.


Ho : µx ≠ µy El precio de los vehículos Mazda es diferente a los de Subaru

Ha : µx = µy El precio de los vehículos Mazda es igual a los de Subaru

3.2. Se calcula la media y la desviación a ambas muestras que tienen el mismo número
de elementos y que son independientes:

292.162 1.281.291.468
µx = σx = √
12 12 − 1

µx = 24.346,83 σx = 10.792,64

253.293 5.599.328.745
µy = σy = √
12 12 − 1

µy = 21.107,75 σy = 4.794,63

3.3. Se determina el valor de T(α/2; n-1) ya que son muestras independientes n = 12 y m


= 12 y tienen el mismo número de elementos, se tiene n + m = 12 + 12 = 24 – 2 = 22
grados de libertad, el valor de T(0,005;22) = 2,819
Como la prueba es bilateral, entonces el intervalo será desde -2,819 hasta +2,819, dentro
de la curva de distribución T de student.

Se determina la T mediante las diferencias de medias y luego se divide entre el error


estándar.

6
3.4. Continuamos con cálculo estadístico:

µx − µy
T(prueba) =
2 2
√((n − 1)Sx + (m − 1)Sy ) ∗ √1 + 1
n+m−2 n m

24.326,83 − 21.107,75
T(prueba) =
2 2
√((12 − 1) ∗ (10.792,64) + (12 − 1) ∗ (4.794,63) ) ∗ √ 1 + 1
12 + 12 − 2 12 12

T(prueba) = 0,9503
3.5. DECISIÓN: Como el valor de T (prueba) es menor a T (tabla), entonces se afirma
que la hipótesis nula es aceptada porque cae en la zona de aceptación bajo la curva de T
de Student.

PREGUNTA 4. Contraste la hipótesis, para un nivel de significación del 95%, de que


el precio de los coches diésel de Mercedes-Benz es superior al de los coches de gasolina
de la propia marca.
RESPUESTA P4.
4.1. Se plantea la hipótesis de nula y alternativa.
Ho : µx > µy El precio de los vehículos Mercedes Benz a diesel es mayor a los de
gasolina.
Ha : µx ≤ µy El precio de los vehículos Mercedes Benz a diesel es menor a los de
gasolina.
4.2. Se calcula la media y la desviación a ambas muestras que tienen el mismo número
de elementos y que son independientes. Prueba unilateral a la derecha, establecemos los
parámetros para las variables y hallamos la media y la desviación estándar.

384.528 1510.003.996
µx = σx = √
4 4

µx = 96.132 σx = 13.038,46

280.677 112.516.223
µy = σy = √
4 4

µy = 70.169,25 σy = 6.124,15

7
4.3. Se determina el valor de T(α/2; n-1) ya que son muestras independientes n = 4 y m =
4 y tienen el mismo número de elementos, se tiene n + m = 4 + 4 = 8 – 2 = 6 grados de
libertad, el valor de T(0,05;6) = 3,182

La prueba es unilateral a la derecha desde -∞ hasta +3,182 dentro de la curva de


distribución T de student.
4.4. Determinamos t calculada mediante las diferencias medias y luego se divide entre
el error estándar para prueba unilateral derecha.
Continuamos con cálculo estadístico:

µx − µy
T(prueba) =
2 2
√((n − 1)Sx + (m − 1)Sy ) ∗ √1 + 1
n+m−2 n m

96.132 − 70.169,25
T(prueba) =
2 2
√((4 − 1) ∗ (13.038,46) + (4 − 1) ∗ (6.124,15) ) ∗ √1 + 1
4+4−2 4 4

T(prueba) = 3,605
3.5. DECISIÓN: Lo acertado es rechazar la hipótesis nula de que los vehículos de la
marca Mercedes Benz a diésel es superior a los de gasolina, ya que la prueba unilateral a
la derecha nos indica que la T estimada es mayor al T crítico y aceptar la hipótesis
alternativa 3.182<3.605

PREGUNTA 5. Desarrolle un modelo de regresión lineal que permita estimar la variable


precio inflación a partir de las variables capacidad_motor, caballos_potencia, longitud y
peso. ¿Cuál de las variables analizadas explica mejor el precio?
RESPUESTA P5.

8
La regresión multilineal obtenida con la herramienta de análisis de datos de Excel, facilita
los siguientes resultados. La variable dependiente es el precio-inflación, las variables
independientes fueron la longitud, el peso, la capacidad-motor y los caballos potencia.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.879398532
Coeficiente de determinación R^2 0.773341779
R^2 ajustado 0.768519263
Error típico 9617.803116
Observaciones 193

El valor de R^2 ajustado, es el más importante, ya que nos indica el porcentaje en el cual
el modelo multilineal predice el comportamiento de la variable dependiente, en este caso
es del 76.85%, la cual es una buena predicción, este valor debe ser lo más cercano posible
a 100%. Otro parámetro importante es el valor crítico de F
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de F Valor crítico
libertad cuadrados cuadrados de F
Regresión 4 59334817465 14833704366 160.3606672 1.8722E-59
Residuos 188 17390401714 92502136.77
Total 192 76725219179

Si es menor a 0.05, que es la significancia; entonces el análisis obtenido es relevante.


Coeficiente S Error típico Estadístico t probabilidad
Intercepción -24993.511 16963.60696 -1.473360649 0.142326157
Longitud -64.07125 123.5154997 -0.518730445 0.604558767
Peso 21.498361 3.682070873 5.838660299 2.27272E-08
Capacidad motor -2565.6169 2246.455409 -1.142073359 0.254876012
Caballos potencia 215.117081 29.43367932 7.308535177 7.50205E-12

Por último, tenemos los coeficientes de las variables, y si estos son significativos para el
análisis. Para que sean significativos para el análisis, el valor de la probabilidad debe ser
menor a 0.05, en este caso las variables que son significativamente representativas en el
modelo son la capacidad motora y los caballos potencia. La ecuación de regresión línea,
con las variables que explican mejor al precio:
precioinflación =24.5 peso+215.11 caballospotencia −24993.511

Estos coeficientes implican que por cada kilogramo que pesa el automóvil, el precio

aumenta en $24.5 y por cada caballo de fuerza que alcanza el auto el precio aumenta

$215.11

9
Bibliografía
FUNIBER. DD118 Estadística Básica, Máster de Infraestructura e Ingeniería Civil.
2021
Kazmier. Leonard J. (1998). Estadística aplicada a la administración y a la
economía. Mc Graw Hill. New York

Gay L. Devore. Probabilidad y estadística para ingeniería y


ciencias. Thomson Learning. 5ta. Edición2001. 325 pp Apéndice. Tabla
de Valores críticos para la distribución T-Student

https://www.geogebra.org/calculator

10

También podría gustarte