Está en la página 1de 13

Informe Estadística Inferencial Kuiper

Realizado Por:

Deivy Johan Gonzalez Arevalo

Hugo Garzon

Presentado a: Efrain Moreno Sarmiento

Politécnico Grancolobiano

31 de agosto de 2018
Introducción

En este documento se estudia las diferentes características que se toman en


cuenta a la hora de evaluar el precio de un auto tales como kilometraje, marca,
modelo, tamaño del motor, estilo interior y control de crucero. El diferente tipo
de variables a considerar según un estudio realizado por Kelly Blue Book para
más de ochocientos mil autos elaborados por la General Motors en el año
2005.

Con base a lo evaluado se consideraran las variables para determinar por


ejemplo que le pasa al auto y a su precio mientras mas kilometros recorre, de
acuerdo a esto nacen algunas preguntas, se emplearan herramientas de
medicion como la regresion simple y multiple en donde podremos determinar
que pasa con el precio, que pasa si dos vehiculos tienen el mismo precio pero
su kilometraje es diferente.

Objetivo

Lograr identificar las variables e identificar que tipo de variable se va a utilizar


para cada escenario, en este caso se identifica que la variable a trabajar sera la
cuantitativa continua, dentro del objetivo tambien se buscara lograr valorar la
unidad de medida dentro de cada caso, nombres de las variables en el caso, el
tipo de poblacion que se manejara en el escenario estipulado, escala de
medida entre otros resultados de igual importancia.

Metodología

Las siguientes son las variables que consideramos importantes al momento de


responder la interrogante impuesta la cual es ¿Cuánto es el valor de su auto?

Para ello tomamos en cuenta una cantidad de datos proporcionados por unas
tablas provistas por Kelly Blue Book en el año 2005 para una muestra de más
de ochocientos mil autos elaborados por la General Motors tales como :
Análisis descriptivo

 Precio: Es el valor minorista sugerido por General Motors, también es el


nombre de la variable a evaluar

Precio
   
21343.143
Media 8
348.61187
Error típico 9
Mediana 18024.995
10921.945
Moda 4
Desviación estándar 9884.8528
97710314.
Varianza de la muestra 9
3.2911486
Curtosis 2
1.5757947
Coeficiente de asimetría 4
62116.535
Rango 8
Mínimo 8638.9309
70755.466
Máximo 7
17159887.
Suma 6
Cuenta 804

Nota: Para corregir se debe tener en cuenta la descripción vista en clase


y aplicarla, no es necesario validar la fórmula que se está dando para
encontrar la media o por ejemplo la desviación estándar, para la
descripción es importante dar la unidad de medida para la variable
ejemplo: el precio de un auto esta dado por la unidad de medida
numérica 21343.1438 según la base de datos.

 Media: en el precio de los vehiculos identificamos que la media


esta en promedio de 21343.1438 tomando todos los datos
(precio) sumándolos y dividiéndolos por la misma cantidad de
datos.
 Error típico: el error típico dentro de la muestra está dada por
348.611879 se calcula dividiendo la desviación estándar por la
raíz cuadrada de la muestra. (error tipico es igual a la desviación
estándar).
 Mediana: la media de la muestra entre los 804 datos esta en
18024.995 según la muestra de menor a mayor.
 Moda: en la moda identificamos que el valor que mas veces se
repite es de 10921.9454 en 2 veces.
 Desviacion estandar: la desviacion estandar la podemos
determinar sacando la raiz cuadrada de la varianza muestral para
nuestra variable de precio es 9884.8528
 Varianza de la muestra: la variancia de la muestra esta dada por
97710314.9
 Curtosis: la curtosis es de 3.29114862 lo que quiere decir que
esta por encima es leptocurtica. Cuando esta por debajo es
platicurtica
 Coeficiente de asimetría: el coeficiente de asimetría esta dado por
1.57579474
 Rango: el rango entre el valor máximo y el valor mínimo esta
dado por 62116.5358
 Minimo: valor o precio minimo dentro de la base de datos de un
vehiculo 8638.93.09
 Maximo: valor o precio maximo dentro de la base de datos de un
vehiculo 70755.4667
 Suma: suma todos los 804 datos de la base de datos en la
variable de precio para un total de 17159887.6
 Cuenta: nos proporciona el numero exacto dentro de la base de
datos a manejar con el precio para este caso 804

 Kilometraje: Cantidad de millas que el auto ha sido conducido

Kilometraje
   
19831.934
Media 1
289.06190
Error típico 9
Mediana 20913.5
Moda 18910
8196.3197
Desviación estándar 1
67179656.
Varianza de la muestra 7
Curtosis 0.1839093
Coeficiente de asimetría -0.1312466
Rango 50121
Mínimo 266
Máximo 50387
Suma 15944875
Cuenta 804

 Media: la cantidad de millas que el promedio cada vehiculo esta


recorriendo es de 19831.9341 unidad numerica.
 Error típico: el error típico dentro de la muestra está dada por
289.061909 debemos tener encuenta la desviacion estandar ya
que dicha variable hace parte del error tipico
 Mediana: la media de la muestra entre los 804 datos esta en
20913.5 según la muestra de menor a mayor.
 Moda: en la moda identificamos que el valor que mas veces se
repite es de18910 para un total de 3.
 Desviacion estandar: la desviacion estandar la podemos
determinar sacando la raiz cuadrada de la varianza muestral para
nuestra variable de kilometros es 8196.31971
 Varianza de la muestra: la variancia de la muestra esta dada por
67179656.7
 Curtosis: la curtosis es de 0.1839093 lo que quiere decir que esta
por encima es leptocurtica.
 Coeficiente de asimetría: el coeficiente de asimetría esta dado por
-0.1312466
 Rango: el rango entre el valor máximo y el valor mínimo esta
dado por 50121
 Minimo: el kilometraje minimo dentro de la base de datos de un
vehiculo 266
 Maximo: el kilometraje maximo dentro de la base de datos de un
vehiculo 50387
 Suma: suma todos los 804 datos de la base de datos en la
variable de kilometros para un total de 15944875
 Cuenta: nos proporciona el numero exacto dentro de la base de
datos a manejar con el precio para este caso 804

 Cilindro: cantidad de cilindros en el motor

Cilindraje
   
Media 5.26865672
Error típico 0.04893445
Mediana 6
Moda 4
Desviación estándar 1.38753127
Varianza de la muestra 1.92524303
-
Curtosis 0.75180984
Coeficiente de asimetría 0.63297427
Rango 4
Mínimo 4
Máximo 8
Suma 4236
Cuenta 804

 Media: la cantidad de cilindros en el motors esta dado por


5.26865672 unidad numerica
 Error típico: el error típico dentro de la muestra está dada por
0.04893445 debemos tener encuenta la desviacion estandar ya
que dicha variable hace parte del error tipico
 Mediana: la media de la muestra entre los 804 datos esta en 6
según la muestra de menor a mayor.
 Moda: en la moda identificamos que el valor que mas veces se
repite es de 4 para un total de 394 según la muestra de 804.
 Desviacion estandar: la desviacion estandar la podemos
determinar sacando la raiz cuadrada de la varianza muestral para
nuestra variable de cilindraje es 1.38753127
 Varianza de la muestra: la variancia de la muestra esta dada por
1.92524303
 Curtosis: la curtosis es de -0.75180984 lo que quiere decir que
esta por debajo es platicurtica.
 Coeficiente de asimetría: el coeficiente de asimetría esta dado por
0.63297427
 Rango: el rango entre el valor máximo y el valor mínimo esta
dado por 4
 Minimo: el cilindraje minimo dentro de la base de datos de un
vehiculo 4
 Maximo: el cilindraje dentro de la base de datos de un vehiculo 8
 Suma: la suma de todos los 804 datos de la base de datos en la
variable de cilindraje para un total de 4236
 Cuenta: nos proporciona el numero exacto dentro de la base de
datos a manejar con el precio para este caso 804

 Litros:

litros
   
Media 3.03731343
Error típico 0.03899016
Mediana 2.8
Moda 2.2
Desviación estándar 1.10556196
Varianza de la muestra 1.22226724
-
Curtosis 0.09749853
Coeficiente de asimetría 0.71792252
Rango 4.4
Mínimo 1.6
Máximo 6
Suma 2442
Cuenta 804

 Media: la cantidad de litros en el motor esta dado por 3.03731343


unidad numerica
 Error típico: el error típico dentro de la muestra está dada por
0.03899016 debemos tener encuenta la desviacion estandar ya
que dicha variable hace parte del error tipico
 Mediana: la media de la muestra entre los 804 datos esta en 2.8
según la muestra de menor a mayor.
 Moda: en la moda identificamos que el valor que mas veces se
repite es de 2.2 para un total de 190 según la muestra de 804.
 Desviacion estandar: la desviacion estandar la podemos
determinar sacando la raiz cuadrada de la varianza muestral para
nuestra variable de cilindraje es 1.10556196
 Varianza de la muestra: la variancia de la muestra esta dada por
1.22226724
 Curtosis: la curtosis es de -0.09749853 lo que quiere decir que
esta por debajo es platicurtica.
 Coeficiente de asimetría: el coeficiente de asimetría esta dado por
0.71792252
 Rango: el rango entre el valor máximo y el valor mínimo esta
dado por 4.4
 Minimo: los litros minimos dentro de la base de datos de un
vehiculo 1.6
 Maximo: los litros dentro de la base de datos de un vehiculo 6
 Suma: la suma de todos los 804 datos de la base de datos en la
variable de litros para un total de 2442
 Cuenta: nos proporciona el numero exacto dentro de la base de
datos a manejar con el precio para este caso 804

 Puertas:

puertas
   
Media 3.52736318
Error típico 0.02998314
Mediana 4
Moda 4
Desviación estándar 0.85016884
Varianza de la muestra 0.72278706
-
Curtosis 0.45434198
Coeficiente de asimetría -1.2437019
Rango 2
Mínimo 2
Máximo 4
Suma 2836
Cuenta 804
 Media: la cantidad de litros en el motor esta dado por 3.52736318
unidad numerica
 Error típico: el error típico dentro de la muestra está dada por
0.02998314 debemos tener encuenta la desviacion estandar ya
que dicha variable hace parte del error tipico
 Mediana: la media de la muestra entre los 804 datos esta en 4
según la muestra de menor a mayor.
 Moda: en la moda identificamos que el valor que mas veces se
repite es de 4 para un total de 644 según la muestra de 804.
 Desviacion estandar: la desviacion estandar la podemos
determinar sacando la raiz cuadrada de la varianza muestral para
nuestra variable de cilindraje es 0.85016884
 Varianza de la muestra: la variancia de la muestra esta dada por
0.72278706
 Curtosis: la curtosis es de -0.45434198 lo que quiere decir que
esta por debajo es platicurtica.
 Coeficiente de asimetría: el coeficiente de asimetría esta dado por
-1.2437019
 Rango: el rango entre el valor máximo y el valor mínimo esta
dado por 2
 Minimo: las puertas minimas dentro de la base de datos de un
vehiculo 2
 Maximo: las puertas maximas dentro de la base de datos de un
vehiculo 4
 Suma: la suma de todos los 804 datos de la base de datos en la
variable de litros para un total de 2836
 Cuenta: nos proporciona el numero exacto dentro de la base de
datos a manejar con el precio para este caso 804

 Crucero:

crucero
   
Media 0.75248756
Error típico 0.01522967
Mediana 1
Moda 1
Desviación estándar 0.43183559
Varianza de la muestra 0.18648197
-
Curtosis 0.62731438
-
Coeficiente de asimetría 1.17228508
Rango 1
Mínimo 0
Máximo 1
Suma 605
Cuenta 804

 Sonido:

sonido
   
Media 0.67910448
Error típico 0.01647375
Mediana 1
Moda 1
Desviación estándar 0.4671113
Varianza de la muestra 0.21819297
-
Curtosis 1.41250902
-
Coeficiente de asimetría 0.76877233
Rango 1
Mínimo 0
Máximo 1
Suma 546
Cuenta 804

 Cuero: variable indicadora que representa si el auto tiene asientos de


cuero

cuero
   
Media 0.7238806
Error típico 0.01577699
Mediana 1
Moda 1
Desviación estándar 0.44735488
Varianza de la muestra 0.20012639
-
Curtosis 0.99566282
-
Coeficiente de asimetría 1.00340428
Rango 1
Mínimo 0
Máximo 1
Suma 582
Cuenta 804

 Muestra : En una muestra representativa de más de ochocientos mil


autos se toma los datos de 804 automóviles
 Consecutivo: lo determinamos según el orden de las variables por la
base de datos.
 Unidad Temporal: El tiempo en el cual se evalúan las variables son los
autos realizados por la General Motors en el año 2005
 Tipo de variable: Ya que la variable a evaluar es el precio de un auto y
esta es una variable que adopta un valor numérico se considera
cuantitativa y ya que son precios que cambian constantemente que no
tienen una cantidad de dinero definida se consideran continuas
 Escala de medición : La variable a medir cambia constantemente de
valor dependiendo el tipo de auto que sea y que cuente con un tipo de
características específicas ,eso hace que su precio sea mayor o menor ,
como el precio se maneja en ese tipo de escala se considera a la
variable de intervalo
 Unidad de medida : Numérica
 Población : General Motors
 Unidad estadistica: periodo de tiempo en el cual se generaran cambios
en las variables ej: cambio de precio entre 2003 y 2005
 Marca: Fabricante del automóvil que en este caso serian Saturno ,
Pontiac , Chevrolet ,SAAB, Buick y Cadillac
 Modelo : Modelos específicos para cada fabricante . Para el Buick
( Lacrosse , Century , Lesabre , Park Avenue ) , para el Cadillac ( CST-V
, CTS , Deville , STS-V6 , STS V8 ,XLR-V8) , para el Chevrolet ( Aveo ,
Cavalier , Classic , Cobalt , Corvette , Impala , Malibu , Monte Carlo ) ,
para el Pontiac ( Boneville , Gran am , Gran Prix , G6 , GTO , Sunfire ,
Vibe ) , para el SAAB ( 9_3 HO ,9_5 , 9_3 , 9_5 HO , 9-2x AWD ) y para
el Saturn ( ION , L series )
 Recorte (del automóvil): tipo específico de modelo de automóvil, como
SE Sedan 4D, Quad Coupe 2D

 Tipo: tipo de cuerpo como sedán, coupé, etc.

 Cilindro: cantidad de cilindros en el motor


 Litros

 Puertas

 Crucero

 Sonido

 Cuero: variable indicadora que representa si el auto tiene asientos de


cuero

Dentro de la metodologia se solicitara la especificacion de las variables y como


se pueden complementar entre si para arrojar los resultados deceados por
medio de la regresion ya sea simple o multiple EJ:

x (axisas) y (ordenadas)
independiente dependiente
millas
recorridas precio minorista
   
   
Kilometraje Precio
8221 € 17,314
9135 € 17,542
13196 € 16,219
16342 € 16,337
19832 € 16,339
22236 € 15,709
22576 € 15,230
22964 € 15,048
24021 € 14,862
27325 € 15,295
30000 -€ 72,379
Kilometrage vs precio
30000

25000 f(x) = − 6.49 x + 122399.05


Kilometraje vehiculos
R² = 0.85
20000

15000

10000

5000

0
€ 14,500 € 15,000 € 15,500 € 16,000 € 16,500 € 17,000 € 17,500 € 18,000
Precio coches

Resultados

Con base a las variables anteriormente explicadas se desarrollara el proyecto


de aula el cual buscara adquirir el conocimiento necesario para resolver
problemas cotidianos como el que se estudiara en este caso Kuiper, con una
muestra de 804 vehiculos los cuales tienen diferentes caractiristicas y recorrido,
lo cual va a permitir utilizar las regresiones simple y multiple obteniendo datos
coherentes y acertivos para contestar las preguntas que nascan.

Kilometrage vs precio
€ 18,000
€ 17,500
€ 17,000
€ 16,500
€ 16,000
€ 15,500
€ 15,000
€ 14,500
€ 14,000
€ 13,500
5000 10000 15000 20000 25000 30000

En la anterior imagen se utiliza la regresion simple para determinar que pasa


con el precio del vehiculo cuando el recorrido del vehiculo aumenta dicho
resultado es lo que se espera al finalizar el proyecto sin embargo se acalara
que esta imagen es solo un ejemplo ya que no cuenta con los datos en general
de lo que se necesita para responder cuanto varia el precio de un vehiculo con
respecto a su recorrido.

También podría gustarte