Está en la página 1de 6

VARIABLE HORSEPOWER

FARLETH HERNANDEZ Y GABRIELA OTERO

Resumen Estadístico para horsepower


Recuento 151
Promedio 89,0
Desviación Estándar 24,424
Coeficiente de Variación 27,4427%
Mínimo 48,0
Máximo 165,0
Rango 117,0
Sesgo Estandarizado 4,27089
Curtosis Estandarizada 0,603367

La variable a analizar es llamada Horsepower, caballos de fuerza. De acuerdo al resumen


estadístico proveído por la herramienta StatGraphic en total se tienen 151 datos. El parámetro de
centramiento utilizado para el análisis es el promedio cuyo valor es 89 hp. Los parámetros
correspondientes a la dispersión son la desviación estándar con valor de 24,424 y el coeficiente de
variación con valor de 27,4427% siendo este último demasiado alto e indica que los datos
contenidos y analizados en esta variable son heterogéneos. Como parámetros de forma se
presentan el sesgo estandarizado con valor de 4,27089 y curtosis estandarizada con valor de
0,6034, indicando que tal como se encuentran agrupados los datos, no presentan una distribución
normal, aunque el valor de la curtosis se encuentra dentro del rango establecido, el valor del sesgo
estandarizado está por fuera del rango de referencia del estadístico (-2 a +2).

Como análisis visual se presenta el diagrama de cajas y bigotes. Se evidencia el valor del promedio
(89 hp), el valor del rango mínimo (48 hp), el primer cuartil (70 hp), el valor del rango máximo
(155,039 hp), la mediana (84,869 hp, el valor del tercer cuartil (105,116 hp) y un valor por fuera de
este rango (165 hp). Se sugiere que este último valor se revise para saber si es un error de
redacción. Como parámetro de centramiento es posible considerar el valor de la mediana (85 hp
aproximadamente) ya que el valor del promedio se ve afectado directamente por el valor fuera del
rango que podría ser atípico puesto que, al comparar los datos de las demás variables con este, no
se evidencian diferencias significativas o que fundamenten este rendimiento a primera vista. En
caso tal de no ser un valor atípico o error, se sugiere evaluar los componentes de este medio de
transporte y las pruebas que se le realizaron para la toma de datos (tanto las pruebas como su
entorno) con el fin de conocer las posibles mejoras que se le puedan realizar a los otros medios de
transporte y alcanzar valor parecidos si se desea.

Para mayor seguridad se realizó la prueba de normalidad de Shapiro- Wilks, la cual indicó:

Pruebas de Normalidad para horsepower


Prueba Estadístico Valor-P
Estadístico W de Shapiro- 0,923662 5,93929E-10
Wilk

El valor P de la prueba de Shapiro- Wilks es menor que 0,05, por tanto, es posible afirmar con un
95% de confianza que la variable Horsepower no sigue una distribución normal.

Con el fin de crear mayor homogeneidad en los datos, se dividió la variable horsepower en tres
grupos basados en los números de cilindros que posean (4, 6 u 8). Al realizar el análisis de las
muestras es interesante resaltar que:

Resumen Estadístico
Recuento Promedio Desviación Coeficiente de Mínimo Máximo
Estándar Variación
HP4cylinder 100 76,73 13,8446 18,0433% 48,0 115,0
HP6cylinder 30 106,067 18,9863 17,9003% 76,0 165,0
HP8cylinder 17 131,588 16,7297 12,7137% 90,0 155,0
Total 147 89,0612 24,6252 27,6497% 48,0 165,0

Rango Sesgo Curtosis


Estandarizado Estandarizada
HP4cylinder 67,0 1,11958 -0,437125
HP6cylinder 89,0 1,97529 1,8898
HP8cylinder 65,0 -1,94691 1,02143
Total 117,0 4,20738 0,516531

El parámetro de dispersión de las variables nuevas HP4cylinder (Horsepower de 4 cilindros) y


HP6cylinder (Horsepower de 6 cilindros) presentan un coeficiente de variación alto, disminuyó sin
embargo continua alto, a comparación con lo establecido en teoría. Con respecto a la curtosis
estandarizada y el sesgo estandarizado de las tres variables, los valores se encuentran dentro del
rango de -2 a 2, lo que indica que podrían seguir una distribución normal los datos tal como están
organizados.
El gráfico de cajas y bigotes ilustra la relación entre horsepower y el número de cilindros. Es
posible evidenciar que a medida que aumentan el número de cilindros de un medio de transporte,
mayor es la potencia del motor medida en caballos de fuerza o horsepower. En la gráfica parece
que su relación fuera inversa, sin embargo, es por cómo están organizadas las variables de
cilindros.

Con el fin de validar lo indicado por los parámetros de forma (sesgo estandarizado y curtosis
estandarizada) se realizó la prueba de normalidad de Shapiro- Wilks:

 Para aquellos con 4 cilindros:


Pruebas de Normalidad para HP4cylinder

Prueba Estadístico Valor-P


Estadístico W de Shapiro- 0,963949 0,0480786
Wilk
El valor P es menor a 0,05, por tanto, se rechaza la afirmación de que esta variable siga
una distribución normal con un 95% de confianza.
 Para aquellos con 6 cilindros:

Pruebas de Normalidad para HP6cylinder


Prueba Estadístico Valor-P
Estadístico W de Shapiro- 0,924458 0,040172
Wilk
El valor P es menor que 0,05. Se rechaza la hipótesis de que los datos de horsepower de 6
cilindros sigan una distribución normal con un 95% de confianza.
 Para aquellos con 8 cilindros:

Pruebas de Normalidad para HP8cylinder


Prueba Estadístico Valor-P
Estadístico W de Shapiro- 0,902475 0,0757243
Wilk
El valor P es mayor que 0,05, es decir que se afirma que los datos presentados de
horsepower con 8 cilindros siguen una distribución normal con un 95% de confianza.

Para reducir la variabilidad de los caballos de fuerza de los medios de transporte de 4 cilindros
(HP4cylinders) se han creado tres variables más correspondientes a los fabricantes de los motores:
HP4C1 (Horsepower de motores con cuatro cilindros fabricados en USA), HP4C2 ( Horsepower de
motores con cuatro cilindros fabricados en Europa) y HP4C3 (Horsepower de motores con cuatro
cilindros fabricados en Japón), cuyo resumen estadístico es:

Resumen Estadístico
Recuento Promedio Desviación Estándar Coeficiente de Variación Mínimo Máximo Rango
HP4C1 42 82,0 10,7454 13,1041% 63,0 105,0 42,0
HP4C2 18 72,3333 18,6863 25,8335% 48,0 115,0 67,0
HP4C3 40 73,175 12,6954 17,3494% 52,0 100,0 48,0
Total 100 76,73 13,8446 18,0433% 48,0 115,0 67,0

Sesgo Estandarizado Curtosis


Estandarizada
HP4C1 -0,636011 -0,509079
HP4C2 1,45313 0,817143
HP4C3 2,28875 -0,414145
Total 1,11958 -0,437125

Esto indica que los motores fabricados en Europa y Japón presentan datos de horsepower
heterogéneos debido al coeficiente de variación elevado de 25,83% y 17,35% respectivamente.
Los motores fabricados en Estados Unidos presentan datos homogéneos. Con respecto a los
parámetros de forma, los motores de Estados unidos y Europa se encuentran dentro del rango de
-2 y +2 tanto para el sesgo estandarizado como para la curtosis estandarizada. Aquellos fabricados
en Japón, el sesgo estandarizado se encuentra por fuera del rango, lo que podría indicar que no
sigue una distribución normal. Para confirmar lo hallado se aplica para cada variable la prueba de
Shapiro- Wilks:

 Para aquellos fabricados en Estados Unidos

Pruebas de Normalidad para HP4C1


Prueba Estadístico Valor-P
Estadístico W de Shapiro-Wilk 0,909679 0,00268295
Debido a que el valor-P más pequeño de las pruebas realizadas es menor a 0,05, se puede
rechazar la idea de que estos datos provienen de una distribución normal con 95% de confianza.

 Para aquellos fabricados en Europa

Pruebas de Normalidad para HP4C2


Prueba Estadístico Valor-P
Estadístico W de Shapiro-Wilk 0,896101 0,0491279
Debido a que el valor-P más pequeño de las pruebas realizadas es menor a 0,05, se puede
rechazar la idea de que HP4C2 proviene de una distribución normal con 95% de confianza.

 Para aquellos fabricados en Japón


Pruebas de Normalidad para HP4C3
Prueba Estadístico Valor-P
Estadístico W de Shapiro-Wilk 0,858112 0,0000559519
Debido a que el valor-P más pequeño de las pruebas realizadas es menor a 0,05, se puede
rechazar la idea de que HP4C3 proviene de una distribución normal con 95% de confianza.

El grafico de cajas y bigotes indica que para los motores fabricados en Europa y Japón presentan
valores de Horsepower por fuera del rango máximo establecido, siendo más evidente en aquellos
fabricados en Japón.

El mismo análisis se realizó para los motores con 6 cilindros, estableciendo tres variables
adicionales como: HP6C1 (Horsepower de motores con seis cilindros fabricados en USA), HP6C2
( Horsepower de motores con seis cilindros fabricados en Europa) y HP6C3 (Horsepower de
motores con seis cilindros fabricados en Japón), cuyo resumen estadístico es:

Resumen Estadístico
Recuento Promedio Desviación Estándar Coeficiente de Variación Mínimo Máximo Rango
HP6C1 24 103,333 17,8415 17,266% 85,0 165,0 80,0
HP6C2 3 111,333 30,8599 27,7185% 76,0 133,0 57,0
HP6C3 3 122,667 8,32666 6,78804% 116,0 132,0 16,0
Total 30 106,067 18,9863 17,9003% 76,0 165,0 89,0

Sesgo Estandarizado Curtosis


Estandarizada
HP6C1 3,40573 5,10731
HP6C2 -1,1328
HP6C3 0,914531
Total 1,97529 1,8898

Es posible observar de acuerdo al parámetro de dispersión que las variables HP6C1 y HP6C2
presentan un coeficiente de variación mayor a 17%. Sin embargo, los datos analizados son, en
cada variable, menores de 30 evidenciado en la Columba de “Recuento”, lo que podría generar
una alteración en la certeza de los parámetros.

El grafico de cajas y bigotes de estas variables (Horsepower de motores con 6 cilindros fabricados
en Estados Unidos, Europa y Japón respectivamente) muestra que para los fabricados en Europa y
Estados Unidos presentan como rango mínimo y máximo los mismos valores correspondientes al
primer y tercer cuartil respectivamente. Los motores producidos en Estados Unidos tienen un dato
que podría considerarse atípico al ser un valor de Horsepower de 160 aproximadamente con
respecto a los demás valores del mismo grupo.

Con el fin de homogeneizar las variables HP4C3 se analizaron los datos del Horsepower de los
motores con cuatro cilindros fabricados en Japón con año de registro 78 (HP4C378), 79 (HP4C379),
80 (HP4C380), 81 (HP4C381) y 82 (HP4C382). Obteniendo como resultado el siguiente resumen
estadístico:

Resumen Estadístico
Recuento Promedio Desviación Coeficiente de Variación Mínimo Máximo Rango
Estándar
HP4C378 8 79,25 18,714 23,6139% 52,0 97,0 45,0
HP4C379 2 65,0 0 0% 65,0 65,0 0
HP4C380 11 72,0909 10,4063 14,435% 60,0 92,0 32,0
HP4C381 10 70,4 12,0665 17,1399% 58,0 100,0 42,0
HP4C382 9 74,0 10,7005 14,4601% 67,0 96,0 29,0
Total 40 73,175 12,6954 17,3494% 52,0 100,0 48,0

Sesgo Estandarizado Curtosis


Estandarizada
HP4C378 -0,355214 -1,16077
HP4C379
HP4C380 1,55424 0,252997
HP4C381 2,28008 2,58231
HP4C382 1,90664 0,737872
Total 2,28875 -0,414145

Se evidencia que para los motores del año 78 la variabilidad sigue siendo alta, sin embargo, dada
la cantidad de datos analizados, este parámetro solo indica si en dicho año los datos son
heterogéneos, para los otros años son homogéneos. Se recomienda que se tomen mayor cantidad
de datos con el fin de establecer con un 95% de confianza si los datos siguen una distribución
normal. De acuerdo a los parámetros del sesgo y curtosis estandarizada, la variable que no sigue
dicha distribución es HP4C381, sin embargo, dado a la misma razón mencionada con anterioridad
(el poco recuento de datos por variable) no es posible confirmar que los datos sigan la distribución
normal.

En esta ocasión el grafico de cajas y bigotes presenta mayores datos por fuera de los rangos
máximos según los años. Para el año 79 no hay una caja fácil de evidenciar debido a la cantidad de
datos registrados.

También podría gustarte