Está en la página 1de 24

UNIVERSIDAD DE SANTIAGO DE CHILE

FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA EN MINAS
LABORATORIO DE MODELACIN Y SIMULACIN

Laboratorio N1
Anlisis de la distribucin, de los valores medidos de consumo de
combustible, de los camiones vacos de la flota minera Estrella 30.
Fecha de realizacin: 15 y 22 de Abril de 2014

Fecha entrega informe: 29 de Abril de 2014

Profesor: Fernando Machuca

Ayudantes: Sebastin Espina


Diego Garca

Alumnas: Valentina Mora


Mara Soledad Pea

Coordinacin: M6
1. Resumen Ejecutivo

En toda rea industrial, debe esforzarse por mejorar la calidad de los productos y
servicios si es que se pretende competir con xito tanto en el mercado interno como a
nivel mundial.

Los recursos estadsticos son una herramienta importante que proporciona


mtodos descriptivos y analticos para abordar la variabilidad de los datos observados.
Una herramienta frecuentemente utilizada es el test de chi cuadrado (X2), que permite
determinar la asociacin de variables, o bien la tendencia de su distribucin.

En el presente informe, se explica el fundamento terico de la estadstica


descriptiva y representacin grfica, a travs de histogramas; la normalizacin de datos y
el posterior, calculo estadstico de X2, utilizando para ello el programa EXCEL.

Las herramientas explicadas anteriormente, se utilizaron para determinar si los


datos de consumo de combustible Fuel Rate, de los camiones vacos de la flota de
camiones de la minera Estrella 30, siguen un comportamiento basado en la distribucin
normal. Para ello, se realiz un anlisis de estadstico preliminar de los datos y de su
distribucin, mediante un histograma. Posteriormente, se normaliz y aplic la prueba de
chi cuadrado, X2, a los datos, previa determinacin de la amplitud de los intervalos
utilizados para su agrupacin. Para ello, se utilizaron tres criterios: Criterio Grupal, de
Sturges y de Kaiser (o raz de n)

De este modo, al someter los resultados observados de Fuel Rate a un anlisis


de chi- cuadrado, X2, para determinar si los datos presentan una distribucin normal
(Hiptesis nula H0) y aplicar una prueba de chi inverso, para establecer los lmites
inferiores (con 95% de significancia) y superiores (con 5% de significancia), parmetros
que se utilizaron para aceptar o rechazar la hiptesis nula, se obtuvieron los siguientes
resultados: Tanto los datos agrupados bajo el Criterio Grupal como de Sturges, no
presentan una distribucin normal, ya que los valores de X2 calculado son mayores que
los obtenidos mediante la prueba de chi inverso, por lo tanto el ajuste es malo, lo que
conlleva el rechazo de la hiptesis nula. Sin embargo, los datos agrupados bajo el Criterio
de Kaiser o raz de n, si presentan un buen ajuste de chi cuadrado (X2 calculado es menor
que los X2 de la prueba chi inverso), por lo que no fue posible rechazar H0. Por lo tanto, se
concluy que los datos de consumo de combustible, agrupados bajo el criterio de Kaiser,
se ajustan a la distribucin normal, basados en los resultados de la prueba de bondad y
ajuste de X2 con un 95% y 5% de significancia respectivamente.

2
2. ndice

Introduccin ......................................................................................................................................... 4
Objetivos ............................................................................................................................................. 5
Marco Terico...................................................................................................................................... 6
Procedimiento.................................................................................................................................... 10
Resultados ......................................................................................................................................... 13
Anlisis de Resultados ...................................................................................................................... 17
Conclusin ......................................................................................................................................... 19
Bibliografa......................................................................................................................................... 20
Anexo ................................................................................................................................................ 21

ndice de Figuras
Figura 1: Representacin grfica del anlisis de Curtosis. ................................................................. 7
Figura 2: Representacin grfica del anlisis de Asimetra. ............................................................. 7
Figura 3: Representacin grfica de la Distribucin Normal ............................................................... 9
Figura 4: Caractersticas del problema analizado en el presente informe. ....................................... 10
Figura 5: Histograma segn Criterio Grupal. En l, se observa la tendencia del consumo de
combustible. ..................................................................................................................................... 14
Figura 6: Asimetra hacia la izquierda de los datos de combustible, descrita por el valor del
coeficiente de asimetra menor a cero. ............................................................................................ 17

ndice de Tablas
Tabla 1: Estadstica descriptiva. Anlisis estadstico, aplicado a los datos Fuel Rate de los
camiones vacos. ............................................................................................................................... 13
Tabla 2: Amplitud de intervalos, calculados para los criterios Grupal, de Sturges y Kaiser
respectivamente. Los valores de rango y nmero total de datos (n) se obtuvieron del anlisis
estadstico de la Tabla 1. ................................................................................................................. 13
Tabla 3: Intervalos. Valores mnimos (Min) y mximos (Max) de los Intervalos obtenidos para los
datos de consumo de combustible segn el criterio grupal, junto con sus respectivas marcas de
clases. . ............................................................................................................................................. 14
Tabla 4: Frecuencia, % acumulado, normalizacin y distribucin normal para cada intervalo, segn
Criterio Grupal. .................................................................................................................................. 15
Tabla 5: Clculos de frecuencias observadas (Oi), frecuencia esperada (Ei) y Chi cuadrado (X2)
para cada intervalo del criterio Grupal. Min y Max, representan los valores mnimos y mximos de
cada intervalo, respectivamente; Y1 e Y2 son las respectivas normalizaciones. ............................. 15
2
Tabla 6: X calculado y lmites inferior y superior, asociado a cada criterio. .................................... 16
Tabla 7: Conclusin del Anlisis de bondad y ajuste de X2, para cada criterio. .............................. 16

3
3. Introduccin

El campo de la estadstica tiene que ver con la recopilacin, presentacin, anlisis y uso de
datos para tomar decisiones y resolver problemas. El conocimiento de la estadstica y la
probabilidad puede ser una herramienta til para ayudar a los cientficos e ingenieros a disear
nuevos productos y sistemas, a perfeccionar los existentes y a disear, desarrollar y mejorar los
procesos de produccin.

Las aplicaciones de la estadstica en el mundo real no solo se aplican al azar, este campo
adems de ser muy viable resulta de gran ayuda en el campo laboral.

La importancia de la estadstica ha ido en aumento con el crecimiento de la industria; una


de las aplicaciones ms importante es la utilizacin de tcnicas de optimizacin que por medio de
estudios lgicos, permiten reducir costos de materia prima, con resultado igual o mejor en dicho
producto. As, tambin por medio de tcnicas de control de calidad se logra mejorar los procesos
de produccin y se puede llegar a la funcionalidad perfecta.

En el presente informe, se analiza el consumo de combustible de camiones sin carga de


una flota de operacin, utilizando tcnicas de estadstica y probabilidad para la interpretacin de
dichos datos.

4
4. Objetivos

Principal:

Determinar si los datos de consumo de combustible, de los camiones vacos de la flota de


operacin de la compaa minera Estrella 30, siguen una distribucin normal.

Secundarios:

Utilizar las herramientas de EXCEL y estadsticas, para:


Realizar un anlisis de estadstica preliminar de los datos de consumo de combustible, de
los camiones vacos.
Calcular la amplitud de intervalo, mediante tres mtodos distintos: criterio Grupal, de
Sturges y Kaiser, respectivamente, para posteriormente, construir un histograma y analizar
la distribucin de los datos.
Realizar una estandarizacin de los valores de consumo de combustible, ajustados a la
distribucin normal.

2
Efectuar una prueba de Bondad y Ajuste de X , utilizando como hiptesis nula (H0) la
2
normal y verificar para que criterio se comporta mejor la prueba X .

5
5. Marco terico

La estadstica es una disciplina que disea los procedimientos para la obtencin de los
datos, como asimismo proporciona las herramientas necesarias que permiten extraer la
informacin.

La estadstica descriptiva es un conjunto de procedimientos que tienen por objeto presentar


un grupo de datos por medio de tablas, grficos y/o medidas de resumen. La estadstica
descriptiva organiza y resume datos, por lo que es la primera etapa a desarrollar en un anlisis de
informacin.

Se deben obtener ciertos parmetros que son necesarios para poder analizar la informacin
tales como:

a. Media: la medida ms comn de localizacin de un grupo de datos es el promedio


aritmtico.

(1)

b. Mediana: es una medida tendencial donde la muestra se divide en dos partes iguales.
c. Moda: es la observacin que se presenta con mayor frecuencia en la muestra.
d. Desviacin Estndar: es una medida de dispersin con respecto al valor promedio.

(2)

e. Varianza de la muestra: es una medida de variabilidad, es la media aritmtica del cuadrado


de las desviaciones respecto a la media de una distribucin estadstica.

(3)
f. Curtosis: el coeficiente de curtosis analiza el grado de achatamiento de un histograma con
respecto al modelo terico de Gauss.


( ) (4)

Existen 3 tipos de distribuciones:


Leptocrtica: presenta una gran concentracin de datos alrededor de los valores centrales
de la variables,
Mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales
de la variable,
Platicrtica: presenta un reducido grado de concentracin alrededor de los valores
centrales de la variable,

6
Figura 1: Representacin grfica del anlisis de Curtosis.
Fuente: www.aulafacil.com/cursoestadistica.

g. Coeficiente de Asimetra: mide el grado de simetra de una distribucin.


( ) (5)

Existen 3 casos posibles:


, es una distribucin simtrica, por lo tanto, se concentra igual cantidad de
valores a la derecha y a la izquierda de la media.
, es una distribucin asimtrica positiva, existe ms valores concentrados a
la derecha de la media.
, es una distribucin asimtrica negativa, existen ms valores concentrados a
la izquierda de la media.

Figura 2: Representacin grfica del anlisis de Asimetra.


Fuente: www.aulafacil.com/cursoestadistica

h. Rango: es una medida de variabilidad, que se define como la diferencia entre las
observaciones ms grande y la ms pequea.
(6)

i. Valor mnimo: es el valor mnimo del conjunto de datos.


j. Valor mximo: es el valor mximo del conjunto de datos.

7
Una forma de presentar un grupo de observaciones, es a travs de tablas de distribucin de
frecuencias. La estructura de estas tablas depende de la cantidad y tipo de variable que se est
analizando. Donde se puede observar las siguientes frecuencias:

- Frecuencia Absoluta: es el nmero de repeticiones que presenta una observacin. Se


denota por ni.
- Frecuencia Relativa: es la frecuencia absoluta dividida por el numera total de datos. Se
denota por fi.
- Frecuencia absoluta acumulada: es la suma de los distintos valores de la frecuencia
absoluta tomando como referencia un individuo dado. La ltima frecuencia absoluta
acumulada es igual al nmero de casos. Se denota por Ni.

Estos datos pueden ser representados en forma de grfica mediante un histograma. Un


histograma es una representacin grfica de una variable en forma de barras, donde la superficie
de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se
representan frecuencias, y en el eje horizontal los valores de las variables, normalmente las
marcas de clase, que corresponden a la mitad del intervalo en el que estn agrupados los datos.

Los datos se pueden agrupar segn los siguientes criterios:

a) Criterio Normal o Grupal: los datos se agrupan en 10 intervalos, donde la amplitud de


define mediante la siguiente ecuacin:

(7)

Donde el rango se define como la diferencia entre el lmite superior y el lmite inferior.

b) Criterio de Sturges: es una regla prctica, donde la cantidad de intervalos depende del
nmero de datos (n). La amplitud del intervalo est dada por:

(8)

c) Criterio de Kaiser: la cantidad de intervalo se define por la raz cuadrada de los nmeros de
datos (n). La amplitud del intervalo est dada por:

(9)

Para analizar los datos, la distribucin normal es una de las distribuciones ms usadas e
importantes; que se ha vuelto una herramienta indispensable en cualquier rama de la ciencia,
industria e ingeniera.

La distribucin normal depende de parmetros y La media (), indica la posicin de la


campana de Gauss, de modo que para diferentes valores de la grfica es desplazada a lo largo del
eje horizontal. Por otra parte, la desviacin estndar () determina el grado de apuntamiento de la
curva. Cuanto mayor sea el valor de , ms se dispersan los datos en torno a la media y la curva
ser ms plana. Un valor pequeo de este parmetro indica, por tanto, una gran probabilidad de
obtener datos cercanos al valor medio de la distribucin.

8
Figura 3: Representacin grfica de la Distribucin Normal

La normalizacin de los datos corresponde a ajustar una distribucin cualquiera a una


distribucin normal. La normalizacin se realiza mediante la siguiente ecuacin:

(10)

Una prueba de bondad de ajuste tiene por objetivo determinar si los datos a analizar se
ajustan a una determinada distribucin, que puede estar especificada como una hiptesis simple.
Existen dos procedimientos conocidos para realizar esta prueba de bondad, ya sea la grfica de
probabilidad o bien la distribucin de Chi-cuadrada.

La prueba de Chi-cuadrado , permite calcular la probabilidad de obtener resultados


que por efecto del azar se desven de las expectativas en la magnitud observada si el modelo es
correcto. Para realizar una prueba de Chi-Cuadrado, el primer paso es comparar la frecuencia
observada (Oi) de los datos en cada categora con la frecuencia esperada (Ei) considerando el
tamao de muestra. Las desviaciones son elevadas al cuadrado y divididas por los valores
esperados; y la sumatoria de esto, proporciona un valor de Chi- Cuadrado calculado. La frmula
para es la siguiente:

(11)

Luego, se debe calcular los grados de libertad () que son el nmero de clases
variables independientes que existen. Donde son los parmetros desconocidos calculados.

(12)

Para finalizar la prueba de chi- cuadrado, se debe buscar el valor de chi- cuadrado con
ciertos grados de libertad en la tabla y determinar su valor de probabilidad; cuyo valor es el
responsable de determinar la aceptacin de la hiptesis inicial una vez comparada con los grados
de libertad y nivel de confianza de la hiptesis.

9
6. Procedimiento

El problema a resolver, en el presente laboratorio, fue el siguiente:

La compaa minera Estrella 30 se encuentra analizando la flota de camiones que se


encuentran transportando el material tronado en la pared sur del rajo BAYODOS, propiedad de
inversiones Mantoverde S.A (INVERMASA).

Estrella 30 actualmente pasa por una problemtica de interpretacin de los datos


entregados por dispatch con respecto a fuel rate (consumo de combustible) de la flota en
operacin. Para solventar esta problemtica, su equipo ha sido contratado para ejecutar un
anlisis estadstico inferencial que permita determinar si el conjunto de valores medidos por
Estrella 30 tienen una correlacin normal en su distribucin.

INVERMASA, en su gestin requiere que la estructura del presente anlisis siga una
lgica como la siguiente:

1. Anlisis estadstico preliminar de la(s) variable(s) de inters.

2. Estandarizacin de las mediciones a valores cannicos sobre la distribucin normal.


2
3. Prueba de bondad y ajuste X , con la normal como hiptesis nula.

La gerencia requiere verificar la estimacin preliminar de Estrella 30 de ajuste normal


sobre los valores medidos a partir de la auditora a realizar por el grupo de trabajo en cuestin.
Para ello los equipos se dividirn en las siguientes labores:

Coordinacin M4: Camiones Cargados

Coordinacin M6: Camiones Sin Carga

Coordinacin W5: Camiones Total de Camiones

Figura 4: Caractersticas del problema analizado en el presente informe.

Tal como se detalla en la figura nmero 2, la coordinacin M6 fue la encargada de analizar


los datos de los camiones sin carga (EMPTY). Para realizar lo anterior, se sigui el procedimiento
detallado a continuacin, utilizando para ello el programa EXCEL:

El primer paso, fue filtrar los datos del archivo Base de datos 2013_2.xlsx, con el fin de
trabajar solo con los de inters: camiones vacos. Para ello, se utiliz la herramienta Datos
y filtro y se seleccion a continuacin la columna load la cual, contena los datos de
SULPHUR y EMPTY, que representan los camiones con carga y vacos
respectivamente: de este modo, se indic mediante la herramienta filtro que solo se
mostraran los datos correspondientes a EMPTY. A continuacin se hizo un recuento de
los datos (ctrl++), para constatar que se contaba con 1035 valores de camiones
vacos.
Luego, se copi y peg los valores de la columna Fuel Rate, en otra hoja de clculo del
libro de EXCEL para aplicar un anlisis estadstico al consumo de combustible de los
camiones vacos. Para ello, nuevamente, se utiliz la herramienta Datos y luego se
seleccion Anlisis de datos y Estadstica descriptiva, se seleccion los datos de la

10
columna Fuel Rate y se indic un nivel de confianza del 95%. De este modo, se obtuvo
un anlisis de estadstica preliminar que entreg la media, error tpico, mediana, moda,
desviacin estndar, varianza de la muestra, curtosis, coeficiente de asimetra, rango,
valores mnimo y mximo, suma, cuenta y nivel de confianza de los datos analizados.
A continuacin, se calcul la amplitud del intervalo, para analizar posteriormente los datos
2
por la prueba de bondad y ajuste de X . Para ello, se utilizaron tres criterios: Criterio
Grupal, de Sturges y de Kaiser. Los valores del tamao del intervalo segn cada criterio,
se calcularon mediante las frmulas (7), (8) y (9) respectivamente, sealadas en el marco
terico y conocido el rango y nmero total de datos (n) de Fuel Rate.
Posteriormente, se construy una tabla en la cual las columnas 1, 2 y 3, corresponden al
valor mnimo, marca de clase y valor mximo del intervalo respectivamente, para cada uno
de los tres criterios. El valor mnimo del primer intervalo, se obtuvo del valor mnimo
entregado por el anlisis de estadstica preliminar, luego, en la columna 3, se calcul el
valor mximo del intervalo, considerando el tamao de este segn cada criterio, mediante
la frmula: =(valor mnimo + amplitud de intervalo) .
De igual modo, en la columna 2 se calcul la marca de clase del intervalo mediante:
=(valor mnimo intervalo + valor mximo intervalo)/2. Finalmente, en la primera
columna para calcular los valores mnimos, a partir del segundo intervalo se utiliz:
=(valor mximo intervalo anterior + amplitud del intervalo);y se arrastr la frmula de
cada columna, para completar la tabla hasta llegar al valor mximo de los datos (descrito
por el anlisis estadstico).
A partir de la tabla anterior, se construy un histograma para cada criterio. As, se
seleccion la pestaa Datos y la seccin anlisis de datos , junto a la herramienta
histograma: se utiliz todos los datos de Fuel Rate filtrados (EMPTY) como rango de
entrada, los valores mximos de la tabla sealada en el punto anterior como rango de
clase y un porcentaje acumulado para crear el grfico. De este modo, EXCEL cre el
histograma, junto a una tabla que sealaba la clase, frecuencia y %acumulado de cada
intervalo. Para completar la construccin del histograma, fue necesario, cambiar el ancho
del intervalo del histograma, para que las barras de este quedarn juntas (y no separadas
como lo hizo automticamente EXCEL): para ello, al hacer click con el botn derecho del
mouse sobre el grfico, se seleccion dar formato a serie de datos y opcin de serie
donde se modific el ancho del intervalo a cero. Finalmente, en la tabla creada por EXCEL
al construir el histograma, se reemplaz los valores de la columna Clase por los valores
de Marca de clase calculados en el punto anterior, para ello se copiaron los valores de
una tabla a otra.
Luego, se realiz la normalizacin de los valores de la tabla construida junto al histograma
(Clase, frecuencia y % acumulado). Para ello, se utiliz la funcin normalizacin:
=NORMALIZACION(marca de clase, media, desv_estndar). Los valores de media y
desviacin estndar se fijaron mediante F4, ya que estos valores corresponden a los
entregados por el anlisis de estadstica preliminar y se seleccion el valor de marca de
clase de cada intervalo para completar la frmula.
A continuacin, se aplic la funcin de distribucin de probabilidad a los datos mediante la
funcin: =DISTR.NORMAL(marca de clase, media, desv_estndar, falso). De igual
modo que en el punto anterior, se fij con F4 los valores de media y desviacin estndar y
se utilizaron los valores de marca de clase de cada intervalo de la tabla del histograma.

2
Para realizar el anlisis de bondad y ajuste de X , se copi en una nueva hoja de clculo
los valores del anlisis de estadstica preliminar y se construy una nueva tabla con los
valores mnimos y mximos de los intervalos, segn cada criterio. A continuacin, en las

11
siguientes columnas, se normalizaron dichos datos por medio de la funcin:
=NORMALIZACION(valor mnimo o mximo del intervalo, media, desviacin
estndar). Nuevamente, se fijaron los valores de la media y desviacin estndar mediante
F4. Las columnas en la que se normaliz el valor mnimo y mximo del intervalo se
denominaron Y1 y Y2 respectivamente, para cada criterio.
Luego, se calcul el rea (probabilidad del dato) con la funcin:
=(DISTR.NORM.ESTAND.N(valor Y1 o Y2 respectivamente, verdadero))*100, para
obtener el rea 1 y rea 2, segn Y1 e Y2 respectivamente.

2
Como se seal en el marco terico, el valor de X se calcula a partir de la frecuencia
observada (Oi) y la frecuencia esperada (Ei). Por ello, para obtener el valor de la
frecuencia esperada se rest los valores de rea 2 y rea 1, mediante: =rea2-rea1.
Posteriormente se copi en una columna adyacente los valores de frecuencia para cada
criterio, obtenida de la tabla del histograma respectivo. Con ellas, se calcul el valor de la
frecuencia esperada (Ei), mediante: =(frecuencia intervalo / frecuencia total)*100,
nuevamente, se utiliz F4 para fijar el valor de la frecuencia total.

2
De este modo, se obtuvo el valor de X para cada intervalo mediante la frmula:
=((Frecuencia observada Frecuencia esperada)^2)/Frecuencia esperada.
Finalmente, se aplic la funcin SUMA, en una celda adyacente, a los valores calculados
2 2
de X de cada intervalo, para obtener el valor de X calculado
Para determinar si los datos siguen una distribucin normal, se hizo la prueba de Chi
inverso al 95% y 5% respectivamente, considerando los grados de libertad de cada criterio,
segn la funcin: =PRUEBA.CHI.INV(%, grados de libertad). Finalmente, se compar el
2
valor de X calculado, con el obtenido mediante la prueba de chi inverso, para cada criterio.

12
7. Resultados

Tal como se seal en la seccin anterior, se trabaj con la base de datos Base de datos
2013_2.xlsx, a la cual se aplic un filtro para trabajar solamente con los datos de consumo de
combustible (Fuel Rate) de los camiones vacos (EMPTY). A dichos valores se les aplic un
anlisis estadstico, los parmetros obtenidos (mediante la herramienta estadstica descriptiva) se
resumen en la siguiente tabla:

Anlisis estadstico
Media 11,68
Error tpico 0,01
Mediana 11,86
Moda 12,03
Desviacin estndar 1,03
Varianza de la muestra 1,05
Curtosis -0,18
Coeficiente de asimetra -0,55
Rango 7,40
Mnimo 9,05
Mximo 16,45
Suma 117168,01
Cuenta 10035,00
Nivel de confianza (95,0%) 0,02

Tabla 1: Estadstica descriptiva. Anlisis estadstico, aplicado a los datos Fuel Rate de
los camiones vacos.

Luego, se calcul la amplitud de los intervalos, para utilizar posteriormente en la prueba de


2
bondad de ajuste de X , mediante las ecuaciones 1, 2 y 3 correspondientes a los criterios Grupal,
de Sturges y de Kaiser, respectivamente, los cuales se sealan en la Tabla 2. A continuacin, se
ejemplifican los clculos que se realizaron para el criterio Grupal, los clculos para los otros
criterios se muestran en el anexo y archivo EXCEL adjunto al presente informe.

Rango 7, 4
Amplitud .Intervalo 0, 74
10 10

Criterio Amplitud intervalo


Grupal 0,74
De Sturges 0,53
De Kaiser 0,07

Tabla 2: Amplitud de intervalos, calculados para los criterios Grupal, de Sturges y Kaiser
respectivamente. Los valores de rango y nmero total de datos (n) se obtuvieron del anlisis
estadstico de la Tabla 1.

Determinado el valor del intervalo para el criterio grupal, se construy una tabla con los
valores mnimos, marca de clase y mximos de cada intervalo, con las frmulas descritas en la
seccin procedimientos. La tabla que se obtuvo, se muestra a continuacin:

13
Min Marca de clase Max
9,05 9,42 9,79
9,79 10,16 10,53
10,53 10,9 11,27
11,27 11,64 12,01
12,01 12,38 12,75
12,75 13,12 13,49
13,49 13,86 14,23
14,23 14,6 14,97
14,97 15,34 15,71
15,71 16,08 16,45

Tabla 3: Intervalos. Valores mnimos (Min) y mximos (Max) de los Intervalos obtenidos
para los datos de consumo de combustible segn el criterio grupal, junto con sus respectivas
marcas de clases.

A partir de la Tabla 3, se construy un histograma, el cual seala la distribucin de los


datos. Para el criterio grupal se obtuvo el siguiente histograma:

Histograma segn Criterio Grupal


3500 120,00% % acumulado
Frecuencia

3000 100,00%
2500 80,00%
2000 Frecuencia
60,00%
1500 % acumulado
1000 40,00%
500 20,00%
0 0,00%

Clase

Figura 5: Histograma segn Criterio Grupal. En l, se observa la tendencia del consumo de


combustible.

Luego se aplic una normalizacin a los intervalos y se calcul su distribucin normal.


Dichos valores, se muestran en la Tabla 4.

14
Clase Frecuencia % acumulado Normalizacin Distribucin normal
9,42 701 6,99% -2,20 0,03
10,16 770 14,66% -1,48 0,13
10,90 1628 30,88% -0,76 0,29
11,64 2568 56,47% -0,04 0,39
12,38 3101 87,37% 0,69 0,31
13,12 1149 98,82% 1,41 0,14
13,86 115 99,97% 2,13 0,04
14,60 2 99,99% 2,85 0,01
15,34 0 99,99% 3,57 0,00
16,08 1 100,00% 4,29 0,00

Tabla 4: Frecuencia, % acumulado, normalizacin y distribucin normal para cada intervalo, segn
Criterio Grupal.

2
Posteriormente, se realiz el anlisis de Bondad y Ajuste de X , siguiendo los pasos
detallados en la seccin Procedimientos. Las hiptesis planteadas para el anlisis son:

Hiptesis nula H0: Los datos siguen una distribucin normal, X=N (11,68; 1,03)

Hiptesis alternativa H1: Los datos no siguen una distribucin normal, XN (11,68; 1,03)

2
Min Max Y1 Y2 rea 1 rea 2 Oi Frecuencia Ei X
9,05 9,79 -2,56 -1,84 0,52 3,30 2,77 701 6,99 2,54
9,79 10,53 -1,84 -1,12 3,30 13,19 9,90 770 7,67 0,64
10,53 11,27 -1,12 -0,40 13,19 34,61 21,42 1628 16,22 1,66
11,27 12,01 -0,40 0,33 34,61 62,77 28,15 2568 25,59 0,26
12,01 12,75 0,33 1,05 62,77 85,25 22,48 3101 30,90 2,29
12,75 13,49 1,05 1,77 85,25 96,15 10,90 1149 11,45 0,03
13,49 14,23 1,77 2,49 96,15 99,36 3,21 115 1,15 3,71
14,23 14,97 2,49 3,21 99,36 99,93 0,57 2 0,02 15,32
14,97 15,71 3,21 3,93 99,93 100,00 0,06 0 0,00 0,00
15,71 16,45 3,93 4,65 100,00 100,00 0,00 1 0,01 0,00

Tabla 5: Clculos de frecuencias observadas (Oi), frecuencia esperada (Ei) y Chi cuadrado
2
(X ) para cada intervalo del criterio Grupal. Min y Max, representan los valores mnimos y mximos
de cada intervalo, respectivamente; Y1 e Y2 son las respectivas normalizaciones.

15
2 2
Los valores de la columna de X de la Tabla 5, se sumaron para obtener el valor de X
calculado. Adems, se realiz una prueba de Chi inverso, mediante la funcin PRUEBA.CHI.INV,
para estimar los lmites inferior y superior con un nivel de significancia del 95% y 5%
respectivamente. Los valores obtenidos, tanto para el criterio Grupal, como de Sturges y Kaiser se
detallan en la siguiente tabla:

2 2 2
Criterio X Grados de libertad X inverso (95%) X inverso (5%)
calculado Lmite inferior Lmite superior
Grupal 26,46 9 3,33 16,92
Sturges 25,24 13 5,89 22,36
Kaiser 19,69 99 77,05 123,23

2
Tabla 6: X calculado y lmites inferior y superior, asociado a cada criterio.

Finalmente, de acuerdo a los valores observados en la Tabla anterior, se pudo concluir


para cada criterio:

Criterio Ajuste Conclusin


Grupal Malo Se rechaza H0
Sturges Malo Se rechaza H0
Kaiser Bueno No se rechaza H0

2
Tabla 7: Conclusin del Anlisis de bondad y ajuste de X , para cada criterio.

16
8. Anlisis de resultados

El anlisis estadstico preliminar entreg una media y desviacin estndar de 11.68, 1.03,
respectivamente, lo que indica que el promedio de los datos estn dispersos entre los valores
(11.68-1.03=10.65) y (11.68+1.03=12.71) respecto al promedio. Esto, se condice con el valor de la
varianza de la muestra, 1.05, el cual al ser bastante menor respecto al promedio, indica que la
dispersin de los datos no es considerable. Por otro lado, el coeficiente de asimetra, -0.55, indica
que los datos presentan una distribucin asimtrica hacia la izquierda, lo que indica que la moda es
mayor que la mediana y esta mayor que la media, lo cual, se refleja en sus valores de orden
descendente: 12.03, 11.86 y 11.68 respectivamente, tal como se observa en la Figura 6;
Respecto al valor de curtosis, -0.18, este indicara que los datos, describen una curva platicurtica,
es decir, ms achatada respecto a una curva de distribucin normal. Por lo tanto, el conjunto de
datos estudiado en el anlisis estadstico preliminar, no presentaran una distribucin normal, ya
que la curva no es simtrica al eje que pasa por la media y no coinciden los valores de media,
moda y mediana, ambas condiciones de una distribucin normal

Figura 6: Asimetra hacia la izquierda de los datos de combustible, descrita por el valor del
coeficiente de asimetra menor a cero. Imagen modificada de:
http://eae0213.wikispaces.com/clase+4.III

A continuacin del anlisis estadstico, se graficaron los datos en histogramas basados en


tres criterios distintos para construir intervalos: Criterio Grupal, de Sturges y de Kaiser. En el
histograma del Criterio Grupal, se aprecia que los datos no siguen una distribucin normal y que
estos se encuentran concentrados hacia la izquierda, tal como lo describi el anlisis estadstico,
esto se debe, a que este criterio entrega el intervalo de mayor amplitud y por lo tanto, refleja una
mayor concentracin de datos en el histograma, por tener un menor nmero de intervalos. Por otro
lado, el histograma del criterio de Sturges, cuenta con un mayor nmero de intervalos y en el se
refleja mejor el intervalo en el que se encuentra la moda de los datos, sin embargo, ninguno de
estos criterios refleja una distribucin normal, al analizar la forma del histograma. Paralelamente, el
histograma basado en el criterio de Kaiser presenta el mayor nmero de intervalos (100) y por lo
tanto, en l se aprecia de mejor modo la distribucin de datos hacia la izquierda, respecto a la
moda y que no representa la tpica distribucin en forma de campana de una variable aleatoria
normal.

Debido a lo anterior, se debi aplicar una transformacin a los datos, mediante el proceso
de normalizacin, de modo de ajustar dichos datos a una media cero y varianza uno, con el fin de

17
analizar cul de los tres criterios de tamao de intervalo se ajusta mejor a una distribucin normal
2
estndar, mediante un anlisis de bondad y ajuste de X .
2
El anlisis de X permiti calcular un valor de chi cuadrado para cada criterio, que al ser
contrastado con los valores lmites que entreg la prueba de chi inverso, con un 95% y 5% de
significancia indican que los criterios Grupal (con 9 grados de libertad) y de Sturges (con 13
2
grados de libertad) deben ser rechazados, ya que el valor de X : 26.46 y 25.24, respectivamente,
son mayores que los limites calculados por la prueba chi inverso y por lo tanto, el ajuste es malo.
2
Sin embargo, el valor de X calculado por medio del criterio de Kaiser (99 grados de libertad):
19.69, es menor que los lmites inferior (77.05) y superior (123.23) calculados con un 95 % y 5% de
significancia, respectivamente, por lo que el ajuste es bueno y no es posible rechazar la hiptesis
nula, H0, en este caso dado que los datos, no entregan suficiente evidencia para rechazar la
hiptesis.

De este modo, de lo anterior, se deduce que el criterio de Kaiser (tambin llamado raz de
n) cumple la distribucin normal con un 95% y 5% de significancia. Es decir, los datos de
combustible analizados bajo este criterio, cumplen con las caractersticas de la distribucin normal,
las cuales son:

La curva tiene forma acampanada


La curva tiene un mximo absoluto
El rea total bajo la curva vale 1
La curva es simtrica respecto al eje que pasa por la media ().
Coincide la moda, mediana y media. La moda, es el punto donde la curva es un mximo.
Es asinttica al eje horizontal
Posee dos puntos de inflexin en .

18
9. Conclusiones
2
A partir del anlisis de bondad y ajuste de X , se concluye que los valores registrados de
consumo de combustible de los camiones vacos de la flota en operacin, registran un
comportamiento que se ajusta a la distribucin normal, bajo el criterio de raz de n (Kaiser), con un
95% y 5% de significancia.

En el presente informe se abord aspectos generales relacionados a la prueba y ajuste de


Chi- cuadrado, siendo necesario para una compresin ms acabada del anlisis, un estudio de
conceptos bsicos en mayor profundidad. Un punto de partida es construir tablas de contingencia
a partir de la muestra, para luego aplicar el ajuste de bondad; de esta manera aportara al lector
una mejor comprensin de los resultados del estudio.

Dado que en la industria, la productividad es un proceso importante para lograr las metas
de la empresa, se requiere optimizar procesos y aumentar en control de calidad, de mantenimiento
y costos; por lo que el anlisis estadstico es fundamental para elegir una medida.

19
10. Bibliografa

[1] Curtosis y coeficiente de asimetra. Visto el 28/04/2014 en:

http://www.aulafacil.com/CursoEstadistica/Lecc-9-est.htm

[2] Ajuste de bondad. Visto el 28/04/2014 en:

http://www.itescam.edu.mx/principal/sylabus/pdb/recursos/r99940.PDF

[3] Estadstica descriptiva. Visto el 27/04/2014 en:

http://www.demre.cl/text/doctecnicos/p2009/estadistica_descriptiva.pdf

[4] Fernando Machuca. Apuntes N1 de Modelacin y Simulacin. Primer semestre 2014.

[5] Douglas. C. Montgomery. Probabilidad y Estadsticas aplicadas a la ingeniera. Captulo 1

20
Anexos

Clculo de tamao de intervalos

Criterio de Sturges:

Rango 7, 4
Amplitud .Intervalo 0,53
1 3, 22*log(n) 1 3, 22*log(10035)

Criterio de Kaiser:

Rango 7, 4
Amplitud .Intervalo 0,07
n 10035
Valores mnimos, mximos y marca de clase de intervalos

Criterio de Sturges:

Min Marca de clase Mx


9,05 9,32 9,58
9,58 9,85 10,12
10,12 10,38 10,65
10,65 10,92 11,18
11,18 11,45 11,71
11,71 11,98 12,25
12,25 12,51 12,78
12,78 13,05 13,31
13,31 13,58 13,85
13,85 14,11 14,38
14,38 14,65 14,91
14,91 15,18 15,45
15,45 15,71 15,98
15,98 16,21 16,45

Tabla 1: Intervalos.Valores mnimos (Min) y mximos (Max) de los Intervalos obtenidos


para los datos de consumo de combustible segn el criterio de Sturges, junto con sus respectivas
marcas de clases.

21
Criterio de Kaiser:

Min Marca de clase Max


9,05 9,09 9,12
9,12 9,16 9,20
9,20 9,23 9,27
9,27 9,31 9,35
9,35 9,38 9,42
9,42 9,46 9,49
9,49 9,53 9,57
9,57 9,60 9,64
9,64 9,68 9,71
9,71 9,75 9,79
9,79 9,83 9,86
9,86 9,90 9,94
9,94 9,97 10,01
10,01 10,05 10,08

Tabla 2: Intervalos. Valores mnimos (Min) y mximos (Max) de los Intervalos obtenidos
para los datos de consumo de combustible segn el criterio de Kaiser, junto con sus respectivas
marcas de clases. Se muestran los primeros 14 intervalos, ya que segn este criterio se obtienen
100 intervalos, como se muestra en el archivo Excel.

Histogramas

Criterio de Sturges

Histograma criterio de Sturges


2500 120,00%
% acumulado
Frecuencia

2000 100,00%
1500 80,00% Frecuencia
60,00%
1000 40,00% % acumulado
500 20,00%
0 0,00%

Clase

Figura 1: Histograma segn Criterio de Sturges.

22
Criterio de Kaiser

Histograma criterio de Kaiser

400,00 120,00% Frecuencia

% acumulado
Frecuencia

350,00 100,00%
300,00 80,00%
250,00
200,00 60,00%
150,00 40,00%
100,00 20,00% %
50,00
0,00 0,00% acumulado
10,42

11,08

11,75

12,41

13,08

13,74

14,41

15,07

15,74

16,41
9,09

9,75

Clase

Figura 2: Histograma segn Criterio de Kaiser.


2
Anlisis de Chi cuadrado, X

Criterio de Sturges

min mx. Y1 Y2 rea 1 rea 2 Oi Frecuencia Ei X^2


9,05 9,58 -2,56 -2,04 0,52 2,06 1,54 472 4,70 2,13
9,58 10,12 -2,04 -1,52 2,06 6,41 4,35 553 5,51 0,25
10,12 10,65 -1,52 -1,00 6,41 15,83 9,42 631 6,29 1,56
10,65 11,18 -1,00 -0,48 15,83 31,50 15,67 1162 11,58 1,44
11,18 11,71 -0,48 0,04 31,50 51,51 20,01 1687 16,81 0,61
11,71 12,25 0,04 0,56 51,51 71,14 19,63 2244 22,36 0,33
12,25 12,78 0,56 1,08 71,14 85,93 14,79 2099 20,92 1,80
12,78 13,31 1,08 1,60 85,93 94,48 8,56 963 9,60 0,11
13,31 13,85 1,60 2,12 94,48 98,28 3,80 197 1,96 1,72
13,85 14,38 2,12 2,64 98,28 99,58 1,30 25 0,25 4,40
14,38 14,91 2,64 3,16 99,58 99,92 0,34 1 0,01 10,89
14,91 15,45 3,16 3,68 99,92 99,99 0,07 0 0,00 0,00
15,45 15,98 3,68 4,19 99,99 100,00 0,01 0 0,00 0,00
15,98 16,45 4,19 4,65 100,00 100,00 0,00 1 0,01 0,01

Tabla 3: Anlisis de Chi cuadrado, bajo el criterio de Sturges

23
Criterio de Kaiser

min max Y1 Y2 rea 1 rea 2 Oi Frecuencia Ei X^2


9,05 9,12 -2,56 -2,49 0,52 0,64 0,12 72 0,72 0,50
9,12 9,20 -2,49 -2,42 0,64 0,78 0,14 53 0,53 0,28
9,20 9,27 -2,42 -2,34 0,78 0,95 0,17 52 0,52 0,23
9,27 9,35 -2,34 -2,27 0,95 1,15 0,20 54 0,54 0,21
9,35 9,42 -2,27 -2,20 1,15 1,39 0,24 60 0,60 0,22
9,42 9,49 -2,20 -2,13 1,39 1,67 0,28 52 0,52 0,11
9,49 9,57 -2,13 -2,06 1,67 1,99 0,32 105 1,05 0,50
9,57 9,64 -2,06 -1,98 1,99 2,36 0,37 115 1,15 0,52
9,64 9,71 -1,98 -1,91 2,36 2,79 0,43 43 0,43 0,00
9,71 9,79 -1,91 -1,84 2,79 3,29 0,49 95 0,95 0,22
9,79 9,86 -1,84 -1,77 3,29 3,85 0,56 74 0,74 0,04
9,86 9,94 -1,77 -1,70 3,85 4,49 0,64 62 0,62 0,00
9,94 10,01 -1,70 -1,62 4,49 5,22 0,72 66 0,66 0,01
10,01 10,08 -1,62 -1,55 5,22 6,03 0,81 92 0,92 0,01
10,08 10,16 -1,55 -1,48 6,03 6,95 0,91 45 0,45 0,48
10,16 10,23 -1,48 -1,41 6,95 7,96 1,01 78 0,78 0,07

Tabla 4: Anlisis de Chi cuadrado, bajo el criterio de Kaiser. Se ilustran los primero datos, de un
total de 100.

24