Está en la página 1de 29

Universidad de Santiago de Chile

Facultad de Ingeniera
Departamento de Ingeniera en Minas

INFERENCIA ESTADSTICA PARA EL


CONSUMO DE COMBUSTIBLE DE UNA
FLOTA DE CAMIONES
Franco Herrera Olivares
Joaqun Andrs Lanez

Profesor: Sebastin Prez Cortes


Ayudante: Alejandro Gonzlez
Asignatura: 17194-0 Modelacin y Simulacin
Coordinacin: L-5

Fecha: 16/04/2015

RESUMEN EJECUTIVO
El presente informe abarca la base de datos del gasto de combustible que tienen los camiones de la
compaa minera VOLCAN S.A.A que se dirigen a la Planta San Expedito, para esto se realiza un
anlisis estadstico inferencial que permite diagnosticar si los valores obtenidos por VOLCAN S.A.A
tiene una correlacin normal en su distribucin.
Para representar los intervalos de los datos, se ocupan tres mtodos estadsticos: Mtodo grupal,
mtodo raz de n y mtodo de struges.
En el estudio estadstico bsico de los datos registrados, se obtiene el camin que gasto menos
combustible (3 (L/h)), el que ms gasto (16 (L/h)), el promedio de consumo de combustible (10.61
(L/h)) con la respectiva desviacin estndar (2.77 (L/h)).
Al hacer un histograma, con la frecuencia, porcentaje de acumulado y marca de clase, se infiere la
amplitud y cantidad de intervalos que tiene cada mtodo, adems al graficar la distribucin normal
de cada dato en el histograma se observa una curva similar a la campana de Gauss, lo cual es un
indicio de que los datos tengan una distribucin normal.
En la realizacin del test de Chi Cuadrado se desprende lo siguiente para cada mtodo:

En el mtodo grupal, existe evidencia suficiente para indicar que los valores obtenidos no tienen
una correlacin normal en su distribucin con un nivel de confianza de 95% y 7 grados de
libertad, por lo que se recomienda un nivel de confianza del 99%.
En el mtodo Raz de n, existe evidencia para indicar que los valores se ajustan muy bien a una
distribucin normal con un nivel de confianza de 95% y 74 grados de libertad.
En el mtodo de Struges, existe evidencia suficiente para rechazar la hiptesis nula con un nivel
de confianza de 95% y 11 grados de libertad.

Dado lo anterior, se recomienda el anlisis basado en el mtodo de raz de n para la agrupacin de


los datos. Adems un monitoreo permanente en la mecnica de los camiones e identificar los
factores que interfieren en el gasto de combustible para lograr una distribucin estndar menor y
una concentracin de datos en la zona inferior de los consumos de combustibles.

ndice
RESUMEN EJECUTIVO .......................................................................................................................... 2
1

INTRODUCCIN ........................................................................................................................... 5

OBJETIVOS ................................................................................................................................... 6

2.1

Objetivo Principal ................................................................................................................ 6

2.2

Objetivos Secundarios ......................................................................................................... 6

MARCO TERICO ......................................................................................................................... 7


3.1

Estadstica Descriptiva......................................................................................................... 7

3.1.1

Rango........................................................................................................................... 7

3.1.2

Media .......................................................................................................................... 7

3.1.3

Desviacin Estndar .................................................................................................... 7

3.1.4

Frecuencia Absoluta .................................................................................................... 7

3.1.5

Marca de Clase ............................................................................................................ 7

3.2

Tabulacin de Datos ............................................................................................................ 7

3.2.1

Criterio Grupal: ............................................................................................................ 7

3.2.2

Criterio Raz de n: ........................................................................................................ 7

3.2.3

Criterio Sturges:........................................................................................................... 8

3.3

Distribucin Normal ............................................................................................................ 8

3.4

Dcima Bondad de Ajuste ................................................................................................... 8

3.4.1
4

Test de Chi Cuadrado .................................................................................................. 9

PROCEDIMIENTOS ..................................................................................................................... 10
4.1

Para la estadstica descriptiva ........................................................................................... 10

4.2

Para realizar un Histograma .............................................................................................. 11

4.3

Para la Distribucin Normal .............................................................................................. 12

4.4

Normalizacin de Datos .................................................................................................... 12

4.5

Test de Chi Cuadrado ........................................................................................................ 13

RESULTADOS ............................................................................................................................. 15

ANLISIS DE LOS RESULTADOS.................................................................................................. 17


6.1

Anlisis para tabla de estadstica descriptiva (Tabla 5.1).................................................. 17

6.2

Anlisis para mtodo grupal ............................................................................................. 17

6.3

Mtodo raz de n ............................................................................................................... 18


3

6.4

Mtodo de struges ............................................................................................................ 19

CONCLUSIONES Y RECOMENDACIONES .................................................................................... 20

BIBLIOGRAFA ............................................................................................................................ 21

ANEXOS ..................................................................................................................................... 22
9.1

Para el criterio grupal ........................................................................................................ 22

9.2

Para de Raz de n ............................................................................................................... 24

9.3

Para mtodo de struges .................................................................................................... 27

INTRODUCCIN

En la actualidad minera el carguo y transporte es uno de los procesos ms importantes y puede


llegar a representar el 60% de los costos operacionales del proceso de explotacin. Pero cabe
mencionar que el consumo de combustible es una variable clave que afecta el costo final de la
tonelada transportada por un camin. Por esto, en la compaa minera VOLCAN S.A.A los datos que
tienen respecto al consumo de combustible se convierten en una problemtica. Dado esto, el
siguiente informe busca solucionar dicha problemtica analizando estadsticamente el conjunto de
datos con los que cuenta VOLCAN S.A.A.
La necesidad de realizar un anlisis estadstico se justifica debido a que una flota de camiones puede
llegar a consumir el 80% del combustible ocupado en una mina y por ende manejar la distribucin
de los datos de combustibles es de suma importancia para la mina.
Por otra parte tambin se informa; la estadstica descriptiva e histograma de los mtodos utilizados,
la normalizacin de los datos, el test de Chi Cuadrado de los datos y si es posible concluir que los
datos tienen una distribucin normal.
Para la realizacin de este proyecto se procedi a realizar una revisin bibliogrfica, la utilizacin de
pginas web y una nivelacin del programa Excel de Microsoft Office.
Para finalizar en necesario indicar que el trabajo se divide en; 1. Visin general del problema y las
soluciones, 2. Anlisis estadstico preliminar de las variables de inters, 3. Estandarizacin de las
mediciones, 3. Prueba de ajuste Chi Cuadrado, 4. Anlisis de los resultados, 5. Conclusiones.

OBJETIVOS

2.1

Objetivo Principal

Realizar un anlisis estadstico inferencial que permita determinar si el conjunto de valores tomados
por VOLCAN S.A.A tiene una correlacin normal en su distribucin.

2.2

Objetivos Secundarios

Hacer un anlisis estadstico preliminar de las variables de inters.


Elaborar la estandarizacin de las mediciones a valores cannicos sobre la distribucin
normal.
Efectuar una prueba de bondad de ajuste Chi cuadrado.
Determinar si es posible para cada criterio de tabulacin la confianza que se debe utilizar
para concluir que la distribucin de los datos se distribuye normal.

MARCO TERICO

3.1 Estadstica Descriptiva


La estadstica descriptiva recolecta, ordena, clasifica y representa un conjunto de datos obtenidos
por observaciones o estudios con la finalidad de describir apropiadamente las caractersticas de
estos y poder obtener conclusiones.
Para la utilizacin de la estadstica descriptiva en el informe, es necesario manejar los siguientes
conceptos bsicos:
3.1.1 Rango
Es el intervalo entre el valor mximo y mino, el cual permite obtener una idea de la
dispersin de los datos.
3.1.2 Media
Es el promedio de todos los datos, para efecto de este informe de utiliza la media aritmtica.
Dado los n nmeros {1, 2, 3 }, se define como:
=

1 + 2 + 3

Ecuacin 3.1 Media

3.1.3 Desviacin Estndar


Es una variacin esperada con respecto a la media aritmtica, sea es una medida de
dispersin. Se define como la raz cuadrada de la varianza y se representa con el smbolo .
3.1.4 Frecuencia Absoluta
Es el nmero de veces que aparece un determinado valor en un estudio estadstico
3.1.5 Marca de Clase
Es el punto medio de cada intervalo y un valor representativo de cada intervalo.
3.2 Tabulacin de Datos
Se refiere a organizar los datos en intervalos, para esto se puede utilizar tres criterios, donde n es el
nmero de datos:
3.2.1

Criterio Grupal:
=

3.2.2

10

Criterio Raz de n:
= /

3.2.3

Criterio Sturges:
= /(1 + 3.322 log())

3.3 Distribucin Normal


Es una distribucin de probabilidad de variables continua, que permite modelar fenmenos reales
o naturales.
Los parmetros que determinan una distribucin normal es la media y la desviacin estndar. Si es
mayor la desviacin estndar mayor es la dispersin de la variable
Su funcin de densidad es:
() =

1
2

1 2
(
)
2

Ecuacin 3.2 Funcin de densidad

La grafica de su funcin de densidad tiene una forma acampanada y simtrica, la cual se conoce
como campana de Gauss.

Ilustracin 3.1 Campana de Gauss

3.4 Dcima Bondad de Ajuste


La prueba de bondad de ajuste describe lo bien que se ajusta un modelo estadstico a un conjunto
de observaciones.
La prueba compara la distribucin de frecuencias observadas de una variable con la distribucin de
la misma variable medida en un grupo de referencia.
En este caso se quiere saber si un conjunto de valores tiene una correlacin normal en su
distribucin, para esto se aplica una dcima para datos tabulados, basado en el test de ChiCuadrado:

3.4.1 Test de Chi Cuadrado


Para el caso de una distribucin normal el test se debe plantear las siguientes hiptesis:
0 : ~(, ) La variable se ajusta a la distribucin planteada.
1 : (, ) La variable no se ajusta a la distribucin planteada.
Y la estadstica a utilizar:

=
=1

( )2

Ecuacin 3.3 Chi Cuadrado Observado

Donde:
=
n: Tamao de la muestra.
pi: Probabilidad del i-simo valor o intervalo de valores segn la hiptesis nula.
: Frecuencia absoluta esperada.
: Frecuencia absoluta observada o emprica.
Cuanto mayor sea el valor de 2 , mayores son las discrepancias entre la frecuencia observada y
esperada. De la misma forma, cuanto ms se aproxima a cero el valor de 2 , ms ajustadas estn
ambas distribuciones, sea concuerdan exactamente.
Se utiliza el siguiente criterio de decisin para las hiptesis:

Se rechaza 0 cuando 2 > 21;1. No se rechaza caso contrario.


Donde:
-

K-r-1: Es el grado de libertad.


K: Numero de intervalos.
r: Numero de parmetros estimados a partir de los datos muestrales
: Nivel de significacin

PROCEDIMIENTOS

Para los siguientes procedimientos se cuenta con la base de datos de la tasa de combustible de los
camiones con direccin a Planta San Expedito de la compaa minera VOLCAN S.A.A. Para esto en
necesario hacer un filtro en la base de datos, para estudiar solo los valores que son de importancia.
La realizacin del anlisis se hace con el programa Excel de Microsoft Office.
4.1

Para la estadstica descriptiva


1. Ingresar a la pestaa Datos de Excel.
2. Hacer clic en Anlisis de Datos y elegir la opcin de Estadstica Descriptiva. Donde
aparecer una ventana (Ilustracin 4.1).

Ilustracin 4.1 Ventana Excel de Estadstica Descriptiva

3. Donde dice Rango de entrada, seleccionar los datos del consumo de combustible.
4. En Rango de Salida, seleccionar el cuadro donde se quiere ver las estadsticas.
5. Seleccionar las opciones de Resumen de estadsticas y Nivel de confianza para la media
95%.
6. Se obtiene una tabla que indica un conjunto de datos estadsticos, se marcan los datos que
interesan para el trabajo (Tabla 4.1).
Columna1
Media
Error tpico
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Curtosis
Coeficiente de asimetra
Rango
Mnimo
Mximo
Suma
Cuenta
Nivel de confianza(95.0%)

10,60590645
0,036174619
11,36
11,78
2,768717493
7,665796557
0,301648007
-0,870359562
13
3
16
62129,4
5858
0,070915604

Tabla 4.1 Datos estadsticos

10

4.2

Para realizar un Histograma


1. Ingresar en dos celdas el rango y el criterio de tabulacin que se ocupar (revisar tem 3.2).
2. Crear dos celdas la primera con el nombre de LI (Lmite inferior) y al lado derecha de esta
la segunda con el nombre de LS (Lmite superior).
3. La primera celda que se encuentra bajo LS corresponde a Mnimo de la tabla 4.1.1, y la
celda que se entraba bajo LS corresponde a las suma entre el lmite inferior y el criterio que
se va utilizar (LS + Ci).
4. El valor de la Segunda celda que se encuentra bajo LI es el valor de la celda que se encuentra
bajo LS y el valor de la segunda celda que se encuentra en LS corresponde a LS+Ci. Esto se
hace reiteradas veces hasta que el valor de LS llegue a 16.
5. Crea una celda con el nombre de xi (Marca de clase), esta corresponde al promedio entre
LS y LI.
6. Hacer clic en la pestaa Datos.
7. Hacer clic en Anlisis de Datos y elegir la opcin de Histograma. Donde aparecer una
ventana similar a la Ilustracin 4.2.

Ilustracin 4.2 Ventana Excel, Histograma

8. Ingresar los valores correspondientes en los cuadros; Rango de entrada, Rango de


clases y Rango de Salida. Luego seleccionar las opciones Porcentaje de acumulado y
Crear grafico, hacer clic en aceptar.
9. Aparecer un histograma y una tabla
10. En la tabla se debe eliminar la ltima fila y en la columna Clase ingresar los datos de xi.

11

4.3

Para la Distribucin Normal


1. Al lado de la tabla generada por el histograma, crear una celda con el nombre de
Distribucin Normal.
2. Bajo esta casilla escribimos la formula =DISTR.NORM.N(x;media;desv_estndar;acum), x
es la marca de clase, media y desv_estandar se obtiene de la tabla de Datos estadsticos
y en acum se selecciona FALSO (Imagen 4.3.1).
3. Hacer el paso dos para la columna completa de Distribucin Normal (Ilustracin 4.3).
4. Graficar la columna de Distribucin Normal en el histograma.

Ilustracin 4.3 ejemplo para determinar la distribucin normal

4.4

Normalizacin de Datos
1. Crear dos celdas, una con el nombre Z1 y la otra a la derecha de esta, con el nombre de
Z2.
2. En la celda Z1 y Z2 se escribe la formula =NORMALIZACION(x;media;desv_estndar), x
corresponde a LI para Z1 y a LS para Z2, los otros valores se obtienen de la Estadstica
descriptiva (Ilustracin 4.4).

Ilustracin 4.4 Ejemplo de la normalizacin del lmite inferior y lmite superior.

12

3. Crear dos celdas ms con el nombre de A1 (rea 1) y A2 (rea 2) respectivamente.


4. Escribir en estas celdas la formula =DISTR.NORM.ESTAND(z)*100, donde z corresponde a
la variable Z1 para A1 y Z2 para A2 (Ilustracin 4.5).

Ilustracin 4.5 Ejemplo para determinar las reas normalizadas

4.5

Test de Chi Cuadrado


1. Generar dos celdas, la primera con el nombre de EJ (valor esperado) y la segunda con el
nombre de OJ (valor observado).
2. La celda EJ corresponde a la diferencia entre A2 y A1 (A2 A1) (Ilustracin 4.6).

Ilustracin 4.6 Ejemplo para determinar la frecuencia esperada

3. En OJ se ingresa la formula =(frecuencia de fila/tamao muestra)*100 (Ilustracin 4.7).

Ilustracin 4.7 Determinacin de la frecuencia observada

13

4. Se realiza una nueva celda con el nombre de ((Ej-Oj)^2)/Ej.


5. Se ingresa en la nueva celda la funcin =((Ej-Oj)^2)/Ej (ilustracin 4.8).

Ilustracin 4.8 Ejemplo para poder determinar el Chi cuadrado

6. Hacer la suma completa de la columna ((Ej-Oj)^2)/Ej. Esta suma representa el valor de ChiCuadrado observado.
7. En las celdas realizar una tabla con los nombres de: Chi cuadrado observado, Grados de
libertad, Chi Cuadrado 5% y Chi cuadrado 95%.
8. Grado de libertad es el nmero de intervalos menos la cantidad de estimadores (revisar
tem 3.4.1)
9. En Chi cuadrado 5% y Chi cuadrado 95 %, se escribe la funcin
=PRUEBA.CHICUAD(probabilidad; grados_de_libertad), donde la probabilidad es de 0.05 y
0.95 respectivamente.
10. En Grados de significacin ingresar la funcin =INV.CHICUA(probabilidad;
grados_de_libertad) (Ilustracin 4.9) .

Ilustracin 4.9 Determinacin del Chi cuadrado, grados de libertad y nivel de significacin

Luego todos estos pasos se repiten para cada criterio de tabulacin (revisar el tem 3.2), de modo
de que se pueda hacer una comparacin.

14

RESULTADOS

Los datos entregados por la compaa VOLCAN S.A.A contienen informacin sobre todos los
camiones que operan en su faena, sin embargo el estudio se focaliza en los camiones con direccin
a la planta de San Expedito, los cuales poseen una carga de sulfuros.
A partir de la informacin entregada, se obtuvo la siguiente estadstica para los camiones en estudio
(Tabla 5.1):
Estadstica
Media
Error tpico
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Curtosis
Coeficiente de asimetra
Rango
Mnimo
Mximo
Suma
Cuenta
Nivel de confianza (95.0%)

10,61
0,04
11,36
11,78
2,77
7,67
0,30
-0,87
13,00
3,00
16,00
62129,40
5858,00
0,07

Tabla 5.1: estadstica para camiones con sulfuros

A partir de esto se realizar una prueba de bondad de ajuste, el nmero de intervalos obtenidos
para cada mtodo es el siguiente:
-

Mtodo Grupal: 10 intervalos.


Mtodo raz de n: 77 intervalos.
Mtodo de struges: 14 intervalos.

Aplicando una prueba de bondad de ajuste, para comprobar si es que los datos de consumo de
combustible de los camiones que se dirigen a la planta de San Expedito, se obtuvieron los siguientes
resultados para cada mtodo:
-

Mtodo grupal
Chi cuadrado observado
Grados de libertad
Chi cuadrado 5%
Chi cuadrado 95%
Nivel de confianza requerido

33,6866986
7
2,16734991
14,0671404
1,9712E-05

Tabla 5.2: Datos de bondad de ajuste, mtodo grupal

15

Mtodo raz de n
Chi cuadrado observado
Grados de libertad
Chi cuadrado 5%
Chi cuadrado 95%
Nivel de confianza requerido

46,91
74
55,1892311
95,0814667
0,99414817

Tabla 5.3: Datos de bondad de ajuste, mtodo raz de n

Mtodo de struges:
Chi cuadrado observado
Grados de libertad
Chi cuadrado 5%
Chi cuadrado 95%
Nivel de confianza requerido

39,89451046
11
4,574813079
19,67513757
3,73E-05

Tabla 5.4: datos de bondad de ajuste, mtodo de struges

16

ANLISIS DE LOS RESULTADOS

Los datos entregados por la empresa VOLCAN S.A.A corresponden a datos de muchos camiones con
direcciones distintas, sin embargo el anlisis se centra en el consumo de combustible de los
camiones con direccin a la planta de San Expedito
De estos camiones, se descarta la informacin donde la velocidad es negativa o excede los 50 km/h
lo cual se utiliza como velocidad mxima dentro de la mina. Luego de descartar los datos que no
entran en el estudio, se dividen estos en intervalos a partir de tres mtodos los cuales se consideran
ms apropiados para un estudio estadstico.
-

Mtodo grupal
Mtodo raiz de n
Mtodo de struges

De los cuales, el mtodo raz de n es el que genera una mayor cantidad de intervalos de estudio, por
lo tanto permite un estudio acabado de la seleccin de datos considerada.
Utilizando el mtodo raz de n y el mtodo de struges se obtienen intervalos de amplitud 0,169 y
0,962 respectivamente, provocando que el valor superior del ltimo intervalo corresponda a un
valor mayor al consumo de combustible mximo (16 l/h), debido a esto, el valor del lmite superior
del ltimo intervalo se cierra en 16 l/h aunque se pierda la simetra entre estos.
Previo a una prueba de bondad de ajuste, se realiza una normalizacin de los datos para luego
elaborar una curva normal cannica, con la cual se puede tener un indicio de un posible
comportamiento normal de los datos seleccionados. Luego de la confeccin de la curva normal
cannica, se puede observar que el comportamiento de esta se asimila a una distribucin normal
por cualquiera de los mtodos a utilizar, para corroborarlo, es necesario realizar una prueba de
bondad de ajuste con los datos seleccionados. Los valores de los datos normalizados y la curva
normal cannica para estos se encuentra en la seccin de anexos
El anlisis de los resultados obtenidos se realiza por separado para cada caso.

6.1 Anlisis para tabla de estadstica descriptiva (Tabla 5.1)


Los 3 (L/h) que muestra el valor mnimo indica que ese fue el menor combustible ocupado por un
camin del mismo modo los 16 (L/h) que es el mximo seala el mximo combustible gastado por
un camin. Tambin se deduce el promedio de combustible gastado por hora en la flota de camiones
(10.61) con la respectiva desviacin estndar 2.77 que puede tener el consumo de algn camin.
6.2 Anlisis para mtodo grupal
Para el caso del mtodo grupal se trabaja con una cantidad de 10 intervalos con igual amplitud entre
s, con sus respectivas marcas de clase, frecuencia, porcentaje acumulado y normalizacin de datos.
17

A partir de estos datos se elabora un histograma (presente en los anexos) para ilustrar los resultados
obtenidos.
Luego de una prueba de bondad de ajuste con las siguientes hiptesis:
-

H0 (hiptesis nula): ~(, )


H1: (, )

Con un nivel de significacin de 5% y 7 grados de libertad


2
2
Se obtiene un valor de 2 = 33,69 ;0,05;7
= 2,17; 0,95;7
= 14,06
2
2
Cuya regin crtica es: . [
> 0,95;7
]

2
Se comprueba que el valor de
pertenece a la regin crtica, es decir, existe evidencia suficiente
para rechazar H0 con un nivel de confianza de 95% y 7 grados de libertad.

Seguido de esto, se busca un valor de confianza para el cual si se distribuyen normalmente los datos
seleccionados, obteniendo un valor igual a 99,99%. Por lo tanto, el estudio de los datos sera
eficiente slo si se aplica un nivel de confianza de 99,99%.
6.3 Mtodo raz de n
Para el caso del mtodo raz de n se trabaja con una cantidad de 77 intervalos donde el ltimo de
estos no tiene igual amplitud que los anteriores ya que ste se cierra con el mayor valor de los datos
correspondiente a 16 l/h, cada intervalo posee su respectiva marca de clase, frecuencia, porcentaje
acumulado y normalizacin de datos. Con los datos mencionados anteriormente se elabora un
histograma (presente en los anexos) para ilustrar los resultados obtenidos.
Luego de una prueba de bondad de ajuste con las siguientes hiptesis:
-

H0 (hiptesis nula): ~(, )


H1: (, )

Con un nivel de significacin de 5% y 74 grados de libertad.


2
2
Se obtiene un valor de 2 = 46,91 ;0,05;74
= 55,19 ;0,95;74
= 95,08
2
2
Cuya regin crtica es: . [
> 0,95;74
]
2
2
2
2
Se comprueba que el valor de
< 0,95;74
y a su vez
< 0,05;74
, por lo tanto, existe
evidencia suficiente para aceptar H0 con un nivel de confianza de 95% y 74 grados de libertad. Sin
2
2
embargo como
< 0,05;74
los datos seleccionados se ajustan muy bien a una distribucin
normal.

18

6.4 Mtodo de struges


Para el caso del mtodo de struges se trabaja con una cantidad de 14 intervalos donde el ltimo de
estos no tiene igual amplitud que los anteriores ya que ste se cierra con el mayor valor de los datos
correspondiente a 16 l/h, con sus respectivas marcas de clase, frecuencia, porcentaje acumulado y
normalizacin de datos. A partir de estos datos se elabora un histograma (presente en los anexos)
para ilustrar los resultados obtenidos.
Luego de una prueba de bondad de ajuste con las siguientes hiptesis:
-

H0 (hiptesis nula): ~(, )


H1: (, )

Con un nivel de significacin de 5% y 11 grados de libertad


2
2
Se obtiene un valor de 2 = 39,89 ;0,05;7
= 4,57; 0,95;7
= 19,67
2
2
Cuya regin crtica es: . [
> 0,95;7
]

2
Se comprueba que el valor de
pertenece a la regin crtica, es decir, existe evidencia suficiente
para rechazar H0 con un nivel de confianza de 95% y 11 grados de libertad.

Seguido de esto, se busca un valor de confianza para el cual si se distribuyen normalmente los datos
seleccionados, obteniendo un valor igual a 99,99%. Por lo tanto, el estudio de los datos sera
eficiente slo si se aplica un nivel de confianza de 99,99%.

19

CONCLUSIONES Y RECOMENDACIONES

En base al estudio estadstico realizado para la compaa VOLCAN S.A.A. se analiz el consumo de
combustible de la flota de camiones que transportan slfuros hacia la planta de San Expedito con
motivo de identificar el comportamiento de los valores de consumo de cada uno de los camiones.
En base a los resultados del anlisis es posible identificar que:
a) Segn el estudio estadstico de los datos el consumo promedio de combustible es de 10,61
l/h con una moda de 11,78 l/h, una mediana de 11,36 l/h y desviacin estndar de 2,77.
Esto nos indica que la mayor concentracin de datos se encuentra entre 10,612,77 l/h.
Sin embargo existen 949 camiones que su consumo de combustible va por debajo de los
7,84 l/h. Se sugiere a la empresa monitorear la condicin mecnica de los camiones e
identificar los factores que interfieren en el consumo de combustible para que la mayor
concentracin de datos sea menor a la actual y as abaratar costos en cuanto a consumo de
combustible.
b) A al estandarizar las mediciones a valores cannicos sobre la distribucin normal y someter
los datos a una prueba de bondad de ajuste Chi cuadrado en base a tres mtodos de
tabulacin distinto llegamos a diferentes conclusiones.
- Mediante una prueba de bondad de ajuste por el mtodo grupal con un 95% de nivel
de confianza los datos recopilados no cumplen con un comportamiento normal, por lo
tanto no pueden ser estudiados como tal. Para lograr trabajar los datos a partir de una
distribucin normal es necesario utilizar 99,99% de nivel de confianza.
- Mediante una prueba de bondad de ajuste por el mtodo raz de n con un 95% de nivel
de confianza los datos recopilados cumplen con un comportamiento normal, el cual es
muy bueno, por lo tanto no se comete ningn error al estudiar los datos en base a una
distribucin normal.
Mediante una prueba de bondad de ajuste por el mtodo de struges ocurra una
situacin similar que al realizar una tabulacin segn el mtodo grupal. Por lo tanto,
trabajar los datos como una distribucin normal no sera factible a menos que se utilice
un 99,99% de nivel de confianza.

20

BIBLIOGRAFA

1. Jay Devore (2008), Probabilidad y Estadstica para Ingeniera y Ciencias, Sptima Edicin.
California Polytechnic State University
2. Test de Chi Cuadrado, visto el 11/04/2015 en:
http://www.ub.edu/aplica_infor/spss/cap5-2.htm
3. Combustible en minera, visto el 11/04/2015 en:
http://www.ingenieros.cl/wp-content/uploads/2013/06/Discurso-Sergio-Jimenez.pdf
4. Distribucin Normal, visto el 12/04/2015 en:
http://www.vitutor.net/1/55.html
5. Prueba de bondad de ajuste, visto el 12/04/2015 en:
http://www.facmed.unam.mx/deptos/salud/censenanza/planunico/spii/antologia2012/3.pdf

21

ANEXOS

Luego de realizar un filtro de los datos de combustible de la minera VOLCAN S.A.A, se obtiene una
tabla con la estadstica descriptiva de los respectivos datos filtrados (Tabla 9.1). De la cual se
desprenden los datos que se necesitan para hacer los clculos correspondientes.

Estadstica
Media
Error tpico
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Curtosis
Coeficiente de asimetra
Rango
Mnimo
Mximo
Suma
Cuenta
Nivel de confianza (95.0%)

10,61
0,04
11,36
11,78
2,77
7,67
0,30
-0,87
13,00
3,00
16,00
62129,40
5858,00
0,07

Tabla 9.1 Estadstica descriptiva de los datos de combustible

Las siguientes tablas, resultados y grficos se determinan aplicando las formulas y procedimientos
descritos en el tem 3 y tem 4. A continuacin se anexaran las tablas y grficos segn el criterio
ocupado (grupal, raz de n y struges):

9.1

Para el criterio grupal


Amplitud de intervalo:
= 10

Tabla que indica el Lmite inferior, lmite superior, marca de clase (x), frecuencia, distribucin
normal y porcentaje acumulado de los datos:

22

Lmite inferior
Lmite
Xi (marca de
(l/h)
superior (l/h)
clase)
3,00
4,30
3,65
4,30
5,60
4,95
5,60
6,90
6,25
6,90
8,20
7,55
8,20
9,50
8,85
9,50
10,80
10,15
10,80
12,10
11,45
12,10
13,40
12,75
13,40
14,70
14,05
14,70
16,00
15,35

Frecuencia
230,00
241,00
281,00
273,00
619,00
682,00
1631,00
1375,00
294,00
232,00

Distribucin
normal
0,01
0,02
0,04
0,08
0,12
0,14
0,14
0,11
0,07
0,03

Clase
3,65
4,95
6,25
7,55
8,85
10,15
11,45
12,75
14,05
15,35

%
acumulado
0,04
0,08
0,13
0,17
0,28
0,40
0,68
0,91
0,96
1,00

Tabla 9.2 Lmite inferior, lmite superior, Marca de clase, frecuencia, distribucin normal y porcentaje acumulado de los
datos registrados en la mina VOLCAN S.S.A

Histograma que representa la frecuencia, porcentaje acumulado y distribucin normal

Histograma criterio grupal


Frecuencia

2000

120,00%
100,00%
80,00%
60,00%
40,00%
20,00%
0,00%

1500
1000
500
0

Frecuencia
% acumulado
Normal canonica

Clase
Grfico 9.1: Histograma para el criterio grupal

Normalizacin de los datos para ocupar bondad de ajuste


Ai
3,00
4,30
5,60
6,90
8,20
9,50
10,80
12,10
13,40
14,70

Bi
4,30
5,60
6,90
8,20
9,50
10,80
12,10
13,40
14,70
16,00

z1
-2,75
-2,28
-1,81
-1,34
-0,87
-0,40
0,07
0,54
1,01
1,48

z2
-2,28
-1,81
-1,34
-0,87
-0,40
0,07
0,54
1,01
1,48
1,95

Area 1
0,30
1,14
3,53
9,04
19,24
34,48
52,79
70,53
84,36
93,04

Area 2
1,14
3,53
9,04
19,24
34,48
52,79
70,53
84,36
93,04
97,43

Tabla 9.3 Normalizacin de los datos

23

Calculo de valores para bondad de ajuste

Ej (esperado) Oj (observado)
0,837
3,926
2,392
4,114
5,507
4,797
10,207
4,660
15,235
10,567
18,316
11,642
17,733
27,842
13,828
23,472
8,684
5,019
4,392
3,960
Chi cuadrado observado

(ej-Oj)^2)/Ej
11,402
1,239
0,091
3,014
1,431
2,431
5,763
6,727
1,547
0,042
33,687

Tabla 9.4 Frecuencia Observada, Frecuencia Esperada, Chi Cuadrad Observado

Datos obtenidos al realizar el test de Chi cuadrado


Chi cuadrado observado
Grados de libertad
Chi cuadrado 5%
Chi cuadrado 95%
Nivel de Significacin necesario
Confianza necesaria

33,69
7,00
2,16
14,06
0,00002
0,99998

Tabla 9.5 Datos al realizar el test de Chi Cuadrado

9.2

Para de Raz de n
Amplitud de intervalo
= 1.698

24

Tabla que indica el Lmite inferior, lmite superior, marca de clase (x), frecuencia, distribucin
normal y porcentaje acumulado de los datos:
Lmite
inferior
(L/h)

Lmite
superior
(L/h)

Xi (marca
de clase)

Frecuencia

3,00
3,17
3,34
3,51
3,68
3,85
.
.
.
14,72
14,89
15,06
15,23
15,40
15,57
15,74
15,91

3,17
3,34
3,51
3,68
3,85
4,02
.
.
.
14,89
15,06
15,23
15,40
15,57
15,74
15,91
16,00

3,08
3,25
3,42
3,59
3,76
3,93
.
.
.
14,80
14,97
15,14
15,31
15,48
15,65
15,82
15,95

35,00
30,00
28,00
30,00
28,00
25,00
.
.
.
30,00
31,00
32,00
32,00
32,00
34,00
31,00
8,00

Distribucin
%
n normal acumulado
0,00
0,00
0,00
0,01
0,01
0,01
.
.
.
0,05
0,04
0,04
0,03
0,03
0,03
0,02
0,02

0,01
0,01
0,02
0,02
0,03
0,03
.
.
.
0,97
0,97
0,98
0,98
0,99
0,99
1,00
1,00

Tabla 9.6 Lmite inferior, lmite superior, Marca de clase, frecuencia, distribucin normal y porcentaje acumulado de los
datos registrados en la mina VOLCAN S.S.A

Histograma que representa la frecuencia, porcentaje acumulado y distribucin normal

Histograma criterio raiz de n


400
300
200
100
0

150,00%

15,82

14,97

14,13

13,28

12,43

11,58

9,88

10,73

9,03

8,18

7,33

6,48

5,63

4,78

3,93

100,00%

3,08

Frecuencia

50,00%

Frecuencia

0,00%

% acumulado
Normal canonica

Clase
Grfico 9.2: histograma criterio raz de n.

25

Normalizacin de los datos para ocupar bondad de ajuste


Ai

Bi

z1

z2

Area 1

Area 2

3,00
3,17
3,34
3,51
3,68
.
.
.
15,06
15,23
15,40
15,57
15,74
15,91

3,17
3,34
3,51
3,68
3,85
.
.
.
15,23
15,40
15,57
15,74
15,91
16,00

-2,75
-2,69
-2,62
-2,56
-2,50
.
.
.
1,61
1,67
1,73
1,79
1,85
1,92

-2,69
-2,62
-2,56
-2,50
-2,44
.
.
.
1,67
1,73
1,79
1,85
1,92
1,95

0,30
0,36
0,43
0,52
0,62
.
.
.
94,61
95,25
95,83
96,35
96,81
97,23

0,36
0,43
0,52
0,62
0,73
.
.
.
95,25
95,83
96,35
96,81
97,23
97,43

Tabla 9.7: normalizacin de datos

Calculo de valores para bondad de ajuste


Ej
Oj
(esperado) (observado)
0,06
0,07
0,08
0,10
0,12
.
.
.
0,64
0,58
0,52
0,46
0,41
0,20

0,60
0,51
0,48
0,51
0,48
.
.
.
0,55
0,55
0,55
0,58
0,53
0,14

(ejOj)^2)/Ej
4,70
2,68
1,82
1,72
1,14
.
.
.
0,01
0,00
0,00
0,03
0,03
0,02

Tabla 9.8: Datos para realizar bondad de ajuste.

26

Datos obtenidos al realizar el test de Chi cuadrado


Chi cuadrado observado
Grados de libertad
Chi cuadrado 5%
Chi cuadrado 95%

46,91
74,00
55,19
95,08

Tabla 9.9: Datos al realizar test de Chi cuadrado

9.3

Para mtodo de struges


Amplitud de los intervalos
= 0,962

Tabla que indica el Lmite inferior, lmite superior, marca de clase (x), frecuencia, distribucin
normal y porcentaje acumulado de los datos:
Lmite
Lmite
Xi (marca Distribucion
%
inferior
superior
Frecuencia
de clase)
n normal
acumulado
(l/h)
(l/h)
3,00
3,96
3,48
0,01
169,00
0,03
3,96
4,92
4,44
0,01
185,00
0,06
4,92
5,89
5,40
0,02
174,00
0,09
5,89
6,85
6,37
0,04
219,00
0,13
6,85
7,81
7,33
0,07
197,00
0,16
7,81
8,77
8,29
0,10
292,00
0,21
8,77
9,73
9,25
0,13
528,00
0,30
9,73
10,69
10,21
0,14
464,00
0,38
10,69
11,66
11,18
0,14
972,00
0,55
11,66
12,62
12,14
0,12
1482,00
0,80
12,62
13,58
13,10
0,10
706,00
0,92
13,58
14,54
14,06
0,07
210,00
0,96
14,54
15,50
15,02
0,04
179,00
0,99
15,50
16,00
15,75
0,03
81,00
1,00

Tabla 9.10: Lmite inferior, lmite superior, Marca de clase, frecuencia, distribucin normal y porcentaje acumulado de los
datos registrados en la mina VOLCAN S.S.A

27

Histograma que representa la frecuencia, porcentaje acumulado y distribucin normal

Histograma criterio struges


Frecuencia

2000,00
1500,00

1000,00
500,00

Frecuencia

Area 1
0,30
0,82
2,01
4,41
8,73
15,62
25,37
37,62
51,27
64,78
76,63
85,86
92,24
96,15

Area 2
0,82
2,01
4,41
8,73
15,62
25,37
37,62
51,27
64,78
76,63
85,86
92,24
96,15
97,43

15,75

15,02

14,06

13,10

12,14

11,18

9,25

10,21

8,29

7,33

6,37

5,40

4,44

3,48

0,00

1,20
1,00
0,80
0,60
0,40
0,20
0,00

% acumulado
normal canonica

Clase

Grfico 9.3: histograma criterio de struges

Normalizacin de los datos para ocupar bondad de ajuste


Ai
3,00
3,96
4,92
5,89
6,85
7,81
8,77
9,73
10,69
11,66
12,62
13,58
14,54
15,50

Bi
3,96
4,92
5,89
6,85
7,81
8,77
9,73
10,69
11,66
12,62
13,58
14,54
15,50
16,00

z1
-2,75
-2,40
-2,05
-1,70
-1,36
-1,01
-0,66
-0,32
0,03
0,38
0,73
1,07
1,42
1,77

z2
-2,40
-2,05
-1,70
-1,36
-1,01
-0,66
-0,32
0,03
0,38
0,73
1,07
1,42
1,77
1,95

Tabla 9.11: datos normalizados para bondad de ajuste

28

Calculo de valores para bondad de ajuste:


Ej (esperado)
0,52
1,19
2,40
4,32
6,89
9,75
12,25
13,65
13,50
11,85
9,23
6,38
3,91
1,28

Oj (observado)
2,88
3,16
2,97
3,74
3,36
4,98
9,01
7,92
16,59
25,30
12,05
3,58
3,06
1,38

(ej-Oj)^2)/Ej
10,76
3,28
0,13
0,08
1,81
2,33
0,85
2,41
0,71
15,26
0,86
1,22
0,19
0,01

Tabla 9.12: clculo de valores para bondad de ajuste

Calculo de valores obtenidos al realizar test de Chi cuadrado.


Chi cuadrado
39,89
observado
Grados de libertad
11,00
Chi cuadrado 5%
4,57
Chi cuadrado 95%
19,68
Nivel de
0,00004
significacin
Nicel de confianza
99,99800
Tabla 9.13: clculo de valores realizar test de chi cuadrado

29