Documentos de Académico
Documentos de Profesional
Documentos de Cultura
03 Guia Análisis de Datos
03 Guia Análisis de Datos
Tiempo
de
servicio
Inicio atencin
LLEGADA
Fin atencin
SALIDA
Los nmeros deben emplear punto para la separacin de cifras decimales y no emplear separadores de
miles.
sin
separador
de miles
3456.6578
con PUNTO
DECIMAL
Dependiendo de la versin de MS Excel que se maneje puede que ste sea el formato por default para
los nmeros. De lo contrario debe cambiar los nmeros a este formato descrito. Para ello se sigue la
siguiente ruta: Herramientas \ Opciones como se muestra en el screenshot inferior.
Se selecciona el tab. Internacional se quita el check del checkbox Usar separadores del sistema. Luego
se procede a definir en el campo separador decimal el smbolo de PUNTO (.)
Tras este cambio los datos se hallarn con puntos decimales. Es posible ahora que sean ingresados al
Input Analizer. Para esto guardamos el archivo con otro nombre. Seguimos la ruta Archivo \ Guardar
como y guardamos el archivo con un nombre que permita identificar las datos que estamos guardado y
el tipo de archivo ser
TEXTO DELIMITADO POR TABULACIONES (Extensin .txt)
Luego aparecern una serie de ventanas de dialogo, se le da aceptar (S) a todas. Finalmente salimos
del Excel y volver a aparecer las mismas ventanas de dialogo, se les da nuevamente aceptar (S) a
todas.
Dado que en el Trabajo Integral emplearn ms de una serie de datos identifiquen claramente cada
archivo generado para que lo puedan identificar fcilmente al abrirlo con el INPUT ANALIZER y
preferiblemente guarden todos en una misma carpeta o ubicacin. En el caso del ejemplo el archivo que
contena los tiempos entre llegadas se esta guardando como llegadas.txt
2. Abriendo el archivo en Input Analizer de Arena
El INPUT ANALYZER se instala por default en la misma carpeta del Arena. Para abrirlo se sigue la
siguiente ruta
Inicio \ Todos los programas \ Rockwell Software \ Arena 9.0 \ Input Analizer
El primer paso consiste en ir a File \ New alternativamente darle clic al icono de hoja nueva en la barra
Luego se procede a vincular en esta nueva hoja de trabajo los datos de tiempos entre llegadas/tiempos
de servicio que tenamos guardados en formato txt. Para estos se accede al men File \ Data File\ Use
Existing damos clic en el icono superior de la barra.
Accedemos a la ubicacin donde guardamos el archivo con extensin txt y seleccionados en Tipo Text
files (*.txt) y aparece el archivo que guardamos previamente en MS Excel con tipo texto delimitado por
tabulaciones lo seleccionamos y damos clic en Abrir. Se muestra la siguiente pantalla:
El INPUT ANALYZER automticamente toma los datos y los agrupa por intervalos mostrando un
histograma de frecuencias observadas en cada intervalo. Tambin presenta en la parte inferior la
siguiente data:
DATA SUMMARY
Number of Data Points
Min Data Value
Max Data Value
Sample Mean
Sample Std Deviation
HISTOGRAM SUMMARY
Histogram range
Number of Intervals
El primer grupo resume el nmero de datos, el valor mnimo, el valor mximo la media y la desviacin
estndar de la data analizada. El segundo grupo proporciona para el histograma los rangos de los
intervalos y el nmero de intervalos.
El Input Analyzer permite determinar ajustes a una gama de distribuciones estadsticas. Para ajustar la
data a una en particular se sigue la ruta Fit y se selecciona alguna de las posibles
Se puede proceder a seleccionar alguna si se tiene una idea aproximada de a cual distribucin estadstica
podran ajustar los datos, sin embargo lo ptimo
es emplear la ltima opcin Fit All que selecciona
entre todas las distribuciones aplicables a la data
aquella que se ajuste mejor. Seleccionamos en
este caso Fit All y se muestra la siguiente
pantalla:
Se obtiene entonces la distribucin que mejor ajusta a los datos y en el campo inferior la siguiente
informacin:
DISTRIBUTION SUMMARY
Distribution
Expression
Square error
CHI SQUARE TEST
Number of intervals
Degrees of freedom
Test statistic
Corresponding p-value
KOLMOGOROV-SMIRNOV TEST
Test Statistic
Corresponding p-value
Para analizar si los datos ajustan a la distribucin mostrada podemos revisar los p-values de las pruebas.
Si el valor del p-value es menor o igual al nivel de confianza (0.05) se rechaza la hiptesis nula de la
prueba, caso contrario no existen evidencias de que no siga la distribucin dada. La condicin para
aceptar es entonces que:
--------------------------------------------------------------------------------------------------------------------------------------------OBSERVACIN. Tenga en cuenta que el Input Analyzer es una herramienta de procesamiento de datos
y ejecucin de pruebas de bondad de ajuste, que si bien le facilita en gran medida el anlisis de la
informacin al poder discernir si los datos ingresados son discretos o no, y en base a ello presentar el
resultado de una o ambas pruebas de bondad de ajuste respectivamente, e incluso brindarle la opcin de
presentar la opcin de mejor ajuste entre todas las disponibles no llega a ser completamente
independiente del anlisis cuidadoso de los resultados por parte del analista.
Existen limitaciones importantes. Una de ellas es que si se ingresan datos discretos si bien el Input es
capaz de reconocerlos y ejecutar solamente la prueba de bondad de ajuste Chi cuadrado, al ser sta
aplicable tanto a discretos como continuos, permite que se prueben como posibles candidatos de ajuste a
distribuciones continuas, y en muchos casos pueden ser sugeridas como las de mejor ajuste para datos
discretos, lo cual no necesariamente es coherente con los tipos de datos que se generan en la realidad, y
por lo tanto emplear dichas distribuciones para simular datos sera ir en contra de los principios de
representacin adecuada del sistema real que se pretende simular. Otra limitante importante que debe
tener en cuenta es el hecho de que el Input Analyzer no requiere un nmero de datos mnimos y por lo
tanto puede aplicar pruebas de bondad de ajuste y presentar resultados aun cuando el nmero de datos
ingresados es menor a los mnimos recomendados tericamente en el caso de la prueba Chi Cuadrado.
Es por ello que debe tener especial cuidado en el anlisis de los resultados y no aceptar a priori el
resultado de Best Fit hallado a travs del Fit All como la respuesta absoluta inequvoca pues existira una
probabilidad importante de cometer errores si se automatiza en el uso de la herramienta.
--------------------------------------------------------------------------------------------------------------------------------------------El Input permite adems revisar el orden de ajuste de los datos a las diferentes distribuciones posible en
funcin del error cuadrado ordenado en forma ascendente. Para ver este resumen se sigue la siguiente
ruta: Window \ Fit All Summary
Como se puede ver en este caso la siguiente distribucin con menor error cuadrado es la Beta. Se puede
revisar el ajuste con una distribucin gamma para observar los p values.
Comparando los resultados de ambas pruebas observamos que en este caso bajo un ajuste a la
distribucin gamma el pvalue tambin es mayor a 0,05 en la prueba KS, e incluso en la prueba Chi
Cuadrado. Sin embargo como tiene un error de 0.004524 es preferible seleccionar la distribucin Beta
que pasa ambas pruebas y tiene un menor error de 0.00314 que refleja un mejor ajuste por ser menores
las diferencias entre los valores de la data y la curva de ajuste. Los datos entonces se pueden modelar
con la expresin:
BETA(0.707, 2.74645 )
Alfa= 0.707
Beta=2.74645
Offset=0
OBSERVACION El Offset es un termino constante que se suma a la distribucin que no tiene efecto
sorbe la varianza slo sobre la media. En este caso es cero pero puede tomar valor positivo o negativo
en otros ajustes.
Lo que quiere decir que dada la data histrica ingresada se pueden simular futuros tiempo entre llegadas
generados a partir de dicha distribucin con los parmetros proporcionados por el Input Analyzer
En el caso de que los datos ingresados no puedan ajustarse a ninguna distribucin se procede a
emplear una distribucin emprica. Para generarla se selecciona Fit y luego Empirical con lo cual el
Input Analyzer genera automticamente una distribucin emprica en base a los datos del archivo.
Si los parmetros del histograma son modificados luego de que una funcin de distribucin ha sido
seleccionada, automticamente se genera una nueva curva que se ajuste a los parmetros actualizados
del histograma.
Distribution command (Options, Parameters menu)
Esta opcin es accesible cuando alguna funcin de
distribucin (diferente a la Emprica) ha sido ajustada a la
data. Si se selecciona esta opcin parece una ventana
donde se pueden cambiar los parmetros de dicha
distribucin en particular. Cuando un parmetro de la
distribucin cambia, una nueva evaluacin del ajuste se
efecta. Por ejemplo si se tuviera un data file con una
distribucin normal ajustada la ventana que mostrara la
opcin de Parameters/Distributions sera:
c) Colors
Ofrece una serie de opciones para cambiar el esquema de colores empleado en el fondo, barras, lneas y
curvas de ajuste de cada histograma y ajuste efectuado.