Está en la página 1de 29

1

En el presente MTA analizaremos un conjunto de datos usando un histograma, el cual


nos permitir plantear la hiptesis acerca de la funcin que podra representar al
conjunto de datos bajo anlisis, posteriormente se ejecutar la prueba de bondad de
ajuste llamada Chicuadrado para verificar la veracidad de la hiptesis planteada.

Casi todos los eventos del mundo que nos rodea tienen un comportamiento aleatorio y
este comportamiento puede ser recreado usando funciones de probabilidad, por
ejemplo:
Sabas que con una distribucin de probabilidades POISSON podemos recrear la
cantidad de ordenes de compra que arriban cada da a la empresa?
Te imaginabas que con una distribucin de probabilidades EXPONENCIAL podemos
recrear el tiempo de atencin de los clientes en la ventanilla de un banco?
Las pruebas de bondad de ajuste nos permiten determinar qu funcin representa a un
conjunto de datos.

A continuacin, determinaremos la funcin de probabilidades a usar para representar


un proceso en un modelo de simulacin.

Iniciaremos analizando los datos recolectados.


Supongamos que tenemos una muestra de tamao 30, esta muestra es tomada a partir
de los tiempos histricos requeridos para atender a los usuarios y estn dados en
minutos, este es el paso inicial de recoleccin de los datos y los mostramos en el
siguiente cuadro de Tiempos de Actividad.
El segundo paso, es hallar los estadsticos mximo, mnimo, promedio y calcular la
cantidad de intervalos de clase, al cual llamaremos K, y el Ancho de Clase
La cantidad de intervalos es hallada usando la regla de STURGES y el ancho de clase
dividiendo la diferencia del mximo y mnimo valor observado entre K, para los datos
analizados, la cantidad de intervalos de clase es 5.87 y lo redondeamos a 6 y el ancho de
clase es 8.5.

El siguiente paso es crear los intervalos de clase.


De acuerdo al anlisis previo, se requiere K = 6 intervalos de clase y usaremos el ancho
de clase para hallar cada intervalo. Cada intervalo de clase tiene un lmite inferior y
superior.
Para el primer intervalo, el lmite inferior es igual al mnimo valor 1 y el limite superior
es obtenido sumando el limite inferior ms el ancho de clase 8.5, lo que nos da como
resultado 9.5.
Para el segundo intervalo el limite inferior es igual al limite superior del primer intervalo
9.5 y el limite superior es obtenido sumando el limite inferior ms el ancho de clase
8.5, lo que nos da como resultado 18.
Del mismo modo hallamos el resto de intervalos de clase, tal como se muestra en el
cuadro completo con los seis intervalos de clase.

En el paso anterior hallamos los intervalos de clase, por lo tanto, ahora podemos hallar
la frecuencia observada (FO), la cual muestra cuntos datos se encuentran dentro de
cada intervalo.
En el primer intervalo que va desde 1 hasta 9.5 tenemos una frecuencia observada
igual a 18, lo cual significa que de los 30 datos analizados, 18 observaciones caen
dentro de este intervalo.
Del mismo modo, para los otros intervalos hay que contar cuntos datos caen dentro de
cada uno de ellos.

Una vez que hallamos la frecuencia observada, podemos obtener el grfico del
histograma.
El grfico del histograma nos ayuda a analizar cmo se distribuyen los datos y dnde
estn ms concentrados. Tambin nos ayuda a plantear la hiptesis acerca de la funcin
de probabilidades que podra representar al conjunto de datos.

10

Descarga el archivo adjunto y crea el histograma en Excel mostrado en el paso anterior.

11

El siguiente paso implica plantear la hiptesis, acerca de la funcin de probabilidades


que representa a los datos bajo anlisis.
Analizando las funciones Uniforme, Exponencial y Normal, notamos que la funcin
exponencial es la que mejor se ajusta al histograma.
Por lo tanto, la hiptesis es:
Ho: Los datos tienen un comportamiento exponencial
H1: Los datos NO tienen un comportamiento exponencial

12

Ahora recordaremos las caractersticas de la funcin de distribucin exponencial.


Notamos que se define la funcin f minscula, la cual es denominada la funcin de
distribucin de probabilidades y la F mayscula la que se denomina la funcin de
distribucin de probabilidades acumulada.
El parmetro beta es el promedio que para los 30 datos bajo anlisis es igual a 11.53

Casi siempre la funcin exponencial representa los tiempos requeridos para la


ejecucin de una actividad o la prestacin de un servicio. Esta funcin requiere
de un parmetro que es el promedio.

13

Una vez que se plantea la hiptesis, hay que verificar la validez de dicha hiptesis, para
lo cual ejecutamos la prueba Chicuadrado.

14

El primer paso al ejecutar la prueba Chicuadrado requiere hallar la probabilidad para


cada intervalo de clase del histograma.
La probabilidad es hallada usando la funcin planteada en la hiptesis, en este caso
exponencial, donde el promedio es 11.53 (un solo parmetro requerido).
Como se desea la probabilidad de un intervalo se usa la funcin de distribucin de
probabilidades acumulada, representada por la F mayscula.

15

Una vez que tenemos la probabilidad de cada intervalo, procedemos a calcular la


frecuencia esperada.
La frecuencia esperada es hallada multiplicando la probabilidad de cada intervalo por la
cantidad de datos (30 en este caso)

16

Una vez hallada la frecuencia esperada, podemos calcular los valores de la columna Chi
cuadrado, elevando al cuadrado la diferencia entre la frecuencia observada y la
frecuencia esperada y dividiendo este resultado entre la frecuencia esperada.
La suma de esta columna es llamada valor Chicuadrado calculado que en este caso es
igual a 2.88.

17

La tabla Chicuadrado es una tabla de doble entrada que requiere a nivel de fila los
grados de libertad y a nivel de columna el nivel de error (alfa).
Los grados de libertad = K 1 [cantidad parmetros de la funcin]
K = numero de intervalos de clase.
La cantidad parmetros de la funcin exponencial = 1, pues solo se estima el promedio.
entonces, los grados de libertad = [6 intervalos de clase] 1 [1 parmetro estimado] =
4 grados de libertad.
Seleccionamos en la tabla la fila correspondiente a 4 grados de libertad y la columna
asociada a un nivel alfa = 10%.
Por lo tanto el valor Chicuadrado = 7.7794

18

El ltimo paso es validar la hiptesis planteada al inicio.

19

20

21

Para practicar lo aprendido, analice los siguientes datos y determine si pueden ser
representados por una funcin EXPONENCIAL (los datos se encuentran en el archivo
Excel que bajaron previamente).
Recuerde calcular la probabilidad usando la funcin planteada en la hiptesis y use un
alfa = 10%.

22

23

24

Esta es la solucin del problema desarrollado en Excel, compara tus resultados con los
mostrados en esta pgina.

25

26

27

28

29

También podría gustarte