Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En las clases anteriores se abordaron las fdp y las FDA de cinco distribuciones comunes:
uniforme, binomial, de Poisson, exponencial y normal. ¿Cómo se reconocen estas distribuciones
en la práctica?
La base para identificar cualquier fdp son los datos sin procesar que reunimos sobre la
situación que estamos estudiando. Esta sección muestra cómo los datos muestreados pueden
convertirse en una fdp.
Paso 1. Resuma los datos sin procesar en la forma de un histograma de frecuencia apropiado
para determinar la fdp empírica asociada.
Paso 2. Use la prueba de bondad de ajuste para evaluar si la fdp empírica resultante se
muestrea a partir de una fdp teórica conocida.
Histograma de frecuencias. Este histograma se construye con datos sin procesar dividiendo
el rango de éstos (valor mínimo a valor máximo) en clases que no se traslapan. La frecuencia
en cada clase es la cuenta de los valores de los datos sin procesar que quedan comprendidos
dentro de los límites designados de la clase.
Ejemplo 1.
Los siguientes datos representan el tiempo de servicio (en minutos) en una instalación de servicio de una
muestra de 60 clientes.
Los valores mínimo y máximo de los datos son 2 y 11.7, respectivamente. Esto significa que la muestra está
cubierta por el rango (0, 12). Dividimos arbitrariamente el rango (0, 12) en 12 clases, cada una de 1 minuto de
ancho. La selección apropiada del ancho de la clase es crucial para revelar la forma de la distribución empírica.
Aun cuando no haya reglas exactas para determinar el ancho de clase óptimo, una regla práctica es utilizar de
10 a 20 clases. En la práctica puede ser necesario probar diferentes anchos de clase antes de decidir sobre un
histograma aceptable.
La siguiente tabla resume la información en forma de histograma de la muestra dada. La columna de frecuencias
relativas fi, se calcula dividiendo las entradas de la columna de frecuencias observadas oi en el total de
observaciones (n = 60). Por ejemplo, f1 = 11/60 = .1833. La columna de frecuencias acumuladas Fi, se genera
al sumar los valores de fi de manera recursiva. Por ejemplo, F1 = f1 = .1833 y F2 = F1 + f2 = .1833 + .1333 =
.3166.
Los valores de fi y Fi proporcionan una versión “discretizada” de la fdp y la FDA en el tiempo de servicio.
Podemos convertir la FDA resultante en una función continua si unimos los puntos resultantes con segmentos
de línea. La figura 1 proporciona la fdp empírica y la FDA para el ejemplo. La FDA, como la presenta el
histograma, aparece definida en los puntos medios de las clases.
1.0 FDA
0.8
0.6
0.4
0.2
fdp
FIGURA 1.
0
FDA lineal de una distribución 1 2 3 4 5 6 7 8 9 10 11 12
empírica t (minutos)
𝑡̅ = ∑ 𝑓𝑖 𝑡𝑖̅
𝑖=1
𝑁
Ejemplo 2
Este ejemplo prueba los datos del ejemplo 1 en cuanto a la hipótesis de una distribución exponencial. La primera
tarea es especificar la función que define la distribución teórica. Según el ejemplo 1, 𝑡̅ = 3.934 minutos. Por
1
consiguiente, 𝜆 = 3.934 = .2542 servicios por minuto según la distribución exponencial hipotética y la fdp y la
FDA asociadas se dan como
𝑓(𝑡) = .254𝑒 −.2542∗𝑡 , 𝑡>0
𝑇
𝐹(𝑇) = ∫ 𝑓(𝑡)𝑑𝑡 = 1 − 𝑒 −.2542∗𝑇 , 𝑇>0
0
Podemos utilizar la FDA, F(T), para calcular la FDA teórica para T = .5, 1.5,…, y 11.5, y luego compararla
gráficamente con el valor empírico Fi, i = 1,2,…, 12, calculado en el ejemplo 1 como se muestra en la figura 2.
Un examen superficial de las dos gráficas sugiere que la distribución exponencial puede proporcionar un ajuste
razonable por los datos observados.
El siguiente paso es implementar la prueba de bondad de ajuste. Existen dos pruebas como esa: (1) la prueba de
Kolmogrov-Smirnov, y (2) la prueba ji cuadrada. Limitaremos la presentación a la prueba ji cuadrada.
FIGURA 2.
Comparación de la FDA empírica y la FDA exponencial teórica
0 0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5 11.5
t (minutos)
La prueba ji cuadrada se basa en una medición de la desviación entre las frecuencias empíricas y teóricas.
Específicamente, para la clase i, la frecuencia teórica ni correspondiente a la frecuencia observada oi se
calcula como
𝐼𝑖
𝑛𝑖 = 𝑛 ∫ 𝑓(𝑡)𝑑𝑡
𝐼𝑖−1
= 𝑛(𝐹( 𝐼𝑖 ) − 𝐹( 𝐼𝑖−1 ))
Luego, suponiendo N clases, se calcula una medida de la desviación entre las frecuencias empíricas y
observadas como
𝑁
(𝑜𝑖 − 𝑛𝑖 )2
𝑥2 = ∑
𝑛𝑖
𝑖=1
El valor crítico x2 N - k - 1, 1 - α se obtiene a partir de tablas ji cuadrada (vea la tabla A.3, del documento
“Tablas estadísticas” cargado en el aula virtual) correspondientes a N – k – 1 grados de libertad y a un
nivel de significancia α.
(a) Use Excel para desarrollar tres histogramas con los datos basados en anchos de clase de .5, 1 y 1.5
minutos, respectivamente.
(b) Compare gráficamente la distribución acumulada de la FDA empírica y la de una distribución
exponencial correspondiente.
(c) Pruebe la hipótesis de que la muestra dada se toma de una distribución exponencial. Aplique un nivel
de confianza de 95%.
(d) ¿Cuál de los tres histogramas es el “mejor” para comprobar la hipótesis nula?
2. Los datos siguientes representan el periodo (en segundos) necesarios para transmitir un mensaje.
Utilice Excel para construir un histograma apropiado. Compruebe la hipótesis de que estos datos se toman
de una distribución uniforme con un nivel de confianza de 95%, dada la siguiente información adicional
sobre la distribución uniforme teórica:
(a) El rango de la distribución es entre 0 y 100.
(b) El rango de la distribución se estima a partir de los datos muestreados.
(c) El límite máximo en el rango de la distribución es 100, pero el límite mínimo debe estimarse a
partir de los datos muestreados.
3. Para contar el volumen del tráfico en una intersección de congestionamiento se utiliza un dispositivo
automático. Se registra el tiempo de llegada y se transforma en un tiempo ab- soluto que inicia de cero.
La siguiente tabla proporciona los tiempos de llegada (en minutos) de los primeros 60 automotores. Use
Excel para construir un histograma apropiado. Compruebe la hipótesis de que el tiempo entre llegadas
es exponencial utilizando un nivel de confianza de 95%.