Está en la página 1de 6

DISTRIBUCION DE FRECUENCIAS DE UNA MUESTRA

REPRESENTACION TABULAR Y GRAFICA DE LAS MUESTRAS En hidrología se trabaja con informaciones hidrometeorológicos; estas informaciones pueden consistir de datos de precipitación, caudales, temperatura, evaporación, etc. Por lo general, se cuenta solo con una muestra de datos de esa población, es decir, nunca se puede disponer de la totalidad de los datos. Pero cuando estos datos se organizan en forma compacta y fácil de utilizar, los hidrólogos pueden disponer de una herramienta de gran utilidad, para las decisiones a tomar. Existen muchas formas de clasificar los datos, de una manera útil, es dividirlo en categorías similares o clases, y luego contar el número de observaciones que caen en cada categoría, lo que constituye una tabla de frecuencias o una distribución de frecuencias. Para una muestra dada se escoge un rango R, que contenga a todos los valores de la misma. Se subdivide en R en subintervalos que se llaman intervalos de clase. Se dice que los valores de la muestra en cada uno de los intervalos forma una clase (figura 2.1) al numero de valores en una clase se llama frecuencia de la clase; su división entre el tamaño N de la muestra es la frecuencia relativa de la clase. Esta frecuencia considerada como función de las marcas de clase, se denomina función de frecuencias de la muestra, y se denota como f(x). La función de frecuencias acumuladas de la muestra, se denota como F(x) y se define como:

PROCEDIMIENTO DE CÁLCULO A continuación se indica un procedimiento practico, para el calculo de las frecuencias y frecuencias acumuladas, la misma que se usara mas adelante para el calculo de la distribución de probabilidades empíricas de datos agrupados en intervalos de clase: Procedimiento: 1. Ordenar la muestra en forma creciente o decreciente: Para agilizar los cálculos resulta conveniente contar con una aplicación que permita el ordenamiento de los datos. Por ejemplo, sise ordenan los datos en forma creciente, se tiene:

x m in , x 2 , x3 ,..., x m ax

…(1)

Seleccionar el número de intervalos de clase NC: …(2) NC depende del tamaño de la muestra N. En aplicaciones de hidrología el número de intervalo de clase puede estar entre 6 y 25. Calcular los límites de clase de cada uno de los intervalos: Como se manifestó en el punto 4. 5. calcular la amplitud de cada intervalo de clase ∆x.33 1nN +1 si N<30 Si 30 < N <75 Si N > 75 Donde: … (3)    NC < 5 8 ≤ NC ≤ 10 10 < NC ≤ 30 N = tamaño de la muestra 1nN = logaritmo natural o neperiano del tamaño muestral. se logra que Xmin y X max queden centrados y representan las marcas de clase inferior y superior del primer intervalo de clase. las siguientes relaciones empíricas. según la ecuación: ∆x= x m ax  x m in R  NC  1 NC  1 … (4) Al dividir el rango entre NC – 1. el mismo que resulta. lo que en realidad se hace es incrementar el rango en ∆x. incluyendo un intervalo mas. las marcas de clase de la primera y ultima clase. Yevjevich sugiere para seleccionar NC. de agregar medio intervalo (∆x/2). (a) (b) NC=1. en cada extremo de la serie ordenada. con el artificio de dividir entre NC-1. Calcular el rango R de la muestra: R  x m ax  x m in 3. 4. a fin de que Xmin y X max sean respectivamente. son: LCI1  xmin  X 2 … (5) .Donde: x m in  x1 Es el valor mínimo de los datos x m ax  x N Es el valor máximo de los datos 2.

(6) Los otros límites de clase. dividido entre el número total de observaciones. de igual forma la marca de clase del último intervalo es igual al valor máximo es decir: MC1= MCn = X m in X m ax Las otras marcas de clase. Calcular las marcas de clase de cada uno de los intervalos: Las marcas de clase se obtienen del promedio de los límites de clase. Calcular la frecuencia respectiva Fri. 6.LCS1  xmin  X  LCI1  X 2 … …. Calcular la frecuencia absoluta: esta es igual al numero de observaciones. se obtienen sumando la amplitud ∆x. la misma que se obtiene por conteo. que caen dentro de cada intervalo definido por sus limites de clases respectivos. de cada intervalo: Esta es igual a la frecuencia absoluta del mismo. 7. Así la marca de clase del primes intervalo es: … (7) Con el artificio realizado anteriormente la marca de clase del primer intervalo es igual al valor mínimo. es decir: fabi ni fri   N N …(9) . se obtienen sumando la amplitud ∆x. al límite de clase anterior. a las marcas de clase anteriores. así se obtiene: fabi  ni Donde: f abi =frecuencia absoluta del intervalo i … (8) n i =numero de observaciones en el intervalo i 8.

para cada intervalo: Esta función según Yevjevich.Donde: fri =frecuencia relativa del intervalo i n i = numero de observaciones en el intervalo i N=numero total de observaciones 9. Calcular la función densidad empírica Fi.2. se calcula usando la formula: … (11) Donde: función densidad empírica para el intervalo i n i = numero de observaciones en el intervalo i N=numero total de observaciones ∆x = amplitud del intervalo de clase 11. . usando la formula: ∑ Donde: ∑ = ∑ … (10) fri =frecuencia relativa del intervalo i j =1.….i acumulación de los intervalos hasta i n i = numero de observaciones en el intervalo i N=numero total de observaciones 10. Calcular la función de distribución acumulada empírica usando la formula: ∑ Donde: … (12) = función densidad empírica para el intervalo j Función densidad empírica para el intervalo i ∆x = amplitud del intervalo de clase Los valores de Fri y Fi obtenidos con las ecuaciones (10) y (12) resultan similares. Calcular la frecuencia relativa acumulada Fri.

3 0.1 0.REPRESENTACION GRAFICA Existen varias formas de representar las muestras en forma grafica.35 frecuencia relativa 0. . se le agrega un intervalo de clase con frecuencia igual a cero. en forma de rectángulos. dentro de las cuales se pueden mencionar: HISTOGRAMA Un histograma es la representación grafica de la frecuencia.2 0. uniendo con líneas rectas los puntos medios de todas las barras de un histograma.25 0.15 0.4 0. siendo la base de cada rectángulo el intervalo de clase y la altura la frecuencia absoluta. La frecuencia absoluta o relativa. los puntos formados por las marcas de clase vs. En forma practica. E n la figura (1) se muestra el histograma 0.45 0.05 0 6 18 30 42 54 66 78 marca de clase Figura 1 Histograma o distribución de frecuencias relativas de los caudales POLÍGONO DE FRECUENCIA Un polígono de frecuencia es la representación grafica de las frecuencias. se obtiene uniendo con líneas rectas. Para que el polígono alcance al eje horizontal. un polígono de frecuencia se obtiene. a ambos lados de la distribución. fabі ò la frecuencia relativa Fri.

En esta ecuación el intervalo de clase tiende a cero. que se hace pequeña y la unión de los puntos se hace mediante líneas curvas. usando la ecuación (11) propuesta por Yevjevich. FUNCION DE DISTRIBUCION ACUMULADA O EMPIRICA Permite ver el porcentaje de las observaciones que quedan por encima o por debajo de ciertos valores. El grafico es parecido al polígono de frecuencia. con la función densidad de probabilidad de distribuciones conocidas. son dependientes del tamaño del intervalo de clase y la posición del límite de clase. es muy útil para comparar los resultados empíricos.FUNCION DENCIDAD EMPIRICA El histograma o el polígono de frecuencia. La función acumulada . con lo que el número de intervalos tiende a infinito. como la normal. con respecto al total. pero con la variante en la vertical. Este grafico de la función densidad. El grafico se obtiene uniendo los puntos obtenido por las marcas de clase vs. Para evitar esta dependencia el histograma o el polígono de frecuencia puede transformarse en una función densidad empírica. log-normal y otras.