Está en la página 1de 12

UNIVERSIDAD TECNOLÓGICA DEL

PERU

DOCENTE:

ING. TEPE ATOCHE VICTOR MANUEL

CURSO:

“GESTION DE LA CALIDAD EN LA
CONSTRUCCION”

TEMA:

“DISTRIBUCIÓN DE FRECUENCIAS, MEDIDAS DE


TENDENCIA CENTRAL Y DISPERSIÓN”

ESTUDIANTE:

PEREZ CORREA ALWIN JOSEPH

AÑO:

2021
INTRODUCCION

Se denomina en estadística a la agrupación de datos en categorías


mutuamente excluyentes que indican el número de observaciones en cada
categoría.

Esto significa una de las cosas más importantes de la matemática, su


estadística con la agrupación de datos. La distribución de frecuencias presenta
las observaciones clasificadas de modo que se pueda ver el número existente
en cada clase.

Estos procedimientos descriptivos dependen de la naturaleza de la variable o


atributo que se analiza y, en este sentido, el programa SPSS los recoge en dos
menús diferentes según se empleen, básicamente, para sintetizar datos
cualitativos o datos cuantitativos.

Así mismo, el programa diferencia entre los procedimientos descriptivos que


hacen referencia al análisis de una sola variable (análisis unidimensional) de
los relativos a dos o más variables conjuntamente (análisis bidimensional o
multidimensional).
DISTRIBUCIÓN DE FRECUENCIAS

Las distribuciones de frecuencias son tablas en que se dispone las


modalidades de la variable por filas. En las columnas se dispone el número de
ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones
en frecuencias es facilitar la obtención de la información que contienen los
datos.

Ejemplo: Quieren conocer si un grupo de individuos está a favor o en contra de


la exhibición de imágenes violentas por televisión, para lo cual han recogido los
siguientes datos:
La inspección de los datos originales no permite responder fácilmente a
cuestiones como cuál es la actitud mayoritaria del grupo, y resulta bastante
más difícil determinar la magnitud de la diferencia de actitud entre hombres y
mujeres.

Podemos hacernos mejor idea si disponemos en una tabla los valores de la


variable acompañados del número de veces (la frecuencia) que aparece cada
valor:

X: Símbolo genérico de la variable.

f: Frecuencia (también se simboliza como ni).

La distribución de frecuencias de los datos del ejemplo muestra que la actitud


mayoritaria de los individuos del grupo estudiado es indiferente.

La interpretación de los datos ha sido facilitada porque se ha reducido el


número de números a examinar (en vez de los 20 datos originales, la tabla
contiene 5 valores de la variable y 5 frecuencias).

Generalmente las tablas incluyen varías columnas con las frecuencias relativas
(son el número de ocurrencias dividido por el total de datos, y se simbolizan "fr"
o "pi"), frecuencias acumuladas (la frecuencia acumulada es el total de
frecuencias de los valores iguales o inferiores al de referencia, y se simbolizan
"fa" o "na". No obstante, la frecuencia acumulada también es definida
incluyendo al valor de referencia), frecuencias acumuladas relativas (la
frecuencia acumulada relativa es el total de frecuencias relativas de los valores
iguales o inferiores al de referencia, y se simbolizan "fr" o "pa")

Ejemplo: Consideremos el siguiente grupo de datos:

La distribución de freciemcias es:

La reducción de datos mediante el agrupamiento en frecuencias no facilita su


interpretación: La tabla es demasiado grande. Para reducir el tamaño de la
tabla agrupamos los valores en intervalos, y las frecuencias son las de los
conjuntos de valores incluidos en los intervalos:
Ahora es más sencillo interpretar los datos. Por ejemplo, podemos apreciar
inmediatamente que el intervalo con mayor número de datos es el 34-39, o que
el 75% de los datos tiene valor inferior a 46.

Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".

Elementos básicos de las tablas de intervalos:

Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila
en una distribución de frecuencias

Límites aparentes: Valores mayor y menor del intervalo que son observados en
la tabla. Dependen de la precisión del instrumento de medida. En el ejemplo,
los límites aparentes del intervalo con mayor número de frecuencias son 34 y
39.

Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si
se contara con un instrumento de precisión perfecta. En el intervalo 34-39,
estos límites son 33.5 y 39.5

Punto medio del intervalo (Mco Marca de clase): Suma de los límites dividido
por dos. Mc del intervalo del ejemplo= 36.5

Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite


exacto inferior. En el ejemplo es igual a 6.
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN EN DATOS
AGRUPADOS

Se identifica como datos agrupados a los datos dispuestos en una distribución


de frecuencia. En tal caso las fórmulas para el cálculo de promedio, mediana,
modo, varianza y desviación estándar deben incluir una leve modificación. A
continuación, se entregan los detalles para cada una de las medidas.
Promedio en datos agrupados. La fórmula es la siguiente:

Donde ni representa cada una de las frecuencias correspondientes a los


diferentes valores de Yi.

Consideremos como ejemplo una distribución de frecuencia de madres que


asisten a un programa de lactancia materna, clasificadas según el número de
partos. Por tratarse de una variable en escala discreta, las clases o categorías
asumen sólo ciertos valores: 1, 2, 3, 4, 5.
Entonces las 42 madres han tenido, en promedio, 2,78 partos.

Si la variable de interés es de tipo continuo será necesario determinar, para


cada intervalo, un valor medio que lo represente. Este valor se llama marca de
clase (Yc) y se calcula dividiendo por 2 la suma de los límites reales del
intervalo de clase. De ahí en adelante se procede del mismo modo que en el
ejercicio anterior, reemplazando, en la fórmula de promedio, Yi por Yc.

Mediana en datos agrupados Sí la variable es de tipo discreto la mediana será


el valor de la variable que corresponda a la frecuencia acumulada que supere
inmediatamente a n/2. En los datos de la tabla 1 Me=3, ya que 42/2 es igual a
21 y la frecuencia acumulada que supera inmediatamente a 21 es 33, que
corresponde a un valor de variable (Yi) igual a 3.

Si la variable es de tipo continuo es necesario, primero, identificar la frecuencia


acumulada que supere en forma inmediata a n/2, y luego aplicar la siguiente
fórmula:

Donde:

Moda en datos agrupados. Si la variable es de tipo discreto la moda o modo


será al valor de la variable (Yi) que tenga la mayor frecuencia absoluta ( ). En
los datos de la tabla 1 el valor de la moda es 3 ya que este valor de variable
corresponde a la mayor frecuencia absoluta =16. Más adelante se presenta un
ejemplo integrado para promedio, mediana, varianza y desviación estándar en
datos agrupados con intervalos. Varianza en datos agrupados. Para el cálculo
de varianza en datos agrupados se utiliza la fórmula

Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2,78
partos por madre,

Cuando los datos están agrupados en intervalos de clase, se trabaja con la


marca de clase (Yc), de tal modo que la fórmula queda:

Donde Yc es el punto medio del intervalo y se llama marca de clase del


intervalo c= (Límite inferior del intervalo + límite superior del intervalo) /2.
Percentiles los percentiles son valores de la variable que dividen la distribución
en 100 partes iguales. De este modo si el percentil 80 (P80) es igual a 35 años,
significa que el 80% de los casos tiene edad igual o inferior a 35 años.
Su procedimiento de cálculo es relativamente simple en datos agrupados sin
intervalos. Retomemos el ejemplo de la variable número de partos:

El percentil j (Pj) corresponde al valor de la variable (Yi) cuya frecuencia


acumulada supera inmediatamente al “j” % de los casos (jxn/100).
El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea
inmediatamente superior a 33,6 ((80x42) /100).
El primer Ni que supera a 33,6 es 39. Por lo tanto, al percentil 80 le
corresponde el valor 4. Se dice entonces que el percentil 80 es 4 partos
(P80=4). Este resultado significa que un 80% de las madres estudiadas han
tenido 4 partos o menos.
Si los datos están agrupados en una tabla con intervalos, el procedimiento es
levemente más complejo ya que se hace necesaria la aplicación de una
fórmula.

Se aplica a los datos del intervalo cuya frecuencia acumulada (Ni) sea
inmediatamente superior al “j” % de los casos (jxn/100).

En la siguiente tabla se muestra la distribución de 40 familias según su ingreso


mensual en miles de pesos. Nótese que para calcular el centro de clase se
usaron los límites reales de cada intervalo.

CONCLUSIONES Y RECOMENDACIONES

 A partir de los resultados obtenidos de cada una de las metodologías


para calcular tiempos de concentración, como lo son: Kirpich, Agencia
Federal de Aviación, Bureau of Reclamation y California, es posible
validar cada una de estas metodologías y concluir que, con cualquiera
de ellas, los resultados obtenidos serán aceptables ya que están dentro
de los rangos previamente establecidos para esas regiones hidrográficas
(1-3 m/s).
 Para esto, se determinaron las diferentes desviaciones estándar para los
valores de tiempos de concentración para cada período de retorno (5,
10, 20, 25, 50 y 100 años), evidentemente los tiempos de concentración
calculados por las metodologías de Kirpich, Giandotti y SCS no varían
con el período de retorno, a excepción de la fórmula de la FAA y se
verificó que estos valores estuvieran dentro del rango permisibles (µ ± s,
donde, µ: media de los valores de tiempos de concentración, s:
desviación estándar).
 Si bien se escogió la metodología estadística como patrón de
comparación para determinar la metodología hidrometeorológica de más
confianza, sus resultados deben de tomarse con suma reserva, puesto
que los autores consultados recomiendan no usar registros de menos de
20 años para análisis estadísticos.
 En el caso del análisis realizado en este documento el mayor número de
registros en las estaciones estudiadas de 20 años precisamente; esto
debido a que no se ha tenido otra alternativa (no se cuenta con mayor
número de registros) y obliga a tener criterio al utilizar los resultados
obtenidos para extrapolar caudales máximos anuales para períodos de
retorno altos, por ejemplo 25, 50 y 100 años, que son los utilizados con
fines de diseño.
 Se recomienda, para futuros cálculos de Caudales por Fórmula Racional
y SCS, actualizar los valores del Coeficiente de Escurrimiento C y el
Número de curva CN, puesto que las coberturas van cambiando con el
tiempo.

BIBLIOGRAFIA

https://www.slideshare.net/BAQUERO2008/microsoft-power-point-parte-1-
distribuciones-de-frecuenciappt-compatibility-m

https://www.slideshare.net/gevalbe/distribucion-de-frecuencias-8527427

https://www.monografias.com/trabajos72/distribucion-frecuencias/distribucion-
frecuencias.shtml

También podría gustarte