Está en la página 1de 6

Universidad de San Carlos de Guatemala

Facultad de Ingeniería
Escuela de Ingeniería Mecánica Industrial

INVESTIGACIÓN DE CONCEPTOS ESTADISTICOS

Ing. Omar Enrique Medrano Méndez

Guatemala, octubre de 2014


Distribución de frecuencias

Necesidad de resumir la información. Para que los datos sean útiles deben
organizarse para distinguir patrones y tendencias y llegar así a conclusiones lógicas

Una forma de organizar un conjunto de datos es clasificarlos en categorías o clases


y luego contar cuántas observaciones quedan dentro de cada categoría.

Para el análisis e interpretación de datos es valioso conocer:

 La forma o patrón de distribución de los datos


 La posición de la distribución: alrededor de qué valor se tienden a concentrar
los datos.
 Variabilidad: la dispersión de los datos alrededor de los valores centrales
 Ordenamiento o arreglo de los datos en clases o categorías indicando para
cada una de ellas, el número de elementos que contiene o frecuencia

Frecuencias Absolutas: Número de elementos u observaciones pertenecientes a


una misma clase.

Frecuencia Relativa: Se obtiene dividiendo la frecuencia absoluta por el número


de observaciones Denota la importancia de la clase, al expresarse en términos
porcentuales. Facilitan el análisis de los datos, en especial para comparar
distribuciones de frecuencias basadas en diferentes números de observaciones

Frecuencia Acumulada: Número de observaciones que son menores que el


Límite superior de la clase. Se obtiene sumando las frecuencias (absolutas o
relativas) en sentido descendente

Punto Medio: Valor central de la clase. Promedio entre el límite inferior de entre
dos clases sucesivas. Es el valor representativo de la clase.
Graficas utilizadas en estadística

Gráfica simple de barras verticales: Para respuestas categóricas cualitativas


en el que solo interviene una barra para cada clase. Su trazo se realiza ubicando
en el eje horizontal   de la gráfica los nombres que identifican cada una de las
clases. En el eje vertical  se usa una escala de frecuencias, una de frecuencias
relativas o una de porcentuales. Luego, con una barra de un ancho fijo trazada
sobre cada indicador de clase llegamos a la altura que corresponde al tipo
de frecuencia escogido. Las barras se separan a fin de señalar que cada clase es
una categoría independiente. Los espacios entre las barras deben corresponder a
la mitad del ancho de una barra.

Diagrama circular: Es de especial utilidad para mostrar proporciones


(porcentajes) relativas de una variable. Se crea marcando una porción del círculo
correspondiente a cada categoría de la variable. 

Gráfica simple de barras horizontales: Se utiliza principalmente para facilitar


la comparación entre las diferentes clases que componen los datos categóricos. El
trazo de la gráfica es muy similar  a la gráfica de barras verticales, solo que  éstas
van en forma horizontal y están ordenadas de la mayor a la menor frecuencia
absoluta, de frecuencia relativa o de porcentajes. De esta manera se logra una
mejor visualización en las preferencias.  

Gráfica  de barras seccionadas: Esta gráfica compara entre categorías  el


aporte de cada valor al total, dando lugar a una columna apilada para cada clase.
También  se puede presentar de manera horizontal o vertical.

Gráfica  de barras componentes: Este tipo de gráfica se usa cuando las


diferentes  categorías de datos  se componen de otras clases , de tal forma que
cada barra se pueda subdividir y representar cada una de estas clases .Así mismo,
entre las categorías y sus componentes se  compara valores. También se le conoce
como barras agrupadas. Se puede hacer uso de barras horizontales o de barras
verticales; su escogencia   depende de lo que se pretenda ilustrar para que facilite
su  visualización.

Diagrama de Pareto: Es un tipo especial de diagrama de barras verticales,


donde las respuestas categóricas se grafican en orden descendente de frecuencias
y se combinan con un polígono acumulado en la misma escala. El diagrama de
Pareto se usa ampliamente en el control estadístico de procesos  y el control
estadístico de la calidad del producto. 
Lo que se pretende con este tipo de grafico es describir en donde se presenta el
mayor porcentaje del problema y que factores lo afectan. Este concepto, se conoce
como la regla de 80-20, considera que el 80% de la actividad se debe al 20% de
los factores. Al concentrarse en el 20% de los factores, los gerentes pueden atacar
el 80% del problema.

Gráficas  de línea: Se ilustra  mediante segmentos de línea los cambios en


cantidades con respecto al tiempo. Son especialmente útiles en el comercio y en
los negocios.  

Histogramas: Una de las maneras más comunes de representar una distribución


de frecuencia. Su grafica consiste en un conjunto de barras, en la que la base de
cada barra representa una clase o intervalo, indicada en el eje horizontal,  y la
altura por su frecuencia, indicada en el eje vertical. Generalmente las barras se
trazan adyacentes una a la otra. 

Polígono de frecuencia: De segmentos de línea que conectan los puntos


formados por la intersección del punto medio de clase  y la frecuencia de clase
absoluta, relativa o porcentual.

Ojiva: Es un polígono acumulado de frecuencia absoluta, relativa o porcentual  y


por lo tanto representa segmentos de línea  que se origina al conectar los puntos
formados por la intersección entre el límite inferior de cada clase con la frecuencia
acumulada. Es conocida como  polígono de frecuencia acumulada menor que, ya
que muestra el número o porcentaje de observaciones menores a cierto valor. La
ojiva es importante por que nos permite extrapolar información que la distribución
de frecuencia oculta y así como calcular estadísticos como la mediana, cuartiles,
deciles y percentiles, en forma aproximada. Para construir la ojiva se debe primero
elaborar la distribución de frecuencia menor que.

Diagrama de caja: Es una representación gráfica, basada en cinco números


estadísticos: valor mínimo, la mediana y valor máximo. Se utiliza como una técnica
de análisis exploratorio de datos y tiene la ventaja de que no se requiere de la
desviación estándar, ni de la media aritmética y así como de resumir los datos en
una distribución de frecuencia, situación que si necesita el histograma, el polígono
y la ojiva.
Medidas de tendencia central

La media: También llamada media aritmética, es la medida de tendencia central


conocida popularmente como “promedio”.

La moda: La moda es la medida de tendencia central que se define como aquel


valor nominal que tiene la frecuencia mayor. Por lo tanto, una distribución de
frecuencias puede tener más de una moda o, inclusive, no tener moda cuando
todos los datos tienen frecuencia. Se simboliza con sus dos primeras iniciales: Mo

La mediana: Es el dato que está a la mitad, es el dato que divide en dos partes
iguales a un conjunto de datos.

Medidas de dispersión

Amplitud o recorrido: La medida de dispersión más simple recibe el nombre de


amplitud o recorrido y es muy poco usada puesto que su única ventaja es la
sencillez con que se calcula. Es común que se use también el nombre de Rango
para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre
las observaciones que tienen el mayor y el menor valor numérico en el mismo.

Desviación media, desviación estándar y varianza: Para presentar la


desviación estándar, que es por mucho la medida generalmente más útil de la
dispersión, obsérvese que la dispersión de un conjunto de datos es pequeña si los
valores se agrupan en forma cerrada en torno a su media y es grande si los
valores se dispersan ampliamente en torno a su media. Por tanto, parecería
razonable medir la dispersión de un conjunto de datos en términos de las
cantidades en las cuales difieren los valores individuales de su media.

Asimetría

Las medidas de asimetría son indicadores que permiten establecer el grado de


simetría (o asimetría) que presenta una distribución de probabilidad de una
variable aleatoria sin tener que hacer su representación gráfica.

Como eje de simetría consideramos una recta paralela al eje de ordenadas que
pasa por la media de la distribución. Si una distribución es simétrica, existe el
mismo número de valores a la derecha que a la izquierda de la media, por tanto, el
mismo número de desviaciones con signo positivo que con signo negativo.
Decimos que hay asimetría positiva (o a la derecha) si la "cola" a la derecha de la
media es más larga que la de la izquierda, es decir, si hay valores más separados
de la media a la derecha. Diremos que hay asimetría negativa (o a la izquierda) si
la "cola" a la izquierda de la media es más larga que la de la derecha, es decir, si
hay valores más separados de la media a la izquierda.

Apuntamiento (Curtosis)

En teoría de la probabilidad y estadística, la curtosis es una medida de la forma.


Así, las medidas de curtosis tratan de estudiar la proporción de la varianza que se
explica por la combinación de datos extremos respecto a la media en
contraposición con datos poco alejados de la misma. Una mayor curtosis implica
una mayor concentración de datos muy cerca de la media de la distribución
coexistiendo al mismo tiempo con una relativamente elevada frecuencia de datos
muy alejados de la misma. Esto explica una forma de la distribución de frecuencias
con colas muy elevadas y un con un centro muy apuntado.

También podría gustarte