Está en la página 1de 12

Histograma

De Wikipedia, la enciclopedia libre


Saltar a navegación, búsqueda

En estadística, un histograma es una representación gráfica de una variable en forma de


barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los
valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del
intervalo en el que están agrupados los datos.

En términos matemáticos, puede ser definida como una función injectiva (o mapeo) que
acumula (cuenta) las observaciones que pertenecen a cada subintervalo de una partición. El
histograma, como es tradicionalmente entendido, no es más que la representación gráfica
de dicha función.

Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la
muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En
los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo
o nivel de estudios, es preferible un diagrama de sectores.

Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en
ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.

Contenido
[ocultar]

 1 Tipos de histograma
 2 Construcción de un histograma
 3 Véase también
 4 Enlaces externos

[editar] Tipos de histograma


 Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra
la cual es proporcional a la frecuencia simple de la categoría que representa.
 Diagramas de barras compuesta
Se usa para representar la información de una tabla de doble entrada o sea a partir
de dos variables, las cuales se representan así; la altura de la barra representa la
frecuencia simple de las modalidades o categorías de la variable y esta altura es
proporcional a la frecuencia simple de cada modalidad.
 Diagramas de barras agrupadas
Se usa para representar la información de una tabla de doble entrada o sea a partir
de dos variables, el cual es representado mediante un conjunto de barras como se
clasifican respecto a las diferentes modalidades.
 Polígono de frecuencias
Es un gráfico de líneas que se usa para presentar las frecuencias absolutas de los
valores de una distribución en el cual la altura del punto asociado a un valor de las
variables es proporcional a la frecuencia de dicho valor.
 Ojiva porcentual
Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango
porcentual de cada valor en una distribución de frecuencias.

En los gráficos las barras se encuentran juntas y en la tabla los números poseen en el primer
miembro un corchete y en el segundo un parentesis, por ejemplo: (10-20]

[editar] Construcción de un histograma


 Paso 1

Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.

 Paso 2

Obtener los números de clases, existen varios criterios para determinar el número de clases
(o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto.
Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo estén los
datos y cuántos sean. Un criterio usado frecuentemente es que el número de clases debe ser
aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de
30 ( número de artículos) es mayor que cinco, por lo que se seleccionan seis clases.

 Paso 3

Establecer la longitud de clase: es igual al rango dividido por el número de clases.

 Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en
relación al resultado del PASO 2 en intervalos iguales.

 Paso 5

Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace
un gráfico de barras, las bases de las barras son los intervalos de clases y altura son la
frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectángulos
se obtiene el polígono de frecuencias.

El histograma de una imagen representa la frecuencia relativa de los niveles de gris de la


imagen. Las técnicas de modificación del histograma de una imagen son útiles para
aumentar el contraste de imágenes con histogramas muy concentrados.

Sea u una imagen de tamaño NxN, la función de distribución del histograma es: Fu(l) =
(Numerodepixels(i,j)talesqueu(i,j) < = l) / N2

Ejemplos de otros tipos de representaciones gráficas: Hay histogramas donde se agrupan


los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta) hay en cada una
de ellas. En algunas variables (variables cualitativas) las clases están definidas de modo
natural, p.e sexo con dos clases: mujer, varón o grupo sanguíneo con cuatro: A, B, AB, O.
En las variables cuantitativas, las clases hay que definirlas explícitamente (intervalos de
clase).

Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias,
absolutas o relativas, en el de ordenadas (eje vertical).

A veces es más útil representar las frecuencias acumuladas.

O representar simultáneamente los histogramas de una variable en dos situaciones distintas.

Otra forma muy frecuente, de representar dos histogramas de la misma variable en dos
situaciones distintas.

En las variables cuantitativas o en las cualitativas ordinales se pueden representar polígonos


de frecuencia en lugar de histogramas, cuando se representa la frecuencia acumulativa, se
denomina ojiva.

En estadística
La ojiva es una gráfica asociada a la distribución de frecuencias, es decir, que en ella se
permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en
lugar de solo exhibir los números asignados a cada intervalo.

La ojiva apropiada para información que presente frecuencias mayores que el dato que se
está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la
que se asigna a valores menores, tendrá una pendiente positiva. Una gráfica similar al
polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma
técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayor
que y las ojivas menor que.

Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por
esto la aplicación de la técnica es parcial):

Un extremo de la ojiva no se “amarra” al eje horizontal, para la ojiva mayor que sucede con
el extremo izquierdo; para la ojiva menor que, con el derecho.

En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de
clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la
mayor.

Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor
que, utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que
está sobre la frontera de clase “4:00″ se ven las visitas que se realizaron en una hora mayor
que las 4:00 horas (en cuestiones temporales se diría, sin errores de gramática: después de
las 4:00). De forma análoga, en la ojiva menor que la frecuencia que se representa en cada
frontera de clase son el número de observaciones menores que la frontera señalada (en caso
de tiempos sería el número de observaciones antes de la hora que señala la frontera).

Si se utiliza una distribución porcentual acumulativa entonces se obtiene una ojiva (mayor
que o menor que según sea el caso) cuyo eje vertical tiene una escala que va del 0% al
100%. El siguiente ejemplo es la misma ojiva menor que que se acaba de usar, pero con
una distribución porcentual:

Obtenido de "http://es.wikipedia.org/wiki/Ojiva_(estad%C3%ADstica)"
3.6.1 Ejemplo de ojivas

Los ingresos de 50 trabajadores de una empresa se resumen en la siguiente tabla


de frecuencia:
 

Ni Lm Ls f F h H MC
[ 10000
1
0 150000 ) 3 3 6,00% 6,00% 125000
[ 15000
2
0 200000 ) 2 5 4,00% 10,00% 175000
[ 20000
3
0 250000 ) 5 10 10,00% 20,00% 225000
[ 25000
4
0 300000 ) 10 20 20,00% 40,00% 275000
[ 30000
5
0 350000 ) 4 24 8,00% 48,00% 325000
[ 35000
6
0 400000 ) 15 39 30,00% 78,00% 375000
[ 40000
7
0 450000 ] 11 50 22,00% 100,00% 425000
Total
50   100,00%    

SOLUCIÓN

PASO 1: En un plano cartesiano (primer cuadrante), procedemos a establecer


la escala de ambos ejes:

 En el eje vertical se colocaran las frecuencias, partiendo desde 0 hasta la


última frecuencia acumulada (absoluta o relativa).

 En el eje horizontal se ubicaran los límites superiores, partiendo desde el


primer límite menor.

PASO 2: A cada límite superior le corresponde su frecuencia acumulada. El


punto inicial será 0 (no existen datos por debajo de 100). Por ejemplo:

 Hasta un valor cercano a 150.000 existen acumulado 3 datos.


 Hasta un valor cercano a 200.000 existen acumulado 5 datos.

Gráficamente tenemos:

Podremos cambiar la escala del eje vertical para que trabaje con las frecuencias
relativas acumuladas sin afectar el gráfico:

3.6.2 Características de las ojivas

 Muestran frecuencias acumuladas.

 Se prefiere para el tratamiento de datos cuantitativos.

 El punto de inicio equivale a una frecuencia de 0.

 Suelen utilizarse para representar tablas tipo B.

 El punto final equivale al 100% de los datos.

3.6.3 Interpretando la información en las ojivas

Dada su ventaja de representar frecuencias acumuladas, las ojivas se convierten


en una herramienta vital para el análisis estadístico.

Partiendo de la información del ejemplo, se desea conocer que porcentaje de los


trabajadores ganan más $225.000.

Para conocer esta información, debemos ubicar primero el valor de $225.000 en el


gráfico y luego, proyectar este punto en el eje vertical:

La proporción de empleados equivale a aproximadamente a un 80%. El


inconveniente de este método es que los cálculos se harán gráficamente (valores
aproximados) y no de forma aritmética (valores exactos).

3.6.4 Construcción de ojivas en Excel

A continuación construiremos una ojiva, empleando la tabla de frecuencia vista en


el ejemplo. Modificaremos los límites superiore e inferiores para poder trabajar en
Excel:

Antes del iniciar el asistiente de gráficos, debemos indicar que para un valor
menor a $100.000, no existen datos:
En el asistente selecionamos el tipo de gráfico XY dispersión, optando por un
gráfico por líneas rectas:

En la ventana siguiente agregamos el nombre OJIVA, y procedemos a asignar los


valores para el eje horizontal (X) y eje vertical (Y). Habíamos recalcado que la
ojiva comienza con el primer límite inferior, por tanto, debemos pulsar sobre la
celda C12 equivalente a los $100.000.

Siguen los límites superiores, que se seleccionaran manteniendo la tecla Ctrl


pulsada:

De igual forma aplicaremos la misma operación a los datos ligados al eje


horizontal. La ventana Datos de origen quedaría:

En la tercera ventana agregamos información adicional al gráfico y desactivar o


activar la leyenda:

La gráfica resultante debería quedar como sigue (con algunos ajustes en el


formato):

Corrijamos la escala del eje horizontal para que empiece con $100.000. Esto se
realiza pulsando sobre la escala con el botón derecho del Mouse y marcando la
opción Formato de ejes.

En la ficha Escala realizamos los siguientes cambios:

La escala modificada se mostrará así:

Modificamos también el valor máximo del eje vertical para que termine en 50.

Un polígono de frecuencias se forma uniendo los extremos de las barras

de un diagrama de barras mediante segmentos.

También se puede realizar trazando los puntos que representan las

frecuencias y uniéndolos mediante segmentos.


Ejemplo

Las temperaturas en un día de otoño de una ciudad han sufrido las

siguientes variaciones:

Hor Temperatu

a ra

6 7º

9 12°

12 14°

15 11°

18 12°

21 10°

24 8°
Polígonos de frecuencia para datos agrupados

Para construir el polígono de frecuencia se toma la marca de clase que

coincide con el punto medio de cada rectángulo de un histograma.

Ejemplo

El peso de 65 personas adultas viene dado por la siguiente tabla:

  ci fi Fi

[50, 60) 55 8 8
[60, 70) 65 10 18

[70, 80) 75 16 34

[80, 90) 85 14 48

[90, 100) 95 10 58

[100, 110) 110 5 63

[110, 120) 115 2 65

    65  

 
Polígono de frecuencias acumuladas

Si se representan las frecuencias acumuladas de una tabla de datos

agrupados se obtiene el histograma de frecuencias acumuladas o su

correspondiente polígono.
Es un gráfico lineal que se utiliza en el caso de una vatiable cuantitativa.

Para realizar el polígono unimos los puntos medios de las bases superiores del diagrama de barras o
del histograma.

También podría gustarte