Está en la página 1de 15

REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS.

La presentación de datos a través de tablas estadísticas es una actividad importante dentro de los sistemas de
información general, estas se fortalecen significativamente cuando se la acompañan con gráficos descriptivos
e ilustrativos. En el contexto de los sistemas de información, en más de una oportunidad se encontrará que un
buen gráfico resume y expresa mucho más que párrafos completos de comentarios e interpretaciones literales.

En general la representación gráfica de una tabla de frecuencias permite percibir con mayor
claridad algunas características de la masa de datos que se investiga. Por ello, a través de
gráficos, resulta bastante más fácil transmitir conclusiones a personas no habituadas a la
interpretación de tablas de frecuencias.
A continuación en términos generales, se dan algunas recomendaciones para la elaboración de graficas.

 La mejor gráfica es la más simple.

 Las gráficas deben ser tan sencillas y claras, de tal manera que sean comprensibles sin la ayuda
de las descripciones del texto.

 Las gráficas no sustituyen a la tabla o cuadro, al contrario deben complementarse.

 Las gráficas más comunes se elaboran teniendo como base los ejes de coordenadas
cartesianas.

 La finalidad de las graficas es visualizar mejor la información.

 La gráfica es considerada como el medio de expresión de la estadística, más llamativa y


sugestiva, a la vez que presenta la ventaja de dejar en la memoria una expresión más duradera
que los cuadros o el texto, en un menor tiempo de lectura.

 Si el informe tiene dos o más gráficas deberán numerarse.

 Toda gráfica debe tener título que indique con claridad el contenido de la misma.

 La línea vertical (ordenada) representa las frecuencias, y se debe comenzar de cero.

 Las variables o características cualitativas y cuantitativas, por lo general, van en la línea


horizontal (abscisa).

 La lectura de la escala del eje horizontal se hace de izquierda a derecha. La lectura del eje
vertical debe hacerse de abajo hacia arriba.

 Cuando la gráfica presenta más de una característica o variable, deberá diferenciarse por medio
de leyendas, notas o signos convencionales.

 En toda gráfica se debe explicar la fuente de donde fueron obtenidos los datos; además aclarar
las escalas, leyendas, notas y convenciones que ayuden a identificar las características
presentadas.

Gráfico de la distribución sin intervalos.


La representación gráfica más común para este tipo distribución de frecuencias es el
diagrama de barras que consiste en trazar en cada valor distinto de la variable, segmentos
de líneas proporcionales a su frecuencia.
Ejemplo Supóngase que ante la pregunta del número de hijos por familia (variable X) una
muestra de 20 hogares, marcó las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.

Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0, 1, 2, 3,


4 que se repiten respectivamente 1, 4, 7, 6, 2 veces. La distribución de frecuencias de X se
da en la tabla 2.6.

Tabla . Distribución de frecuencias del número de hijos por familia.

Número de Frecuencias Frecuencias Frecuencias


hijos Absolutas Relativas Porcentajes
Xi ni hi hi (%)
0 1 0.05 5
1 4 0.20 20
2 7 0.35 35
3 6 0.30 30
4 2 0.10 10
Total 20 1.00 100

Fuente.- Datos obtenidos de los formularios de la encuesta.

Grafica: Distribución del número de hijos por familia


Número de hijos por familia
8

6
Número de familias

0
0 1 2 3 4

Número de hijos

Fuente.- Datos obtenidos de los formularios de la encuesta.

GRÁFICO DE LA DISTRIBUCIÓN POR INTERVALOS.

Los gráficos más usadas son: Histograma, Polígono de frecuencias y polígono de


frecuencias acumuladas u ojiva.

a) Histograma.
Es una representación gráfica de una distribución de frecuencias agrupadas en
intervalos de clase, mediante una serie de rectángulos contiguos que tienen:
 sus bases sobre un eje horizontal y cuya longitud será igual al tamaño de los
intervalos de clase.
 Las alturas proporcionales a la frecuencia (absoluta o relativa).
Ejemplo. Dada la siguiente distribución de empresas según el número de empleados, se pide:
a) Dibujar el histograma y el polígono de frecuencias.

Solución.
Completando la tabla de distribución de frecuencias, tenemos:

Número de Amplitud Densidad


empleados ni Ci hi h i /c i 100 x h i %
[ 0 - 10) 5 10 0.02 0.002 2%
[ 10 - 20) 20 10 0.08 0.008 8%
[ 20 - 30) 35 10 0.14 0.014 14 %
[ 30 - 40) 40 10 0.16 0.016 16 %
[ 40 - 60) 50 20 0.20 0.010 20 %
[ 60 - 80) 30 20 0.12 0.006 12 %
[ 80 - 100) 20 20 0.08 0.004 8%
[ 100 - 140) 20 40 0.08 0.002 8%
[ 140 - 180) 15 40 0.06 0.0015 6%
[ 180 - 260) 15 80 0.06 0.0008 6%
Total 250 250 250 250 250

a) El histograma y el polígono de frecuencias de estos datos se muestra en la figura 3.11.

Densidades
16%
0.016
14%
0.014

0.012
20%
0.010
8%
0.008
12%
0.006
8%
0.004
8%
0.002 6% 6%

0 10 20 30 40 60 80 100 140 180 260

b) Polígono de frecuencias.
Cuando la variable está agrupada en intervalo de clase, el polígono de frecuencia se
obtiene uniendo los puntos medios de las bases superiores de cada rectángulo en el
histograma.
Estatura de los alumnos de la UNP
Número de alumnos 40

30

20

10

0
147.5 152.5 157.5 162.5 167.5 172.5 177.5 182.5 187.5 192.5

Estatura en cm.

Figura 2.7. Polígono de frecuencias de la estatura de los alumnos .

c) Polígono de frecuencias acumuladas u ojivas.


Está representación es válida para variables estadísticas agrupadas en intervalos de
clase. En el eje de las abscisas representamos los distintos intervalos de clase que han
de estar naturalmente traslapados. En el extremo superior de cada intervalo se levanta
una vertical con altura igual a la frecuencia (absoluta o relativa) acumulada, luego se
unen los extremos superiores de las verticales con segmentos rectilíneos. Así el
polígono de frecuencias acumuladas absolutas alcanzará su máxima altura en el último
intervalo.
Abriendo la ventana Descripción  Datos numéricos  Análisis unidimensional  Opciones gráficas  Histograma
y haciendo clic con el botón derecho del mouse para que aparezca la ventana de dialogo Opciones de ventana, seleccionar
en Tipo de gráfico la opción Polígono y finalmente seleccionar en Frecuencia la opción Acumulada, para obtener el
polígono de frecuencias acumuladas absolutas (menor o igual que) para el ejemplo 2.32.

Estatura de los alumnos de la UNP


100
Número de alumnos

80

60

40

20

0
150 155 160 165 170 175 180 185 190

Estatura en cm.

Figura . Polígono de frecuencias acumuladas “Menor o igual que” para la estatura de los alumnos .

GRÁFICO PARA LA DISTRIBUCIÓN DE FRECUENCIA DE VARIABLE CUALITATIVA.

Los gráficos más comunes para la distribución de frecuencias de variable cualitativa son el
de diagrama de rectángulos y el de sectores circulares.

En un Diagrama de rectángulos los datos de cada una de las modalidades (caracteres


cualitativos) se representa por un rectángulo vertical (u horizontal), cuya altura (o largo) es
proporcional a su frecuencia (absoluta o relativa). Los rectángulos se dibujan dejando un
espacio entre ellos.
Ejemplo: En una encuesta de opinión acerca de las preferencias de una marca de bebidas
gaseosas por sus colores: Negro (N), Blanco (B), Rojo (R), 20 consumidores dieron las
siguientes respuestas:

B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N.

Construir la distribución de frecuencias.

Solución.
La tabulación de estos datos, donde la variable cualitativa es X: Color de bebida gaseosa, es la
distribución de frecuencias .

Tabla . Distribución de personas por su color preferido de la bebida gaseosa.

Color de Número de Frecuencias Frecuencias


Bebida Consumidores: ni relativas: hi Porcentajes: hi(%)
Blanco (B) 8 0.40 40
Negro (N) 9 0.45 45
Rojo (R) 3 0.15 15
Total 20 1.00 100

Fuente.- Datos obtenidos de la encuesta realizada.

Ejemplo . Abriendo la ventana Descripción, escogiendo Datos cualitativos  Tabulación y finalmente en el icono
Opciones gráficas seleccionar Diagrama de barras para obtener el diagrama de rectángulos para los datos de la tabla .

Diagrama de rectangulos para las bebidas gaseosas de acuerdo a su color.

10
Número de personas

0
Blanco Negro Rojo
Color de las bebidas gaseosas

Figura . Diagrama de rectángulos para los datos de la tabla 2.9.


En un gráfico circular, los datos de cada categoría se representan por un sector circular. Es
utilizado principalmente cuando se pretende comparar cada valor de la variable con el total.
Para construir se divide el circulo en sectores, cuyas áreas serán proporcionales a los
valores de la variable. Está división es obtenida a través de la regla de 3 simples.
Total  360o
Parte  xo

Ejemplo . Construir el diagrama de sectores para la información contenida en la tabla 2.9. Abriendo la ventana descripción,
escogiendo Datos cualitativos  Tabulación y finalmente en el icono Opciones gráficas seleccionar Diagrama de
sectores.

Diagrama de Sectores de para las gaseosas, según su color de preferencia.


Color de preferencias
15.00%
Blanco
Negro
Rojo
40.00%

45.00%

Figura . Diagrama de sectores circulares para los datos de la tabla 2.9.

Observación 2. (Intervalos de clases de tamaños desiguales). Es muy común el uso de


intervalos de clases con tamaños desiguales en el agrupamiento de los datos en tablas de
frecuencias. En estos casos se deberá tomar algunos cuidados especiales en cuanto al
análisis y construcción del histograma.

 Un primer cuidado es construir una columna que indique las amplitudes c i de cada
clase.

 Un segundo paso es la construcción de la columna de las densidades de frecuencias


en cada clase, que es obtenido dividiendo las frecuencias relativas h i por las
amplitudes c i. Esto es, una medida que indique cuál es la concentración por unidad
de variable.
1. MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN PARA DATOS SIMPLES.

Entre las medidas de tendencia central tenemos:

 Media.
 Media geométrica.
 Media armónica.
 Mediana.
 Moda.

Se debe tener en cuenta que existen variables cualitativas y variables


cuantitativas, por lo que las medidas de posición o medidas de tendencia
se usan de acuerdo al tipo de variable que se está observando.

1.1 Medidas de tendencia central

 Media: ( x ) Es el promedio aritmético de todos los valores que


componen el conjunto de datos. Se calcula mediante la siguiente
fórmula.

 No olvidando que la ( x ) está afectada por los valores extremos .si el


valor muy grande o muy pequeño con respecto al resto de valores.

1.1.2 DATOS NO TABULADOS Ó SIN AGRUPAR

 Para una muestra y para una población se tiene respectivamente:


Muestra Población

xi
x 
xi
n N
Ejemplo 1: En un equipo de fútbol, una muestra de estaturas de sus integrantes
son las siguientes:

1.70,1.79,1.73,1.67,1.60,1.65,1.79,1.84,1.67,1.82, 1.74. Calcule la media.

xi 19
x    1.73 Si es representativa (Homogeneidad Datos)
n 11

Ejemplo 2: Dado los Siguientes Datos siguientes: 2, 3, 5, 100

Calcule la media.
xi 110
x   27.5  No es Representativo
n 4
(No homogeneidad de Datos)

1.1.3 DATOS TABULADOS Ó AGRUPADOS

 Se considera dos casos para datos agrupados en tablas sin intervalos y otros
en tablas por intervalos al cual se puede aplicar la siguiente Formula

 Para una muestra y para una población se tiene respectivamente:


Muestra Población

x
x f i i

xi f i
n N
Ejemplo 1: En un salón de clase se pregunto el número de mascotas que tenían en
Casa cuales repuestas fueron las siguientes:

Variables # de
X Mascotas Xi . fi 0 = no tienen mascotas
fi 1 = Tienen una mascota
0 3 0 2 = Tienen dos mascotas
3 = Tienen tres mascotas
1 8 8 4 = Tienen cuatro mascotas
Calcule la media.
2 5 10
xi. fi 50
4 12 x   2
3 n 25
4 5 20
Si es

Total 25 50

Ejemplo 2:
Formula de la Marca de
clase
Marca Frecuencia
Clases ó de fi Xi . fi Li  Ls 0.4  2.7
Intervalos Clase X    1.55
Xi 2 2
0.4 - 2.7 1.55 5 7.75 Formula de la Media ( x )
2.7 - 5.0 3.85 8 30.8
5.0 - 7.3 6.15 14 86.1

x f
7.3 - 9.6 8.45 11 92.95
9.6 - 11.9 10.75 7 75.25 363.05
11.9 - 14.2 13.05 3 39.5 x i i
  7.261
14.2 - 16.5 15.35 2 30.7 n 50
TOTAL ------- 50  xi fi =
363.05

 MEDIANA: ( ~ x Ó me)
Es la medida de Tendencia Central que divide un conjunto ordenado en forma creciente
o decreciente en dos grupos iguales de modo que la mitad (50%)de las observaciones
tendrá valores que son menores que la mediana y la otra mitad (50%) alcanzara valores
mayores que esta .

DATOS NO TABULADOS Ó SIN AGRUPAR:


n 1
Me  , Si es una muestra.
2

N 1
Me  , Si es una Población.
2
Si es impar :la mediana es la observación que esta en el lugar (n+1)/2 ,esto es :

Me  X n 1
( )
2
Si es par :la mediana es el promedio de las observaciones n/2 y n/2+1 , esto es:

X n  X n 1
( ) ( )
Me  2 2

 Nota: Se aplica a datos Cuantitativos. 2

Ejemplo 1: Encuentre la mediana para los siguientes Datos impares.

9, 12, 5, 16, 8, 3,11

1. Ordenamos los Datos:


3, 5, 8, 9, 11, 12, 16
2. Una vez ordenado los datos , como el numero de datos es impar (7) se busca el
que tiene |
n 1 7 1
( ) ( )
2 2
la posición ó sea este número es el 4 ,buscamos el

Número que ocupa la cuarta posición en los datos ordenados encontramos el valor
de la mediana Me = 9
Ejemplo 2: Encuentre la mediana para los siguientes Datos inpares.

1.74 , 1.79 , 1.79 , 1.67 , 1.67 , 1.70 , 1.73 , 1.82 , 1.84 , 1.60 , 1.65

1. Primero Ordenamos los datos de mayor a menor se obtiene:

1.60 , 1.65 , 1.67 , 1.67 , 1.70 , 1.73 , 1.74 , 1.79 , 1.79 , 1.82 , 1.84;
2. Una vez ordenado los datos , como el numero de datos es impar (11) se busca el
que
1 11
( )
tiene la posición n 1 ó sea 2
este número es el 6 ,
( )
2

Buscando el número que ocupa la sexta posición en los datos ordenados


encontramos el valor de la mediana Me = 1.73.

Ejemplo 3: Encuentre la mediana para los siguientes Datos Pares.

El riesgo de manifestar deficiencia de hierro en algún momento es alto , en particular


durante el embarazo .el problema con esta detección de deficiencia es que algunos
métodos para cuantificar el hierro se ven afectados por el estado de embarazo ,
considere los siguientes datos en relación con la concentración de receptor de
trasferencia para una muestra de mujeres con pruebas de laboratorio de anemia
explicita por deficiencia de hierro (“Serum Transferrin receptor for the Detection of Iron
Deficiency in Pregnancy ” , Amen .J.of Clinical Nutrition, 1991: 1077-1081):

15.2 9.3 7.6 11.9 10.4 9.7 20.4 9.4 11.5 16.2 9.4 8.3

Determine la mediana (Me):

1. Primero Ordenamos los datos de mayor a menor se obtiene:

7.6 , 8.3 , 9.3 , 9.4 , 9.4 , 9.7 ,10.4 , 11.5 ,11.9, 15.2 ,16.2, 20.4

2. Una vez ordenado los datos , como el numero de datos es par (12) utilizamos la
siguiente Fórmula:

3. En este caso n = 12 , por consiguiente la mediana se localiza entre los valores


centrales X6 y X7 Es decir entre los valores 9.7 y 10.4 . Por lo tanto , el valor
mediano es :

X  X n 1
X6  X7 9.7  10.4
n
( ) ( )
Me  2 2
 
2 2 2
Me  10.05
El valor de la mediana Me = 10.05
Nota: Estas formulas son muy objetivas y de fácil aplicación , pero no siempre se
utilizan ;generalmente se apela a una distribución de frecuencias , cuando es grande la
cantidad de datos disponibles .

EJEMPLOS DE DATOS TABULADOS - AGRUPADOS:

 Se considera dos casos para datos agrupados en tablas sin intervalos y otros
en tablas por intervalos al cual se puede aplicar la siguiente Formula

n
( )  Fi 1
Me  LI  ( 2
) * Tic
fi

n
( )  Fi 1
Me  LI  ( 2
) * Tic
Fi  ( Fi  1)

Ejemplo 1: Encuentre la mediana para los siguientes Datos

Variables Frecuencia Frecuencia


X Fi Acumulad
Fi

0 2 2
Fi - 1
1 3 5

2 6 11 Fi

Fi + 1
3 5 16
4
4 20

Total 20 -
1°) n Calculamos la Posición de Orden
( )
2
2°)Por las frecuencias Acumuladas se identifica la clase que contiene a la mediana ,
esto es ,la clase para el cual se cumple .

Fi – 1 ≤ (n/2) ≤ Fi

5 ≤ (10) ≤ 11

Con lo cual la mediana estará en la clase que tiene como frecuencia acumulada Fi al
cual aplicamos la siguiente Formula :

10  5
n
( )  Fi 1
Me  LI  ( 2
) * Tic  2  ( ) *1  2.88
fi 6

Me  2

Ejemplo 2: Encuentre la mediana para los siguientes Datos

Se obtuvo una distribución de frecuencias de 100 alumnos de la UNP, según su


estatura, se pide determinar el valor mediano de las estaturas.

Li - Ls Marca de clase
X fi Fi
150 - 155 152.5 4 4
155 - 160 157.5 5 9
160 - 165 162.5 12 21 FI- 1
165 - 170 167.5 33 54 Fi
170 - 175 172.5 17 71 Fi+1
175 - 180 177.5 16 87
180 - 185 182.5 9 96
185 - 190 187.5 4 100
Total - 100 -
1°) Calculamos la Posición de Orden n
( )
2
2°) Por las frecuencias Acumuladas se identifica la clase que contiene a la mediana,
esto es, la clase para el cual se cumple.

Fi – 1 ≤ (n/2) ≤ Fi

21 ≤ (50) ≤ 54

Remplazamos los datos en la formula obtendremos:


54  21
n
( )  Fi 1
Me  LI  ( 2
) * Tic  165  ( ) * 5  170
fi 33
 Interpretación: Este valor mediano significa, que el 50% de
los alumnos tienen una estatura menor o igual que 170 Cm. , en tanto que
el otro 50% tienen una estatura mayor que 170 Cm.

MODA (Mo):

Es el valor que se representa con mayor frecuencia en un conjunto de datos Mo =


Observación con mayor frecuencia

DATOS NO TABULADOS Ó SIN AGRUPAR:

Ejemplo 01:

Muestra : 2 ; 2 ; 4 ; 5 ; 5 ; 6 ; 6 ; 7 ; 9 ; 1 ; 8 ; 8 ; 8 ; 3

Mo =8 Distribución monomodal
(Tiene una Mo)

Población : 3 ; 3 ;4 ;1 ;5 ; 6 ;7 ;3 ;8 ;7; 9 ;2 ;7

Mo =3 Mo =7 Distribución bimodal
(Tiene dos Mo)
Muestra: 1; 2; 3; 6; 7:9; 8

Mo =No hay moda Distribución Amodal o Uniforme


Nota: La moda es una medida de tendencia Central muy inestable porque cambia de
valor al pasar de una muestra a otra.

DATOS TABULADOS Ó AGRUPADOS:

TABLAS SIN INTERVALOS:


La clase que contiene la mayor frecuencia será la que contiene a la moda y se llama
clase modal.

N° de Hijos por Número de Familias


familia (fi)
0 60
1 120
2 210 Fi-1
3 360 Fi

4 160 Fi+1
5 50
6 a mas 30
Total 990

En este caso la frecuencia Apsoluta Maxima es de n4 =360


Luego , la moda es el valor de la variable que corresponde a la frecuencia n4 =360 , Mo=3

También podría gustarte