Está en la página 1de 8

1.

2 Organización de datos 21

Definición 1.2.8 (a) La frecuencia relativa de un dato o de una clase se en-


cuentra dividiendo la frecuencia de dicho dato (o de la clase) entre el total de
datos. Entonces, a la tabla se le llama tabla de frecuencias relativas.

(b) La frecuencia acumulada de cualquier dato o clase, es la suma de la fre-


cuencia de ese mismo dato o clase con las frecuencias de todos los demás datos o
clases anteriores. A la tabla se le llama tabla de frecuencias acumuladas.

(c) La frecuencia relativa acumulada de un dato o de una clase se obtiene


dividiendo la frecuencia acumulada del dato o de la clase por el número total de
datos. A la tabla que contiene a estas frecuencias se les denomina tabla de
frecuencias relativas acumuladas.

Ejemplo 1.2.9 En la tabla 1.7 se muestra la tabla de frecuencias relativas, de frecuencias


acumuladas y de frecuencias acumuladas relativas para los 40 datos del ejemplo 1.2.5.

Clase Frec. Frec. rel. Frec. acum. Frec. rel. acum.


11,5 - 12,5 2 2/40 = 0,05 ≈ 5% 2 2/40 = 0,05
12,5 - 15,5 8 8/40 = 0,20 ≈ 20% 10 (= 8+2) 10/40 = 0,25
15,5 - 18,5 11 11/40 = 0,275 ≈ 27,5% 21 (= 11+10) 21/40 = 0,525
18,5 - 21,5 10 10/40 = 0,25 ≈ 25% 31 (= 21+10) 31/40 = 0,775
21,5 - 24,5 8 8/40 = 0,32 ≈ 32% 39 (= 8+31) 39/40 = 0,975
24,5 - 27,5 1 1/40 = 0,025 ≈ 2,5% 40 (= 1+39) 40/ 40 = 1,0

Tabla 1.7: Tabla de frecuencias relativas, de frecuencias acumuladas y de frecuencias


relativas acumuladas con 6 clases para las datos del ejemplo 1.2.5. ◭

Tablas bivariadas
Una tabla de frecuencias bivariadas es un arreglo de datos clasificados en dos
categorı́as con sus respectivas frecuencias. Las categorı́as pueden ser números discretos,
intervalos numéricos o valores cualitativos como género, color de cabello o religión.

Ejemplo 1.2.10 Una encuesta sobre el deporte preferido tuvo los resultados en hombres y
mujeres que se muestran en la siguiente tabla bivariada.

Deporte preferido
Béisbol Básquetbol Fútbol Total
Hombres 19 15 24 58
Mujeres 16 18 16 50
Total 35 33 40 108

La información que sigue, entre otras, puede leerse fácilmente de la tabla:


(a) Se han encuestado en total a 108 personas.
1.2 Organización de datos 22

(b) Hay 19 hombres que juegan beisbol.


(c) Hay 40 personas que juegan fútbol.
(d) Hubo 50 mujeres entrevistadas. ◭

1.2.4 Organización de datos mediante representaciones gráficas


Hay gráficas de varios tipos, entre los cuales se encuentran los siguientes: el diagrama
circular o de pastel, el pictograma, el diagrama de barras, el diagrama de caja y bigote,
el histograma, el polı́gono (de frecuencia o de frecuencias relativas), la ojiva (o polı́gono
de frecuencias acumuladas o polı́gono de frecuencias relativas acumuladas) y el diagrama
de tallo y hojas. Discuteremos cada uno de ellos con excepción del diagrama de caja y
bigotes, que se introducirá en la sección 1.5.2.

Diagramas circulares (o de pastel)


Estos diagramas se utilizan para hacer representaciones porcentuales y se utilizan gene-
ralmente para datos categóricos.

Ejemplo 1.2.11 La siguiente tabla presenta los datos sobre la cantidad de refrescos de
marca A, B, C, D y E que se vendieron en una tienda.

Refresco Frecuencia Frecuencia relativa


A 19 0,38
B 8 0,16
C 5 0,10
D 13 0,26
E 5 0,10

Esta información se puede presentar a través de un diagrama circular como el que se muestra
en la figura 1.3.

Fig. 1.3: Diagrama de pastel sobre compras de refresco

Para trazarlo se dibuja primero un cı́rculo. A continuación, con las frecuencias relativas, se
divide el cı́rculo en sectores o partes que corresponden a la frecuencia relativa de cada clase.
Por ejemplo, como hay 360 grados en un cı́rculo, y como el refresco A tiene 0,38 de frecuencia
relativa, el sector del diagrama circular que le corresponde debe tener (0,38)(360)=136,8
1.2 Organización de datos 23

grados. Se efectúan cálculos semejantes para las demás clases, obteniéndose el diagrama
de la figura 1.3. Los valores numéricos que se ven para cada sector pueden ser frecuencias,
frecuencias relativas o porcentajes. ◭

Pictogramas o pictógrafos
Un pictograma es la representación de datos estadı́sticos por medio de sı́mbolos que
por su forma sugieren la naturaleza del dato.

Ejemplo 1.2.12 El siguiente pictograma representa una información sobre las casas cons-
truidas en algunos años por una firma constructora. En él se hacen las siguientes conven-
ciones: ∆ significa 1.000 casas construidas y Λ significa 500 casas construidas.

Años Casas construidas


2.000 ∆∆∆∆∆
2.001 ∆∆∆∆∆∆∆Λ
2.002 ∆∆∆∆∆Λ
2.003 ∆∆∆∆∆∆∆

Fácilmente se puede interpretar del diagrama que en el año 2.000, la firma construyó 5.000
casas y, el 2.002, construyó 5.500 casas. ◭

Diagrama de barras
Es una representación gráfica en la que cada una de las modalidades del aspecto de
interés se representa mediante una barra. En este gráfico se suelen disponer los datos
en el primer cuadrante de unos ejes coordenados, levantando sobre el eje de las abscisas
una barra para cada modalidad del dato observado. La altura de la barra ha de ser
proporcional a la frecuencia absoluta o relativa, que se representará en el eje de las
ordenadas. Estos diagramas se utilizan tanto para datos categóricos como numéricos.

Ejemplo 1.2.13 La figura 1.4 muestra un diagrama de barras sobre los datos del ejemplo
1.2.11.

Fig. 1.4: Diagrama de barras para la compra de refrescos ◭


1.2 Organización de datos 24

Histogramas
Los histogramas son una forma de representación gráfica de una distribución de fre-
cuencia que consiste en representar las frecuencias (absolutas, relativas, acumuladas o
relativas acumuladas) por medio de áreas de rectángulos (barras). Cuando utilizamos fre-
cuencias absolutas, hablamos de histograma de frecuencias; cuando usamos frecuencias
relativas, histogramas de frecuencias relativas, etc. Los histogramas pueden construirse
para distribuciones de frecuencias agrupadas y no agrupadas.

Histogramas para frecuencias agrupadas


La idea de construir un histograma para frecuencia no agrupada de los datos, es repre-
sentar cada frecuencia por una barra cuya área sea proporcional a ella. Tı́picamente, el
ancho de cada barra se escoge como 1 y ası́ el área de la barra es igual a la frecuencia
(absoluta, relativa, acumulada o relativa acumulada) del dato.

Es importante señalar que aquı́ los datos pueden ser categóricos o núméricos y que
estos se colocan en el horizontal y sus correspondientes frecuencias (absolutas, relativas,
acumuladas o relativas acumuladas) en el eje vertical del diagrama.

Ejemplo 1.2.14 El diagrama que se muestra en la figura 1.4 es un ejemplo de un histograma


para la frecuencia de los datos de compra de refrescos. ◭

Histogramas para frecuencias no agrupadas


Para construir un histograma para datos medidos en una escala de intervalo o en una
escala de razón, se acostumbra seguir dos pasos:
• Se organizan los datos en una tabla de frecuencias (absolutas, relativas, acumu-
ladas o relativas acumuladas) agrupadas.
• Se construye una gráfica de barras usando las fronteras de clase para colocar
barras, y las frecuencias (absolutas, relativas, acumuladas o relativas acumuladas)
para indicar las alturas de las barras.

Ejemplo 1.2.15 La tabla de frecuencias (absolutas, acumuladas y relativas) correspondien-


te a los datos del ejemplo 1.2.6 se muestra en la tabla 1.8.

Clase Frecuencia Frecuencia acumulada Frecuencia relativa


5,95 - 7,95 4 4 0,2
7,95 - 9,95 2 6 0,1
9,95 - 11,95 8 14 0,4
11,95 - 13,95 3 17 0,15
13,95 - 15,95 3 20 0,15

Tabla 1.8: Tabla de frecuencia agrupada para los datos del ejemplo 1.2.6

Los histogramas de frecuencias relativas y de frecuencias acumuladas para estos datos son
como se ve en las figuras 1.5 y 1.6, respectivamente.
1.2 Organización de datos 25

Fig. 1.5: Histograma de frecuencias relativas para los datos del ejemplo 1.2.6

Fig. 1.6: Histograma de frecuencias acumuladas para los datos del ejemplo 1.2.6◭

Polı́gonos
Estos gráficos se utilizan para representar series cronológicas y se construye usando una
tabla de frecuencias (absoluta o relativa) agrupadas con marcas de clase. Si se usan
frecuencias absolutas, se denomina polı́gono de frecuencias y si se utilizan frecuencias
relativas, polı́gono de frecuencias relativas.

Ejemplo 1.2.16 Construir un polı́gono de frecuencia para los datos del ejemplo 1.2.6.

SOLUCION:
Consideremos la tabla 1.5 corresponde a la tabla de frecuencias agrupadas para los 20 datos
del ejemplo 1.2.6, con sus correspondientes marcas de clase. Ahora, construimos el polı́gono
con frecuencias absolutas mostrada en la figura 1.7. Las marcas de clase se colocan en el eje
horizontal y las frecuencias en el eje vertical. Notemos que el polı́gono se “baja” en ambos
extremos, colocando el primer y el último puntos en puntos del eje horizontal que distan
w = 2 de las marcas de clase más cercanas.
1.2 Organización de datos 26

Fig. 1.7: Polı́gono de frecuencias para los datos del ejemplo 1.2.6 ◭

Ojivas
La ojiva, llamada también polı́gono de frecuencias acumuladas (o polı́gono de frecuen-
cias relativas acumuladas), se construye a partir de tablas de frecuencias (acumuladas o
relativas acumuladas). Las ojivas ofrecen un medio gráfico para interpolar o aproximar
el número o porcentaje de observaciones menores o iguales que un valor especı́fico.

Ejemplo 1.2.17 La figura 1.8 representa una ojiva con frecuencias acumuladas para los
datos del ejemplo 1.2.6. Para su construcción consideramos la tabla 1.8.

Fig. 1.8: Ojiva para los datos del ejemplo 1.2.6 ◭

Para localizar los puntos de la ojiva usamos las fronteras superiores de cada clase (ubicadas
1.2 Organización de datos 27

siempre sobre el eje horizontal) y sus correspondientes frecuencias acumuladas (ubicadas


siempre sobre el eje vertical). Después unimos los puntos consecutivos por segmentos de
recta (observe que la frecuencia acumulada para la frontera inferior de la primera clase es
0).

Diagrama de tallo y hojas


El uso de una tabla de frecuencia agrupada tiene una desventaja bastante obvia: los datos
originales se pierden en el proceso de agrupamiento. Para salvar esta limitación puede
usarse el llamado diagrama de tallo y hojas. Estos diagramas fueron creados por el
estadı́stico John Tukey y ofrecen una forma novedosa y rápida de exhibir información
numérica: si un numeral tiene dos o más digitos, entonces, se puede descomponer en
una rama y una hoja. Un tallo es el primer dı́gito o parte del numeral, mientra que
una hoja está formada por él o los dı́gitos restantes. Por ejemplo, el numeral 534 se
puede descomponer en dos formas:
5 | 34 53 | 4
↑ ↑ ↑ ↑
tallo hoja tallo hoja
La exhibición gráfica de datos es muy fácil de realizar usando tallos y hojas; cada dato
aporta una hoja de algún tallo.

Ejemplo 1.2.18 Los datos de abajo muestran el número de anuncios radiofónicos de 30


segundos pagados el año pasado por cada uno de los 45 miembros de una empresa. Organice
los datos en un diagrama de tallo y hojas y determine la forma que toma este diagrama.
¿Alrededor de qué valores tiende a acumularse el número de anuncios? ¿Cuál es el menor
número de anuncios pagados por un comerciante? ¿El mayor número pagado?

96 93 88 117 127 95 113 96 108 94 148 156 139 142 94


107 125 155 155 103 112 127 117 120 112 135 132 111 125 104
106 139 134 119 97 89 118 136 125 143 120 103 113 124 138

SOLUCION:
En el conjunto de datos se observa que el menor número de anuncios pagados es 88. Ası́ es
que el valor del primer tallo será 8. El número más grande es 156. Entonces, los valores de
los tallos empezarán en 8 e irán hasta 15. El primer número en los datos es 96, que tendrá
como tallo 9 y como hoja 6. Moviéndose por el renglón superior el segundo valor es 93 y el
tercero 88. Después de tomar los tres primeros valores del conjunto de datos, su diagrama
es
8 8
9 6 3
10
11
12
13
14
15

Despueés de organizar todos los datos, el diagrama de tallo y hojas se ve ası́:


1.2 Organización de datos 28

8 8 9
9 6 3 5 6 4 4 7
10 8 7 3 4 6 3
11 7 3 2 7 2 1 9 8 3
12 7 5 7 0 5 5 0 4
13 9 5 2 9 4 6 8
14 8 2 3
15 6 5 5
Lo que suele hacerse es ordenar los valores de las hojas de menor a mayor y, en este caso, el
diagrama final se verá ası́:
8 8 9
9 3 4 4 5 6 6 7
10 3 3 4 6 7 8
11 1 2 2 3 3 7 7 8 9
12 0 0 4 5 5 5 7 7
13 2 4 5 6 8 9 9
14 2 3 8
15 5 5 6
Del diagrama de tallos y hojas se pueden sacar varias conclusiones como, entre otras, las
siguientes:
• Primero, el menor número de anuncios comprados es 88 y el mayor es 156.
• Dos comerciantes compraron menos de 90 anuncios y tres, más de 150.
• Puede observarse, por ejemplo, que los tres comenrciantes que compraron más de 150,
compraron 155, 155 y 156 comerciales.
• La mayor concentración del número de comerciales está entre 110 y 130.
• Hubo 9 comerciantes que compraron entre 110 y 119 anuncios y que 8 compraron
entre 120 y 129.
• También podemos decir que dentro del grupo de 120 a 129 el número de anuncios
comprados se repartió uniformemente.
• Dos comerciantes compraron 120, un comenrciante compró 124, tres compraron 125
y dos, 127.
Para concentrarnos en la forma que toma el diagrama de tallos y hojas, coloquemos un
rectángulo para representar la “cantidad de hojas” de cada tallo. Al hacerlo obtenemos la
siguiente representación:
8 8 9
9 3 4 4 5 6 6 7
10 3 3 4 6 7 8
11 1 2 2 3 3 7 7 8 9
12 0 0 4 5 5 5 7 7
13 2 4 5 6 8 9 9
14 2 3 8
15 5 5 6
Si giramos la página 90 grados en el sentido de las manecillas del reloj, obtenemos una
imagen de los datos que se parece mucho a la de un histograma con clases de 80 a 90,
90 a 100, 100 a 110, etc. Aunque el diagrama de tallos y hojas parece ofrecer la misma
información que un histograma, tiene dos ventajas principales:

También podría gustarte