Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2 Organización de datos 21
Tablas bivariadas
Una tabla de frecuencias bivariadas es un arreglo de datos clasificados en dos
categorı́as con sus respectivas frecuencias. Las categorı́as pueden ser números discretos,
intervalos numéricos o valores cualitativos como género, color de cabello o religión.
Ejemplo 1.2.10 Una encuesta sobre el deporte preferido tuvo los resultados en hombres y
mujeres que se muestran en la siguiente tabla bivariada.
Deporte preferido
Béisbol Básquetbol Fútbol Total
Hombres 19 15 24 58
Mujeres 16 18 16 50
Total 35 33 40 108
Ejemplo 1.2.11 La siguiente tabla presenta los datos sobre la cantidad de refrescos de
marca A, B, C, D y E que se vendieron en una tienda.
Esta información se puede presentar a través de un diagrama circular como el que se muestra
en la figura 1.3.
Para trazarlo se dibuja primero un cı́rculo. A continuación, con las frecuencias relativas, se
divide el cı́rculo en sectores o partes que corresponden a la frecuencia relativa de cada clase.
Por ejemplo, como hay 360 grados en un cı́rculo, y como el refresco A tiene 0,38 de frecuencia
relativa, el sector del diagrama circular que le corresponde debe tener (0,38)(360)=136,8
1.2 Organización de datos 23
grados. Se efectúan cálculos semejantes para las demás clases, obteniéndose el diagrama
de la figura 1.3. Los valores numéricos que se ven para cada sector pueden ser frecuencias,
frecuencias relativas o porcentajes. ◭
Pictogramas o pictógrafos
Un pictograma es la representación de datos estadı́sticos por medio de sı́mbolos que
por su forma sugieren la naturaleza del dato.
Ejemplo 1.2.12 El siguiente pictograma representa una información sobre las casas cons-
truidas en algunos años por una firma constructora. En él se hacen las siguientes conven-
ciones: ∆ significa 1.000 casas construidas y Λ significa 500 casas construidas.
Fácilmente se puede interpretar del diagrama que en el año 2.000, la firma construyó 5.000
casas y, el 2.002, construyó 5.500 casas. ◭
Diagrama de barras
Es una representación gráfica en la que cada una de las modalidades del aspecto de
interés se representa mediante una barra. En este gráfico se suelen disponer los datos
en el primer cuadrante de unos ejes coordenados, levantando sobre el eje de las abscisas
una barra para cada modalidad del dato observado. La altura de la barra ha de ser
proporcional a la frecuencia absoluta o relativa, que se representará en el eje de las
ordenadas. Estos diagramas se utilizan tanto para datos categóricos como numéricos.
Ejemplo 1.2.13 La figura 1.4 muestra un diagrama de barras sobre los datos del ejemplo
1.2.11.
Histogramas
Los histogramas son una forma de representación gráfica de una distribución de fre-
cuencia que consiste en representar las frecuencias (absolutas, relativas, acumuladas o
relativas acumuladas) por medio de áreas de rectángulos (barras). Cuando utilizamos fre-
cuencias absolutas, hablamos de histograma de frecuencias; cuando usamos frecuencias
relativas, histogramas de frecuencias relativas, etc. Los histogramas pueden construirse
para distribuciones de frecuencias agrupadas y no agrupadas.
Es importante señalar que aquı́ los datos pueden ser categóricos o núméricos y que
estos se colocan en el horizontal y sus correspondientes frecuencias (absolutas, relativas,
acumuladas o relativas acumuladas) en el eje vertical del diagrama.
Tabla 1.8: Tabla de frecuencia agrupada para los datos del ejemplo 1.2.6
Los histogramas de frecuencias relativas y de frecuencias acumuladas para estos datos son
como se ve en las figuras 1.5 y 1.6, respectivamente.
1.2 Organización de datos 25
Fig. 1.5: Histograma de frecuencias relativas para los datos del ejemplo 1.2.6
Fig. 1.6: Histograma de frecuencias acumuladas para los datos del ejemplo 1.2.6◭
Polı́gonos
Estos gráficos se utilizan para representar series cronológicas y se construye usando una
tabla de frecuencias (absoluta o relativa) agrupadas con marcas de clase. Si se usan
frecuencias absolutas, se denomina polı́gono de frecuencias y si se utilizan frecuencias
relativas, polı́gono de frecuencias relativas.
Ejemplo 1.2.16 Construir un polı́gono de frecuencia para los datos del ejemplo 1.2.6.
SOLUCION:
Consideremos la tabla 1.5 corresponde a la tabla de frecuencias agrupadas para los 20 datos
del ejemplo 1.2.6, con sus correspondientes marcas de clase. Ahora, construimos el polı́gono
con frecuencias absolutas mostrada en la figura 1.7. Las marcas de clase se colocan en el eje
horizontal y las frecuencias en el eje vertical. Notemos que el polı́gono se “baja” en ambos
extremos, colocando el primer y el último puntos en puntos del eje horizontal que distan
w = 2 de las marcas de clase más cercanas.
1.2 Organización de datos 26
Fig. 1.7: Polı́gono de frecuencias para los datos del ejemplo 1.2.6 ◭
Ojivas
La ojiva, llamada también polı́gono de frecuencias acumuladas (o polı́gono de frecuen-
cias relativas acumuladas), se construye a partir de tablas de frecuencias (acumuladas o
relativas acumuladas). Las ojivas ofrecen un medio gráfico para interpolar o aproximar
el número o porcentaje de observaciones menores o iguales que un valor especı́fico.
Ejemplo 1.2.17 La figura 1.8 representa una ojiva con frecuencias acumuladas para los
datos del ejemplo 1.2.6. Para su construcción consideramos la tabla 1.8.
Para localizar los puntos de la ojiva usamos las fronteras superiores de cada clase (ubicadas
1.2 Organización de datos 27
SOLUCION:
En el conjunto de datos se observa que el menor número de anuncios pagados es 88. Ası́ es
que el valor del primer tallo será 8. El número más grande es 156. Entonces, los valores de
los tallos empezarán en 8 e irán hasta 15. El primer número en los datos es 96, que tendrá
como tallo 9 y como hoja 6. Moviéndose por el renglón superior el segundo valor es 93 y el
tercero 88. Después de tomar los tres primeros valores del conjunto de datos, su diagrama
es
8 8
9 6 3
10
11
12
13
14
15
8 8 9
9 6 3 5 6 4 4 7
10 8 7 3 4 6 3
11 7 3 2 7 2 1 9 8 3
12 7 5 7 0 5 5 0 4
13 9 5 2 9 4 6 8
14 8 2 3
15 6 5 5
Lo que suele hacerse es ordenar los valores de las hojas de menor a mayor y, en este caso, el
diagrama final se verá ası́:
8 8 9
9 3 4 4 5 6 6 7
10 3 3 4 6 7 8
11 1 2 2 3 3 7 7 8 9
12 0 0 4 5 5 5 7 7
13 2 4 5 6 8 9 9
14 2 3 8
15 5 5 6
Del diagrama de tallos y hojas se pueden sacar varias conclusiones como, entre otras, las
siguientes:
• Primero, el menor número de anuncios comprados es 88 y el mayor es 156.
• Dos comerciantes compraron menos de 90 anuncios y tres, más de 150.
• Puede observarse, por ejemplo, que los tres comenrciantes que compraron más de 150,
compraron 155, 155 y 156 comerciales.
• La mayor concentración del número de comerciales está entre 110 y 130.
• Hubo 9 comerciantes que compraron entre 110 y 119 anuncios y que 8 compraron
entre 120 y 129.
• También podemos decir que dentro del grupo de 120 a 129 el número de anuncios
comprados se repartió uniformemente.
• Dos comerciantes compraron 120, un comenrciante compró 124, tres compraron 125
y dos, 127.
Para concentrarnos en la forma que toma el diagrama de tallos y hojas, coloquemos un
rectángulo para representar la “cantidad de hojas” de cada tallo. Al hacerlo obtenemos la
siguiente representación:
8 8 9
9 3 4 4 5 6 6 7
10 3 3 4 6 7 8
11 1 2 2 3 3 7 7 8 9
12 0 0 4 5 5 5 7 7
13 2 4 5 6 8 9 9
14 2 3 8
15 5 5 6
Si giramos la página 90 grados en el sentido de las manecillas del reloj, obtenemos una
imagen de los datos que se parece mucho a la de un histograma con clases de 80 a 90,
90 a 100, 100 a 110, etc. Aunque el diagrama de tallos y hojas parece ofrecer la misma
información que un histograma, tiene dos ventajas principales: