Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2.1 Introducción.
Una serie estadística puede entenderse como una colección de datos estadísticos
clasificados, ordenados u organizados según un determinado criterio. Las series estadísticas
se pueden clasificar de la siguiente manera: series cronológicas, series espaciales, series
cualitativas y series cuantitativas entre otras.
Tabla 2.1
Las series espaciales son secuencias de datos referentes a una característica o variable
que se estudia a través del espacio, en un determinado tiempo.
Las series cuantitativas son secuencias de datos que cuantifican (miden la cantidad o
intensidad) de una característica de los individuos pertenecientes a una población en
estudio, independiente del espacio y del tiempo.
Ejemplo 2.4. Este ejemplo ha sido adaptado de Bejarano [4]. Un ejemplo de serie
cuantitativa es I : niveles de ingreso mensual de una muestra de trabajadores en la fábrica
W en la ciudad de Cali 2006. Ver Tabla 2.4.
Una vez se ha determinado el tipo de serie estadística que corresponde a una variable
es posible realizar tablas de frecuencias que resumen la información a través de frecuencias
absolutas o frecuencias relativas. La frecuencia absoluta es el número de veces que aparece
un dato en una serie estadística y la frecuencia relativa es un porcentaje que se obtiene al
dividir cada frecuencia absoluta entre el total de los datos.
Ejemplo 2.5. Los siguientes datos corresponden a la variable, A : número de artículos
defectuosos producidos por cada una de las 4 máquinas en una fábrica de juguetes en la
semana 5 de producción. La máquina 1 (M1) produjo 5 artículos defectuosos, la máquina 2
(M2) produjo 10 defectuosos, la máquina 3 (M3) produjo 10 defectuosos y la máquina 4
(M4) produjo 15 defectuosos. Estos datos se pueden organizar como se indica en la Tabla
2.5.
X fi hi
1.0 3 3/30 = 0.1
2.0 3 3/30 = 0.1
2.5 7 7/30 = 0.233
3.0 4 4/30 = 0.133
3.5 3 3/30 = 0.1
3.8 2 2/30 = 0.066
4.0 4 4/30 = 0.133
5.0 4 4/30 = 0.133
Tabla 2.6
El tamaño de la población es N 30 . Ahora se pueden ordenar los datos y determinar
las frecuencias absolutas, como se indica en la Tabla 2.6.
X fi hi Fi Hi
1.0 3 0.1 3 0.1
2.0 3 0.1 6 0.2
2.5 7 0.233 13 0.433
3.0 4 0.133 17 0.566
3.5 3 0.1 20 0.666
3.8 2 0.066 22 0.732
4.0 4 0.133 26 0.865
5.0 4 0.133 30 0.998
Tabla 2.7
A continuación se hace la interpretación de algunas de las frecuencias presentadas en la
Tabla 2.7.
La frecuencia absoluta f 2 = 3, indica que 3 estudiantes de Estadística I obtuvieron
una calificación de 2.0.
La frecuencia relativa h3 = 0.233 que representa al 23.3%, indica que el 23.3% del
total de estudiantes obtuvieron una calificación de 2.5 en Estadística I.
X fi hi Fi Hi
20 4 0.2 4 0.20
50 1 0.05 5 0.25
80 5 0.25 10 0.50
150 8 0.4 18 0.90
200 2 0.1 20 1.00
Tabla 2.8
Cuando se tiene datos correspondientes a una variable continua es posible agrupar la
información en categorías o clases, especialmente cuando el número de datos es grande (50
o más datos). La cantidad de clases a incluir en la tabla de frecuencias es decisión del
investigador o del analista de datos, generalmente se organizan los datos en tablas de
frecuencias que contienen entre 4 y 14 clases. Es recomendable formar clases de igual
amplitud. Para elaborar tablas de frecuencias para datos agrupados se puede tener en cuenta
el siguiente algoritmo:
R( X ) x( N ) x(1)
Formar las clases empezando con el dato mínimo y aumentando cada vez la
amplitud del intervalo hasta que la última clase contenga al dato mayor.
332 333 335 338 338 191 191 192 198 200 203
205 208 208 227 227 227 226 225 225 219 214
209 230 230 230 230 235 240 240 246 247 295
280 280 278 275 268 267 260 297 300 310 330
331 296 200 220 245 250
Los datos como se indicaron anteriormente no están ordenados, es conveniente
ordenarlos ascendentemente de la siguiente forma,
191 191 192 198 200 200 205 208 208 209 209
214 219 220 225 225 226 227 227 227 230 230
230 230 235 240 240 245 246 247 250 260 267
268 275 278 280 280 295 296 297 300 310 330
331 332 333 335 338 338
Se obtiene el rango,
log(50)
m 1
log(2)
m 6.64 7
Con los anteriores elementos, se pueden formar intervalos semi abiertos que
corresponden a las 7 clases siguientes:
191, 212 , 212, 233 , 233, 254 , 254, 275 , 275, 296 , 296,317 , 317,338
Para formar la tabla de frecuencias, se cuenta cuantos datos caen en cada clase y dicho
número corresponde a la frecuencia absoluta que para datos agrupados se denotará con f j
con j 1, 2,..., m . Para determinar las frecuencias relativas h j y las frecuencias acumuladas
( F j y H j ) se procede de modo similar a como se indicó en datos no agrupados.
La marca de clase x j es el punto medio de cada clase, este valor se utiliza para calcular
algunas estadísticas tales como el promedio y la varianza para datos agrupados, su análisis
se realizará en el Capítulo 3. Los valores Li y Ls se denominan límite inferior y límite
superior de clase respectivamente. Los resultados de organizar los datos se presentan en la
Tabla 2.9.
n = 50 h
j 1
j 100%
Tabla 2.9
La frecuencia relativa h3 = 0.14 que representa al 14%, indica que el 14% del total
de los restaurantes estudiados en la ciudad de Cali vendieron entre 233 y 254
millones de pesos en el mes de Julio de 2008.
La frecuencia absoluta acumulada F4 = 34, indica que 34 restaurantes de los 50
estudiados en la ciudad de Cali vendieron menos de 275 millones de pesos en el
mes de Julio de 2008.
R 147
C 29.4
m 5
X fj hj Fj Hj Marca de Clase
Li - Ls xj
191 – 220.4 14 0.28 14 0.28 205.7
220.4 – 249.8 16 0.32 30 0.60 235.1
249.8 – 279.2 6 0.12 36 0.72 264.5
279.2 – 308.6 6 0.12 42 0.84 293.9
308.6 – 338 8 0.16 50 1.00 323.3
5
n = 50 h j 1
j 100%
Tabla 2.10
La frecuencia relativa h3 = 0.12 que representa al 12%, indica que el 12% del total
de los restaurantes estudiados en la ciudad de Cali vendieron entre 249.8 y 279.2
millones de pesos en el mes de Julio de 2008.
La frecuencia absoluta acumulada F4 = 42, indica que 42 restaurantes de los 50
estudiados en la ciudad de Cali vendieron menos de 308.6 millones de pesos en el
mes de Julio de 2008.
Para representar datos numéricos se pueden utilizar diversas formas, tales como:
Histogramas, diagrama de Puntos, diagrama de Líneas, diagrama de Barras, diagrama de
Pastel, Ojivas, entre otros.
Un polígono de frecuencias es una línea quebrada que se traza a partir de los puntos
medios de cada clase ubicados en la parte superior de cada barra del histograma. En la
Gráfica 2.4 se presenta el histograma y el polígono de frecuencias correspondiente a las
frecuencias que se indican en la Tabla 2.8.
El diagrama de puntos se elabora con base en las clases que se formen y contando las
veces que aparece un dato en una clase en particular, cada vez que se identifica que un dato
está en una clase en particular se representa superponiendo en esa clase un símbolo que se
decida utilizar.
3504 3693 3436 3433 3449 4341 4354 4312 4425 3850 3090 4142
4034 4166 3850 3563 3609 3353 3761 3086 2372 2833 2774 2587
2130 1835 2672 2430 2375 2234 2648 4615 4376 4382 2130 2264
2046 1978 2634 3439 3329 3302 3288 4209 4464 4154 4096 4955
4746 5140 2962 2408 3282 3139 2220 2123 2074 2065 1773 1613
1834 1955 2278 2126 2254 2408 2226 4274 4385 4135 4129 3672
4633 4502 4456 4422 2330 3892 4098 4294 4077 2933 2511 2979
2189 2395 2288 2506 2164 2100 4100 3672 3988 4042 3777 4952
4464 4363 4237 2228
Con los datos de la variable Y : “peso en libras de unos vehículos”, usando el paquete
estadístico R con sus especificaciones por defecto en este caso, se construye el histograma
con 15 clases que se presenta en la Gráfica 2.5, también se incluye el polígono de frecuencias
(línea quebrada).
En la Gráfica 2.6 se presenta el diagrama de tallos y hojas para la variable mencionada
con 8 clases, el cual está conformado por números que se superponen cada vez que un dato
aparece ubicado como corresponde en una de las clases que se han formado, el tallo se
forma con uno o más dígitos iniciales de la medición y las hojas se forman con uno o más
de los dígitos restantes. Se remite al lector al Capítulo 5 para que observe el proceso que se
utiliza en R para la construcción del diagrama de tallos y hojas y se plantea en el trabajo
independiente la consulta de la elaboración de dicho diagrama.
Es importante mencionar que en la Gráfica 2.6 el tallo representado está formado por los
dígitos que encabezan la fila.
Frecuencia
absoluta clases
6,00 1. 678899
25,00 2. 0001111111222222223333444
11,00 3. 55566678999
12,00 4. 001223334444
12,00 5. 556666778889
27,00 6. 000001111112222333333344444
6,00 7. 566799
1,00 8. 1
Gráfica 2.6