Está en la página 1de 7

Organización y presentación de

datos
ESTADÍSTICA Ordenando la Información
Al ordenar datos muy numerosos, es usual
agruparlos en clases o categorías. Al determinar
ORGANIZACIÓN Y PRESENTACIÓN DE cuántos pertenecen a cada clase, establecemos
DATOS la frecuencia. Construimos así una tabla de
datos llamada tabla de frecuencias.

¿Para qué se construyen las tablas Tabla de Frecuencias


de frecuencias ? El formato general de una tabla estadística , llamada
también TABLA DE FRECUENCIAS O TABLA DE
DISTRIBUCIÓN DE FRECUENCIAS es la siguiente:

1. ORDENAR Nombre de la Frecuencia


2. AGRUPAR variable
Categorías o Frecuencias
3. RESUMIR información
Recorrido de la Observadas
variable
TOTAL n

FRECUENCIA ABSOLUTA ( fi )
La frecuencia absoluta es el TABLA
número de veces que aparece un
valor (x i) en los datos xi f i
obtenidos.
0 4
Es el número de observaciones
que presentan una modalidad 1 9
perteneciente a la clase. 2 12
3 10
f1 + f2 + f3 + ……….……fk = n
4 8

En nuestro ejemplo, la frecuencia 5 4


absoluta indica el número de 6 2
familias que tienen esa cantidad de 7 1
hijos:

1
FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA ( hi )
ACUMULADA ( Fi ) Son datos que muestran la fracción del conjunto total de datos que
caen dentro de cada conjunto de clases mutuamente excluyentes.
La frecuencia absoluta acumulada indica cuantos elementos de la La frecuencia relativa es el cociente entre la frecuencia absoluta
lista de datos son menores o iguales a un valor dado. Es la suma de (fi) y el número total de datos (n). En nuestro ejemplo n=50:
las frecuencias absolutas desde la primera fila hasta la fila elegida.
Representación tabular de los datos que muestra cuantas hi = fi/n
observaciones se hallan encima o debajo de ciertos valores.
F1 = f1 xi f i Fi xi f i Fi hi
0 4
0 4 4
F2 = f1 + f2 1 9
1 9 13
----------------------------- 2 12
3 10 2 12 25
Fk = f1 + f2 + ……….+ fk TABLA
4 8 3 10 35
5 4 4 8 43
6 2
5 4 47
7 1
Por ejemplo, sabemos que hay 25 matrimonios de la muestra que 6 2 49
tienen a lo más 2 hijos: 7 1 50
7

FRECUENCIA RELATIVA ACUMULADA (Hi)


 Es el tanto por uno de los elementos de la población que están en alguna clase y
Como organizar los datos?
que presentan una modalidad inferior o superior a la clase. • Cuando se tiene información acerca de cierta
característica de una determinada cantidad de
 La frecuencia relativa acumulada es el cociente entre la frecuencia absoluta
datos, se procederá a organizar y presentar
acumulada (Fi) y el número total de datos (n). En nuestro ejemplo, n =50:
TABLA
estos de modo que facilite el análisis.
H1 = F1/n
xi fi Fi hi Hi H2 = F2/n • Un primer paso es determinar si la variable es
0 4 4 0,08 ----------------------------- Cualitativa o si es Cuantitativa.
1 9 13 0,18 Hk = Fk/n
• Luego de esto se construye la tabla de
2 12 25 0,24
distribución de frecuencias, la cual tendrá
3 10 35 0,20
ciertas características según sea el tipo de
4 8 43 0,16
variable.
5 4 47 0,08
6 2 49 0,04 • También se veremos algunas pautas para la
7 1 50 0,02 representación de estos datos mediante gráficos

Tabla de distribución de frecuencias


• En esta caso la tabla de distribución de frecuencias
tendrá una columna para las posibles categorías de la
ORGANIZACIÓN Y variable y otra para las frecuencias.
PRESENTACIÓN DE Tabla de distribución de frecuencias
DATOS Variable fi hi Variable fi hi Fi Hi
VARIABLE CUALITATIVA C1 f1 h1 C1 f1 h1 F1 H1
C2 f2 h2 C2 f2 h2 F2 H2
... ... ... ... ... .. .. ..
Ck f k hk Ck fk hk Fk Hk
Escala de medición: Nominal Escala de medición: Ordinal

2
En este caso definimos las siguientes frecuencias: hi : frecuencia relativa simple. Representa el
Ci : Representa las categorías o posibles valores porcentaje de datos que tienen la
de la variable en estudio. característica Ci
fi : Es llamada frecuencia absoluta simple, y Se calculan de la siguiente forma:
representa el número de datos que tienen la fi
hi 
Característica Ci n
Se obtienen mediante un conteo directo de Donde n es el tamaño de muestra, es decir es el
los datos. número de datos.
Siempre se debe cumplir que Si multiplicamos hi por 100, la tendremos
expresada en porcentaje.

Ejemplo: Cuadro 1
EVALUACIÓN DE LA CALIDAD DE LOS
Un restaurante de Florida emplea cuestionarios en los ALIMENTOS
que pide a sus clientes que evalúen el servicio, la
calidad de los alimentos, los cocteles, los precios y la
atmósfera del restaurante. Cada uno de estos puntos G V V O O O A G V P

se evalúa con una escala de óptimo (O), muy bueno G A G V O O A O V V


(V), bueno (G), regular (A) y malo (P). Emplee la O G P O V A V O O O
estadística descriptiva para resumir los datos siguientes O G V O O V G O G A
respecto a la calidad de los alimentos. O G O G V O O A V V

Se pide organizar los datos en una tabla de distribución


de frecuencias

En este caso, el cuadro de distribución de frecuencias


tendrá la siguiente forma: Representación Gráfica
CALIDAD DE LOS
ALIMENTOS fi Fi hi Hi
O 19 19 0.38 0.38
GRÁFICO CIRCULAR GRÁFICO DE BARRAS
V 13 32 0.26 0.64 20
18 19
P
G 10 42 0.2 0.84 A
12%
4% 16

O 14

A 6 48 0.12 0.96 38% 12 13


G 10
10
P 2 50 0.04 1 20% 8
6
6
Total 50 1 V
4
2
26% 2
0
O V G A P

3
Tabla de distribución de frecuencias
ORGANIZACIÓN Y Si tenemos una variable Tabla de distribución de
cuantitativa discreta, cuyos frecuencias
PRESENTACIÓN DE posibles valores son pocos, Variable
Frecuencia Frecuencia Frecuencia Frecuencia

entonces la tabla de
Absoluta Relativa Absoluta Relativa

DATOS
Acumulada Acumulada

distribución de frecuencias Xi fi hi Fi Hi
tendrá la forma mostrada.
VARIABLE CUANTITATIVA DISCRETA X1 f1 h1 F1 H1
En la primera columna se
colocan todos los posibles
valores que puede tomar la X2 f2 h2 F2 H2
variable, y en las otras dos
columnas se presentan la ..... ... ... ... ...
frecuencias.
Xk fk hk Fk Hk

Para construir una tabla de distribución de frecuencia Ejemplo


en este caso, consideraremos las siguientes pautas:
Las tiendas Pelican, una división de National Clothing, es una
• Primero se determina todos los posibles valores que puede cadena de tiendas de ropa para mujer que tiene sucursales por
tomar la variable, a los que llamaremos X1, X2, ...... Xk todo Estados Unidos. Hace poco la tienda realizó una promoción
• En esta tabla tenemos lo siguiente: en la que envió cupones de descuento a todos los clientes de
otras tiendas de National Clothing. Los datos obtenidos en una
Xi : Cada uno de los posibles valores que muestra de 30 clientes acerca del número de artículos
comprados en las tiendas Pelican durante un día se presentan a
puede tomar la variable.
continuación:
fi : Frecuencia absoluta simple del valor Xi
hi : Frecuencia relativa simple del valor de Xi
1 1 1 5 2 1 9 10 2 1
fi 3 2 2 4 3 3 5 4 4 7
hi 
n 6 2 6 6 4 4 7 2 3 2
Fi : frecuencia absoluta acumulada, hasta el valor Xi
Hi : Frecuencia relativa acumulada, hasta el valor Xi

El cuadro de distribución de frecuencias en


Representación gráfica
este caso será:
• HISTOGRAMA: Gráfica en la que las clases se señalan en el eje horizontal y
Número las frecuencias de clases en el eje vertical. Las frecuencias de clase se
total
fi hi Fi Hi representan por medio de las alturas de las barras, estas se dibujan de manera
artículos
comprados adyacente.

1 5 0.17 5 0.17
8
2 7 0.23 12 0.4
7
3 4 0.13 16 0.53
6
4 5 0.17 21 0.7
5
5 2 0.07 23 0.77
4
6 3 0.1 26 0.87
3
7 2 0.07 28 0.94
2
8 0 0 28 0.94
1
9 1 0.03 29 0.97
0
10 1 0.03 30 1 1 2 3 4 5 6 7 8 9 10

Total 30 1

4
Representación gráfica
Representación gráfica
• POLIGONO DE FRECUENCIA.- es similar a un histograma. Consiste en • POLIGONO DE FRECUENCIA ACUMULADA.-
segmentos de recta que conectan los puntos formados por las intersecciones
de los puntos medios de clase y las frecuencias. 35

30 30
29
28 28
8 26
25
7 7 23
21
20
6

5 5 5 16
15

4 4 12
10
3 3

2 2 2 5 5

1 1 1
0
1 2 3 4 5 6 7 8 9 10
0 0
1 2 3 4 5 6 7 8 9 10

Tabla de distribución de
Frecuencias
ORGANIZACIÓN Y • En este caso la tabla de distribución de
frecuencias tendrá seis columnas, en cada una
PRESENTACIÓN DE de las cuales tendremos:
DATOS  Intervalos de Clase: [Linf , Lsup [
VARIABLE CUANTITATIVA CONTINUA
 Marcas de Clase: Xi
 Frecuencias Absolutas simples: fi
 Frecuencias Relativas simples: hi
 Frecuencia Absolutas acumuladas: Fi
 Frecuencias Relativas acumuladas: Hi

• La tabla de distribución de frecuencias tendrá la


siguiente estructura: Algunas relaciones importantes entre los componentes
de esta tabla de distribución de frecuencias
Intervalos Xi fi hi Fi Hi
de Clase
 La marca de clase Xi es el punto medio del
intervalo de clase respectivo.
[Linf , Lsup[ X1 f1 h1 F1 H1  k es el número de intervalos de clase y n es el
número de datos.
[Linf , Lsup[ X2 F2 h2 F2 H2
 Tendremos que:
fi
..... .... .... .... .... .... hi %  (100)
n
 Siempre se debe cumplir que:
[Linf , Lsup] Xk fk hk Fk Hk k k

 fi n h i  100
Total n 1 i 1 i 1

 Además: Fk = n y Hk = 100

5
Procedimiento para construir una tabla de • Paso 3:
distribución de frecuencias: Hallar la amplitud de clase, la denotaremos por A
• Paso 1: A = R / k
Determinar el rango o amplitud de las datos, este valor
se denota por la letra R, y se calcula de la siguiente El resultados se redondea al valor inmediato superior, teniendo
manera: en cuenta el número de decimales que se está utilizando.
R = XMAX - XMIN • Paso 4:
• Paso 2: i) En base a los resultados anteriores determinar los límites
Determinar el número de intervalos de clase, al que de los intervalos de clase.
denotaremos por k, y se calcula utilizando: ii) Proceder al conteo de los datos que dará como resultado
K = 1 + 3.322 Log(n) n<=50 las frecuencias absolutas simples fi , a partir de estas se
K= 1.8914 + 3.9910 Log(n) 50< n <=100 calcular el resto de las frecuencias hi , Fi y Hi
K= 2.7560 + 5.8154 Log(n) n> 100

En este caso se utiliza el redondeo matemático usual.

Para explicar este procedimiento veamos el siguiente


ejercicio: Procedimiento:
• Paso 1:
Ejemplo:
Calculamos el rango o recorrido(R):
NRF/BIG proporciona los resultados de una investigación
sobre las cantidades que gastan en vacaciones los R = XMAX – XMIN = 2050- 180 = 1870
consumidores (USA today; 20 de diciembre de 2005). Los • Paso 2:
datos siguientes son las cantidades gastadas en vacaciones
por los 25 consumidores de una muestra. Determinamos el número de intervalos de clase(K)
K= 1 + 3.322 Log(n) 50< n <=100
1200 850 740 590 340 k = 1+3.322 log (25) =5.643946 = 6
450 890 260 610 350
• Paso 3:
1780 180 850 2050 770
Calculamos la amplitud de clase (A):
800 1090 510 520 220
1450 280 1120 200 350 A = R/k = 1870 /6 = 311.67 por lo tanto
A =312

Marca de Clase ( Xi )
fi hi Fi Hi
• La marca de clase es el punto medio de cada intervalo y intervalos Xi
se calcula sumando los límites de cada intervalo y
dividiéndolos entres dos, por ejemplo: 180 492 336 9 0.36 9 0.36

492 804 648 7 0.28 16 0.64


180+492
• 𝑋1 = 2
= 336
804 1116 960 4 0.16 20 0.8

492+804 1116 1428 1272 2 0.08 22 0.88


• 𝑋2 = 2
= 648
1428 1740 1584 1 0.04 23 0.92

1740 2052 1896 2 0.08 25 1


………… total 25 1
Así sucesivamente.

6
Representación gráfica Representación gráfica
• HISTOGRAMA: Gráfica en la que las clases se señalan en el eje horizontal y • POLIGONO DE FRECUENCIA.- es similar a un histograma. Consiste en
las frecuencias de clases en el eje vertical. Las frecuencias de clase se segmentos de recta que conectan los puntos formados por las intersecciones
representan por medio de las alturas de las barras, estas se dibujan de manera de los puntos medios de clase y las frecuencias.
adyacente.

10
10
9 9
9
8
8
7 7 7

6 6
5 5
4
4 4
3
3
2
2 2 2
1
0 1 1
336 648 960 1272 1584 1896
0
336 648 960 1272 1584 1896

Representación gráfica
• POLIGONO DE FRECUENCIA ACUMULADA.-

25

23
22

20 20

16
15

10
9

0
336 648 960 1272 1584

También podría gustarte