Está en la página 1de 4

TEMA 1: DESCRIPCIN DE VARIABLES CUALITATIVAS

DISTRIBUCIN DE FRECUENCIAS

Supongamos que tenemos N observaciones de una variable cualitativa.

Supongamos que la variable puede tomar valores pertenecientes a k clases o categoras:

V e r d e
A zul

Color de ojos=
M a rron
N e g r o

k=4

Representamos mediante n1, n2, , nk el nmero de datos que aparecen en cada una de las k categoras.

Frecuencia absoluta de la clase i-sima (ni): nmero de observaciones en la clase i.

Frecuencia relativa de la clase i-sima (fi): es la proporcin de datos en la clase i-sima, es decir,
-

fi =

ni
N

La suma de las k frecuencias relativas es igual a la unidad: f1 + f2 ++ fk=1


Nos permiten comparar las frecuencias de las categoras en conjuntos de datos con distinto nmero de observaciones

Distribucin de frecuencias: es la tabla que presenta las categoras de una variable y sus respectivas frecuencias.

Nos indica cmo se distribuye la frecuencia total entre las categoras

Es el resumen ms importante de la informacin contenida en una variable cualitativa


Ejemplo:
Se ha clasificado a 20 individuos segn su nivel de estudios que puede tomar valores:

1
2

Nivel de Estudios=
3
4

s in e s tu d io s
p r im a r io s
m e d io s
s u p e r io r e s

y se han obtenido los siguientes datos:


1 1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3
N=20; k=4
Frecuencias absolutas:
n1=3; n2=7; n3=6; n4=4

N = n1 + n2 + n3 + n4 = 3 + 7 + 6 + 4 = 20

Frecuencias relativas:

f1 =

= 0 ,1 5 ;

f2 =

= 0 ,3 5 ;

f3 =

= 0 ,3 ; f 4 =

20
20
20
f 1 + f 2 + f 3 + f 4 = 0 ,1 5 + 0 , 3 5 + 0 , 3 + 0 , 2 = 1

4
20

= 0 ,2

Distribucin de frecuencias:
Categoras
1

ni
3

fi
0,15

2
3
4

7
6
4
N=20

0,35
0,3
0,2
1

La categora ms frecuente es la de estudios primarios y la menos frecuente la de sin estudios


REPRESENTACIN GRFICA DE LA DISTRIBUCIN DE FRECUENCIAS
A)

Diagrama de barras: Permite visualizar de forma sencilla la distribucin de una variable cualitativa. Se dibuja sobre cada
categora una barra (o rectngulo) cuya altura coincida con la frecuencia absoluta o relativa de dicha clase.
Ejemplo: Nivel de estudios (pag. 4)
Frecuencias relativas fi
0.40
0.35
0.30
0.25
0.20
0.15
0.10
1

B) Diagrama de Pareto: Es como un diagrama de barras en el que se ordenan las clases de mayor a menor frecuencia (absoluta o
relativa).
Ejemplo: Nivel educativo
Frecuencias relativas fi
0.40
0.35
0.30
0.25
0.20
0.15
0.10
2

En la parte superior de la figura suele trazarse una lnea que representa la suma de la frecuencia de cada clase y las que la
preceden:
f2=0,35
f2+ f3=0,35+0,3=0,65
f2+ f3+ f4=0,35+0,3+0,2=0,85
f2+ f3+ f4+f1=0,35+0,3+0,2+0,15=1

1.0
0.8
0.6
0.4
0.2
0.0
2

C) Pictograma: Consiste en un crculo en el que se representan sectores o porciones con reas proporcionales a las frecuencias de
cada una de las categoras.
Ejemplo: Nivel de estudios

1
2

3
4

LA MODA

La moda o clase modal es el dato o categora de mayor frecuencia.

Nos sirve como descripcin de la variable en el sentido de ser la clase ms representativa porque es la ms frecuente.

La moda no tiene por qu ser nica. Puede existir ms de una clase o dato con la mxima frecuencia.

Ejemplo: Nivel de estudios


La clase modal es la 2, la de estudios primarios.
Ejercicio 2.7 de Pea y Romo: La variable SOC describe la categora socioeconmica:

1 t r a b a j a d o r e s a g r a r i o s
2 e m p r e s a r i o s a g r a r i o s

3 o b r e r o s

SOC= 4 a u t o n o m o s
5 c l a s e m e d i a

6 c l a s e a l t a
7 r e t i r a d o s

Los datos de 75 hogares (o unidades de gasto) son:


373535157553351132231 375333555775142 173433353 366 727133253722 7522761
53533343
(a)

Obtener las frecuencias absolutas de cada una de las categoras.

n1=8
n6=3
(b)

n2=9
n7=11

n3=25

n4=3

n5=16

Calcular las frecuencias relativas y mostrar la distribucin de frecuencias

f1 =
f3 =

n1
8
=
= 0 ,1 1
N
75

n2
9
=
= 0 ,1 2
N
75
n
3
f4 = 4 =
= 0 ,0 4
N
75
n
3
f6 = 6 =
= 0 ,0 4
N
75
f2 =

n3
25
=
= 0 ,3 3
N
75

n
16
=
= 0 ,2 1
N
75
n
11
f7 = 7 =
= 0 ,1 5
N
75
f =

Ntese que:

f1 + f

+ f

+ f

+ f5 + f

+ f

fi = 1

i=1

Distribucin de frecuencias:
Categora
1
2
3
4
5
6
7
(c)
(d)
(e)

ni
8
9
25
3
16
3
11
N=75

fi
0,11
0,12
0,33
0,04
0,21
0,04
0,15
1

Hallar la moda
La moda o clase modal es la 3, obreros
Qu ventaja tiene usar frecuencias relativas en vez de absolutas?
Nos permite comparar con otros conjuntos de datos con diferente n de observaciones.
Hallar el diagrama de Pareto
1.0
0.8
0.6
0.4
0.2
0.0
3

f3=0,33; f3+f5=0,33+0,21=0,54
f3+f5+f7=0,33+0,21+0,15=0,69
f3+f5+f7+f2=0,33+0,21+0,15+0,12=0,81
f3+f5+f7+f2+f1=0,33+0,21+0,15+0,12+0,11=0,92
f3+f5+f7+f2+f1+f4=0,33+0,21++0,11+0,04=0,9
F3+F5+F7+F2+F1+F4+F6=0,33+0,21++0,04+0,04=1

También podría gustarte