Está en la página 1de 13

TEMA 1: DESCRIPCIN DE VARIABLES CUALITATIVAS

DISTRIBUCIN DE FRECUENCIAS

Supongamos que tenemos N observaciones de una variable

cualitativa.

Supongamos que la variable puede tomar valores

pertenecientes a k clases o categoras:

V e r d e
A zul

Color de ojos= k=4
M a r r o n
N e g r o

Representamos mediante n1, n2, , nk el nmero de datos

que aparecen en cada una de las k categoras.


Frecuencia absoluta de la clase i-sima (ni): nmero de

observaciones en la clase i.

Frecuencia relativa de la clase i-sima (fi): es la proporcin

ni
de datos en la clase i-sima, es decir, f i .
N
- La suma de las k frecuencias relativas es igual a la

unidad: f1 + f2 ++ fk=1

- Nos permiten comparar las frecuencias de las categoras

en conjuntos de datos con distinto nmero de

observaciones

Distribucin de frecuencias: es la tabla que presenta las

categoras de una variable y sus respectivas frecuencias.

- Nos indica cmo se distribuye la frecuencia total entre

las categoras

- Es el resumen ms importante de la informacin

contenida en una variable cualitativa


Ejemplo:

Se ha clasificado a 20 individuos segn su nivel de estudios

que puede tomar valores:

1 s in e s tu d io s
2 p r im a r io s

Nivel de Estudios=
3 m e d io s
4 s u p e r io r e s

y se han obtenido los siguientes datos:

1 1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3

N=20; k=4

Frecuencias absolutas:

n1=3; n2=7; n3=6; n4=4

N n1 n2 n3 n4 3 7 6 4 20

Frecuencias relativas:

3 7 6 4
f1 0 ,1 5 ; f2 0 ,3 5 ; f3 0 ,3 ; f 4 0 ,2
20 20 20 20

f 1 f 2 f 3 f 4 0 ,1 5 0 , 3 5 0 , 3 0 , 2 1
Distribucin de frecuencias:

Categoras ni fi
1 3 0,15
2 7 0,35
3 6 0,3
4 4 0,2
N=20 1

La categora ms frecuente es la de estudios primarios y la

menos frecuente la de sin estudios


REPRESENTACIN GRFICA DE LA DISTRIBUCIN DE

FRECUENCIAS

A) Diagrama de barras: Permite visualizar de forma

sencilla la distribucin de una variable cualitativa. Se

dibuja sobre cada categora una barra (o rectngulo)

cuya altura coincida con la frecuencia absoluta o

relativa de dicha clase.

Ejemplo: Nivel de estudios (pag. 4)

Frecuencias relativas fi

0.40

0.35

0.30

0.25

0.20

0.15

0.10
1 2 3 4
B) Diagrama de Pareto: Es como un diagrama de barras

en el que se ordenan las clases de mayor a menor

frecuencia (absoluta o relativa).

Ejemplo: Nivel educativo

Frecuencias relativas fi

0.40

0.35

0.30

0.25

0.20

0.15

0.10
2 3 4 1
En la parte superior de la figura suele trazarse una lnea

que representa la suma de la frecuencia de cada clase y

las que la preceden:

f2=0,35

f2+ f3=0,35+0,3=0,65

f2+ f3+ f4=0,35+0,3+0,2=0,85

f2+ f3+ f4+f1=0,35+0,3+0,2+0,15=1

1.0

0.8

0.6

0.4

0.2

0.0
2 3 4 1
C) Pictograma: Consiste en un crculo en el que se

representan sectores o porciones con reas

proporcionales a las frecuencias de cada una de las

categoras.

Ejemplo: Nivel de estudios

1 3
2 4
LA MODA

La moda o clase modal es el dato o categora de

mayor frecuencia.

Nos sirve como descripcin de la variable en el

sentido de ser la clase ms representativa porque es la

ms frecuente.

La moda no tiene por qu ser nica. Puede existir ms

de una clase o dato con la mxima frecuencia.

Ejemplo: Nivel de estudios

La clase modal es la 2, la de estudios primarios.


Ejercicio 2.7 de Pea y Romo: La variable SOC describe

la categora socioeconmica:

1 tr a b a ja d o r e s a g r a r io s
2 e m p r e s a r io s a g r a r io s

3 obreros

SOC= 4 a u to n o m o s
5 c la s e m e d ia

6 c la s e a lta
7 r e tir a d o s

Los datos de 75 hogares (o unidades de gasto) son:

373535157553351132231 37533355577

5142 173433353 366 727133253722 752

276153533343

(a) Obtener las frecuencias absolutas de cada una de

las categoras.

n1=8 n2=9 n3=25 n4=3 n5=16

n6=3 n7=11
(b) Calcular las frecuencias relativas y mostrar la

distribucin de frecuencias

n1 8 n2 9
f1 0 ,1 1 f2 0 ,1 2
N 75 N 75

n3 25 n4 3
f3 0 ,3 3 f4 0 ,0 4
N 75 N 75

n 16 n6 3
f 5
0 ,2 1 f6 0 ,0 4
N 75 N 75
5

n7 11
f7 0 ,1 5
N 75

Ntese que:

7
f1 f2 f3 f4 f5 f6 f7
i1
fi 1
Distribucin de frecuencias:

Categora ni fi
1 8 0,11
2 9 0,12
3 25 0,33
4 3 0,04
5 16 0,21
6 3 0,04
7 11 0,15
N=75 1

(c) Hallar la moda

La moda o clase modal es la 3, obreros

(d) Qu ventaja tiene usar frecuencias relativas en vez

de absolutas?

Nos permite comparar con otros conjuntos de datos

con diferente n de observaciones.

(e) Hallar el diagrama de Pareto


1.0

0.8

0.6

0.4

0.2

0.0
3 5 7 2 1 4 6

f3=0,33; f3+f5=0,33+0,21=0,54

f3+f5+f7=0,33+0,21+0,15=0,69

f3+f5+f7+f2=0,33+0,21+0,15+0,12=0,81

f3+f5+f7+f2+f1=0,33+0,21+0,15+0,12+0,11=0,92

f3+f5+f7+f2+f1+f4=0,33+0,21++0,11+0,04=0,9

F3+F5+F7+F2+F1+F4+F6=0,33+0,21++0,04+0,04=1

También podría gustarte