Está en la página 1de 13

TEMA 1: DESCRIPCIÓN DE VARIABLES CUALITATIVAS

DISTRIBUCIÓN DE FRECUENCIAS

● Supongamos que tenemos N observaciones de una variable

cualitativa.

● Supongamos que la variable puede tomar valores

pertenecientes a k clases o categorías:

V e r d e
 A zul

Color de ojos=  k=4
 M a r r o n
 N e g r o

● Representamos mediante n1, n2, …, nk el número de datos

que aparecen en cada una de las k categorías.


● Frecuencia absoluta de la clase i-ésima (ni): número de

observaciones en la clase i.

● Frecuencia relativa de la clase i-ésima (fi): es la proporción

ni
de datos en la clase i-ésima, es decir, f i  .
N
- La suma de las k frecuencias relativas es igual a la

unidad: f1 + f2 +…+ fk=1

- Nos permiten comparar las frecuencias de las categorías

en conjuntos de datos con distinto número de

observaciones

● Distribución de frecuencias: es la tabla que presenta las

categorías de una variable y sus respectivas frecuencias.

- Nos indica cómo se distribuye la frecuencia total entre

las categorías

- Es el resumen más importante de la información

contenida en una variable cualitativa


Ejemplo:

Se ha clasificado a 20 individuos según su nivel de estudios

que puede tomar valores:

1 s in e s tu d io s
2 p r im a r io s

Nivel de Estudios= 
3 m e d io s
 4 s u p e r io r e s

y se han obtenido los siguientes datos:

1 1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3

N=20; k=4

Frecuencias absolutas:

n1=3; n2=7; n3=6; n4=4

N  n1  n2  n3  n4  3  7  6  4  20

Frecuencias relativas:

3 7 6 4
f1   0 ,1 5 ; f2   0 ,3 5 ; f3   0 ,3 ; f 4   0 ,2
20 20 20 20

f 1  f 2  f 3  f 4  0 ,1 5  0 , 3 5  0 , 3  0 , 2  1
Distribución de frecuencias:

Categorías ni fi
1 3 0,15
2 7 0,35
3 6 0,3
4 4 0,2
N=20 1

La categoría más frecuente es la de estudios primarios y la

menos frecuente la de sin estudios


REPRESENTACIÓN GRÁFICA DE LA DISTRIBUCIÓN DE

FRECUENCIAS

A) Diagrama de barras: Permite visualizar de forma

sencilla la distribución de una variable cualitativa. Se

dibuja sobre cada categoría una barra (o rectángulo)

cuya altura coincida con la frecuencia absoluta o

relativa de dicha clase.

Ejemplo: Nivel de estudios (pag. 4)

Frecuencias relativas fi

0.40

0.35

0.30

0.25

0.20

0.15

0.10
1 2 3 4
B) Diagrama de Pareto: Es como un diagrama de barras

en el que se ordenan las clases de mayor a menor

frecuencia (absoluta o relativa).

Ejemplo: Nivel educativo

Frecuencias relativas fi

0.40

0.35

0.30

0.25

0.20

0.15

0.10
2 3 4 1
En la parte superior de la figura suele trazarse una línea

que representa la suma de la frecuencia de cada clase y

las que la preceden:

f2=0,35

f2+ f3=0,35+0,3=0,65

f2+ f3+ f4=0,35+0,3+0,2=0,85

f2+ f3+ f4+f1=0,35+0,3+0,2+0,15=1

1.0

0.8

0.6

0.4

0.2

0.0
2 3 4 1
C) Pictograma: Consiste en un círculo en el que se

representan sectores o porciones con áreas

proporcionales a las frecuencias de cada una de las

categorías.

Ejemplo: Nivel de estudios

1 3
2 4
LA MODA

● La moda o clase modal es el dato o categoría de

mayor frecuencia.

● Nos sirve como descripción de la variable en el

sentido de ser la clase más representativa porque es la

más frecuente.

● La moda no tiene por qué ser única. Puede existir

más de una clase o dato con la máxima frecuencia.

Ejemplo: Nivel de estudios

La clase modal es la 2, la de estudios primarios.


Ejercicio 2.7 de Peña y Romo: La variable SOC describe

la categoría socioeconómica:

1 tr a b a ja d o r e s a g r a r io s
2 e m p r e s a r io s a g r a r io s

3 obreros

SOC=  4 a u to n o m o s
5 c la s e m e d ia

6 c la s e a lta
7 r e tir a d o s

Los datos de 75 hogares (o unidades de gasto) son:

373535157553351132231 37533355577

5142 173433353 366 727133253722 752

276153533343

(a) Obtener las frecuencias absolutas de cada una de

las categorías.

n1=8 n2=9 n3=25 n4=3 n5=16

n6=3 n7=11
(b) Calcular las frecuencias relativas y mostrar la

distribución de frecuencias

n1 8 n2 9
f1    0 ,1 1 f2    0 ,1 2
N 75 N 75

n3 25 n4 3
f3    0 ,3 3 f4    0 ,0 4
N 75 N 75

n 16 n6 3
f  5
  0 ,2 1 f6    0 ,0 4
N 75 N 75
5

n7 11
f7    0 ,1 5
N 75

Nótese que:

7
f1  f2  f3  f4  f5  f6  f7  
i1
fi  1
Distribución de frecuencias:

Categoría ni fi
1 8 0,11
2 9 0,12
3 25 0,33
4 3 0,04
5 16 0,21
6 3 0,04
7 11 0,15
N=75 1

(c) Hallar la moda

La moda o clase modal es la 3, obreros

(d) ¿Qué ventaja tiene usar frecuencias relativas en vez

de absolutas?

Nos permite comparar con otros conjuntos de datos

con diferente nº de observaciones.

(e) Hallar el diagrama de Pareto


1.0

0.8

0.6

0.4

0.2

0.0
3 5 7 2 1 4 6

f3=0,33; f3+f5=0,33+0,21=0,54

f3+f5+f7=0,33+0,21+0,15=0,69

f3+f5+f7+f2=0,33+0,21+0,15+0,12=0,81

f3+f5+f7+f2+f1=0,33+0,21+0,15+0,12+0,11=0,92

f3+f5+f7+f2+f1+f4=0,33+0,21+…+0,11+0,04=0,9

F3+F5+F7+F2+F1+F4+F6=0,33+0,21+…+0,04+0,04=1

También podría gustarte