Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 4 4 2 3 1 3 1 0 90.000 90.000
2 4 2 0 7 2 2 1 54 62.091 61520
3 4 6 4 3 2 2 1 94 113.379 114.080
4 4 4 2 5 2 4 2 90 137.168 137.600
5 4 3 1 3 2 3 1 82 156.860 158.000
7 4 1 1 4 2 2 75 146.374 147.100
3 4 6 3 5 1 7 2 0 600.000 600.000
9 4 1 0 7 1 1 1 0 48.000 48.000
10 4 5 3 5 1 3 1 0 212.800 212.800
11 4 4 0 5 2 7 2 70 438.000 450.000
12 3 7 0 3 2 3 6 68 597.688 597.688
13 3 5 0 3 2 3 4 80 270.000 270.000
14 4 6 2 5 2 3 2 75 277.200 277.200
15 1 3 0 1 1 2 2 0 115.008 115.008
16 4 4 2 1 2 2 1 59 82.999 84.000
17 4 5 1 3 2 3 2 65 317.200 317.200
18 3 3 0 2 2 3 2 55 149.085 150.000
22 4 3 0 3 1 3 1 0 98.000 98.000
23 3 3 1 7 2 2 1 72 256.000 256.000
24 4 7 1 5 2 5 3 0 501.149 506.000
25 3 3 0 3 1 3 2 0 92.400 91400
26 4 3 1 3 1 3 1 0 127.750 127.750
27 2 0 3 2 3 1 90 131000 131000
28 4 5 0 5 2 3 2 65 346.000 346.000
29 4 6 4 5 1 3 1 0 360.000 360.000
30 1 4 2 5 1 4 1 0 240.000 240.000
32 3 2 0 7 1 3 1 0 71.400 71.400
35 4 5 0 4 2 3 1 0 111200 114.000
36 4 4 0 2 1 3 3 0 298.000 298.000
37 2 4 0 1 1 2 4 0 320.124 320.124
38 4 3 1 7 1 3 1 0 184.800 184.800
39 4 4 1 3 1 3 2 0 263.200 263200
40 4 1 0 4 2 3 1 25 90.350 90.656
41 4 1 0 3 1 3 1 0 242.000 241000
42 4 4 2 3 2 3 1 54 229.999 234.000
43 2 1 0 3 2 3 1 40 78.520 78.520
Las variables ordinales recogen la idea de orden —ausente en las nominales—, pero no
tiene sentido realizar operaciones aritméticas con ellas; un ejemplo es pedir a una persona que
indique sus preferencias sobre tres objetos asignando el valor 3 al preferido, 2 al siguiente y 1 al
menos deseado. No tiene sentido decir que, como las diferencias entre 1 y 2 y entre 2 y 3 son las
mismas, ocurre igual con las preferencias entre los objetos. Tampoco se puede operar
aritméticamente con este tipo de variables: carece de significado establecer que el objeto
favorito es tan preferido como la suma de los otros dos.
Las variables de intervalo incluyen la noción de orden y admiten las operaciones de
suma y resta. Por ejemplo, si en vez de solicitar a una persona que ordene tres objetos, le
pedimos que indique sus preferencias en una escala de 0 a 100. Supongamos que los valores
obtenidos son 90, 55 y 40; ahora las diferencias tienen sentido y se puede afirmar que hay más
diferencia entre las preferencias del primero y el segundo que entre las del segundo y el último.
Un rasgo de este tipo de variables es que no hay un valor que sea el cero —u origen— natural
de la escala: en el ejemplo anterior, es igual tomar una escala de í) a 100 que de 200 a 300.
Finalmente, las de cociente admiten cualquier tipo de operación matemática y son variables
como el ingreso o el gasto.
La naturaleza de las variables con que se trabaja es importante porque de ella depende el
tipo de técnicas que pueden utilizarse para estudiarlas.
el número de datos que aparecen en cada una de ellas. El valor n¡ representa el número
de observaciones en la clase i-ésima y recibe el nombre de frecuencia
absoluta de dicha clase. La proporción ni/N de datos en cada una de las clases la
denotaremos por f¡ y recibe el nombre de frecuencia relativa de la i-ésima clase.
Claramente, las frecuencias son números no negativos. Además, la suma de las
frecuencias absolutas es el número total N de observaciones. La suma de las frecuencias
relativas es uno.
El interés de las frecuencias relativas radica en que permiten comparar las frecuencias
de las clases en conjuntos de datos con distinto número de observaciones. La tabla que presenta
las clases o categorías de la variable y sus respectivas frecuencias se llama distribución de
frecuencias (indica cómo la frecuencia total se distribuye entre las clases) y constituye el
resumen más importante de la información contenida en una variable cualitativa.
Ejemplo 2.1.
La variable EDC de la Tabla 2.1 representa el nivel educativo. Las categorías son: 1,
analfabeto; 2, sin estudios; 3, estudios primarios; 4, bachillerato elemental o equivalente; 5,
bachillerato superior o equivalente; 6, formación profesional; 7, anterior al superior; 8, superior.
En la Figura 2.4 pueden verse el diagrama de
barras, el de Párelo y el pictograma para estos datos. Nótese que las clases 6 y 8 tienen
frecuencia igual a cero en este conjunto de observaciones.
En el diagrama de Pareto que aparece en (b) pueden verse las clases ordenadas de
mayor a menor frecuencia. La clase con más personas es la 3 (estudios primarios), seguida por
la de personas sin estudios (2) y analfabetos (1). Nótese cómo la frecuencia en las ciases 4 y 5
disminuye al aumentar el nivel de estudios.
La información que aporta esta variable combinada con la que aparecía en el Ejemplo
21 hace pensar que los datos corresponden muy probablemente a un núcleo rural.
Las Figuras 21 a 2.4 ponen de manifiesto cómo las representaciones gráficas facilitan la
obtención de conclusiones sobre la distribución de frecuencias y la variable estadística El
diagrama de Pareto es la más utilizada: es fácil de construir y proporciona rápidamente la
información fundamental sobre la distribución de los datos.
2.4. La moda.
La descripción numérica natural de una variable cualitativa o categórica viene dada por
la frecuencia relativa f¡ —o proporción de datos p¡— de cada una de las clases. El dato o clase
de mayor frecuencia recibe el nombre de moda o clase modal y sirve como descripción de la
variable en el sentido de ser el dato o clase más representativo por ser el más frecuente. Como
puede existir más de una clase o dato con la máxima frecuencia, la moda no es necesariamente
única.
Ejemplo 2.3.
La moda o clase de mayor frecuencia para la variable SITPROF del Ejemplo 2.1 es la
categoría 2 (empresario o profesional que no emplea personal). En el Ejemplo 22, la moda es la
categoría 3 que corresponde a las personas con estudios primarios. Esto corrobora la conclusión
sobre los datos expresada al final del Ejemplo 2.2
2.5. Resumen.
2.6. Ejercicios.