i CAPÍTULO 2
!
LOS NIVELES DE MEDICIÓN
27
.,.,.
....
t
cuatro niveles de medición: nominal o clasificatorio, ordinal, de obrero calificado de un obrero no calificado; una persona activa
y una no · activa económicamente.
intervalo y de razón.
La única relación entre las unidades que componen el conjunto
es la de equivalencia, simbolizada por el signo igual; es decir, que
los miembros del subconjunto deben ser equivalentes respecto a las
2.2 Nivel nominal o clasificatorio
propiedades o características que los constituyen co_mo similares .
En este nivel de medición las unidades (personas, objetos, _etcé- El tipo de operaciones estadísticas más empleado en la escala
tera) únicamente se clasifican de acuerdo a la característica o ca- nominal lo constituye d conteo de las frecuencias con que se pre-
racterísticas que se pretendan analizar. Para distinguir los agrupa- sentan las características en las unidades de las respectirns subclases·.
mientos de unidades empleamos símbolos, letras o números; En el Estas frecuencias pueden ser presentadas ya sea con números abso-
caso de que se empleen números para distinguir las clasificaciones . lutos, porcentajes o proporciones. Además se puede determinar la
o subclases, éstos tienen un valor simbólico y no numérico. No exis- razón del número de una u otra subclase, tasas de incremento,
te ninguna relación empírica entre las subclases numeradas, que modo, coeficientes de contingencia y pruebas de significación con
corresponda a la relación matemática de los números asignados. x2.
Por ejemplo dos subclases, hombres y mujeres, las podemos distin-
guir con diferentes símbolos:
2.3 Niue[ 011dinal
Hombres: H, A, X, o, 1
En este nivel las unidades de las subclases guardan una cierta
Mujeres: M, B, Z, 'i?, 2 relación entre sí, esto se pone de manifiesto cuando estamos en
posibilidad de estc1blecer la relación mayor que ( > _) o menor que
Al emplear números, éstos constituyen sólo etiquetas que penni- ( < ) respecto a las características de las unidades escaladas. Por
ten diferenciar un conjunto del otro; no sería correcto afirmar por ejemplo cuando clasificamos a los miembros de una comunidad en
esto que una mujer vale el doble que un hombre o que tiene mayor estratos alto, medio y bajo, se puede establecer que: alto > medio
valor. > bajo; o a la inversa : bajo < medio < alto. Si en un concurso
Cuando clasificamos a un conjunto de personas en varios sub- de oratoria se debe jerarquizar a los participantes de acuerdo con las
conjuntos mutuamente excluyentes, por ejemplo de acuerdo a la calificaciones de los jueces, pueden ser ordenados a partir del más
cáracterística estado civ_il en: solteros, casados sólo por lo civil, ca- al menos apto y esto constituye una escala ordinal. ·
sados sólo por la religión, casados por lo civil y religioso, viudos,
Muchas de las pruebas psicológicas de habilidad, aptitud y las
divorciados, unión libre, podemos valemos de diversos símbolos para
escalas de opinión, tienen la particularidad de constituir escalas
distinguir los subconjuntos, que pueden consistir en letras o números.
ordinales, pues aunque se afirme que la medirión puede situarse en
Cuando clasificamos a los núembros de una comunidad en alfa-
un nivel más alto -nivel de intervalo- no hay razones teóricas
betos y analfabetos, en económicamente activos e inactivos; a los
suficientes para esta suposición. Las medidas · estadísticas más co-
miembros de partidos políticos en PRI, PAN, PPS, PCM; el tipo
múnmente empleadas en este nivel son : mediana, cuan tilas, coefi-
de politización: centro, derecha, izquierda; las carreras que cursa
ciente p (rho) de Spearman; r (tau) de Kendall, ~i de Kendall.
un conjunto de estudiantes, entidad en la que nacieron, creencias
religiosas, etcétera, son ejemplos evidentes de escalas nonúnales. En algunos casos puede establecerse la relación > o < sólo para
algunos pares de subclases. En est_e caso ]a escala se denomina par-
Algunas clasificaciones son más fáciles de realizar que otras
porque es fácil establecer los criterios de clasificación. En ocasiones cialmente ordenada, pero si la relación ?e establece para todos los
resulta difícil establecer quién es un peón y quién un obrero; un pares de subclases entonces es una escala ordinal.
28 29
j-
En el nivel ordinal la distancia entre dos unidades no es cono-
En este mismo ejemplo podemos comprobar, mediante los va·
cida. Por ejemplo no se determina qué distancia existe entre un
lores numéricos, que la razón de las diferencias entre dos intervalos
miembro del estrato medio respecto a otro del estrato alto, pero
son independientes de las unidades empleadas y del punto cero, por
sí se conoce su relación en cuanto al rango o jerarquía. ejemplo:
En el nivel ordinal los números que se asignan a las caracterís-
ticas permiten determinar el orden o la posición jerárquica en una 40 - 30 104 - 86
escala) pero no tienen significado en lo referente a ¿cuánto? o 1 = 1
¿ cuántas veces?, porque son cualidades no aditivas. 30 - 20 86 - 68
En la escala de grados centígrados la congelación del agua En este tipo de escalas no es correcto afirmar por ejemplo que
a nivel del mar constituye el punto cero, y la ebullición a este mismo 100 es· el doble que 50, aunque sí es correcto decir que la diferencia ·
nivel el punto cien. En la escala Fahrenheit estos puntos equivalen entre 50 y 100 grados centígrados será igual a la diferencia entré
rt 32 y 212 grados. En ambas escalas el punto cero es arbitrario; 212 y 122 grados Fahrenheit. .
para la escala de grados centígrados pudo haberse seleccionado otro En la escala de grados Kelvin, utilizada en física, el-cero absolu- ·
procedimiento para determinar el cero y el valor de cien, por ejem- to se establece a -273 grados centígrados; o sea, el nivel más bajo
plo la congelación y la ebullición a la altura de 5 000 metros. Las posible de temperatura que se establece cuando las partículas se
unidades de medición -grados- están determinadas por el sistema encuentran en absoluto reposo, ausencia de movimiento.
empleado para fijar los valores de O y 100. Sin embargo ambas
A partir de cero grados. centígrados, 60° aparenta ser el doble
escalas contienen la misma cantidad y el mismo tipo de información.
que 30º y 15º la mitad de 30°. Sin embargo a partir del cero ab·
i
_l
30 31
w
soluto -----,-273° sólo se observan pequeñas .diferencias. En la escala 2.5 Nii·el de razón
Kelvin 60° son 333º y 30° son 303°. Es obvio que 333° no es el
doble de temperatura que 303°. Se caracteriza porque tiene un punto cero verdadero, es decir
absoluto, además de. poseer las características de la escala de inter-
valo; esto es, las distancias entre dos valores de la escala son cono-
GRÁFICA 2. 1 cidas en el sentido cuantitativo y su "razón" es independiente de
- 273º -200° •150º -100° -50º ºº 60° 100° las unidades empleadas; en las escalas empleadas en ·1a medición
de longitudes, pesos y masas, el punto cero es absoluto, real; por
lllllllllllllilllllllllllllllllllllmllllllmllllllllllll~ 11111111 1 ejemplo en las unidades metro, yarda; kilogramo, libra, metros cú- •
bicos, puesto que un valor cero indica ausencia de medición; esto
es, inexistencia. En la escala de interya]o no podemos afirmar, ver-
30º
l
bigracia, que Ogrados centígrados indique ausencia de temperatura.
En la escala de razón se da una razón igual entre dos valores
11111111111111~1111111111~1111111111111111111111111mm11 de escalas diferentes, por ejemplo kilogramos y libras; la razón entre
15º 40 y 25 kilogramos es igual a la razón entre 40 y 25 libras.
]
La escala de razón reúne todas las propiedades de las escalas
nominal, ordinal y de intervalo, además de poseer un cero absoluto;
11111111111111111111111111111111111111111111111111111111111 es decir, equivalencia, mayor o menor que, razón conocida entre dos
intervalos y entre dos va.lores de escala.
.Con el siguiente ejemplo se comprenderá mejor la diferencia
entre una escala de intervalo y una de razón :
2.6 Rango entre los nivel.ies de mediáón
Eh dos personas, X con estatura de 2.00 m e Y con estatura de
1.50 m, la razón de la estatura de X a la de Y es de 2.00 a 1.50;
Entre los cuatro niveles .de medición puede establecerse un or-
o sea, 2.00 / 1.50; es deci~, 1.33 a l.
denamiento jerárquico de perfección: Ja escala de razón posee todas
Si estas dos personas las vemos detrás de un mostrador, de un
las propiedades de las escalas de interválo, ordinal y nominal. La
metro de altura, a partir de la cubierta, X tendrá un metro e Y sólo
escala de intervalo pooee las propiedades de la escala ordinal
· medio metro; no podríamos concluir por ello que X tiene el doble
de estatura que Y . La razón de estaturas· no puede ser 1 a 0.5; y nominal, y la ordinal, además; de ·su propiedad1 posee la de la
nominal.
o sea, de 2 a 1, sino de 2.00 a 1.50.
Otras escalas de intervalo son las escalas de actitudes, las pun- El nivel nominal sólo pemüte identificar los objetos de acuerdo
tuaciones (IQ) de inteligencia y la escala para medir el tiempo en a la categoría o clase que pertenecen. El nivel ordinal permite com-
nuestro calendario. parar Yariables en el sentido de más grandes o menores. El nivel
De .las escalas ya mencionadas, nominal, ordinal y de intervalo, de intervalo y el de razón permiten establecer qué tanto más grande
esta última es la primera realmente cuantitativa y admite todas o más pequeña es una medición comparada con otra.
las manipulaciones aritméticas. La escala de razón puede. transformarse para ser manipulada por
Las medidas estadísticas más comunes (medí.as, desviaciones es- los procedimientos empleados por ]as otras escalas. Por ejemplo, las
tándar, coeficientes de correlación de Pearson), pueden ser legíti- estaturas es factible arreglarlas en un orden jerárquico de mayor
mamente obtenidas ·de mediciones que tengan la propiedad ·de la a menor ( nivel ordinal), asimismo podríamos clasificar el con junto
es.c ala de. intervalo. en dos, tres o más subclases, por ejemplo de estatura baja, m~dia,
32 33
:,¡
alta (nivel nominal). El proceso inverso no es factible; es decir,
transformar datos de un nivel de medición más bajo a otro mayor,
cuando sólo reune las propiedades de bajos niveles.
PROBLEMAS Y RESPUESTAS
34
35
13. Una persona tiene un coeficiente de inteligencia de 65 y la
1 001 a 1 500 4 001 a 5 000
hasta 600 otra de 130, ¿ es correcto afirmar que la segunda es doblemente
1 501 a 2 000 5 001 a · 6 000 inteligente que la primera?
601 a 700
2 001 a 2 500 6 001 a · 8 000 Respuesta : No, los coeficientes de inteligencia se sitúan en es-
701 a 800
cala de intervalo y no de razón.
2 501 a 3 000 8 001 a 10 000
801 a 900
3 001 a 4 000 10 00ly más 14. Si usted clasifica a las personas de una pobláción por el
901 a, 1 000
n{1mero que habitan en las viviendas y por el número de miembros
Respuesta: Nivel ordinal. Bajo ciertos supuestos se calculan que tienen las familias, ¿ cuál clasificación resultará más difícil de
medid.as estadísticas a nivel de razén. establecer?
7. La lista alfabética de las entidades féderativas de la república Respuesta: Clasificar número de miembros por familia ya que
el concepto familia es más difícil de definir que el concepto de
mexicana. vivienda.
Respuesta: No constituye un nivel de medición.
l_
1
\
1
39
¡l. >
~ .¡,
t.
¡ .
i,~iJ l
las permitidas por la tabulación manual y cuando el número de CUADRO 3.2
"ítems" no es muy grande.
ESTRUCTURA DE LA FUERZA DE TRABAJO
· La tabulación electrónica. Es de gran utilidad en operaciones
EN MÉXICO POR SECTORES D.E ACTIVIDAD
a gran escala, .complicadas y repetidas. Es un sistema que por estar
de moda se recurre a él con frecuencia, aun cuando no siempre
1940, 1950 y 1960
con la debida justificación práctica, ya que requiere de una canti-
dad relativamente grande de trabajo preliminar para la perforación ( Miles de habitantes)
de tarjetas y la elaboración de programas para el procesado elec·
Actividades · 1940 1950 1960
trónico de los datos. Sin embargo, en operaciones a gran escala, el
trabajo preliminar se justifica poda velocidad y eficiencia con que
las máquinas procesan los datos. Los sistemas más conocidos y em- Agropecuaria 3 831 4824 6084
pleados en la actualidad son el IBM y el BULL. Minero metalúrgica y
La tabulación electrónica emplea en algunos casos (sobre todo petróleo 107 97 141
en operaciones de un gran número de unidades, pero con poco
número de "ítems") las tarjetas de marca, sensible, que permiten Electricidad 9 25 41
evitar el proceso manual de su perforación, pue;to que la informa- 1 551
Manufacturas 524 973
ción previamente codificada se pasa directamente a la tarjeta me·
diante una marca .con lápiz de grafito, que al pasar a la máquina Construcciones e ms-
se perfora automáticamente. talaciones 106 225 407
Un procedimiento más reciente consiste en registrar los datos
Transportes 149 211 355
directamente en cinta magnética que elimina la perforación de tar-
jetas y permite una mayor velocidad de registro. Comercio 552 684 1 022
Otras 579 1 234 1 601
--
3.3 Cuadros estadísticos Suma: 5 857 8 273 11 202
El resultado de la tabulación de los datos se presenta en cuadros FUENTE: VI, VII y VIII censos generales de población, Secretaría de
estadísticos. Los cuadros estadísticos pueden ser sólo "depositarios Industria y Comercio, Dirección General de Estadística, México.
de información" con el propósito de efectuar los cómputos para ob-
tener de allí las medidas estadísticas, llamados "cuadros de trabajo".
En ot~os casos los cuadros estadísticos tienen por finalidad ayudar
en el análisis formal de las interrelaciones entre las variables; es El cuadro anterior simpl_emente presenta los datos, como_resul--
decir, contienen información ya procesada (proporciones, porcenta- tado de un recuento y de la clasificación de la poblacíón económi·
jes, tasas, coeficientes, etcétera). Se les conoce con el nombre de camente activa de acuerdo al año y la rama de actividad en que
"cuadros de referencia". desempeñan su ocupación; lo-s datos aún se · encuentran sin elabo-.
La diferencia entre los dos tipos de cuadros estriba principal- ración y por tanto es un "cuadro de trabajo".
mente en su uso y no en su construcción, ya que sus características El mismo cuadro puede constituirse en un cuadro analítico me-
estructurales son prácticamente las mismas. diante la transformación de 101> datos absolutos en relativos, en este
Ejemplo de un cuadro de referencia o depositario de información. caso en porcentajes, por ·ejemplo:
42 . 43
,
¡.i
.. . --i;bl
CUADRO 3.3 a) Número del cuadro. Con objeto de permitir una fácil y rá-
pida referencia al mismo y se pueda relacionar con otras formas d;e
ESTRUCTURA DE LA FUERZA DE TRABAJO presentació.q gráfica o t<1,bular;
EN MÉXICO, POR SECTORES DE ACTIVIDAD: b) Título. En términos generales indica el contenido del cuadro,
1940, 1950 Y 1960 su circunscripción espacial, el periodo o espacio temporal, las uni-
dades empleadas ( cientos, miles, etcétera) ;
(porcentajes) c) Nota en el encabezado. Proporciona información relativa ál
cuadro como un todo o a la parte principal del mismo. Por ejemplo
1940 1950 1960 si los datos provienen de una muestra o de un censo. En ocasiones
Actividades
se emplea para indicar las unidades en que se presentan los datos;
65.4 58.3 54.3 d) Notos al pie del cuadro. Se usan con frecuencia para caJifi-
Agropecuaria
Minero metalúrgica y car o explicar un elemento particular; por ejemplo que un dato
1.8 1.2 1.3 es poco confiable, que en un determinado caso se ha utilizado un
Petróleo
0.3 0.4 criterio distinto de clasificación, etcétera;
Electricidad 0.2
e) Fuente. Se indica al pie del cuadro; informa sobre el origen
9.0 11.8 13.8
Manufacturas de los da tos;
Construcciones e ins- f) Casillas cabecera. Tienen por objeto contener ]a denomina-
1.8 2.7 3.6
talaciones ción de un "ítem", por ejemplo año que cursa, especialidad, sexo,
2.5 2.5 3.2 estado civil;
Transportes
8.3 9.1 g) Columnas. Son las subdivisiones verticales de las casillas ca-
Comercio 9.4
becera. Se incluyen tantas columnas en una casilla cabecera como
9.9 14.9 14.3
Otras · subclases le correspondan al "ítem";
Suma: zoo.o 100.0 100.0 h) Líneas interc,olumnares. Pueden ser sencillas o dobles. Para
destacar los límites de una casilla cabecera se emplean generalmente
Base de % (miles de líneas dobles; se utilizan líneas sencillas .en la subdivisión de una
(5 857) (8 273) ( 11 202)
habitantes) ca.silla cabecera. En los cuadros de trabajo se indican ciertas etapas
l'UENTE: VI, VII y VIII censos generales de poblaci6n, Secretaría de
del cómputo estadístico que se señalan en el título;
Industria y Comercio, Dirección General de Estadística, México. i) Renglones o hileras . Son las divisiones horizontales que corres-
ponden a un criterio de clasificación;
j) Esp·acios entre los renglones. Sirven generalmente para hacer
3.4 Partes componentes más clara la presentación de los datos y por lo mismo más fácil
de un cuadro estadístico* su lectura, lo que da lugar a que en d_eterminado número de renglo·
nes se deje un espacio. En ocasiones se utilizan para destacar agru-
Los cuadros estadísticos de trabajo y de r.eferencia tienen carac· pamientos de datos mediante un criterio lógico de clasificación;
terísticas estructurales similares, por lo que sus partes componentes k) Cabeza ,del cuadno. Está formada por el conjunto de casillas
son prácticamente las mismas: cabecera y encabezados de columnas;
l) Cuerpo del cuadro. Está constituido por los dat0s sin consi-
* El contenido de este subtítulo se ha tomado, con algunas modifica- derar la cabeza del cuadro y los renglones de totales: es decir, la
ciones, de óscar Uribe Villegas, Técnicas estadísticas para investigadores
sociales, México, UNAM, Instituto de Investigaciones Sociales, 1957. parte donde se consignan los datos originales;
44 45
1:, :Jt~
m) Casillas. Se forman en la intersección d.e la columna y el
renglón;
n j Renglón de totales. Consigna la suma de las columnas cuan-
do esto es factible. El renglón de totales pu,ede consignarse en el PROBLEMAS Y RESPUESTAS
primero o .en el último renglón. Cuando se trate de cuadros de tra-
bajo es conveniente emplear el último renglón.
l. Construya un cuadro de concentración para los siguientes da-
tos que se solicitan en un cuestionario:
a) Número de registro;
b) Sexo [ffi 1M) ;
e) Estado civil actual :
l. Soltero
2. Casado
3. Unión libre
4. Viudo
5. Divorciado;
f) Estudios realizados:
l. Ninguno
2. Primaria · incompleta
3. Primaria completa
4. Nivel medio incompleto
5. Nivel medio completo
6. Nivel superior incompleto
7. Nivel superior completo.
46
47
2. Indique las partes componentes del siguiente cuadro esta·
Respuesta:
dístico:
Minero meta-
lúrgico 2.+ 1.7 1.3 1.3 1.0
Construcciones
e instaiacio-
nes 4.5 4.9 5.0 5.1 5.9
Otras activida-
des 22.3· 2i.3 23.9 24.l 25.4
Suma de por-
centajes 100.0 100.0 100.0 100.0 100.0
Bases de por-
centajes** (85 409) (155 86'7) (207 719) (284217) (561 619)
4.9
48
\;
jJ,
Respuesta:
------
{III) (porcentajes) (V) (X)
;}
,r' '
RAZONES, INCREMENTOS
Rama de Informe censa/ 1 ◄ fro)'eccioncs•¡},,. I)
actividad 1950 1960 1965 1970 1980
VI)
16.6 15 .2 14.5 14.5,.
4.1 Porcentajes
Agropecuario 20.0
XIIi
Minero meta-
lúrgico 2.4 1.7 1.3 1.3 1.0 Los porcentajes, proporciones, coeficientes y razones los ubicamos
en el nivel nominal o clasificatorio de medición, en lo que se refiere
Petróleo 2.2 2.5 2.7 2.8 [z) ♦ (X~
a cómputos estadísticos.
Electricidad 0.6 0.9 1.0 1.2 1.6
Un porcentaje es la relación que se establece entre una de las
Industria manu- partes con respecto al todo o total multiplicado por cien. Por ejem-
facturera 19.2 21.4 23.5 24 2 24.4
plo si un conjunto de personas lo dividimos en dos subconjuntos
Construcciones ~ II!J (hombres y mujeres), el cociente que resulta de dividir el número
e instalacio-
nes 4.9 5.0 5.1 5.9
de hombres en relación al .tQtal de personas y ·multiplicado por
4.5
cien, nos indicará el número de hombres por ca<la cien personas
Transporte 4.0 4.0 3.5 3.6 3.6
JI) de ese conjunto:
Comercio 24.3 23.7 23.9 23.2 20.1-,
,----.A:=._
Otras activida- Mujeres 200
des 22.8 24.3 23.9 24. l 2:i.4
-- --- --- --- Hombres 600
Suma de por-
centajes IDO.O IDO.O 100 O [00.0 IDO .O Suma: 800
J\
Bases de por-
centajes* ( 85 409) (155867) (207 719) (2842[7) X¡ número de mujeres
(561 619) 200
% de mujeres = (100) =- (100) =
total de personas _. 800
(XIV) * Millones de pesos a precios constantes de 1960
(IV) Ft;ENTt::S: 1 Informes anuales, Banco de México, S. A. = .25 (100) = 2J%
2 Secretaría de Hacienda y Crédito Público y Banco de
México. número de hombres 600
% de hombres = (100) =- (100)
total de personas 800
( I) Número del cuadro. (VIII) Cut:r¡.,o del cuadro. = .75 (100) = 75%
(Ir) Títuio del cuadro. (IX) Renglón de totales.
(III) Nota en el encabezado. (X} Líneas intercolumnares.
(IV) Fuente de los datos. (XI) Casillas. Simbólicamente se puede .expresar al conjunto de mujeres por
(V) .Casillas cabecera. (XII) Columna. n1, al conjunto de hombres por n 2 y al conjunto total por N:
(VI) Encabezado de columna. (XIII) Renglón.
(VII) Cabeza de cuadro. (XIV) Nota al pie del cuadro.
51
CUADRO 4.1
Mujeres: n1 = 200
ESCUELA PRIMARIA DE DONDE PROVIENEN
Hombres: n~ = 600
LOS ALUMNOS DE LA FCPS (1967)
Suma: N = 800
Escuela Mujeres Hombres · Suma
D1 n1
% de mujeres= --.(100) = ---100
N D1 + D2 Oficial 146 814
668
La suma de porcentajes de subconjuntos de unidades mutua- Los datos absolutos no indican claramente· en qué medida los
mente excluyentes y exhaustivas, será siempre igual a 100: ·hombres y mujeres provienen en mayor o menor proporción de es-
cuelas oficiales. Si bien podemos apreciar que la mayor parte de las
n1 n2 mujeres proviene de escuelas particulares y que los hombres en
= (- + -) = 100.
Il1 112
- (100) + - (100) 100 mayor proporción provienen de escuelas oficiales, se dificulta
N N N N señalar en cuánto se da esta diferencia, porque las relaciones se
ven oscurecidas por la dimensión absoluta de las cifras. Si reducimos
el total de mujeres, por una parte, y, por la otra, el total de hom-
El principal papel de los porcentajes es el de obtener compara· bres a la base de cien y calculamos los porcentajes correspondientes
bilidad, pues con las cifras absolutas resulta muchas veces imposible · en los dos subconjuntos ( escuelas oficiales y privadas), entonces las
lograrlo, en virtud de que oscurecen las relaciones. La comparabili- diferencias se presentan con claridad.
dad es posible porque los números absolutos se reducen a una escala
que es fácil de multiplicar y dividir. Transforman el número base,
digamos el conjunto en la cifra 100 que es fácilmente divisible y CUADRO 4.2
1
multiplicable por otros números, lo cual permite la determinación
..- -
de su magnitud relativa.
Los porcentajes son especialmente útiles cuando se comparan dos Mujeres Hombnes Suma
o más conjuntos numéricos. Por ejemplo: en la Facultad de Cien- Escuela Absoluto % Absoluto % Absoluto %
cias Políticas y Sociales se inscribieron en el año de 1967 un total
de 1 375 alumnos. Si lo que nos interesa saber es el tipo de escuela Oficial ( 146) 39 (668) 67 (814) 59
primaria de la que provienen -oficial o privada- y además su
relación con el sexo, entonces es conveniente transfonrtar los datos Pri~ada (225) 61 (336) 33 (561) 41
absolutos a porcentajes, para establecer mejor la relación.
Suma: (377)
--
100 (1004) 100
-
(1375) . 100
53
52
.!
¡. :¡
:~
-~ ,;.
·.,;¡ -
Al reducir los valores absolutos a relativos se aprecia que de informa_ción obstaculice la comparación. El cuadro. que hemos pre-
cada 100 mujeres inscritas1 39 provienen de escuelas Qficiales y que sentado como ejemplo es bastante pequeño y la ventaja que señala-
de cada 100 hombres, 67 provienen de escuelas oficiales. mos .podrá no• parecerla, pero cuando se trata de cuadros mayores
resalta. de inmediato la conveniencia de este tipo de presentación
tipográfica.
4.2 Presentación de los porcentajes Cuando se desea presentar ·los porcentajes junto con los valores
absolutos y además comparar éstos con la menor interferencia de las
Este ejemplo nos muestra la forma de presentar porcentajes cifras absolutas, podemos presentar los porcentajes y las cifras abso-
simultáneamente con los valores absolutos, en un cuadro, para ha- lutas de manera escalonada:
cerlo más claro y conciso.
Otra de las alternativas más usuales consiste en consignar en el
cuadro no todas las cifras absolutas, sino únicamente las bases de CUADRO 4.4
donde se obtuvieron los porcentajes, con objeto de simplificar el
cuadro, y resaltar únicamente las relaciones porcentuales.
Mujeres Hombne.s Suma
Escuela Abs. % Abs. % Abs. %
CUADRO 4.3
Oficial 39 67 59
Escuela Mujeres Hombres Suma
( 146) (668) (814)
Privada 61 33 41
Oficial 39 67 59 (225) (336) (561)
-----
Privada 61 33 41 Suma: (371) 100 (1004) 100 (1375) 100
Número base (371) ( 1 004) ( 1 375) Se notará que los porcentajes se presentan únicamente como en-
teros no obstante que pudiéramos calcularlos con dos, tres, cuatro .
o más cifras decimales. Para los fines de nuestro análisis los números
enteros son suficientes; de hecho, en la práctica, es Jo mismo que
Los números base o absolutos así presentadoo nos permiten co· 146 respecto a 371 sea el 39% que el 39.3531%. Podemos afirmar
nacer cuál es el número de casos correspondientes a cualquier por- que en la gran mayoría de los casos basta presentar los porcentajes_
centaje. Por ejemplo si el 39% de mujeres provienen de escuelas en unidades enteras; en contados casos será necesario un decimal y
primarias particulares, resulta sencillo determinar cuál es el número pocas vece~ dos decimales.
absoluto, simplemente al multiplicar 39 x 371 y dividir el producto
Si el ,estudiante desea una norma, podríamos recomendarle em-
entre 100.
plear como máximo un decimal en la presentación final de las ci-
Los números base se encierran entre paréntesis para que se dis- fras de porcientos. Con la presentación de los porcentajes con varias
tinga con toda claridad que no se trata de porcentajes. cifras decimales se pretende darles mayor ,exactitud y se piensa que
El cuadro permite comparar los porcientos sin que el exceso de así cumplirán mejor con su finalidad; esto generalmente no es cierto,
54 55
·1
1J _j_
pues los porcientos así presentados pudieran ser más difíciles de puede apreciarse en el cuadro que el verdadero valor es de 59%.
leer que las cantidades originales, lo cual anularía su principal fun· En el caso de los que provienen de escuelas particulares, el proce·
ción; es decir, presentar de manera clara y sencilla las relaciones 9imiento impropio de promediar sería de:
numéricas.
Es erróneo manipular los porcentajes como sí fueran números 61 + 33 94
absolutos; cuando éstos se han obtenido de bases diferentes no de-
= 47%
2 2
ben sumarse, promediarse o combinarse.
El procedimiento correcto para promediarlos consiste en obtener el verdadero valor es de 41%.
los valores absolutos correspondientes a los porcentajes y de éstos Resulta obvio decir que 39% + 67% no es 106%; es decir, no
obtener los nuevos porcentajes. deben sumarse porcentajes con distintas bases.
Volviendo a nuestro ejemplo anterior : Sólo será correcto sumar, restar o promedíar porcentajes cuando
los conjuntos de los que fueron obtenidos sean iguales; es dec.ir,
que los valores porcentuales provengan de una misma base. Por
CUADRO 4.5 ejemplo: si la. votación por ios candidatos X o Y de acuerdo al sexo
de los votantes, expresados en porcentajes, fueran los que consigna
TIPO DE. ESCUELA PRIMARIA PARTICULAR U OFICIAL el siguiente cuadro:
1 ¡
DE LA QUE PROVIENEN LOS ALUMNOS
DE LA FCPS EN 1967
CUADRO ",.6
PORCJENTOS VOTACIÓN PORCENTUAL POR LOS CANDIDATOS X, Y
· Escuela Mujeres Hombres Total
DE ACUERDO AL SEXO DE LOS VOTANTES
Oficial 39 67 59
Sexo X y Suma
Particular 6i 33 41
--
Suma% 100 100 100 Hombres 62.5 75 68.75
39 + 67 106 62.5 + 75
=- = 53 68.75%
2 2 2
56 57
!
1L
~ .
también es correcto En este cuadro tenemos dos factores: sexo y alfabetismo. Pode·
mos calcular los porcentajes tomando como base la suma de hom-
37.5 + 25 bres y de mujeres separadamente y computar el porcentaje de al-
= 31.25% fabetos en cada uno de los sexos. También podemos calcular los
2
porcientos tomando como base ( 100%) el total de alfabetos por
una parte, y, por la otra, el total de analfabetos, y calcular qué
porque tanto X como Y tienen una base igual; es decir, 200. (En
porcentajes corresponden a los hombres y cuáles a las mujer.es en
este ejemplo llevamos los decimales hasta su última expresión, con
cada una de las características de alfabetos y analfabetos.
objeto de que sea clara la exactitud del procedimiento.)
El' sentido en que se computen los porcentajes depende fqnda·
mentalmente del tipo de análisis que nos interese. En ocasiones un
factor puede considerarse como la causa que afecta al otro factor.
4.3 Sentido en que se c,alculan los porcentajes
En estos casos para determinar el sentido del cómputo debemos
tomar en consideración, la siguiente regla:
Cuando en un cuadro estadístico se ponen en relación dos ca-
racterísticas, por ejemplo: sexo y votación, trabajo y sexo, edad y
Los porcentajes deben calcularse en el sentido del factor que
delincuencia, estrato social e ideología política, afiliación a partidos
se considera como la causa.
políticos y niveles de ingreso, etcétera, generalmente lo que se pre-
tende con ello es establecer si existe algún tipo de relación o si no
Por ejemplo si consideramos que el sexo- puede ser causa ( entre
la hay entre los atributos o factores en cuestión, por 'ejemplo:
otras) de mayor o menor grado de alfabetismo, calcularemos los
porcentajes en el sentido del factor sexo.
CUADRO 4.7
CUADRO 4.8
POBLACIÓN DE MÉXICO POR SEXO Y ALFABETISMO
POBLACIÓN DE MÉXICO POR SEXO Y ALFABETISMO
(Miles de habitantes)
(Porcentajes. 1960)
Alfabetismo Hombres Mujeres Suma
s e x. o
17 415 Alfabetismo Hombr,es · .Mujeres Suma
Alfabetos 9103 8 312
58 59
(. -~
Al computar los porcentajes en un sentido) la comparación debe que los hombres sean más alfabetizados que .las muJeres, ya que
hacerse en sentido contrario. En el cuadro se computaron en el sen- los dos sexos tienen magnitudes diferentes.
tido del 'factor sexo_, y ia comparación se estableció en el sentido En este caso consideramos el alfabetismo como factor causp.]
del alfabetismo. Entre los hombres el porcentaje de alfabetos es de no en un sentido estrictamente lógico, sino como la forma en que
65.6% y en las mujeres de 58.9%, lo cual indica que el alfabetismo este factor afecta la distribución de los porcentajes en el otro factor.
es mayor en casi 7?0 en los hombres que en las mujeres. La Con objeto de hacer más explícito el cómputo de los porcentajes
comparación también puede establecerse en el segundo renglón: en uno y otro sentidos, recurriremos a la siguiente ilustración:
34.4% de analfabetos en el subconjunto hombres y 41.1 % en el
subconjunto mujeres; comparación que indica un mayor porcentaje
de analfabetismo en las mujeres, casi del 7%, que en los hombres. CUADRO 4.10
Los porcentajes pueden calcularse en el sentido horizontal ( anal-
EXTRANJEROS RESIDENTES EN MÉXICO SEGÚN
fabetismo), lo que indicará el porcentaje de hombres y mujeres
LA RAMA DE OCUPACIÓN (1960)
entre los que son alfabetos- y analfabetos, que de ninguna manera
es exactamente lo mismo que en el análisis anterior. Por ejemplo:
Naciona- Activ. Indus- Trans- Servi-
lidad Primar.;' trias Comercio portes cios Suma
CÜADRO 4.9
Español 971 5 688 7 519 342 4 025 18 545
60 61
(:;
L___ __ ~t.!::.
Al cuadro anterior podemos calcularle los porcentajes en cual- extranjeros que provienen de países latinoamericanos y de Canadá
. quiera de los dos sentidos, vertical u horizontal; cada uno de estos son los que mayormente se dedican a las actividades primarias, se-
sentidos ·dará un tipo de información distinta. Si los calculamos en guidos por los norteamericanos y los alemanes . .Poco más de una
sentido vertical (rama de actividad), indicará el porcentaje que re- tercera parte de norteamericanos, franceses, alemanes y, · con una
presenta cada una de las naciónalidades en cada rama de actividad proporción muy cercana a ésta, los españoles, se dedican a activida-
por separado. Si los porcentajes se computan en sentido horizontal des industriales. Entre los chinos y españoles es muy devado el
(nacionalidad), indicarán cómo se distribuye cada nacionalidad en porcentaje que se dedican al comercio con 49,7% y 40.6% respec-
las diferentes ramas de actividad. tivamente, etcétera.
Si calculamos le>s porc~ntajes en sentido vertical, obt~ndremos
los siguientes resultados: ·.
CUADRO 4.11
Al comparar los porcentajes en sentido vertical -ya que el * Agrictiltura, ganadería, silvicultura, ·caza y pesca;
cómputo se hizo en sentido horizontal- podemos apreciar que los ** Argentinos, cubanos y guatemaltecos.
62 63
El 89% de los extranjeros dedicados a actividades primarias está CUADRO 4.13
constituido por norteamericanos (43%), españoles ( 14o/o), cana•
PORCENTAJES DE PERSONAS QUE' VOTARON POR EL PRI, POR
dienses ( 16%) y argentinos, cubanos y guatemaltecos ( 16%). Los OTROS PARTIDOS Y QUE NO VOTARON EN LAS ELECCIONES
éxtranjeros dedicados a la industria, que integran el 81 %, son es· PRESIDENCIALES DE 1958, SEGÚN SU NIVEL DE EDUCACIÓN
pañoles (42%) y norteamericanos (39%).
El cuadro presenta ,un caso en que se hace necesario presentar Nivel de educación
la colµmna del total. Cuando sólo es necesario determinar las dife- Vote 1 11 111 y IV
rencias entre las subdivisiones del factor (en este caso tipo de acti-
vidad), es innecesaria la columna del total. Pero si además se trata
Por PRI 53 75 75
de cionocer la importancia relativa cie cada nacionalidad en el to-
tal de extranjeros por rama de actividad o el porcentaje de extran. No PRI 7 10 15
jeros, como un conjunto, resulta iüdispensable computar los porcen-
tajes de los totales. Lo que hemos afirmado en relación al sentido en No votaron 40 15 10
que deben computarse los porcentajes es aplicable a todos los caso& -
100
- 100
--100
en que los conjuntos analizados constituyan datos de tipo censal, (Base de %) (55) (216) (60)
como en los ejemplos ya mencionados; es decir, que la investigación
en las unidades que componen al conjunto sea exhaustiva. También
se aplica con muestras que sean representativas en los dos factores
Los niveles de educación fueron definidos así:
que se analizan.
Cuando una muestra sólo es representativa en uno de los fac· Nivel I : Analfabeto
toi:es que se ponen en relación, los porcentajes sólo deben calcularse
en el sentido del factor no representativo. Nivel II: Educación primaria
Nivel III : Educación secundaria
Nivel IV: Educación universitaria.
4.4 Limitaciones a causa de la no
representatividad de la muestra
La votación por el PRI fue la más alta en los tres niveles. La
Hay casos donde los porcentajes no deben calcularse indistin- proporción de votantes por la oposición se incrementa a medida.
tamente en las dos direcciones: horizontal y vertical. Por ejemplo, que es mayor el nivel educativo. En cambio la abstención es muy
cuando los datos proviehen de una muestra que no es representativa alta (40%) en el nivel más bajo y disminuye a medida que eI nivel
educativo es mayor.
en uno de los factores.
La muestra de 331 personas fue obtenida al azar pero sólo se
En un estudio* se establece la relación entre nivel socio-econó·
considera representativa en cuanto al voto emitido y al abstencio-
mico y votación de acuerdo con los siguientes datos:
nismo; sin emba'rgo el autor considera que no es representativa en
cuanto a los niveles educativos.
El siguiente cuadro presenta el cómputo de porcentajes en sen·
* José Luis Reyna Pérez, Algunos aspectos políticos de México (tesis tido horizontal; es decir, en la dirección del voto, lo cual es in-
profesional), México, i 96 7. correcto.
64 65
¡;: 'i~.
._,_~
1
'li
CUADRO 4.14 es representativa para cada uno de los niveles por separado; es decir,
nos daría la proporción adecuada de votantes por el PRI:, .por_la
PORCENTAJES DE PERSONAS QUE VOTARON POR EL PRI, POR
oposición y de abste~ciones al interior de cada nivel educativo1 pero
OTROS PARTIDOS Y QUE NO VOTARON, SEGÚN
SU NIVEL DE EDUCACIÓN no la proporción de votantes que deberían tener los niveles educa·
tivos entre sí.
Por tal razón no es conveniente presentar la hilera de total o
Nivel educatwo
I II III ,,, IV Base Porcentaje suma. En el cuadro anterior es evídente que la hilera de total -en
Suma de% vertical sentido horizontal- da una falsa idea de los porcentajes corres-
Voto % - % %
pondientes a cada nivel; aunque desde el. punto de vista aritmético
12 69 19 100 (237) 72% el calcular porcentajes en la hilera de total es correcto, . puede dar
PRI
62 26 100 (34) 10% lugar a falsas interpretaciones cuando se tratan de inferir las pro•
No PRI 12
J)?rciones de toda la población .de votantes.
37 53 10 100 (60) 18%
No votaron
-17- - -18- -- 100
-- -100%
- La muestra no es representativa en cuanto a la proporción total
Suma: 65 (331) de votos por el PRI, por la oposición y de abstenciones aun cuando
sea representativa en el interior de cada estrato educacional, por
NOTA: El autor citado no elaboró este cuadro. tal razón no debe incluirse la columna de total. Son incorrectos los
porcentajes 72% por el PRI, 10% por la oposición y 18% de abs-
tenciones, tal como se indica en la última columna del cuadro
De _acuerdo con el cómputo anterior, podríamos concluir que anterior.
de aquellos que votaron por el PRI el 12% fue del nivel J, el 69%
Veamos qué sucede si en vez de 55 personas en el nivel J se hu-
del nivel Jl y 19% de los niveles III y IV. Los votos emitidos a par-
bieran encuestado 200 y mantuvieran las mismas proporciones den-
tidos de oposición fueron 12% del nivel I, 62% del nivel II y 27% tro de cada estrato.
de los niveles 111_y IV. Los cuadros con los valores ~bsoluto~ y con los porcentajes
Lo anterior es erróneo porque la muestra no tiene las propor- verticales, serían los siguientes :
. dones o porcentajes de niveles educativos que en ese año ( 1958)
tenía la población. La proporción de analfabetos ern considerable-
mente mayor a 17% y el porcentaje con educación secundaria o
CUADRO 4.15
superior era bastante menor al 18%.
Para dar. una idea de los niveles de educación, el censo de 1960
indica :que en la población mayor de 29 años, ;ólo 6:2% tenían 7 Números absolutos Porcentajes
]JI y III y
años o más de educación y en la poblaci6n de 15 a 29 años única- Voto I II IV Suma 1 JI IV Suma
mente el 10%. No habían cursado estudios el 33.2% de la pobla-
ción en edades de 15 a 29 años y en _la población mayor de 29
años el porcentaje que no cursaron estudios era de 45.7%. PRI 106 163 45 314 53 75 75 66
No PRI 14 21 9 '14 7 10 15 9
4.5 Las columnas e hileras áe suma ,o tot·al
No votaron 80 32 6 118 40 15 10 25
La muestra de 331 personas tuvo por finalidad descubrir la --------- --------
relación entre nivel educativo y el voto. En este caso la muestra sólo
Suma: 200 216 60 476 100 100 100 100
66 67
¡ l1:
Mujeres = 200 Subconjunto nt
En la columna de suma en Porcentajes se aprecia un cambio
importante de votantes por el PRI, 66(;,b en vez 72%, no PRI 9% Hombres = 600 Subconjunto n~
en vez 10% y abstenciones 25% en lugar de 18%- Veamos qué
acontece con los porcentajes horizontales. Suma = 800 . Conjunto total N
200 1
CUADRO 4.16 La proporción de mujeres: .- - :::: .25 == -
4
- -· · -
800
Base
Porcentajes 600 3
Suma de%
Voto I II III y IV La proporción de hombres: - ·=.75=-
800 4
100 (314)
34 52 14
PRI
(44) n:?
No PRI 32 48 20 100
s·1mb oT1camente: 1
n- = P1 - = Pi P1 + P2 :::: 1
100 ( 118) N N
- ·
68 27 5
.. - - -
No votaron
.....--- -
45
·- -13- 100 (476}
42
Suma:
-- ------- La suma de todas las proporciones de un conjunto suman uno
cuando las unidades del conjunto se subdividen exhaustivamente
en subconjuntos mutuamente excluyentes. Las proporciones son am-
Si comparamos el cuadro ( 4.14) con porcentajes horizontales, pliamente empleadas en los cálculos estadísticos, pero en los repor-
con este último apreciamos que los cambios son bastante consi- tes o presentación final de la cifra son más empleados los porcen-
derables. tajes que se obtienen simplemente multiplicando la proporción por
Podemos concluir que cuando una muestra no es representativa cien.
de la población total, aun cuando sí lo sea dentro de cada subgrupo,
no deberá ponerse la columna de total, porque los léctores le darán
una falsa interpretación. 4.7 Razones
Cuando los cuadros se refieran a toda una población, no se
presentará el problema de representatividad, como puede ser el caso Una razón es la relación que se da entre dos subconjuntos o dos
de los censos nacionales o encuestas en toda la población. conjuntos. Volviendo al ejemplo anterior1 la razón de hombres a
muJeres es:
~'!~
La relación de mujeres a hombres será de: veces que un evento específico ocurre durante un particular periodo
de tiempó y el denominador es el número de veces que el evento está
200 1. sujeto al riesgo de que ocurra o acontezca. Por lo general las tasas
200:600 = -. - = - a 1 = .33 .. . a 1 = 3.3 .. . a 10
600 3 se multiplican por algún número; es usual multiplicarlas por mil,
= 33 ... a 100 diez mil y cien mil, con el objeto de expresarlas- como el número
de veces que el evento del numerador acontece en cada 1 000,
lo cual indicaría la existencia de 33 mujeres por 100 hombres. Para 10 000, etcétera, casos.
aclarar lo anterior: de 133 personas, 33 son mujeres y 100 son hom- Muy conocidos son los coeficientes de mortalidad general, nup-
bres; y si los transformamos nuevamente .a porcentajes, tendremos cialidad) natalidad, delincuencia, fertilidad general y específica, ín-
que en un conjunto de 133 personas, 33 mujeres constítuyen el 25% dices de -profesionistas, de estudiantes, de afiliación a grupos polí-
y los 100 hombres constituyen el 75%. ticos.
En demograií'a es muy empleada la razón de hombres a mujeres,
relación que no .es necesario especificar, pues es ya ampliamente Número de defunciones en
conocida y empleada en las ciencias sociales. Indica el · número una área determinada, du•
de hombres por cada 100 mujeres. Se le conoce con los nombres de Tasa de mortalidad rante un año dado
( 1 000)
relación de masculinidad, índice de masculinidad, razón de mascu- general Población del área a mitad
linidad o sex r-OJtio. Simbólicamente puede expresarse como: del año ( l 9 de julio)
';
* Véase el "Apéndice VI, Tasas más Usuales en las Estadísticas mogéneos de una población en lugar de basarse en toda la pobla-
Vitales". 1 ción. Por ejemplo las tasas de mortalidad pueden ser específicas
1
1
70 71
1.
respecto a la edad, al tipo de ocupación, al tipo de oausa que la Incremento 1966-1967 - 6 625 - 6 383 (100) = 3.8%
provocó, etcétera. La natalidad específica sólo toma en considera- 6 383
ción al número de mujeres que, por lo general, están en edad fértil.
Es importante tener cuidado de respetar los signos, especialmen•
Número de niños nacidos te en el caso de los incrementos negativos. Por ejemplo: en el año
vivos en un á.rea y tiempo de 1910 el censo de México registra una población de 15160 y en
dados 1921 de 14 335 ( Gifras indicadas en miles) :
Tasa de natalidad ( 1 000)
específica Número de mujeres en eda-
14 335 - 15160
des de 14 a 49 años en el Incremento 1910-1921 = ------ (100) =
área y tiempo del nume- 15 160
rador
-825
= (100) = -5.4%
Los índices pueden ser aún más específicos, por ejemplo: 15 160
Número de nacidos vivos de Lo cual indica que en el lapso de esos 11 años la población de
mujeres en edades de 40 a México disminuyó en 5.4%.
Tasa de natalidad
44 años Es muy empleada en demografía la tasa de crecimiento natural
de mujeres en ( 1 000)
edades de 40 a = Número de mujeres en eda-
de una población. Ésta se define como la relación que existe entre
la diferencia de nacimientos respecto a las defunciones en un pe-
44 años des de 40 a 44 años
riodo dado y la población media en ese periodo. La tasa de creci-
miento natural no toma en consideración el aumento odisminudón
de la población por los movimientos migratorios; es decir, la in,
4.9 Incrementes y diferencias porcentuales migración ( entrada de población) y la emigración ( salida de po•
blación ) .
Es común analizar ciertos fenómenos en función del tiempo para
determinar si crecen) decrecen o permanecen estables y además pre-
cisar la magnitud del incremento o decremento. Nx - Dx K
El incremento en porcentajes se puede expresar así:
r = Px
donde :
Valor del dato último _ valor del
Incremento dato base
( 100)
porcentual = valor del dato base Nx nacimientos del año x
¡.
·¡ Dx = defunciones del año x
i Incremento n1 - no ( 100)
Px = población media del año x
porcentual no .
:1
K = constante (por lo general 100).
_:¡
Por ejemplo, en el año de 1966 se inscribieron en la Facultad de
Comercio y Administración de la UNAM 6 383 alumnos y en 1967 Por ejemplo: la población de México en 1950 fue de 25 825 836;
:¡ se inscribieron 6 625. Calcular el porciento del crecimiento. se registraron 1174 947 nacimientos y 418 430 defunciones.
,¡ '
l1
,! 73
j,
72
t
·.¡
_,_~'.l~
1174947 - 418430 756517 P0 = población anterior
r = - --- --- (lOO) = 25 825 836 = 2.93%
P1 = población última
El incremento naitural de la población de México en el año de n = número de periodos (años, etcétera)
1950, en términos absolutos, fue de 756 517 personas. Expresado
como una tasa porcentual este crecimiento fue de 2.93%,
K = constante (generalmente 100).
Jn.crement,os por.centuafrs altos. No es raro encontrarse con ex-
presion~ que indican incrementos de 500%, 800%, 1500%, Éstas En el ejemplo anterior el cálculo de acuerdo con la fórmula,
se efectúa:
son, por lo general, numéricamente correcta~, pero técnicamente
constituyen estadísticas muy pobres. En estos casos es preferible em-
2 664 - 2 203 2 461 2
plear el número de veces que una cantidad dada se incrementó, por
ejemplo: 2 664 + 2 203 5
(100) = ( 100) =
4867 5
En 1932 la UNAM tuvo una inscripción de 10 558 alumnos; en
1964 la inscripción fue de 73 615. Expresado el incremento como 922 92 200
porcentaje es de 597%. Seria más correcto indicar que se incremen-
= 24335
( 100) = 3.789 = 3.8
24 335
tó en 5.97 veces, o en términos aproximados, casi 6 veces la mag-
nitud que tenía en 1932. Si se multiplica este incremento por la inscripción en 1962 y se
Promedio de incremento. Es común entre los estudiantes que divide por 100 y la suma a 2 203, se obtendrá una inscripción para
inician el aprendizaje de la estadística cometer errores al calcular el año de 1963 de 2 287; después se multiplica 2 287 por el incre-
un promedio de incremento. Por ejemplo en la Escuela Nacional de mento _3.8%, se divide entre 100 y se suma este cociente a 2 287,
Economía de. la UNAM, en 1962 se inscribieron 2 203 alumnos con lo que se obtendrá una inscripción de 2 374 alumnos_para el
y en 1967 se inscribieron 2 664. ¿ Cuál es el incremento porcentual año de 1964. Si se continúa .el ,mismo proceso para los años de
anual?
1965, 1966 y 1967, debería obtenerse en el último año una cifra
Sería erróneo calcular el incremento promedio obteniendo sim- muy cercana a los 2 664 alumnos. El cálculo no es rigurosamente
plemente el incremento de 1962 a 1967 y después dividir entre el exacto porque la fórmula sólo es aproximada:
número de años:
2 203 en 1962
2 664 - 2 203 (2 203) (3.8)
(Procedimiento erróneo) r = (100) 5 =
2 203 100
+ 2 203 = 2 287 para 1963
74 75
•.i:.-,_..,_•,J
j!;
inscritos, así como la población actual (mayo de 1976) en las Divi-
(2 558) (3.8) . + 2 558 = 2 655 para 1967 siones de Ciencias Sociales y Humanidades de la Universidad Au-
100 tónoma Metropolitana en sus tres unidades en la primera genera·
ción (septiembre de 1974). -
Es necesl!rio resaltar con el mayor énfasis posible la base a par• CUADRO 4.17
tir de la cual se computan los porcentajes.
ESTUDIANTES QUE PRESENTARON EXAMEN DE ADMI_S lóN
El siguiente ejemplo ayudará a tener una idea más clara sobre (SEPTIEMBRE 1974) ADMITIDOS, INSCRITOS Y POBLACIÓN
la necesidad de especificar la base de los porcentajes. ACTUAL (MAYO 1976) EN LAS DIVISIONES DE CIENCIAS
Supongamos que el costo del productor de un artículo, una ca- SOCIALES Y HUMANIDADES DE LA UNIVERSIDAD AUTÓNOMA
misa, es de $25.00 y se vende a $75.00. ·¿Cuál es el porcentaje de METROPOLITANA
ganancia?
(Inscritos == 100)
Y = •$ 75 (precio al menudeo)
Unidad de la Universidad Autónoma
X = $ 25 (costo del productor) Metro Politana
Azcapotzalco Ixtapalapa Xochimilco Total UAM
' 1
El comprador posiblemente empleará como base el costo del Estudiantes Abs % Abs % Abs % Abs %
Y-X 75-25
productor; esto es,% de utilidad = - -.- 100 = - 100 = Examinados 784 124 491 135 541 131 1 816 129
1· X 25
200%. Admitidos 748 119 456 126 517 125 1 721 122
! 1
El porcentaje de utilidad para el vendedor al menudeo es de Inscritos 631 100 363 100 413 100 1407 100
200%; es decir, que por cada cien pesos que invirtió el comercian•
te en la compra de camisas obtuvo una ganancia de $200.00. Población actual 293 46 166 46 238 58 697 50
76 77
t a.
·~
4-.1 l indice para la medición del cambio porcentu.al
ción mostró que en el grupo A respondieron correctamente a la
Como ya fue indicado con anterioridad, los incrementos porcen- prueba 40 alumnos y 55 en el grupo B.
tuales están sujetos a dos situaciones que los hacen variar sustan-
cialmente:
CUADRO 4.19
a) El punto de partida o magnitud inicial;
b) El potencial de crecimiento. Nivel anterior Nivel posterior Porcentajes
Grupo Alumnos Absoluto % Absaluto % Increm. Dif.
Un punto de partida de escasa magnitud puede ocasionar incre- 1 2 3 4 5 6 7=5-3
mentos porcentuales mtiy elev¡dos o muy bajos, lo cual depende A 60 6 10 40 66.7 567.0 56.7
básicamente de la naturaleza de los datos.
B 60 42 70 55 91.7 31.0
Cuando el potencial de crecimiento es igual, entonces el punto 21.7
inicial de partida tiene una menor importancia.
En ciencias sociales es común encontrar casos en que un punto
de partida inicial bajo tiene mayor.es posibilidades de incremento l. Si medimos la efectividad del método en cada grupo mediante
que un punto de partida inicial alto. el incremento porcentual, es decir:
Veamos el siguiente ejemplo: en dos grupos de una escuela se-
cundaria se trata· de probar la efectividad de un método para la en el grupo A de 6 a 40
enseñanza de un terna histórico. Para tal efecto se escoge un grupo
en el grupo B de 42 a 55
de 60 alumnos (A) que tiene un bajo nivel de aprovechamiento y
otro grupo (B) de 60 alumnos que es clasificado como de alto
obtendremos :
aprovechamiento.
A los grupos se les hacen pruebas de conocimientos del tema que
se les va a enseñar. Éstas revelan que en el grupo B el 70% y en
40 - 6 34 .
Incremento en A -
6
( 100) = ~ (100) = 566.7%
el grupo A el 10% tienen conocimientos del tema. 6
Incremento en B 55 - 42 (100) - 13
CUADRO 4.18
42 42 (100) = 31.0%
78
79
nuevo método dio resultados satisfactorios pero mejores ( como era
66.7-10 56 7
Incremento en
= ( 100) = · ( 100) = 567% de esperarse) en el grupo B, que tiene alumnos de mejor nivel.
el grupo A JO 10 Este método se basa en el siguiente razonamiento: resulta más
fácil pescar en un lago donde los peces son abundantes que en un .
91.7-70 21.7 lago donde los peces son escasos; esto es, si un gran número de
!ne.remen to en
= (100) = -70 (100) = 31% personas desconocen el tema en la primera prueba, resulta más fácil
el grupo B 70
obtener mayor número de respuestas correctas en la segunda; y en
El resultado . es idéntico al anterior. el caso de que un pequeño número las ignore, se obtendrán menos
3. Otro procedimiento que pudiera aplicarse es· el de obtener respuestas correctas.
las diferencias porcentuales del porcentaje posterior menos el por- Si se observa con cuidado la fórmula, se notará que el numerador
es la diferencia obtenida antes y después de la prueba1 y el deno-
centaje anterior; es decir, Po - P1:
minador el potencial; es decir, la diferencia total faltan te.
Diferencia porcentual en A: 66.7% 10 % = 56.7 %
Diferencia porcentual en B: 91.7% - 70'1/o ='21.7°fa 4.12 Estimación de la población
Aunque con este procedimiento las diferencias porcentuales no Los factores que modifican la magnitud de las poblaciones hu-
son tan considerables, siguen siendo contradictorios los resultados, manas son los nacimientos, las defuncion~s y los movimientos mi-
pues los mayores incrementos le c01responden al grupo que observa gratorios.
menor rendimiento.
4. E.n casos como el presente ejemplo, donde el potencial es li· Los nacimientos y la inmjgración la incrementan.
mitado; es decir, que existe un límite en el crecimiento ( en este . Las defunciones y la emigración la disminuyen.
caso 100%), y ad~más el porcentaje inicial pequeño da una situa-
ción ventajosa, se recomienda emplear el siguiente índice que es co- Con estos elementos para calcular la población para una fecha
nocido con el nombre de índice de efectividad: estipulada se aplica la siguiente ecuación.
P1 - Po Pc+x = Pe+ (N + I) - (D + E)
IE = 100
100 - Po
donde Pc+x es la magnitud de la. población que se desea en el año
En el ejemplo anterior el índice de efectividad será: c + x, o sea del año censal (c) más el número de años (x) que
transcurren de dicho censo.
66.7 - 10 56.7
Para el grupo A; IE = = - = 63.0% Pe es la magnitud de la población en el año del último censo (e)
100 - 10 90
N los nacimientos entre los aíios e y c + x
91.7 - 70
Para el grupo B: IE =
= Zl.7 = 72.3% I El volumen de inmigrantes entre los años c y c + x
100 - 70 30
D Las"'defunciones entre los años c y c + x
La aplicación de este índice da resultados que son congruentes . E El volumen de emigrantes entre los años c y e + x
con la naturaleza del problema. En ambos casos la aplicación del
81
80
.,·; { ~~ .
1,.,
La estimación de la población para el lo. de julio del año de
que se trate ( que no sea del año del censo, pues en este caso no
sería necesario) se puede hacer de varias maneras, pero la. más
simple para periodos menores de 15 años entre el penúltimo oenso PROBLEMAS Y RESPUESTAS
y el año que se desea estimar, es la siguiente:
;.: Yb-Ya
Yx =Ya+ (x-a) l. El censo de 1960 registra un total de 6 380 miles de vivien-
b-a das que según el material pre9ominante, en los muros o paredes,
j se distribuyen de acuerdo a los siguientes materiales: Adobe (e11
'\ J
Yx = Población que se desea estimar miles) 3 184; tabique 1 547; madera 558; embarro 495; mam pos-
tería 171 i bloques de material ligero 76; otros materiales 349.
Y a. = Población e,;, el penúltimo censo
Obtenga las proporciones y los porcentajes con-espondientes para
Yb . = Población en el último ceriso
;
cada uno de los materiales y presente los datosJ tanto absolutos
'
como relativos, en un cuadro estadístico.
a == Fecha d_el penúltimo censo
b = Fecha del último censo Resp1iesta:
x = Fecha para la cual se quiere estimar la población. CUADRO 4.20
ji
VIVIENDAS SEGúN EL MATERIAL PREDOMINANT:E':
\ 1
EN LOS MUROS O PAREDES (CENSO DE 1960 )
¡'
1 ( Miles de viviendas)-
i!.
}:•
Material predominante Nilmero de pro por-
en muros o paredes viviendas ciones Porcentajes
1
Bloques de material
ligero 76 .012 1.2
82 83
.¡:
t
:t& . .
Respuestas:
2. En el año de 1964 se registraron un total de 615 suicidios en 1
Económicas 32 2 34 '
¡ Disgustos familiares 9.2 12.7 9.9
1 !.
Disgustos familiares 45 16 6l Enfennedades graves e incu-
rabies 14.5 9.5 13.5
Enfermedades graves e in-
curables 71 12 83 Enajenación mental 7.2 8.7 7.5
Enajenación mental 35 11 46 i
1 Intoxicación por alcohol 8.2 o.o 6.5
84
85
b) 1 3. En los censos de 1950 y 1960 se obtuvieron los datos del si•
guiente cuadro:
CUADRO 4.23
CUADRO 4.24
Hombres Mujeres Suma
¡
Causas del suicidio Absoluto% Absoluto% Absoluto% CATEGORlA OCUPACIONAL DE LA VIVIENDA
EN LA REPúBLICA MEXICANA (CENSOS DE 1950, 1960 Y 1970)
( Miles áe ocupantes)
7.8 15.1 9.3
Amorosas (38) (19) (57)
j: Categoría de
ocupación 1950
6.5 1.6 5.5 1960 1970
Econ6micas (32) (2) (34)
Inquilinos 1 889
,j,
. 2 941 2 815
1· 9.2 12.7 9.9 Propietarios
1
, ,,!
.Disgustos familiares (45) 3 370 3 468 5 471
(16) (61)
Suma: 5259 6409
---
·s2a6
14.5 9.5 13.5
Enfermedades graves (71) ( 12·) (83)
j
87
1
./
j
Incremento ? 941 _ 1 889 1052 '00 == 55.7% Trabájese en forma similar al cuadro 4.21.
. .. - 100=--i
mquilmos = 1 889
1 889
1 052 2 2 104
- - - (100) = -- (100) = 4.36% Enfermedades graves e incu-
4 830 10 4-8 300 ' rabies 75 11 86
Enajenación mental 27 9 36
EJEMPLOS ACTUALIZADOS
Intoxicación por alcohol 40 2 42
· lnforrnación para prácticas estadL,ticas.
Trabájese en fonna similar al cuadro 4.7. Intoxicadón por drogas 6 4 10
Alfabetos 14 133 13 381 27 514 FUENTE: Anuario Estadístico Compendiado, 1972, Secretaría de Industria
y Comercio D.G.E.
Analfabetos 4 917 5 940 10 857
88 89
··¡
:L
k_
,.,
Trabájese en forma sirnllar al cuadro 4.20. Defunciones
de menores de Defu.nciol!es Matrimonios Di¡,orcios
Años un año regs. fetales regs. registrados registrados
VIVIENDAS SEGúN EL MATERIAL PREDOMINANTE 1955 114 834 29 084 211 87.5 12 203
EN LOS MUROS O PAREDES
( Miles de viviendas) 1960 119316 33 192 239 527 14 964
1970
1965 114 600 40 319 293 227 24· 705
Material Viviendas
1970 146 008 43 841 357 080 31 181
Adobe 2 495
Tabique · 3 658 1973 133 842 45 792 452 640 13 517
Madera 1 317
Embarro 416
Otros 400
Respuesta:
j ¡
NOTA: Se agrupan las viviendas de mampostería y bloques de material CUADRO 4.29
ligero en el rubro de tabique en el censo de 1970.
·t TASAS POR MIL PERSONAS
Con los datos del cuadro siguiente, obtener las tasas de nata•
Mortalidad Mortinn- Nupcia• Tasa de
lidad, mortalidad general e infantil, mortalidad, nupcialidad y de
Años Natalidad General Infantil ta{idad lidad divorcio*
divorcio.
1
DATOS DEMOGRAFICOS PARA LA REPÚBLICA MEXICANA 1960 44.2 11.l 74.2 20.G 6.6 62.5
; Población esti- Nacidos De.funciones 1965 44.i 9.4 60.7 21.4 6.8 84.3
Años mada (30 jun.) villos r~gs. registradas
1 1970 42.1 9.6 68.5 20.6 7.0 87 .3
'
1950 26 606 434 1174 947 418 430
1955 30 948 963 1377 917 407 522 1973 45.8 8.2 52.0 17 .8 8.1 29.9
1960 36 368 748 1 608 174 402 545
1965 42 859 422 1 888 171 404163
1970 50 694 671 2 132 630 485 656 Número de divorcios registrados
1973
* Tasa de divorcio
56 161 054 2 572 287 458 915 Número de matrimonios registrados
j
91
,. 90
1
·¡ ,
¡¡ J·
·1 .
Obtenga la razón de masculinidad al nacer.
CUADRO 4.30
CAPÍTULO 5
NACIDOS VIVOS REGISTRADOS EN LA REPÚBLICA MEXICANA
REPRESENTACIÓN GRAFICA DE DATOS
Masculinidad A NIVEL NOMINAL
Años Hombres Mujeres al nacer
jJ,. .
2. A salubridad, asistencia y seguro social 14 541 millones
La presentación tabular de los datos pudiera ser bastante para
(22%) ; . quienes tienen la preparación necesaria, pero para el común de ·las
3. A comunicaciones y transportes 10575 núllones (16%) ;
personas quizá no resulte lo suficientemente claro; por ello es con-
4. A educación y cultura 6 610 millones ( 10%);
Vt'niente el empleo de gráficas que permitan mostrar la información
5. A la deuda pública 5 949 millones (9%) ;
con la mayor sencillez y claridad para que sea fácilmente com-
6. Al ejército Yla armada 2 644 millones (4%) ; prensible.
7. Al fomento y conservación de los recursos naturales renovables
Utilizaremos los datos del ejemplo para mostrar algunos tipos de
2 644 millones (4%) ; gráficas: ·
8. A gastos de administración 1 322 . millones (2%) .
Este ejemplo preserita de manera textual el gasto del sector pú- a) De una barra simple subdividida en valores absolutos;
blico; es decir, básicamente con palabras; sin etn.bargo la informa- b) De una barra simple de cien por ciento subdividida;
ción ganará en claridad si presentamos los datos en una tabla o t) De barras simples con valores absolutos;
cuadro estadístico de la siguiente manera: d) De barras simples en porcentaje;
e) De sectores o circulares.
CUADRO 5.1
DESTINO DEL GASTO TOTAL DEL SECTOR PúBLICO GRÁFICA 5.1
DE MtXICO (1969) BARRA SIMPLE SUBDIVIDIDA EN VALORES ABSOLUTOS
( millones de pesos)
t
1
·i•.;
1 ,;,
,,
J
I'! !
Cuando las leyendas en los sectores son muy amplias, es más ·Puede apreciarse que la gráfica es más clara y permite presen-
con~eniente presentar las barras en posición vertical y entonces re- tar mayor cantidad de información.
cibe el nombre de gráfica de columna. La siguiente es una gráfica Este tipo de representación es muy conveniente emplearlo cuan-
de columna simple. do se comparan gráficamente las distribuciones de iguales conceptos
ert dos o más periodos. En el ejemplo pudiera ser interesante com-
. parar las distribuciones porcentuales en 4 o 5 años, basta para ello
GRÁFICA 5.3 disponer las colui:pnas de manera paralela. ·
DESTINO DEL GASTO DEL SECTOR PÚBLICO Como puede apreciarse, las gráficas de una barra no son muy
DE Mt.XICO ( 1969) eficientes cuando contienen muchas subdivisiones, por ello puede ser
¡
1
conveniente el empleo de la gráfica de "barras simples".
(Millones de pesos)
1
!-
novables
!'
1
Ejército y armada
J.
'' Deuda públir:-i
Comunicaciones y trans-
¡· Educación y cultura 6 610 portes
Salubridad y asistencia e
5 949
IMSS
Deuda pública
Fomento, producción y
Ejército y armada 2 644 reglamentación de indus-
Fomrnto y conservación de recursos na- tria y comercio
turales renovables 2 644 8 10 12 14 16 18 20 2i
¡-
Administr;:ición 1 322
96 97
!l¡i:, _
t
,¡·,
!
.
.,;
o
u
Q.
simultánea en una gráfica los valores absolutos y relativos. e o :1 u
ii: 1- C
La gráfica de barras simples puede modificarse mediante la or- 1-
en "'-z - ..,
"O
..,
(.) a:
<( OI ca: lal
~ 0:0 e
Se emplea para demostrar la relación existente entre los compo-
t, U)
OI ~
z 2
2
ol.) ·"'...o (,)
::, 2
Q. •
-.,,"'
_J :: o(.) o lal
e
nentes de una clase. Cada uno de los sectores del círculo representa o
l&I
a:
C/1
o 111 .§
una parte de un agregado o de un total; recibe además los nombres
11.1
o
..J ◄
.J
"'::, o:
Q. o
~ ~ x
C(
.J ,,,o◄ ,..o Q.
-
2
u
de gráfica circular o de pastel. Por ejemplo: !!J'lll ~ l&l
CI)
QI
>~ o: ..,
1-
C/1 "'
::,
m
!
1() 111 a.
~
- -...
Q. ::, 2
CUADRO 5.2 iri 11'. ~ 11'
11) Q. cr,
~
a. l1 CI)
..,...
0
cf o
SECTORES DE LOS QUE PROVl&NE EL GASTO u w
:, ~o .,
" (1)
e
a.
ii:
...
DEL SECTOR PÚBLICO EN MÉXICO (1969) O .J e :) o
<( u
11'.
m o a. ·;;
t, ~ ·:> := ~
::,:
Secto,r Millones Porcentajes .J a. :E
11.1 o:
....,, ,,u
Organismos descentraliza-
dos; empresas propiedad ºº
1/) ...
:o
o
.!:!
11.1 ~ -::,
del gobierno federal y
aportaciones al seguro o:o "'_J ...a.
1- 11.1
2u
social 39 658 60
11 897 18 Uo u
111
~ - sobre la renta 11.1
al comercio e industria 7 271 11 1/) ... ......... •-::•-::•:.:: ...:.:;..· ,,ü
~ al comercio exterior
otros impuestos
3 305
1 322
5
2
~
-.,,
~.... E
derechos, productos, o
aprovechamiento 1 983 3 ee,,
colocación de emprésti-
tos y financiamientos w
diversos 661
~
Suma: 66097 100 - ~
j
Los datos del cuadro anterior se representan así en una gráfica de sectores. ¡
i
1
98 99
j
CUADR0 . 5.3
Para dividir la circunferencia en sectores expresad~s como por-
centajes, se emplea la relaci.ón: CARACTERISTICAS DE CALZADO DE LA POBLACióN
URBANA Y RURAL DE MAYORES DE UN A'f:l'O EN M~XICO (1960)
;' !¡ 100 360 X (Porcentajes)
:,/
.;¡ Características del calzado Urbana Rural
¡·:¡
Por ejemplo, 60% corresponde a 216°.
Usan zapatos 84.3 39.6
100 360 60: X X = 216° Usan huaraches o . sandalias 9.4 37.9
¡r
(18%) (3.6°)
¡,{! ,
La representación gráfica del ejemplo anterior, puede utilizarse CUADRO 5.4
para indicar la importancia absoluta o relativa de cada concepto
en cualquier tipo de población; en este caso la representación grá- INVERSIONES EXTRANJERAS INDIRECTAS EN MÉXICO
fica recibe el nombre de grafica de _
barras simples subdivididas, por (MOVIMIENTO ANUAL DE CRÉDITOS DEL EXTE.R IOR
A PLAZO DE UN ARO O MAS, OBTENIDOS POR
ejemplo:
CONDUCTO DE NACIONAL FINANCIERA, S. A.)
1960-1964
Población
•
'
• 'I
1
11¡ ¡1
1
1
1
11
1
1 ¡ 11
1 11 1
1 1
GRÁFICA. 5.8
;~ ,1 '11'
rural 1
;" .
'1 1 1 ,
,l,iul1111ui,~
111 1,
1, 1
1
1 ~:1:11~:~:¡¡¡¡¡¡1¡¡¡¡¡¡¡¡~
PORCENTAJE DE VARIACION RESPECTO AL A~O
ANTERIOR DE LAS INVERSIONES EXTRANJERAS
. Usan zapatos INDIRECTAS EN MtXICO
(1960-1964)
Usan huaraches o · sandalias
-20 -10 O 10 20 30 40 50 60 70 80 90 100
4,
)f fj
::.:-:-:-:-:-:
Andan descalros 1960
*·•-•.•.•_!_._._.,.' ....... ,..... )! .... _·_ . ..~ _,_,_,), ¡_¡ ,
Lf..l.L!..,.•.
Iii!ilfi!ii!il!Iii!ii!Ii!IIiiii!iiiiiiiiiiiiiil!i!1iti
1961
1963
IIIIl
quierda de la misma línea. Este tipo de ·representación es de uti•
lidad cuando se trata de r.epresentar las variaciones positivas y ne-
gativas, como pérdidas y ganancias, incrementos posftivos y ne- 1964
gativos.
Por ejemplo:
liili/iltil!ll:!il!lli/:!íii!iI!lillI!!Il:lliiili!!!II!!lIIIIii!:~:¡¡
FUENTE:: Dates drl cuaclro 5.4.
102 103
'
J
il·
L .
La única diferencia entre las gráficas de b~rras y las de colum- Símbolos pictóricos de tamaño proporcional En ellos las figuras
nas estriba en· que mientras las gráficas de barras se arreglan hori- deben tener una magnitud proporcional a los valores que represen-
zontalm;ente, las de columnM se arreglan en sentido vertical. tan. No obstante que su empleo esté muy generalizado no es reco·
··· '.· 11
i_ ¡
· mendable utilizarlas en virtud de que resulta muy complicado cons-
., ,
truir y comprender las comparaciones basadas en tamaños variables
5.7 Mapas estac:tístic.os de símbolos Como la' figura humana, animales, automóviles, etcé-
tera.
Constituyen uno de los mejores procedimientos para representar Unidades pictóricas donde cada símbolo representa -un valor
relaciones espaciales en mapas geográficos. definido y uniforme. Constituye un procedimiento más aceptable
Los siguientes tipos de mapas estadísticos, son los más usuales: que el anterior. Cada símbolo es de tamaño uniforme y con un valor
¡
l. Mapas sombreados; 2. Mapas punteados; 3. Mapas de ise· igual. Por ejemplo) si una unidad o símbolo representa 1 000 tra.
,¡
'· líneas; 4. Mapas con uno o más tipos de gráficas sobrepuestas: bajadores, 2 símbolos representarán 2 000, etcétera.
barras, columnas, líneas,. flujos o dibujos pictóricos; 5. Combinacio- Gráficas pictóricas. Se auxilian con ilustraciones tales como ca-
nes de dos o más de los anteriores. ricaturas, bocetos, croquis, dibujos. Aunque son relativamente sim-
En los mapas sombreados la intensidad de la sombra indica la ples de comprender -sú. principal finalidad-, por lo gener~l su
construcción requiere de especialistas en dibujo.
magnitud del fenómeno en el área. Estos mapas se emplean princi-
palmente para representar tasas y proporciones, por ejemplo tasas
de mortalidad, natalidad, fertilidad) divorcio, morbilidad, crimina-
Información para prácticas estadísticas:
lidad; porcentajes de población por sexo, estado civil, edad, tipo
de ocupación; densidades de población, ingreso per cápita, consu-
Trabájese en forma similar al cuadro 5.3.
mos per cápita, etcétera.
¡· Los mapas punteados enfatizan las magnitudes absolutas.
Mapas de isolíneas. Se emplean frecuentemente para mostrar la CUADRO 5.5
distribución de fenómenos meteorológicos, económicos y demográ-
\·
;¡,
ficos. CARACTERÍSTICAS DE CALZADO DE LA POBLACION RURAL
:, Mapas con gráficas sobrepuestas. Constituyen un buen recurso Y URBANA, MAYORES DE UN Afl'O EN MÉXICO (1970)
!i
para la mejor comprensión de las relaciones espaciales. Si, por ejem- ( Miles de habitantes)
plo, deseamos representar las magnitudes de emigración, inmigración
en los diferentes estados del país, pueden sobreponerse dos gráficas Rural
Características del calzado Urbana
de columnas en cada estado, que indiquen dichas magnitudes.
Usan zapatos 25 195 12 096
Usan huaraches o sandalias 1 478 4 608
5.8 Gráficas pictóricas Andan descalzos 684 2 496
--
Suma : 27 357 19 200
Son muy empleadas por ser atractivas y de fácil comprensión
para el público; pero no resultan muy necesarias para quienes tie 0
NOTA: Se recomíenda a los profesores usar los ejemplos de la sección de
nen preparación estadística. problemas y respuestas del capítulo anterior para que los alumnos ela-
. Son empleados principalmente Íos siguientes tipos de gráficas boren representaciones gráficas.
f ..
pictóricas: ·
L)
l::i ,
1:
104 105
l¡r,·¡.l: ''.·•I1
·~t] i{.
t1:
CAPÍTULO 8
DISTRIBUCIONES DE FRECUENCIA
(CONCEPTOS BÁSICOS)
153
edades expresadas en años cumplidos pudieran ser las siguientes : 8, frecuencia u ocurrencia ; en otras pala_bras, el valor que más se
9, 5, 13, 6, 14, 5, 8, 5, 10) 12, llJ 7, 11, 14 y 5. repite eri un conjunto.
El escaso número de datos tiene por objeto simplificar al máximo Si en los datos del ejemplo localizamos el valor central, dicho
la obtención e interpretación de las medidas sumarias que emplea- dato recibe el nombre de mediana. Ésta se define como el valor que
remos para describir el conjunto; si imaginamos que este conjunto divide al conjunto en dos partes iguales; es decir, por debajo de la
en vez de ser de dieciséis niños fuera de 16 000 llegaríamos a cara· mediana se localiza la mitad de los datos, el 50%, y la otra
prender mejor la utilidad. ·de las medidas estadísticas, que nos per· mitad, el otro 50%; por encima de la mediana. En nuestro ·ejemplo
miten condensar la información para hacer más fácil la compren- la mediana (Md) es igual a 8.5 años, la mitad de los niños tienen
sión de la característica que se pretende describir2 en este caso las menos de 8.5 años y la otra mitad más de 8.5 años.
edade$ del conjunto de niños. Si dividimos al conjunto en cuatro partes y para ello lo<:alizamos
los datos que sirven de fronteras, obtenemos las cuartilas:
154 155
cientes (Q1 a M,1), normoexcedentes (Mct a Q 3), y excedentes (Qa X=~+~+~+~+~+~+~+~+~+
a M.x).
Es posible separar un conjunto en otro tipo de divisiones, por t X10 + X11 + X12 + X1a + Xl4 + X1s + X1a ...;.. N
ejemplo en cinco partes (quin tilas) ; diez partes (decilas) ; ci.en partes 1
1
X1 + X2 ... + X1s
(percentilas). La denominación genérica de este tipo de subdivisio- 1 X=----~--
nes en un conjunto recibe el nombre de cuantilas. 16
Las medidas estadísticas anteriores pueden ser aplicadas también llx 143
a datos expresados en un nivel ordinal de medición, donde los datos X= -=- - 8.94
N 16
pueden arreglarse de acuerdo a un ordenamiento jerárquico de sus
características de manera creciente o decreciente.
Sigma mayúscula (.¿) se conoce con el nombre de sumatoria e
Por ejemplo cuando ordenamos a 16 concursantes de oratoria indica que debe sumars.e lo que está a continuación en un mismo
por el lugar que ocuparon en un concurso_; podemos conocer a los término.
concursantes de rendimiento mínimo y máximo) a los de rendimiento
En nuestro ejemplo X = 8.94 indica 8 años y 94 centésimos de
mediano, localizar cuantilas y el valor modal.
año. 94 centésimos expresados en días se obtendrá con la siguiente
relación:
8.4 Me,di(JJ aritmética 1 año: 365 días : .94 de año : X días = 343.1 días.
~
todas las diferencias obtenidas y dividir dicha suma entre el nú·
3, 35, 1, 2, 3.7
mero de elementos que componen el conjunto.
En nuestro ejemplo obtendremos el promedio de desviaciones : el promedio de desviaciones será igual a 10.4 años.
Si comparamos los promedios de desviaciones con la media
5-8.94 + S.-8.94 + 5-8.94 + 5-8.94 + 6-8.94 + aritmética podemos decir que si bien los dos conjuntos tienen igual
promedio de edades, el último es considerablemente más hetero-
+ 7-8.94 + 8-8.94 + 8-8.94 + 9-8.94 + géneo que el primero.
+ 10-8.94 + 11-8.9+ + 11-8.94 + 12-8.94 + No obstante que el promedio de desviaciones es una medida fácil
de obtener y de sencilla interpretación, tiene el inconveniente de
+ 13-8.94 + 14-8.94 + 14-8.94 + 16. que no se presta a la manipulación algebraica.
(J = /----
igual a cero. Para evitarlo se consideran las desviaciones absolutas ';
·1 y' N
( todas positivas) en vez de ser algebraicas. Las dos rayas vertica· . '
'
en nuestro ejemplo: ·1 ·
las diferencias de las características con respecto a gu. promedio
' aritmético. Para evitar que la suma de las diferencias resulte igual
158 159
111
a cero se elevan al cuadrado, con lo que siempre serán positivas 3.19
CV =- (100) = 35.7%
(un .valor negativo multiplicado por un valor negativo) su produc· 8.94
to es positivo) . La suma de ·los cuadrados de las diferencias se
divide entre el número de elementos del conjunto y a. dicho CV indica que la variabilidad en el conjunto es de 35.7%.
cociente se le extrae raíz cuadrada.
Para nuestro ejemplo, el cálculo de sigma, se obtendrá:
Resumiento: en el conjunto de 16 niños el análisis de su edad
revela la sigu_iente información:
0
2
= (3.94-2 + 3.94 + 3.94 + 3.94-2 + 2.94 + 1.94-2 +
2 2 2
y' 16 · Md (mediana) = 8.5 años (50% con edad menor a 8.5 años)
Q1 ( cuartila uno) 5.5 años (25% con edad menor a 5.5 años)
El promedio de desviaciones constituye aproximadamente cua- Q3 (cuartila tres) 11.5 años (75% con edad menor a 11 .5 años) .
tro quintas partes de la desviación estándar en un mismo conjunto.
Como se podrá apreciar posteriormente, la desviación estándar X (media aritmética) = 8.94 años (edad promedio)
tiene un significado muy preciso en su relación con una distribu- PD (promedio de desviaciones ) (promedio de variación)
ción normal. 2.8 años
La desviación estándar y el promedio de desviaciones son me· ( desviación estándar)
a = 3.19
didas de variabilidad absoluta; es decir, indican la variación de años ( promedio cuadrático de variación)
los datos respecto a la media aritmética en los valores originales
CV (coeficiente de variabilidad) =
en que éstos se miden. Por ejemplo, si la desviación estándar es de 35.7% (porcentaje de variación)
3.19, su valor está ,expresado en años; si se tratara de una distri-
bución de ingresos, la desviación estándar se expresaría en pesos.
El promedio de desvi.¡.ciones es de 2.8 años, como se indica en Con e3tas medidas sumarias estamos en posibilidad de obtener
las unidades originales (años) . una visión más clara de lo que es el conjunto respecto a la varia-
El co.eficiente de variabilidad, por el contrario, expresa la va- ble edad. Para ello es necesario obtener el mayor número de me-
riación como un porcentaje, por ello se considera como una me· didas estadísticas; en cuanto éstas aumentan, será mejor "visua-
dida de variabilidad relativa, ya que no está expresada en años, lizado" y sus propiedades más asequibles.
sino en unidades distintas (porcentajes) : Resulta obvio decir que el ejemplo que hemos desarrollado:
no es, en manera alguna, de los que se presentan .e n la práctica
cotidiana; por lo general los conjuntos que se analizan constan de
CV =-=a (100) centenares) millares y hasta millones de unidades; sería absurdo
X pretender calcular, por ejemplo, la media aritmética de los ingre-
sos de la población activa del Distrito Federal, o su desviación
En nuestro ejemplo: ·estándar aplicando las f ónnulas anteriores, pues tendríamos que
160 161
hacer sumas de más de dos miliones de casos, lo que en la realidad PROBLEMAS Y RESPUESTAS
r~sulta •prácticamente imposible, cuando no se dispone de equipo
electrónico apropiado.
El objetivo que se persigue en este capítulo_; es el de hacer 1. Ordene los siguientes datos:
más comprensibles algunos conceptos estadísticos que empleare-
mos con bastante frecuencia posteriormente. 3 9 1 4 1 6
a) En orden creciente;
b) En orden decr.eciente.
Respuesta:
a) 1 1 3 4 6 9
b) 9 6 4 3 1 1
a) Mínimo;
b) Máximo;
e) Modal;
d) Amplitud máxima.
Respuesta:
a) Valor mínimo= 1;
b) Valor máximo= 9;
e) Valor modal= 1;
d) Amplitud máxima: Mx - Mn = 9 - 1 = 8
15 8 2 1 10 20 4 7' 3
Respuesta :
162 163
4. Localizar -encerrando en un cuadro-, el valor correspon- 6. Los ingresos semanales de 4 personas son los siguientes:
diente a la mediana en los siguientes 2 conjuntos de datos; observe
que el primer conjunto es impar y el segundo par: $100, $200, $150, $350.
164 165
800
e) 200 = despejamos N
N
CAPÍTULO 9
. N = 800 = 4
200 SERIES DE FRECUENCIAS
Lo anterior nos indica que conocidos dos valores cualesquiera de
- . }:X
la. ecuación X = -N- es posible obtener el tercero. 9.1 Agrupamiento de Los datos
.
Cuando los datos que se analizan son "discretos"; es decir, las
diferencias entre unos y otros son finitas -por ejemplo el número
de hijos de las familias-, es muy frecuente, aunque no necesa-
riamente, el agrupamiento de los datos en una serie de frecuen-
cias, con objeto de que el cálculo de las medidas estadísticas pue·
da realizarse de una manera sencilla. Por ejemplo si queremos
analizar las calificaciones redondeadas al entero más próximo de
un grupo de 100 alumnos del primer año, procederemos primero
a tabular dichas calificaciones. · ·
CUADRO 9.1
7 5 8 6 7 9 7 7 7 6
8 8 7 7 6 8 9 6 9 7
10 6 7 9 8 7 6 7 5 6
8 7 6 10 5 7 9 8 7 9
6 8 8 6 7 6 7 7 8 6
9 8 7 9 8 8 8 8 7 7
5 6 8 6 5 10 7 6 8 8
8 9 7 9 7 8 8 10 10 10
7 7 7 6 6 7 8 6 9 9
8 6 10 7 8 7 5 7 6 8
i 167
166
l
l
leen los datos y se registran con marcas ( cuadro 9.2) hasta agotar ponde a la primera frecuencia acumulada, que contiene el 25%
·.•· el conjunto. de los casos, constituye el valor de la cuartila uno. Los valores de
I
g
;,,
Las series de frecuencias tienen por objeto sumarizar o conden- X correspondientes a la primera frecuencia acumulada, que .con-
sar grandes masas de datos. Al arreglo tabular de los datos y sus tienen el .50 y el 75% respectivamente, constituyen l<l, mediana y
frecuencias correspondientes se le denomina distribución de fre- las cuartila tres.
cuencias. A los datos organizados y condensados de esta manera Ejemplo:
se les conoce, además, frecuentemente, como datos agrupados.
CUADRO 9.3
CUA!>RO 9.2
.111J
1
Calificacicmes Frecuencias Frecuencias
j IIU Ca/if icación Co11lev Frecuencw X f acumuladas
6 6
5 CS;J 1 5 6
6 20 26
6 rs;J r:::J r:::J CSJ 20
7 30 56
30 25 81
7 cs;J cs;J cs;J cs;J LSJ [:;] 8
25 9 12 93
8 CSJ CSJ CSJ cs;J CSJ 10 7 100
9 CSJ CSJ L 12 -
Suma 100
10 (SJ L. 7
-
100 NOTA: La serie de frecuencias se ha el.aborn.do deliberadamente con 100
Suma casos para hacer coincidir las frecuencias absolutas con sus por-
centajes correspondientes.
168 169
Q1 = 6: 25% de los alumnos obtuvieron una calificación de sólo que en vez de sumar todos los valores de X, que son iguales,
6 o menos. El 75% obtuvieron calificaciones de 6 los multiplicamos por el número de veces que se repiten. Por
o más. ejemplo: en vez de sumar 5 + 5 + 5 + 5 + 5 + 5, obte-
Es incorrecto, como puede apreciarse en el cuadro, nemos el mismo resultado si multiplicamos 5 x 6 (la calificación
interpretar: 25% de los alumnos obtuvieron una 5 que tiene una frecuencia de 6 alumnos) . Después multiplicamos
calificación menor que · 6. Unicamente 6% tienen 20 x 6 que es lo mismo .que sumar la calificación 6 veinte veces.
calificaciones inferiores a 6. Por otra parte };f = N, como podrá apreciarse en el cuadro.
Como ya se dijo, los cuadros estadísticos tienen por finalidad
Md = 7: 50% obtuvieron calificaciones de 7 o menos. El presentar datos numéricos para su mejor comprensión; pero, ade_
resto, 50% obtuvieron calificaciones de 7 o mayores. más, otros cuadros se emplean para realizar cálculos de manera
ordenada y sistemática (cuadros de trabajo) : el siguiente cuadro
Qa = 8: 75% obtuvieron calificaciones de 8 o menos, y 25% tiene esta última finalidad.
de 8 o mayores.
CUADRO 9,4
~X PD = ~flX - XI
X=N ~f
170 171
Esta fórmula es similar a la empleada en una serie simple: diferencias de un mismo valo-r X respecto a la media aritmética,
por ser todos iguales, se multiplican por su frecuencia; es decir, por
PD = ~IX-:-- XI el número de veces que se repiten.
N El cuadro anterior puede ~er utilizado para calcular la des-
viación estándar, con sólo agregar una columna donde se consig-
sólo que, como en el caso del cálculo de la media aritmética, en nen los productos de la 3a. por la 4a. columnas y la suma de estos
vez de sumar todas las diferencias de un mismo valor de X res- productos. Por ahora realizaremos el cálculo en otro cuadro para
pecto a su promedio aritmético, se multiplica por su frecuencia una mejor comprensión.
correspondiente.
CUADRO 9.6
CUADRO 9,5
X f X-X (X-X)2 f(X -X)2
X f IX-XI ti X-XI
5 6 -2 .4 5.76 34.56
5 6 2.4 14.4 6 20 -1.4 1.96 39.20
6. 20 1.4 28.0 7 30 - .4 .16 4.80
7 30 .4 12.0 8 25 .6 .36 9.00
8 25 .6 15.0 9 12 1.6 2.56 30.72
9 12 1.6 19.2 10 7 2.6 6.76 47.32
10 7 2.6 18.2
Suma :
--
--- -- 165.60
== V 1.66 ==
PD =
~flX - x¡ = -
106.8
- = 1.07 cr
.
= v/~f(X~f- X) 2 -
- v 165.6
/
100
1.29
~f 100
172 173
Q¡ = 6 La marta parte --25%- obtuyieron califica-
1
PD 1.07
CVm =-=- (100) = - (100) = 14.5% dones iguales o menores a 6. Las tres cuartas
X 7.4· partes -75%- obtuvieron calificaciones igua-
les o superiores a 6.
Los cálculos de la media aritmética, el promedio de desvia-
ciones y la desviación estándar, pueden r:ealizarse con la ayuda de Qa = 8 Las tres cuartas partes -75%- tienen califi-
caciones iguales o menores a 8. Una cuarta par-
un solo cuadro estadístico. Por ejemplo:
te obtuvo calificaciones iguales o mayores a 8.
-
18.2 47 .32
desviación estándar a la media aritmética fue
-
10 7 70 2.6
~
175
174-
,.
PROBLEMAS Y RESPUESTAS
Respuesta:
a) 6,2%;
Observe cuidadosamente el siguiente cuadro:
b) 45.7%;
e) 16.6%.
CUADRO 9.8
a) ¿ Cuál es el porcentaje con más de 6 años de estudio?; En la columna de porcentajes acumulados (última) se locali-
b) ¿ Qué p9rcentaje no tiene ningún año de estudio terminado za la primera frecuencia relativa acumulada que contiene el 50%; ·
y aprobado?; en el ejemplo corresponde a 50.9. En la primera columna se loca-
liza el valor en el mismo renglón donde se encuentre. 50.9; este
e) ¿ Cuál es el porcentaje con 6 y más años de estudio? valor es de un año, mismo que corresponde a la mediana (Md
::: 1 año).
176
177
Interpretación: el 50% de la población mayor de 30 c,lños tie·
ne un año o menos de estudios terminados y aprobados. Otro
50% tie~e un año o más de estudios t,erminados y aprobados. CAPÍTULO 10
6. _¿Es posible calcular con los datos del cuadro, las siguientes SERIES DE CLASES Y FRECUENCIAS
medidas estadísticas?
10.1 Agrupamiento de los ·ilatos
X, PD, (j' CV
Respuesta : No es posible porque 1~ última clase ( 7 y más) La organización de datos en una distribución de clases y frecuen-
cias tiene por finalidad, como en la serie de frecuencias, condensar
es abierta. grandes masas de datos; pero esta condensación, en la serie de clases
y frecuencias, es aún mayor, ya que la característica que-se analiza
también se agrupa en clases. Los datos en una serie de clases y
Información para prácticas estadística.s
frecuencias pueden ser discretos o continuos.
CUADRO 9.9
Ejemplo:
179
178
la posibilidad de que se repitan con cierta frecuencia las 45 posi- Ingresos semanales:
bles calificaciones expresadas hasta un decimal ( 5.5 a 9.9). Si
a pesar de todo formamos un cuadro de frecuencias, éste llegaría a
tener 45 renglones, aun en el ejemplo sencillo que presentamos. El
De 51 a 199 Pm = 125 f =3
conjunto de valores se agrupa en clases y cada una de éstas tiene Ingresos: 150, 180, 195 X= 175
un límite inferior y un límite superwr. Por ejemplo en la sexta
clase, el límite inferior es 8.0 y el límite superior es 8.4. De 200 a 300 Pm = 250 f = ·4
Es necesario obtener un valor único para cada clase, el más
representativo. Este valor se conoce .como punto medio y se ob-
Ingresos: 200, 225, 275, 300 X = 250
tiene sumando el límite inferior con el límite superior dividiendo
entre dos, simbólicamente.
En la primera clase el purito medio es de 125 y X = 175, en la
. segunda clase Pm = 250 y X = 250.
Ejemplo para obtener media aritmética en serie de clases y
Pm - Li + Ls frecuencias.
2
"i,/Pm
--
97.0
= 955.6
medio sea representativo de esa clase, lo cual puede o no aconte-
cer. En otras palabras, el punto medio deberá ser un valor cercano
al promedio aritmético de las unidades incluidas en la clase co- _ I f Pm 955.6 (,, )
rrespondiente. X= -~f- = - 118 = 8.098 = 8.1,
' .I
A continuación presentamos dos casos en que- en la primera
clase el punto medio no es representativo y en la segunda sí lo es:
180
181
. ,
igualmente aplicable a la desviaci6n estándar, promedio de des·
10.3 Desviación estándar, promedio viaciones y coeficiente de variabilidad.
de desviaciones )' c,oefiricntc de variabilitlad
en series de clases y frecuencias
10.4 Localización de cuantilas
La desviación estándar se obtiene con la f6rmula: en seri.es de clases y fu:cuencias
-- -
9.0 a 9.4 9.2 25.60 16.00
10 1.6 2.56
9.5 a 9.9 9 .7
112.2/J 94.8
Sumas: CUADRO 10.4
';(. -: \ Frecuencias
_✓
CI -
~f(Pm-X)
I,f
2
= J11 2,28 _=
118 .
y .9515 = .98 Clases f acumuladas
5.5 a 5.9 2 2
6.0 a 6.4 4 6
If!Pm-X! 94.8 _ 0 6.5 a 6.9 9 15
PD ·- - - -
- If
= .--
118
- ·8 7.0 a 7.4 17 32
.-: ,
7.5 a 7.9 18 50
8.Q a 8.4 23
CI .98 8.5 a 8.9 19 -g-2
CV = -::::. 100 :.:: - (100) = 12.1%
9.0 a 9.4 16 108
X 8.1
9.5 a 9.9 10 118
~-
Lo que indicamos respecto a la representatividad del punto Suma: 118
medio para la mejor aproximación de la media aritmética, es
183
182
Se obtiene la mitad de· la suma de frecuencias ; en este ejemplo: Ls - Li =i 8.45 - 7.95 = .5
l:f 118 Un procedimiento sencillo para determinar el valor del inter-
2=-2--- 59 valo consiste en obtener la diferencia positiva entre dos intervalos,
superiores o inferiores, de dos clases contiguas, cuando los inter-
La mediana tendrá 59 casos por debajo de su valor y 59 por valos son iguales. Por ejemplo:
encima.
En seguida localizamos la clase que co~tiene a la mediana ( en 6.0 - 5.5 = .5 6.4 - 5.9 = .5
el renglón de la primera frecuencia · acumulada que contiene a
59). A la clase 8.0 a 8.4 le corresponde la frecuencia acum~lada 73. volviendo al cálculo de la mediana:
Con las frecuencias acumuladas y los límites inferiores de clase
hacemos el siguiente razonamiento: por debajo de 5.5 no existe 9 4.5 . · .
ningún valor; por debajo_de 6.0. hay dos pen.onas; cori califica-
- (.5)
23
= - 23 = .196 =.2
ciones por debajo de 6.5,-es decir menores de· 6.5- seis personas;
por debajo de 7.0 hay quince casos; por debajo de 7.5 ,hay treinta Este valor debe swnarse al límite inferior de la clase que con-
y dos casos1 etcétera. tiene al valor de la mediana; es decir, 8.0 a 8.4. Entonces 8.0 +
Por debajo de 8;0 (límite inferior de la clase que contiene a =
.2 8.2. Con el razonamiento anterior, se calcula la mediana con
la mediana) hay 50 alumnos ; como el valor de la mediana es 59, la siguiente fórmula:
faltan 9 caso~. El valor que en la clase 8.0 a 8.4 le correspondería
a 9 ·casos, ,se calcula por· interpolación. La clase 8.0 a 8.4 tiene 23 l:f
casos. Si partimos del supuesto que el número de casos que con- . ·-2 - .fa
tiene cada clase estári distribuidos a una distancia aproximadamen- Md = Li + -- -_-
f .
te igual en_el intervalo de la clase, entonces el valor X -que
se localiza de 8.0 a 8.4, y que corresponde a nueve un·idades-, se donde:
obtiene dividiendo el número de unidades que se requieren en la
frecuencia para obtener la mediana entre el número de unidades] Md = mediana
que contiene la frecuencia de la clase donde se localiza la mediana
(en este ejemplo 9 sobre 23) y se multiplica el cociente ( .391) por Li = límite inferior de la clase que contiene a la mediana
el valor del intervalo.
fa = frecuencia acumulada anterior a la primera que
El interualo es la diferencia que hay entre los i•erdaderos lí- contiene a la mediana:
mites de una clase, conocidos también como front,eras de clase.
a
En este ejemplo si las calificaciones fueran redondeadas un de- f = frecuencia no acumulada de la clase que contiene a
cimal, los valores 5.45, 5.46, 5.47, 5.48 y '5.49, se redondean a 5.5; la mediana
las calificaciones de 5.91, 5.92, 5.93 y 5.94, se redondean a 5.9.
Por lo tanto los Verdaderos límites de la primera clase son
i = intervalo de la clase que contiene ala mediana.
5.45 a 5.95; en la segunda, de 5.95 a 6.45; en la tercera de En nuestro ejemplo:
6.45 a 6.95, etcétera. La diferencia del límite superior menos el
límite inferior es de .5; es decir : ::Ef = 118.0
184 185
Li = 8.0
f = frecuencia no acumulada de la clase que contiene
a la cuartila uno
fa= 50.0
i = intervalo de la clase qu,e contiene a la: Q 1 •
f = 23.0
En nuestro ejemplo:
i = .5
118 If = 118
2 - 50.0 59 - 50
Md = 8.0 + (.5) = 8.0 + (.5) = l:f
23 23 -4 = 29.5
9
= 8.0.+ - (.5) = 8.0 + .39 (.5) = fa = 15.0
· 23
= 8.0 + .195 = 8.2 f = 17.0
= .5
Es conveniente recordar que en una expresión con dos o más
términos se resuelven primero las operaciones indicadas que estén Li = 7.0
antes, después o entre los signos más y/ o menos, y después se re-
29.5 - 15 14.5
~uelven las sumas y restas. Es decir, en estas operaciones resuelve Q1 = 7.0 + (.5) = 7.0 +- (.5) =
el segundo término (la multiplicación) y después se suma al lí· 17 17
mite inferior; de no hacerse así, se obtendrá un resultado inco- + .85(.5) = 7.0 + .425 = 7.4
= 7.0
rrecto.
Cuantilas. Con un rnzonamiento similar al anterior se calculan 3~f
--fa
las cuartilas, quintilas, decilas, percentilas. . 4
Qa = L1 +--
f
~f - fa
4 donde:
Cuartila uno: Qi = Li + - -f- -
Li = límite inferior de la clase que contiene a Q3 (la
dase donde la primera. frecuencia acumulada con-
donde:
tiene a las tres cuartas partes de la distribución :
Li = límite inferior de la clase que contiene a la cuartila 354 entre 4)
uno (correspondiente a la clase donde está la pri- fa = frecuencia acumulada anterior a la que contiene a
mera frecuencia acumulada que contiene a la cuar- Q::
ta parte del conjunto l:f)
4 f = frecuencia no acumulada de la clase que contiene a
Q3
fa = frecuencia acumulada anterior a la que contiene a
la cuartila uno i = intervalo de la clase que contiene a Q 3
186 187
88.5 - 73 15.5 9~f -fa
Qs = 8.5 + (.5) = 8.5 + -9- (.5) = 10
19 1 Ds = Li + f
i ( decila nueve)
= 8.5 + .816 (.5) = 8.5 + .408 = 8.908,; 8.9
Percentilas:
El razonamiento para calcular cuartilas puede emplearse en
el cálculo de otras cuan tila.~:
l:f
Quintilas: - - -fa
100
P1 == Li + i (percentila uno)
f
l:f
---fa 2>.:f
5
51 = Li + f i (quintila uno) ---fa
100
P2 = Li + i (percentila dos)
f
2If
- - - fa 15~f
5
52 = Li + i (quin tila dos) · ---fa
100
f Pis = Li + i (percentila quince)
f
3}.;f
---fa
5
5a = Li +
f
i (quin tila tres)
10.5 Construcción de una distribución
de clases y frecuencias
4}~f
- - ·- fa
5 Daremos varias sugestiones de tipo general que ayuden a cons-
54 = Li + f
i ( quintila cuatro) .
truir una distribución de clases y frecuencias, aunque no existen
para ello reglas completamente definidas en virtud de que las co·
Decilas: lecciones de datos difieren entre sí con mucha frecuencia. El sis-
tema de agrupamiento de los datos que puede ser indicado para
~f un conjunto puede no serlo para otro.
---fa
10 l. Obtenga la amplitud máxima (Mx - Mn);
D1 = Li + i (decila uno)
2. Divida la amplitud má.xima por el n(1mero de clases que se
f
.¡
considere apropiado, para tener una idea de la magnitud del
' intervalo:
2~f '~
10 - fa
D2 = Li + f
(decila dos) Valor máximo - Valor mínimo .
Número de clases
3:'!:f
D ~-fa
a = Li + _10_ a) Si la serie o conjunto tiene menos de j0 rasos no debe
(decila .tr~)
f exceder en más de 10 el número de clases ;
188 189
10.6 Puntajés estándar
b) Si la serie o conjunto tiene de 50 a 100 casos, es apropiado
formar de 10 a 15 clases; El puntaje estándar es una medida que algunos consideran,
e) Si tiene más de 100 casos, fórmese la serie con 15 a 20 · equivocadamente, como de dispersión.
Un puntaje estándar (z) se expresa:
clases;
d) Por lo general se emplean no menos de 8 clases ni más de
(X -X)
20; \l z=
(J
e) Para facilitar los cálculos, si el cociente de la diferencia
del valor máximo menos el mínimo entre el número de clases da .
!l Tiene pór objeto determinar la posición relativa de los valores,
un valor cercano a 5 o múltiplo de 5, emplee 5 o el múltiplo de 1
considerados individualmente en el conjunto que se analiza. El
5 como el valor del intervalo. De lo contrario seleccione el número
\ puntaje estándar se aplica para comparar casos o datos individua·
par más cercano al cociente. les de dos o más conjuntos.
191
190
otro alumno en literatura, o de un mismo alumno en dos o 111[1~ Buscamos un valor que consideramos es el más cercano a la
materias. media arihnética. En cuanto más cercana esté la media arbitraria
Un alumno quiere determinar en cuál de las dos materias que de la media verdadera, los cálculos serán más sencillos de realizar.
aprobó tiene mejor posición relati\·a ; ei:J. mátemáticas obtu\'o 75 En caso contrario un valor muy · por debajo, o muy por encim_a,
puntos y en métodos de investigación social 85. -En la distribución complica los cálculos) pero el resultado será correcto.
de las calificaciones en matemáticas se obtuvo: X = 78; a = 12. La suma de las desviaciones de una media aritmética con re-
En métodos de inYestigación se obturn para dicha distribución : lación a, la variable) puede expresarse: :i: d' = :i:(X - X')
X = 88 y (J = 14.
P~ntaje estándar en matemáticas: .
donde d' = (X- X')
X = ·X' +~(X-X') 1 2 -1
N 4 2 2
2 2 o
para una serie sin1ple, donde X' simboliza la media arbitraria.
5 2 3
de
* Los temas de los incisos 10.7 a 10.10 pueden omitirs~. Con el empleo
:calculadoras no se
consideran necesarios los procedimientos· abrevi'ados. Suma: ~(X'--X') =
-4
192 193
CUADRO lQ.6
Si la media arbitraria coincidiera con la media aritmética, la
suma de las desviaciones sería igual a cero. En este caso el error PROMEDIOS OBTENIDOS POR LOS ALUMNOS DE LA ESCUELA
total es igual a 4 y el error medio se obtendrá dividiendo el DE TRABAJO SOCIAL DE LA UNAM (1964)
error total entre el número de casos:
Clase de promedios f Pm d" fd"
erro.r total
5.7 -4. -8
error medio = número de casos
5.5
6:o
a 5.9
a 6.4
2
4 6.2 -3 -12
6.5 a 6.9 9 6.7 -2 -18
7.0 a 7.4 17 7.2 -1 -17
. 1 . ,4 7.5 a 7.9 18 7.7 o o
E n nuestro eJemp o: -4 == 1 8.0 a 8.4 23 8.2 1 23
8.5 a 8.9 19 8.7 2 38
9.0 a 9.4 16 9.2 3 48
Si sumamos el error medio a la media arbitraria, obtendremos 9.5 a 9.9 10 9.7 4 40
--- --
el valor de la media verdadera. Entonces: 118 -55
Sumas : +149
~
- 4
"$,fd" = 94
- - 'Zd' X==2+-==3
X==X' +n- 4
_ 94 47.0
X = 7.7 +- (.5) = 7.7 +- = 7.7 + .40 = 8.1
La aplicación de la fórmula en una serie de clases y frecuencias 118 118
con intervalos iguales, facilita los cálculos cuando no se dispone
del equipo mecánico necesario o al menos de una calculadora. Compare usted ieste procedimiento con el empleado en el
La fórmula en una &erie de clases y frecuencias tiene algunas cálculo de X en la página 180 y podrá apreciarse la simplicidad
variantes respecto a la anterior. El punto medio (Pm) se conside· de los cálculos con el método abreviado.
ra el valor representativo de la clase. Además empleamos el valor ·1 Ahora trataremos de explicar brevemente el porqué se em-
del intervalo para obtener mayor simplificación. plea la fórmula que hemos aplicado en el ejemplo anterior:
En series de clases y frecuencias se emplea la siguiente fórmula:
d' =X - X'
195
194
7.7 - 7.7 o
d" = - -=
- .5
o Podemos demostrar que esta fórmula puede expresarse así :
.5
. V N N
7.2 - 7.7 -.5
¿».=
.5
==--
.5
=- 1
En la fórmula del procedimiento largo eliminamos el radical,
6.7 - 7.7 -1.0 y elevamos al cuadrado el primer miembro de la ecuación ( u 2 )
d" = = ·- - 2 •
.5 .5
_ _ i ~fd"
~fd" _ (J2 = í:(X 2 - 2X}f + X2 )
X= X'+--- ·= X' + - - - i N
~f If
196
197
l:X2 - 2X IX + I:X2 Si sumamos los dos últimos términos (-2X:Z + X 2), 1a suma
ª2 = . da -X2, esto es:
N
~x 2xix + NX 2 ...: 2
a2 = Ex.2 - )2
a~=-------
N
entonces: ( EX
N N ·
En lugar de dividir todo el m.¡merador por N, pueden dividir· Si obtenemos raíz cuadrada a .los dos miembros de la ecuación,
se cada UflO de los términos por N: tendremos la: fórmula para calcular la desviación estándar:
· ~x 2 2xl:x NX2
02=-----+--
a=v-- -l:X
2 2
IEX ) (
N N N
N N
En el último término N divide a X, por lo que se cancelan:
10.9 Simplificación del cálculo de u
en series de frecuencias
~x 2x~x _
ci-2 = - - - - - -- + X 2
N N En una serie de frecuencias ~ (X - X) J puede expresarse como
198 199 ¡I
que puede transformarse al procedimiento abreviado
En el tercer térmfoo del segundo miembro se cancelan ~f en
2 2 virtud de que aparecen tanto en el numerador ( donde multiplica
/~X
cr=v-- (
-};X ) a la constante X 2) como en el denominador.
N N
~fX 2 _ _
~f
cr
2
== ---:- - 2X + X 2 2
~f
eliminando el paréntesis :
~f
2,fX 2
Las constantes pueden salir de la sumatoria:
cr2==--x2
1Jf
1Jf 2f .
= - - - - 2X};fX
~fX 2
1Jfx2 ~f
(J~
w w +-~
Ejemplo para el cálculo de u con el procedimiento abreviado
en una serie de frecuencias .
200
201
CUADRO 10.8
CUADRO 10.7
PROMEDIOS OBTENIDOS POR LOS ALUMNOS DE LA ESCUELA
CALIFICACIONES DE 100 ALUMNOS EN LA DE TRABAJO SOCIAL DE' LA UNAM (1964)
MATERIA DE ESTADÍSTICA
Promedios f Pm d" fd,, fd"tJ
Calificación
x1. ¡x2 fX . 5.5 a 5.9 2 5.7
X f -5 -10 50
6.0 a 6.4 4 6.2 -4 -'--16 64
150 30 6.5 a 6.9 6.7 -3 -27 81
5 6 25 9
720 120 7.0 a 7.4
6 20 36 17 7.2 -2 -34 68
1 470 210 7.5 a 7.9 18 7.7 -1 -18 18
7 30 49
8 25 64 1 600 200 8.0 a 8.4 23 a:2 o o o
972 108 8.5 a 8.9 19 8.7 1 19 19
9 12 81
-
700 70 9.0 a 9.4 16 9.2 2 32 64
--
10 7 100
Suma:
- -
100 355 5 612 738
9.5 a 9.9
---
10 9.7 3 30
-
90
Suma: liB -105 t!-54
+ 81
-
lfd" = -24
ª= J 5 612. _-(-- 738 }~ = v 56.12 - (7.38)2 =
100 100 I
Se escoge un punto medio que se considere el más cercano a la
= '-/ 56.12 - 5,t.46 = \I 1.66 = 1.29 ~ 1.3
media aritmética del conjunto (en el ejemplo fue 8.2), se forw..a
una columna de d" y frente al punto medio escogido se coloca
El procedimiento abreviado además de ser más simple de cal- cero; hacia arriba, en unidades sucesivas se le dan los valores. de :
cular, puede resultar más exacto, pues evita el manejo de muchos -1, -2, ... , -n; y hacia abajo 1, 2, 3, ..., n.
decimales que generalmente se obtienen al calcular las desvi¡¡.cio· La fórmula puede expresarse así:
nes. Como dichos decimules se redondean frecuentemente, se ob-
( ~)2
tiene un resultado menos exacto que, sin embargo; no afecta prác-
ticamente a la interpretación. <1 = i,/ Ifd"2
ílí - 1Jí ,
i
203
202
.,
\
Las desviaciones de los puntos medios respecto a una media
¡ Mo = 8.1 - 3(8.1 - 8.2)
1
arbitraria, al dividirse entre el valor del intervalo, son: -5, -4) ;
·> ;\,fo= 8.1 - 3(-.1)
-3, -2, -1; o, 1, 2, 3.
. 1v1o = 8.1 - ( - .3)
,, 8.2 - 8.2 Mo = 8.4 (aproximadamente) .
d,; =-~ --
j
=O
Otro procedimiento aproximado para calcular el modo está
l' _ 7.7 - 8.2
" -· - - ----- -1 dado por la relación:
.5
,, 9.7 - 8.2 1.5
d~ =-' - - -
.5
= -.5- = 3 Mo = Li + i
1 (
u1 .~l fl..,
..L
1 ...
)
•
.
de clasrs y fre cuencias 111 = (léase delta subíndice uno) es la diferencia entre la
mayor frecuencia y la frecuencia anterior
En una serie simple y en una serie de frecuencias, la obtención
112 = (léase delta subíndice dos.) es la diferencia entre la
del modo no ofrece problemas; como ya se explicó, éste es el valor
mayor frecuencia y la: frecuencia que le sigue.
de máxima frecuencia ; o sea, aquel que má.'> se repite en el con-
junto total. · En el ejemplo del cuadro 10.8 :
En una serie de clases y frecuencias son varios los procedimien•
tos empleados para calcularlos, pero no existe uno de aceptación
5
universal. Mo = 8.0 + .5 ( ) =8.3
El método de mayor simplicidad) poco exacto pero suficiente 5+4
para la mayor . parte de los análisis, consiste en una simple inspec-
ción de la distribución; localizar la clase con mayor frecuencia y
el punto medio de dicha clase (la clase modal) es el dato que pue•
de considerarse como el ya}or modal. En nuestro ejemplo anterior
el modo es 8.2.
Otro procedimiento consiste en el empleo de la relación empí-
rica:
¡l
En el ejemplo desarrollado : ¡
l
204 205
1 CUADRO 10.10
·~
PROBLEMAS Y RESPUESTAS
j
Clases dé edad Frecuencia Clases de edad Frecuencia
Use los datos del siguiente cuadro, para dar respuesta a los 16 a 18 126 37 a 39 17
problemas 1 a 5: 19 a 21 749 40 a 42 10
22 a 24 824 43 a 45 6
CUADRO 10.9
25 a 27 394 46 a 48 5
EDADES EN A:f-1'OS CUMPLIDOS DE LOS ALUMNOS DE LA
¡
ESCUELA NACIONAL DE ECONOM1A DE LA UNAM . 28 ,a 30 167 49 a 51 3
31 a 33 76 52 a 54 2
Edad Frecuencia Edad Frecuencia Edad Frecuencia Edad Frecuencia
34 a 36 38
36 8 46
16 4 26 136
7 47 3
27 96 37
17 25
48 1 2. Indique cuáles son: el valor mínimo, valor máximo, aro-
61 38 7
18 97 28 plitud máxima, clase modal.
3 49 3
29 57 39
19 175 Respuesta : Valor mínimo = 16 años
so o
257 30 49 40 3 Valor máximo = 54 años
20
51 o Amplitud máxima = 54 - 16 = 38 años
31 41 3
21 317 31 Clase modal = 22 a 24 años
4 52 o
32 23 42 . ~
22 332
1 53 3. ¿ Cuáles son los verdaderos límites de la primera y segunda
33 22 43 {.
23 275 j clases?
1 J
44 4 54*
217 34 19
24 Respuesta: Las edades de esta distribución están redondeadas
35 11 45 en años cumplidos, por lo que, verbigracia, una edad de 16 años
25 162
y 360 días se redondea a 16 y no a 17 años; por tanto:
* Se omiten 23 alumnos con edades de 61 y más años para simplificar ,
,¡
í
el ejercicio. 1 Límites verdaderos: 16 a 18.99
Anuario estadístico de la UNAM, 1964. -~
FUENTE : 19 a. 21.99
l. Forme una distribución de frecuencias con inten·alos igua· 4. Calcule mediana, cuartila uno, cuartila tres y quintila dos.
~
les de 3 años. )
'l Respuesta:
Respuestn : i
l
207
206
~
CUADRO 10.11 1 113.75
= 25 + - - (3) = 25 + .289 (3) = 25 + .867
394
l
28 a 30 167 2 260 91.8 -
76 2 336 = 22+ -·- (3) = 22 + .111 (3) = 22 + .333
31 a 33 821 ·
34 a 36
37 a 39
38
17
2 374
2 391
2 401
l 5~ = 22.3
40 a 42 10
43, a. 45 6 2 407
46 a 43
49 a 51
5
3
2 412
2 415
l1
5. Calcule X, cr2, cr con procedimientos abreviados.
Cuadro de trabajo:
j
52 a 54 2 2 417
CUADRO 10.12
Q, 'Li +
~ - fa
4 _ ¡ = 19 +
604.25 - 126 (3)
749
~ 34
37
a
a
36
39
38
17
35
38
4
5
152
85
608
425
2 374
2 391
40 a 42 10 41 6. 60 360 2 401 ·
43 a 45 6 44 7 42 294 2 407
478.25
= 19 + - (3) == 19 + .639 (3) = 19 + 1.917 46 a 48 5 47 8 40 320 2 412
749 49 a 51 3 50 9 27 243 2 415
52 a 54 2 53 10 20 200 2 417 :
Q1 = 20.9 ¡
_j ·-------·-
' Suma ; 2 417 -1001 544.9
3~f ¡.
---fa
1 812.75 ....: 1699 + 1 382
4
Qa = Li + i = 25 + (3) = j
~
381
f 394
208
1
209
l
J
Respuesta: Respuesta: únicamente clase modal, Md y cuantilas.
_ _ i:í:fd" 3(381) 1143
X= X' +- if = 23 + -2 417 = 23 + -2 417 = 7. ¿Por qué no es posible calcuhu Mn, Mx, Am, PD, :x, a,
a2, CV?
X = 23 + .47 = 23.47 = 23 años 172 días Respuesta: El límite inferior de la primera clase y el límite
2
superior de la última clase¡ son abiertos.
I 5 449 ( 381 )
. I ~f d" 2
a=1v---=
If
(
~
~fd" )~·
~f
= iy 2 417 - 2417 = 8. Calcule el promedio aritmético de los ingresos familiares en
el siguiente cuadro:
6. En la siguiente distribución de clases y frecuencias: Clase de ingresa Frecuencia Clase de ingreso Frecuencia
500 a 599 16 7 500 a 7 999 24
600 a 699 7 8 000 a 8 499 138
CUADRO 10.13 700 a 799 7 8 500 a 8 999 10
800 a 899 22 9 000 a 9499 39
SUELDOS MENSUALES DE LOS ALUMNOS DE FACULTADES 900 a 999 19 9 500 a: 9 999 15
DE LA UNAM QUE' TRABAJAN EN OCUPACIONES 1 000 a 1 099 42 10 000 a 10 999 139
REMUNERADAS (1964) 1 100 a 1 199 11 11 000 a 11 999 ]6
1 200 a 1 299 43 12 000 a 12 999 24
Frecuencia. 1 300 a 1 399 12 13 000 a 13 999
Clases de ingresos 5
1400 •a 1 499 24 14 000 a 14 999 10
2 009 1 500 a 1 749 157 15 000 a 15 999 39
Hasta
600 a
599
699 1 ººº
579
1 750
2 000
a
a
1 999
2 249
68
290
16 000 a 16 999
17 000 a 17 999
1
4
700 a 799 853 2 250 a 2 499 60 18 000 a 18 999 4
800 a 899 433 2 500 a 2 749 201 19 000 a 19 999
900 a 999 3 707 2 750 a 2 999 34 20 000 a 20 999 13
1-000 a 1 999 811 3 000 .a 3 499 416 21 000 a 21 999
2 000 a 2 999 317 3 500 a 3 999 207 22 000 a 22 999
3 000 a 3 999 50 4 000 a 4 499 347 23 000 a 23 999
4 000 a 4 999 262 4 500 a 4 999 109 24 000 a 24 999
5 000 y más 5 000 a 5 499 433 25 000 a 25 999 6
5 500 a 5 999 51 26 000 a 26 999
6 000 a 6 499 252 27 000 a 27 999
¿ Qué valores estadísticos de los siguientes, es posible obtener 6 500 a 6 999 28 28 000 a 28 999 1
7 000 a 7 499 119 29 000 a 29 999
de manera rigurosa?
NOTA: Se omite I.a. última clase de 30 000 y más . que tiene una frecuencia
O', (J'\ CV, clase modal, Md, cuantilas de 13. La primera clase que aparecía como "hasta 599" se ha in-
Mn, Mx, Am, PD, X, dicado "500 a 599", aunque afecte un poco los objetivos de esta
serie.
210 11 UENTE: Anuario estadístico de la UNAM, 1964.
· Respuesta: .Respuesta:
* únicamente se especifican los puntos medios de clase en la primera Respuesta: El promedio más exacto es X = 4 794.49 porque
columna. los intervalos de clase son más pequeños y esto reduce el llamado .
error de agrupamiento.
_ ~fPm 16 608 100
X = - - = - - - = 4794.49
~f 3 464
11. ¿ Cuál será el procedimiento para calcular con toda exac·
X = $4 794.49. titud X, o-, PD, CV?
9. Calcule el promedio aritmético de la distribución anterior, Respuesta: Sólo es posible cuando se calculan directamente de
!
agrupando los datos en 10 clases de ingreso: los datos individuales; es decir, en una serie simple.
l
212 213
Cuanto mayores son los intervalos de las ciases se pierde en
exactitud, pero los cálculos se efectúan con mayor facilidad.
CAPÍTULO 11
12. ¿ Es posible obtener cuantilas en series con intervalos de- LA DISTRIBUCIÓN NORMAL O CURVA NORMAL
1
siguales?
Respuest-a: Sí es posible, pero deberá cuidarse que ~l valor del
1 11.1 Características de la curva normal
intervalo que se sustituye en la fórmula, sea el que corresponda
\ La curva normal tiene las siguientes características:
a la clase que contiene a la cuantila.
1
Su representación gráfica tiene forma de campana y es si-
métrica.
La curva se extiende en ambas direcciones y a medida que se
acerca a los extremos tiende a unirse con el eje horizontal ( abs-
cisa) sin llegar a tocarlo, en otras palabras es asintótica.
Los valores correspondientes a la media aritmética, mediana
y modo son iguales (X = Md = Mo). Estos valor.es constituyen
el punto central o de equilibrio de la curva normal.
La curva normal es cóncava hacia abajo entre -1 y + 1. Es
· cóncava hacia arriba a la derecha de + 1 y a la izquierda de -1.
El área total bajo la curva es igual a l. El área a la derecha
de la media es igual a .5 y por simetría, a su izquierda es tam-
bién de .5.
GRÁFICA 11.1
ÁNEA itUAL A , 5
. ~ ~"~- •••-• A ,5
- 1 ' 1• 1 :,--- ASINTÓTICA
-co -za- -1a- _ •_1cr +za- +co
1
l
X IIEDIA AAITIIETICA
Md MEDIANA
llo 11O0.l
l
215
21.4
La curva normal tiene su origen en un trabajo que publicó 11.2 Puntajes estándar
Abraham de :tvfoivre en 1733 con el título de "Doctrina de la
Suerte". Sin embargo fue hasta principios del siglo xrx cuando
Es necesario entonces estandarizar las distribuciones normales
Gauss y Laplace redescubrieron esta curva. Gauss elaboró una
reduciéndolas a un patrón único, transformando los elatos origi·
teoría de los errores de observación con base en la curva nonnal,
nales a una nueva variable conocida con e! nombre de puntaje o
por lo que se le conoce además con el nombre de curva de Gauss
puntuación estándar y que se simboliza con la letra zeta minúscula,
o curva normal de :errores. empleando la siguiente fórmula:
Las limitaciones propias de los instrµmentos empleados por los
astrónomos para medir las distancias de la tierra a los cuerpos
celestes hacían que éstas fuei;-an diferentes unas de otras, por lo
X-X
Z=
que se consideró necesario estudiar su distribución para establecer <J
cx-·x ) cx-x )
ta_n te más pequeña que la segunda y tendríamos serias dificultades
2
para compararlas.
;:~
f -a - z /~
_!
--o
2
1 az = "\l ___
I
I =
N_ _ _
v / <J
N
-
-
216 1
j
217
de procedencia de los 51 O alumnos que ingresaron a 1a Escuela
/~cX-X)2
Nacional de Arquitectura en 1966 e: aproximadamente normal con
X = 77.5 y (f = 6.44.
.j <J . éada uno de los 51 O promedios de calificaciones pueden ser
transformados a puntajes ·estándar, con lo cual los valores de N,
X y u se transformarán a N = 1, X = O, a = °l.
Al eliminar el paréntesis de (X - X/ a-) 2, se elevan al cuadra-
Calculados los puntajes estándar o valores z recurrimos a la
do el numerador y el denominador, entonces tabla de áreas bajo la curva normal del apéndice que únicamente
proporciona el área de la p-1.edia aritmética o z = O al valor z
/ (X-X) 2 consultado, pero con una -simple resta podremos obtener cualquier
¡~-- - área, como se verá más adelante.
/ 02 /'2Hcr 2 (X-X) 2
(JZ =-..V/ = 'v/ N = Las siguientes curvas señalan algunas áreas y los principios fun-
N damentales para calcularlas.
l
IL(X-X) 2
=-
(J V N
GRÁFICA 11.2
La expresión con el radical es la fórmula de la desviación es-
tándar, por tanto: Curvo A Curva B Curva C
1 r:¡
º" = -<J
(J
=- =1(J
!
z1 y este valor se resta de .5000, que es el área de X al extremo Se requiere conocer : -1. El área b; 2. El área a., y 3. El
izquierdo de la curva. De manera similar se procede para obtener área a + b. Para obtener el área b obtenemos el valor z de X =
80.
ei área h.
El área i de la curva C se obtiene restando al área entre X y
~- 80 - 77.5 _ 2:5
X2 (zo y z2 ) el área de X a X 1 (z11 a z1 ). El área j se obtendría ~=
- a = - 6.44 = .39
6.44
con un procedimiento similar.
Continuando con el ejemplo anterior: se mencionó que la dis- En la tabla de áreas .39 equivale a .1517; o sea, 15.17%del
tribución de los promedios de calificaciones que obtuvieron 510 área total que corresponde a .1517 X 510 = 77 alumnos.
álumnos es aproximadamente normal con X = 77.5 y cr = 6.44. El área entre 77.5 y 75:
Estos dos últimos valores es lo único que se requiere para obtener
cualquier área deseada. X1 -X. 75 - 77.5 -2.5
Z1 = = 6.44 = --- .39 que equivale a
Cada uno de los 51 O promedios podrían transfomiarse a pun· a 6.44
tajes estándar, pero no es necesario. .1517 o 15.17%.
¿ Qué proporción de alumnos (área) y cuántos alumnos obtu-
vieron aproximadamente?: El signo en -.39 indica que el área se encuentra a la izquierda
. de la curva.
a) Calificaciones de i7.5 a 80; La proporción de alumnos con calificaciones de 75 a 30 es igual
b) Calificaciones de 75 a 77.5; a .1517 +. .1517 = .3034 y el número de alumnos es de 77 + 77
. e) Calificaciones de 75 a 80. = 154.
Si se desea obtener áreas en los extremos de 1~ curva procede-
remos de acuerdo con el siguiente ejemplo:
220 221
a la izquierda de la curva. En la tabla de áreas bajo la curva
Procedimbento
normal 1.16 corresponde a .3770; o sea, el área entre X == 77 .5
y X2 = 70 o z = O y z2 == 1.16. El área a la izquierda de X2 a) Consultamos en el cuerpo de la tabla y localiza!Uo~ el .valor
= 70 es .5000 - .3770 === .1230 o 12.30%. El número aproximado .2500, o el más cercano, y en la primera columna y ¡.~nglón de en-
de alumnos es .1230 X 510 == 63. · cabezado obtenemos el valor z = .67 (el valor · más exacto sería
En la gráfica las áreas que deben obtenerse son las que apare- .6745). Conocido z despejamos X 1 en la ecuación:
cen sombreadas. X1 - X
z = ---- = despejando Xi, tenemos: X, X= ZO'
(í
GRÁFICA 11.4
+X
X1 :::::; ZO'
l
222 223'
El ajuste normal a los _dat~s observados tiene por lo general
una o más de las siguientes finalidades: La distribución de los pesos_corporales observados y esperados
se muestran en el cuadro anterior.
a) Comparar visualmente para determinar si la curva normal El procedimiento para obtener las frecuencias esperadas en una
es un buen modelo para analizar la distribución real o en qué distribución ~e muestra a continuación.
medida difieren;
b) Aceptado el modelo teórico de la curva normal, determinar
a partir de éste el comportamiento de la distribución observada. CUADRO 11.2
Se podría partir del supuesto de que las diferencias entre los va-
(1) (2) (3)
lores observados y los teóricos o esperados fueron producto de los (4) (5) (6) ( 7) (8)
errores generados en las fuentes de información, por los instru- Clases Punto Límites X-X Área de
en kg. medio z=-- Área en el
mentos empleados en la medición y por otras causas; reales cr z=O a z intervalo Fe
e) Si la distribución real corresponde a una muestra de la po- ··----··· - - - - ~ - - - - - -
""' con el ajuste para estimar
blación, utilizar los valores obtenidos 40 a 42 41
39.5 -2.66 .4961
las características de la población. ;0i53 4.31 4
42.5 -2.07 ..J.808
4.3 a 45 44
Veamos el siguiente ejemplo: 45.5
.'0502 14.16 14
-1.48 .4306
46 a 48 47
En un estudio biotipológico~i- realizado por el doctor José Gó- . 1173 33.08 33
48.5
mez Robleda y otros autores en una muestra N = 282 indígenas 49 a 51 50
- .89 .3133
otomíes el promedio del peso corporal fue de 53.06 kg y S = 5.1. .1916 54.03 54
51.5
52 a 54 53 - .31 ·{ .1217
.23 20 65.42 65
CUADRO 11.1 54.5 - .28 .1103
55 a 57 56
.1975 55.70 56
Frecuencia Frecuencia 57.5 .87 .3078
58 a 60 59
Peso en kg observada esperada .1201 33.87 34
60.5 1.46 .4279
61 a 63 62
40 a 42 3 4 .0519 14.64 15
63.5 2.05 .4798
43 a 45 8 14 64 a 66 65
46 a 48 41 33 .0161 4.54 -~
66 .5 2.64 .4959
49 a 51 61 54 67 a 69 68
52 a 54 68 65 .003.5 .99
69.5 3.22 .4994
55 e. 57 46 56 70 a 72 71
58 a 60 40 34 ;"
¡i _ooos .14 O
72.5 3.81 .4999
61 a 63 5 15 ~
64 a 66 6 5 rf 73 a 75 74
.0000 .00 O
75.5 4.40 .4999
67 a 69 3 1 '
70 a .72 o o
o t 280.88
73
Suma:
a 75
~
1
282
- 281 . i
¡
Procedimiento
* José Gómez Robleda, et al., Estudio biotipológico de los otomíes,
México, UN AM, Instituto de Investigaciones Sociales, 1961. Columna l . Se consignan las clases del peso corporal que tienen
todas ellas un intervalo de 3. Para el ajuste no es necesario que los
224
225
GR.ÁFICA 11.5
intervalos sean iguales y pueden incluso tener intervalos abiertos PESO EN KILOGRAMOS DE 282 OTOMÍES.
en el límite inferior de la primera clase y en el límite superior FRECUENCIAS OBSERVADAS Y ESPERADAS
de la última clase.
72
Calumna 2. Se indican las marcas de clase o puntos medios
de cada clase. 64
EMPIRICA
Columna 3. Se indican los límites reales correspondientes a ca-
da marca de clase. Cuando la primera clase es abierta en su límite 56
inferior se consignaría .cero corrio primer límite inferior real y el 48 AJUSTADA
límite superior real correspondiente sin consignar la marca de
clase. 40
aritmética y la desviación estándar que en este ejemplo son X = Estos inconvenientes se evitan utilizando la siguiente fórmula:
53.06 kg y S = 5.1 kg.
227
226
-'~
CUADRO 11 .3
X-X
(zt) Puntaje estándar. transformado = 10 + 50
s CALIFICACIONES ORIGINALES Y PUNTAJES
ESTÁNDAR MODIFICADOS
zt = zlO + 50
Sociología Estadística Met . de inv. Promedio
por
Con la fórmula se hace una transformación lineal que convierte Calif. zt Calif. ;;t Calif. zt alumno
a los puntajes en valores positivos y evita los valores decimales re-
dondeando los resultados a números de dos cifras enteras. a 110 70 80 90 120 54 71
231
230
·; s:
'
_ f1X11 + f2Xr2 + + fkXrk }:fXr ~(X - X)r
y'=------------ ---
}:f
mr =
2:t
or - •. N
X= 8, 4, 1, 3
Cuando r = 2, entonces:
- 32 + 42 + 12 + 32 ¡x2 2:(X - Xf
x = - - -4- - - = - N =
2 22:s ill2= = a~
N
En la siguiente serie de frecuencias obtenga el primero y ~.e• En datos agrupados en frecuencias, los momentos centrados se
gundo momentos: obtienen
X 1 2 3 4 2:f(X - X) r
m,.=
f 5 4 6 5 Suma= 20 Lf
Ejemplos:
Primer momento:
•✓
Segundo momento:
CUADRO 12.1 ·
í:fX 5 + 16 + 54 + 80
x =_ = -155 = 7.75
2
232
1' 233
~fX 75
X=--=-=3
~f 25 se efectuó en el cálculo de X y u por procedimientos cortos. Para
}.;f tal efecto se .emplea la relación
~f(X - X)º
mo = = -1:f = 1
~f
X= X'+ id"
}.;f(X-X) 1 o
m1 = = -}.;f = o donde
}.;f
}.;f(X - X) 2 26
ID!?=
=- = 1.04 = a
2 X' indica un valor arbitrario
}.;f 25
valor del intervalo
ya que en todos· los casos: d" desviación en relación a un valor arbitrario dividida entre
el intervalo.
mo = 1
Aprovechando esta relación, se puede· hacer un cambio de
m1 =o variable
}.;f(Pm - X) r J;fd"r
m' ir ------
mr r
~f
}.;f
234
235
m4 = m'4 - 4m'1m'
3
+ 6m'1m'
2
- 2
·3m',i
l m'3 = iª ~
~d" 'l
f = (2~) ~ =~ = 3.6
..... 100 100
Ejemplo:
m' = ¡4 Lfd"4 445 7 120 .
4 -- - (2· 1) - = --- = 71.2
CUADRO 12.2 ~f - 100 100
INGRESOS SEMANALES DE 100 EMPLEADOS
( decenas de pesos)
Transformamos los momentos:
Ingresos
( punto tnedio) . d" fd" fd"2 fd"ª fd"4 mo = 1
t
28 15 2 30 60 120 240
--
m = 3.6 - 3(.3 ) (5.8) + 2( .3) = 3
236 237
1
-. .
,X= 4
1 7 4
GRÁFICA 12. 1
12.4 Asimetrí-a y curtosis
Las medidas sumarias y las de posición que se estudiaron an-
teriormente) si bien proporcionan muchos elementos para describir
un conjunto, pueden no ser suficientes para ciertos fines.
Es muy posible que en dos o más distribuciones de frecuencia
se obtengan medias aritméticas iguales y además idénticas desvia-
ciones estándar y sin embargo ·1as distribuciones pueden llegar a ser 6 7
t
'
CUADRO 12.3
f2 f j
X f1
1 2
o 3
2 2
3 4 !
3 4 !
f¡ 5 6 7 5 · 6 7
10
4 6
9 í B e
5
4 . 3
2
t
6 2 o i Las dos primeras distribuciones son simétricas y la última es
o
- -
2
7
t asimétrica. Es decir, en la primera y la segunda distribuciones las
i
ffi4
GRÁFICA 12.2
Coeficiente de curtosis B~ =
m2
2
La asimetría se califica por la dirección de la cola de la curva; B2 < 3 cuando la curva es platicúrtica o aplanada.
cuando ésta se encuentra a la derecha la asimetría es positiva., cuan-
do está a la izquierda la. asimetría es negativa.
Medición ,de la magnitud de la asimetría. Con los momentos GRÁFICA 12.4
240 241
!l
PROBLEMAS Y RESPUESTAS 4. Calcule los coeficientes de asiri1etría y curtosis empleando
los momentos 2 y 4 corregidos.
Respuesta:
(1, = -.12 la distribución es de asimetría negativa. Se pre-
senta un ligero predominio de los ingresos altos.
tos 2 y 4.
Respuesta: ¡t
1.
= 5.71 - - (2 2 ) = 5.38
mi (corregida) 12 1
7 ¡:
m, (corregida) = 69.99 - .2_2 (2 2 ) 5.71 + _240
_ (2~)
'
= ~
(:
= 69.99 - 2.855 + .467
= 67 .60
243
1
242
i
,1:
1
:¡
CAPÍTULO 13
REPRESENTACióN GRÁFICA DE
SERIES CRONOLÓGICAS, DE FRECUENCIAS
Y DE CLASES Y FRECUENCIAS
ILUSTRACIÓN 13 . 1
y
CUADRANTE II 8 CUADRANTE I
7
-x 6
+)(
+y
5l _
4-----,(54)
+ y
f '
3 1
2 1
ORIGEN 1
_, 1º
X , , , • , , , 1 • ,_ )(
-7-.::-'--A-"-"-' ¡· 2 3 4 5 6 7 8 9 lll
¡!
,. CUADRANTE III -2 CUADRANTE r./
,~
1:
I· - X
- y
-3
-4.
y
+X
-Y
~
k
245
;~r,
Al punto de intersección de los dos ejes se le denomina origen En la escala horizontal (abscisa), se representa la variable con-
siderada como independiente y en la escala vertical (ordenada) la
de las coordenadas o simplemente origen.
variable dependiente.
Los valores que Ee grafican en el cuadrante 1, son todos positi·
vos; los del cuadrante IIl t<Xlos son negativos; los valores del cua- Ilustraciones y leyendas en las escalas. Ambas escalas deberáh
durante II son negativos en X (abscisas) y positivos en Y (ordena- indicar claramente el tipo de unidades empleadas ( años, ingresos,
edades, etcétera) .
das) ; en el cuadrante IV los valores son positivos en X y negativos
Líneas coorde.nadas. Tienen por objeto ayudar a la lectura de
en Y. las magnitudes en cualquier punto de ·1a curva.. Se presentan como
Los ejes pueden dividirse en cualquier número de unidades
de medición, comenzando por el punto cero. Todo punto en las un enrejado dentro del cuadrante, ~e deberá tener cuidado de li-
coordenadas es determinado por sus distancias en los ejes de X_ mitar al máximo posible el número de líneas coordenadas.
Leyendas de las curvas. Se indican sobre la curva o en la parte
y Y. inferior de la gráfica, esto sólo es necesario cuando üna gráfica
En la representación gráfica de los fenómenos sociales se em·
plea por lo general el cuadrante 1; sólo en muy raras ocasiones se contiene dos o más curvas.
En la siguiente ilustración se muestran los principales compo-
utilizan los cuadrantes n, m, 1v.
Convencionalmente un par de valores se escriben dentro de un nentes de una gráfica lineal de coordenadas.
paréntesis separados por una coma; el primero de dichos valores
debe corresponder a la abscisa y el segundo a la ordenada; es de-
cir, en el orden alfabético xy. Por ejemplo: en la ilustración an- GRÁFICA 1'3.1
terior aparece señalado el punto (5,4). (A) EXPORTACIONES E iMPORTACIONES DE MÉXICO
( B) (1956-1965)
19
le ~C) }-__J
-13.2 Principales .<:omponentes HD) "'1E)._,_ /
de una gráf Íca lineal 17
16 / 1 1
- .i---
Núm,ero de la gráfica. Tiene por objeto facilitar su localización ( M) IMPORTACIONES ..411,
15 !--
dentro del texto y además facilitar su fácil referencia. _l.,""'
14 .- - -
Título. Se indica generalmente en la parte superior, aunque en # J
~46 247
.,1
·1
11
(F) diferenciación de curvas (sólido y achurado)
(G) origen
( H) absci&a o eje de X
( I) números en posición horizontal de ser posible 1956 195·7 1958 1959 1960 1961 1962 1963 1964 1965 X
y
(J) números de la escala Y 12 .7
248 249
~
anchura igual -cuando se trata de . una serie de frecuencias--
13.3 Representación gráfica de
las series de frewencias y proporcional a la longitud del intervalo, en una serie de clases y
frecuencias; en este último caso el centro de la base de los rectán-
Hist·ograma de frecuencias. La representación gráfica de una gulos corresponde al punto medio de clase.
serie de frecuencias; .es decir, en una serie donde los valores de la Las áreas de los rectángulos son proporcionales a las frecuen-
i
característica no se agrupan en cl;ses, puede presentarse en un his- cias de las clases.
tograma de frecuencias. Por ejemplo: , La representación gráfica mediante un histograma de Íl~ecuen-
cias de lós datos del cuadro 13.1 puede hacerse de· acuerdo con la~
1
!
frecuencias absolutas (2á. columna) o con las frecuencias relativas
CUADRO 13.1 ¡ ( 3a. columna) .
j
¡
¡
FAMILIAS CENSALES (ACEPCIÓN MEXICANA)* SEGÚN
EL NúMERO DE SUS MIEMBROS (1960)
( miles de f ami[ias) j
Frecuencias Frecuencias
il GR.ÁFICA 13 . 3
Número de ~iembros l
1
absolutas relativas FAMl!,..IAS CENSALES {ACEPCIÓN MEXICANA)
de la familia
SEGÚN EL NÚMERO DE SUS MIEMBROS
,.
') 815 12.7 y
14.0 1
3 900 1100
4 926 14.4
1 088 16.9
5 1000
6 791 12.3
7 637 9.9 ] 900
8 480 7.5
5.1
·e
9 330 -; 800
10 y más 462 7.2
e 700
.':!
--8
¡
, 100.0
Suma: 6 429 i: o
600
* "Entiéndese por familia censal el conjunto de personas generalmente o...
vinculadas ·por el parentesco que hacen vida común bajo un mismo techo; <11 500
es decir, el jefe de familia, los parientes que viven con él y aquellas otras "
fi'
E
,::,
personas que participan de esa vida en común por razones de trabajo u ~ z 400
ir
otro vínculo. Las demás personas que comparten los cuartos ocupados
por la familia o que disponen . de cuartos separados en la misma vivienda,
pero toman sus comidas con la familia, se consideran también corno· miem- 300
bros de la familia." <11
i 251
1,
250.
1 11:
¡I
-~:
!II ¡,
l,
:J
El histograma anterior corresponde a la representación gráfica 13A Representación gráfica de ·distribucwnes ·
1
,! de las frecuencias absolutas. con intervalos desiguales
·¡·, .! Las frecuencias absolutas al expresarse en porcentajes reciben
¡ los nombres de distribución relativa de frecuencias o distribución Cuando un histograma corresponde a una serie de clases y fre-
·:I
¡~ p·orcentual de frecúencias. Su representación en un histograma cuencias donde todas las clases tienen igual intervalo, entonces la
'.'.li; recibe los nombres de histograma de frecuencias relativas, histogra- ·altura de cada barra o rectángulo será ·igual a su respectiva fre-
l: I .
1 •
ma de po7centajes o histograma de. proporciones, según el casó.
El histograma de la gráfica 13.3 se transforma a uno de fre-
cuencia de clase.
Como es sabido algunas distribuciones tienen intervalos dife.-
.. 1 :
·! i cuencias relativas con el cambio de· la escala vertical de valores rentes; en estos casos no todas las alturas corresponden a. la fre-
!! absolutos a porcentajes, sin que la representación gráfica se altere. cuencia en el intervalo.
; 1:
"' ! Por ejemplo: Es usual que en distribuciones con intervalos desiguales se tie-
1 ne un intervalo que es .el predominante y al cual denominaremos
l1:: intervalo-patrón. Al intervalo de clase específico; es decir, al que
concretamente calculamos su. altura, le llamaremos intervalo de
GRAFICA 1:3.4 clase.
FAMILIAS CENSALES (ACEPCIÓN MEXICANA) SEGUN Si un intervalo es el doble de ancho que otro deberá ser ex-
EL NÚMERO DE SUS MIEMBROS presado así en la gráfica.
i
1
Llamaremos frecuencia normalizada a la altura que tiene la
I
¡ barra en el gráfico y ésta se obtiene multiplicando la frecuencia de
y
' .
clase por el intervialo patrón y dividiendo el producto entre el in-
¡ :( 17
tervalo de clase.
1 1 16
f
,!
.. .,
. :r
J
~
14
12
Frecuencia de clase X intervalo patrón
intervalo de clasa
= frecuencia normalizada
J
:i
f to
Cuando el intervalo de una clase es igual al intervalo patrón, la
w
o 8
altura de la barra corresponde a-la frecuencia de esa clase ya que
..,
w se cancelaría en la ecuación anterior el intervalo del numerador
~ ;z 6 con el del denominador:, porque la frecuencia normalizada sería
j
w igual a la frecuencia de clase.
l1 ,,. o
« 4 Ejemplo: representar un histograma de frecuencia con la si-
!' o
1
1
(l. guiente distribución de los ingresos diarios de 125 trabajadores.
,. 2
1 il
X
o Z 3 4 5 6 7 8 9 10 y mas
252 253
¡¡¡
1
,¡ ..
ill,I
~ 1 , •• ..,,
,¡
:¡
13.5
GRÁFICA
GRÁFICA 13.6
HISTOGRAMA INCORRECTO HISTOGRAMA CORRECTO
10
40
40
30
30 25
25
20
20
20 12
15
lO
8 2 10
10 u11) u11)
10 ...... ....1-<
5
o ou 5
u ¡:.:
.....i:: .....
: 50.5 60.5 70.5 80.5
.1
i 100.5 140.5
70.5 80.5 100.5 140.5
j ·: 50.5 60.5
~ ¡i Es obvio que si los 30 trabajadores están comprendidos en un
¡¡ :'
intervalo de 20, si dividimos en dos intervalos de 10 a cada ínter·
1! ,. CLASES DE INGRESO valo le corresponden 15 trabajadores. ·Lo mismo sucede con la úl-
l! tima clase ya que si los 20 trabajadores se dividen entre 4 inter-
!\ 51 a 60 10 valos, entonces a cada intervalo le corresponderá 5 trabajadores.
11 25 L~ alturas de la primera, segunda y tercera clases, correspon·
I ' 61 a 70
ji den a la frecuencia que se les asigna en la gráfica 13.6 pero esto
80 40
.!
1::
···¡ 1
:
71 a no acontece con las frecuencias cuarta y quinta.
30 · El intervalo patrón es 10 para toda la distribución. La altura
!!t1 : 81 a 100
de las cinco son:
1'1 . ¡
20
i'; : 101 a 140
j 125
¡' Suma: Para la primera clase
10 X 10
i;
10
= 10
¡
f
20 X 10 GRÁFICA 13.7
Para la quinta clase = 5
40 POBLACIÓN DE MÉXICO -POR GRUPOS DE EDAD
{ MILES DE HABITANTES)
y
13.5 Histograma y polígono en 11000
series de clases y f1iecuBncias 10000
El histograma en una serie de clases y frecuencias difiere · en el
9 000
eje de las equis respecto al histograma de frecuencias, pues en
el primero las bases delos· rectángulos tienen su centro en el punto 8000
medio de clase.
El histograma se construye levantando líneas verticales en los <t 7000
256 257
j•·
Para construir una distribución acumulativa de. frecuencias ab-
Es posible demostrar que la suma del área de los rectángulos
solutas y de por'centajes:
en el histograma es igual al área contenida debajo del polígono de
frecuencias . El histograma y el polígono de frecuencias de una se-
rie de clases y frecuencias pueden ser representados en porcentajes, .a) Se registra ei valor de la primera frecuencia en el primer
con el remplazo de las frecuencias absolutas por sus valores relati- renglón;
vos y con el cambio correspondiente en la e~cala vertical. Los po-
(7) A la primera frecuencia se le suma el valor de la siguiente
lígonos de este tipo reciben los nombres de polígonos de frecuen·
frecuencia y la suma se registra en un segundo renglón; el valor
cías relativas, de porcentajes y de proporciones. así obtenido constituye la primera frecuencia acumulada;·
CUADRO 13.3
Se construyen con la representación gráfica de. las frecuencias
acumuladas y constituyen un valioso auxiliar en el análisis de los
POBLACIÓN DE MÉXICO POR GRUPOS datos.
DE EDAD EN A:ti'rOS CUMPLIDOS
Las ojivas penniten obtener, sin necesidad de cálculos laborio-
( miles de habitantes)
ws, el valor de las cuantilas ( cuartilas, quintilas, decilas, percenti-
Frecuencias acumuladas las) , basta para ello una simple inspección visual.
Frecuencias Relativas
Relativas Absolutas Las oji\'as corresponden al tipo de gráficas conocidas con el
Clases de edad Absa-lutas
nombre de analítfoas y pueden ser, según se verá más adelante, oji-
11094 31.9
11 094 31.9 vas "menos de" y ojivas "más de".
Hasta 9 18 988 54.6
7 894 22.7
10 a 19· 24 440 70.3 Para construir una ojiva es necesario elaborar un cuadro que
5 452 15.7
20 a 29 28 412 81.7
3 972 11.4 registre las frecuencias acumuladas. Para obtener una. ojiva mmor
30 a 39 31 007 89.2
2 595 7.5 de se procede de la manera siguiente:
40 a 49 32 870 94.5
1 863 5.3
50 a 59 34 029 97.8
1159 3.3
60 a 69 34 550 99.3
521 1.5 a_\ En una primera columna se registran sucf'.5Ívamente los lí-
70 a 79 34 810 100.0
260 .7
80 o más f• mites inferiores de las clases, del primero al último;
34 810 100.0
Suma: b) Se indican las magnitudes de las frecuencias acumulada~
VIII Censo General de Poblacián, Secretaría de Industria y con Yalores menores a cada límite inferior.
FUENTE:
Comercio, Dirección General de Estadística, junio, 1960.
259
258
t:;
1~
•·
La escala para registrar las frecuencias se dividió en 10 partes
CUADRO 13.4 iguales; como la máxima frecuencia acumulada es de 34 81 O, ~
cada intervalo de la escala le corresponde 3 481.
FRECUENCIAS ACUMULADAS MENOS DE
Si en la ojiva anterior deseamos conocer con cierta aproxima-
ción cuántas personas tienen edades menores ·a 35 años, elevamos
Frecuencias
Relativas una línea vertical a partir de 35 años en el eje horizontal hasta °la
Edades Absolutas
ojiva y de este punto una línea horizontal a la frecuencia acumu-
· 11 094 31.9 lada o al porcentaje acumulado, en donde la graduación · del eje
Menos de 10
Menos de 20 18 988 54.6 indicará la frecuencia o el porcentaje con edades men_ores a 35
Menos de 30 24 440 70.3 años; en ·este caso es aproximadamente de 26 456; o sea, el 76%,
!
n412 81.7
Menos de 40 cifra que sólo varía ligeramente a la del valor censal que _es de
31 007 89.2
Menos de 50 26 492 miles de habitantes.
Menos de 60 32 870 9't.5
97.8
. ¡l Para obtener el valor de una cuantila se localiza en el eje de
Menos de 70 34 029
99.3 l
Menos de 80 34 550 !1 frecuencias acumuladas el valor correspondiente a la mitad de la
100.0
Menos de 81 y más* 34 810 1
¡ suma de frecuencias. Por ejemplo para la Md el valor será 34 810
entre 2 = 17 405, que corre~ponde en el eje horizontal a 18 años ·
* Si la última clase fuera cerrada, por ejemplo: de 80 a 90, podríamos
aproximadamente; es decir, la mitad de los habitantes del país en
indicar menos de 91; pero corno en este caso no es así, se expresa
menos de 81 y más.
1960 tenían menos de 18 años. Este. valor puede localizarse a par-
tir de la escala graduada en porcentaj_es, sin necesidad de efectuar
ningún cálculo.
El principio en que se fundamenta la localización de valore5
GRÁFICA 13.8 intermedios; esto es, no especificados en el cuadro, consiste en la
OJIVA MENOS DE interpolación de dichos valores y por ·10 mismo supone que la ca-
100
<ll 34810 racterística se distribuye uniformemente en los intervalos.
<l -~ ~ 1/)
~ 31329 ..... 90
o Una ojiva puede construirse sin importar que las clases sean
/ o
:: 27848 ._ __ --- --- I✓- --- --- --- ---o
80
75%
<l
J
;:JI/)
desiguales o que la distribución tenga clases abiertas, tanto en el
~ 70 límite inferior de la primera clase, como en el límite superior de
/
::) 24367 1 ~<t
o ::,-
<t 20886
1 60 oº la última clase.
~
(/)
<l 17405
.
V 1
1
<(
50% lll:, Para construir una ojiva más de se especifican los límites supe-
ü
2 13924
/i -
1
1
40
,L!J
l&JÜ
et: O:
riores, pero en vez de "menos de" se les califica como "más de".
a
1
w V 1
1 1
__ ,. 30
1-LL
Zw
l&I
10443
kt--j --+ --
_ 1__
1
--- --- - -- 25% ~ O Por ejemplo:
20 O:
/a',= 8 M~¡1 8
Q'. 6962
LL a 3 = ~4 o
10 a.
I
3481
'
•
1
~
o
10 '
20 30 40 50 60 70
o
261
260
CUADRO . 13.5
'
50 W:,
~
l&J ~
:, 13924
- -- --- -1x --- --- --- --- -- - 40
o;i¡
IIJ
.., <(
a la población total se presentan en el cuadro 14.1. La primera co-
lumna indica las clases de ingresos y la segunda las frecuencias de
-
:, 10443
·o 30 ~
~
1
llJ 6962 1 z familias correspondientes a cada clase. La tercera columna con-
a: 1
r--,..... 20 ~
ll. 3481 1 (r
o tiene el ingreso promedio de las familias en cada clase de ingreso.
1 ...... I"'-- ...._ o
1
Q.
En la cuarta columna se especifica el ingreso agregado o total
1
o 9 19 29 39 49 59 69 - 79
EDADES EN AÑOS CUMPLIDOS de cada clase, el cual se obtiene multiplicando el ingreso medio de
cada clase poi: su frecuencia correspondiente.
En la ojiva "más de" localizamos con cierta aproximación cuál
es el número de unidades con valores superiores a una determina-
da magnitud. En la ojiva se obsen,a que 13 641 personas tienen
más de 25 años. i:)
l
. t
u
262 :jj
263
~!¡¡¡
~
- 'I
.,
.., --.
C)
O<ONNCC')lOON.-.<O
-
c.,~ o oai<!i o~r-: .... ai<!i<!i
. , e. .
OO')O'l O')C:Ot---t.O'Q"'N..-1
" ¡,:
t:uJ.-<
,...._
... __, En la columna 5 se presentan las frecuencias absolutas de fa-
<O
<O 't:!
C) ·~
<, milias en porcentajes. En la columna 6 se traducen los ingresos de
Ol
...... ~
;:I
~
<, ·~
ti cada clase a porcentajes. Con estas dos columnas (5 y 6) tenemos
~
1:
q·~~
"~--. 0.-.--iNO')t---Lt')..-1~('("')
o<.o,.....;ll')cr;~ ......;r.é~N
o
¡.:¡
;:I
<, " · -<
OO'>OOC.OU"')"q"'C'-1..-1 · una cierta información sobre la distribución del ingreso; así, por
~ 1:., ejemplo; el 3.9% de las familias de menores ingresos perciben el
~t/J ..,
::i
¡.:¡
.... "
.::\)1=! "" ....
\) co
bJJ__..
~-
.,
C)
si' :OCXll'-L'"lOCXlOl,;l<O
Q.:c-jO)u-iCNcici~~O ~
0.4% del ingreso; un 15% de las familias perciben el 3.4% del in-
greso; 15.9% de las familias percibe el 6% del ingreso; en el
~ <,
..
... ¡,:
¡,: ....
'P"'"'I N cr, l.'") r-.. CO O
.... «s
ü último renglón el 2.3% de las familias c~n mayores ingresos per-
~
o
~ ·e" .., ~ os
cibe el 16.6% del ingreso.
P-1 lJ~- O')O')C:0.-tCt')ll")O')-tr--,.O
u
Si se hace una acumulación creciente de las familias, por- una
-~
-
<.
r-< «ic:o~<.<:i<J:i.,¡.'.:<i.,.;r-:o «s
z :2:; li") E
¡:; cisas se gradúan ,en una escala de O a 100%. El eje horizontal
o... r
-abscisas- corresponde a los porcentajes acumulativos de la po· ·
~
o
::i .2 blación; el eje vertical --ordenadas- corresponde al porcentaje
i:Q 'O
acumulativo de los ingresos.
º º º º º º º º º .. CJ
~ ººººº""'ººº
,...Nc<1,:j<l0l'-OOO,«s
.... N e<) El
E
.o
o
t/J
a",...._ ., ~
,, .......
o,o.....,
'O «s «s «s «s «s «s «s «s
.,
~
.s
b/J
!!:,, ¡,:
.... 5o_.o ............
o o o o ~, o o o " _¡ ...... ...,._. ............
E ~
~.-<NC'J...,..lOl'-000 ;:t 265
:!!/
• ~ 1;
~ ,..... NCt') e,:,
*
:·¡ ~:.i;
GRAFICA 14. 1 Una vez que la Curva de Lorem: ha sido construida, podemos
responder a interrogantes como ésta: ¿ Qué porcentaje de los in-
100 gresos le corresponde al 50%, de las familias de menores ingresos?
(f)
g 90
1/ Para responder esta cuestión localizamos el 50% en el eje horizon-
<t.
cr / tal, y hacia arriba podemos apreciar que el punto de intersección
i/
·o
z
80 con el otro eje es aproximadamente de 18%; la respuesta a la
w
~
70
J pregunta es: el 50% de las familias de menores ingresos perciben
wo
..1,,.,
o,,.,
C/lW 60 V I sólo el 18% del ingreso total.
En tanto que la curva se aproxime a la diagonal, más equita-
oa:
00
<tZ 50
V ) tiva será la distribución del ingreso; cuanto más se aleje la curva
:!:º
..J-
Cj (/)
Cjj 40 / ,Jv de la diagonal, más desigual será la distribución. El. grado máxi-
u <t
<( .
(f) V ~
/ mo de desigualdad se dará cuando la cun-a esté más próxima al
ángulo inferior derecho.
tJ>'<t. 30
.., ;:¡¡ ~
~
uJ
20
V / La Curva de Lorenz permite comparar la magnitud de la con-
15
<.) V -/~ centración independientemente del tipo de unidades empleadas, ya
a:
o
a.
10
1~i..-- ~ ... que ésta se expresa en valores relativos (porcentajes). Por ello es
posible romparar si la distribución de la tierra está más o menos
O 10 20 30 40 50 60 70 80 90 100
PORCENTAJES ACUMULADOS DE FAMILIAS DEL MENOR coneentrada que el ingreso, no obstante que la primera se inida
A LOS MÁS ALTOS INGRESOS en hectáreas y la segunda en pesos.
La Curva de Lorenz puede construirse no obstante que los in-
tervalos de las clase, sean desiguales y también en ,el caso de que
La diagonal en el cuadro indica cómo sería la representación •
!
se presenten intervalos abiertos en la primera y última clase, si se
r conoce el valor medio de los ingresos para dichas clases.
gráfica de la distribución del ingreso en la población si ésta fuera !·
~
completamente equitativa; es decir, un 10% de las familias perci- r La Curva de Lorenz puede aplicarse al estudio de la distribu-
~
biría el 10% de los ingre~os, un 20~~ de las familias .el 20% de f ción de la tierra; por ejemplo, si se dispone de la información de
l
los ingresos, y así sucesivamente. ~·
266 267
.,
-~
·1
CUADRO 14.2
14.2 GRi\FICA
"' 80 L
500 000 y más
250 000 a 499 999
3
2
4166
551
.00
.00
11.9
1.6
.0-0
.00
11.9
13.5
~
. ~ -:g
B.!:!
u u
C:
70)
¿
100 000 a 249 999
75 000 a
50 000 a
99 999
12
9
1 795
799
.02
.01
5.1
2.3
.01
.03
18.6
20.9
-el
Q,) .D
8.
"'o o.... 60
L
40 000 a
74 999
49 999
15
11
932
485
.02
.01
2.7
1.4
.05
.06
23.6
25.0
'O
'5 8 50
(I!
e:
ClJ
V
30 ººº 'ª
20 000 a
39 999
29 999
40
38
684
940
.02
.04
1.9
2.7
.08
.12
26.9
29.6
1
1
t
E ro
3 . . 40
ro o L
/ '
1
j
>--
10 000 a 19 999 146 2 028 .16 5.8 .28 35.4 l "' ro
í -~ E: 30
¡
-¿
j
i
5 000 a 9 999 340 2 366 .38 6.8 .66 42.2 "'.., QJ
2 500 a 4 999 865 2 959 .97 8.5 1.63 50.7
¡
r¡ ~
~ -o
20
r- r- -
,...._ --- - - --- -
1 000 a 2 499 3 342 4 _995 3 .73 14.3 5.36 65.0 o
~
o.. r, 1
500 a 999 6 156 4 254 6.87 12. 2 12.23 77.2 .. ' .'
.) 1
---- - -. - - .,
~
t 10 1
~
100 a 499 18.3 42.47 95.5
~
27 098 6 41 0 30.24 1
1 1
1 a 99 51 555 1 558 57 .53 4.5 100.00 100.0 1; !,...-- 1 1
--
Suma : 89 612 34922 100.00 100.0 ¡,f lO 20 · 30 40 50 60 70 80 90 100
Porcentajes acumulados de la población
FUENTE: VII Censo General de Población, México, 1962.
,,. 268
,,:r- 269
~ j·
¡t
,• ¡I1
t: j
La fórmula indica el área contenida entre la curva y la diago- PROBLEMAS Y RESPUESTAS
nal. Una distribución equitativa (señalada por la diagonal) dará
un índiée igual a cero; a medida que la distribución es cada vez
más desigual, el índice se acercará a más l. Dado que X e Y son Las siguientes distribuciones muestran los ingresos _mensuales
de las familias de los alumnos de la Escuela Nacional de Enfer-
porcentajes) cada producto resulta multiplicado dos veces por 100
mería y de la Escuela Nacional de Comercio y Administración de
-por 10 000-, por ello el numerador se divide entre 10 000.
la UNAM en el año de 1964.
La curva toma la forma de la gráfica 14.2 cuando X crece
más rápidamente que Y, y en tal caso la ~urva se encuentra por
debajo de la diagonal; si Y crece más rápidamente que X enton•
ces la curva se sitúa robre la dia.gonal y el límite del índice de CUADRO 14.3
Gini sería menos l. Ejemplo de cálculo: en la distribución del
, r 1
' ingreso familiar, correspondiente a los datos del cuadro 14.l, cal· Frecuencias
culamos el índice con los porcentajes acumulados -crecientes ( co- Clase de ingreso ENE END~
lumnas 7 y 8) : ·
' ! •
''i 500 a 999 212 361
¡
1 95.l X 83.4 = 7 931.34 X 15 000 a 19 999 59
_¡.
97.7 X 100.0 = 9 770.00 100.0 X 83.4 = 8 340.00
100.0 20 0('10 a 29 999 3 27
100.0
~--
= -31 665.50 ~(X¡;.,)Y 1 = 26814.95 i:
¡
~Xi (Y¡+ 1 ) <: Suma: 807 5 419
IG = = = .485 = .48 t
Én el 0nuario aparece una primera clase ·'h"¼sta 599" y la. última
[
NOTA:
10 000 10000 clase "más de 30 000", ambas las cerran,os arbitrariamente con
r
¡ objeto de calcular los puntos medios.
·¡
· l. En dos cuadros de trabajo efectúe las operaciones necesarias
para graficar una Curva de Lorenz.
\'1
ft 271
1:,
,\ 270
\,¡,
1i\
1l \l .
·1lt ,
h¡.·
,-¡ ,,
Respuesta: 2. Presente las dos distribuciones en un gráfico de Lorenz y
compárelas.
CUADRO 14.4
Respuesta:
ESCUELA NACIONAL DE ENFERMERÍA
/ I
47 211.5 5.8
4500
1.4 4.4 98.4 88.5 "'
/;b
6 500 11 71.5
2.7 99.0 91.2 .5 70
/
.6
/
8 750 5 43.7
.5 3.1 99.5 94.3 d)
"'
"'
'iu 30 / ,¡/- ~
CUADRO 14.5
ª~
QJ
·V ,A'
V
.,
20
ESCUELA NACIONAL DE COMERCIO Y ADMINISTRACIÓN ~
10 / ~
~
~
~
Ingreso Porcentajes % Acumulados
Punto medio Fami- Ingre-
del grupo Fami- lngre-
( de las clases Frecuen- sos 10 20 30 40 50 60 70 80 90 100
lías sos lias
de ingreso) cia (miles$) Porcentajes acumulados de familias
1.2 6.7 1.2 - - Escuela Nacional de Enfermería
361 271 6.7
750
9.0 .2.7 15.7 3.9 -- -- Escuela Nacional de Comercio y
1 250 486 608
20.9 10.3 36.6 14.2 Administración
2 000 1 131 2 262
20.2 14.9 56.8 29.1
3 000 1 093 . 3 279
25.1 27.8 81.9 56.9
4 500 1 361 6 124
8.1 13.0 90.0 69.9
6 500 442 2 873 (El gráfico muestra que el grado de concentración del ingreso
4.0 8.7 94.0 78.6
8 750 220 1 925 familiar es muy similar en ambas escuelas)
4.4 13.6 98.4 92.2
12500 239 2 988
4.7 99.5 · 96.9
59 1 032 1.1
17 500 3.1 . 100.0 100.0
27 675 .5
25 000 -100.0
- 3. Calcule el ingreso familiar promedio en ambas distribucio-
Suma : 5 419 22 037 zoo.o
nes. Interprete dichos promedios comparados con la concentraci6n.
1
:. --
,. ,
Í!i 272 273
i ,1 i
j-J.
, ,¡,
í'
"!:i\\".
li\. ~
5. Calcule el índice de Gini a la distribución de ingresos fa·
Respuest,a:
miliares en la Escuela Nacional de Comercio y Administr~ción.
1619 200,
Escuela de enfermería: = $2 006
Respuesta:
807
Escuela de comercio:
22 037 000 = $4 067
CUADRO 14.7
5 419
ESCUELA NACIONAL DE COMERCIO Y ADMINISTRACIÓN
(No obstante que los. promedios difieren considerablemente, el
grado de concentración es muy similM'. El promedio no afecta
x. (Y,+ iJ (X,+ iJ yi
el nivel de concentración.)
1.2 6.7
4. Calcule el índice de Gini a la distribución de ingresos fami-
6.7 X 3.9 = 26.l 15.7 X 1.2 = 18.8
liares en la Escuela Nacional de Enfermería.
15.7 X 14.2 = 222.9 36.6 X 3.9 = 142.7
Respuesta:
36.6 X 29.1 = 1 065.1 56.8 X 14.2 = 806,6
CUADRO 14.6
56.8 X 56.9 = 3 231.9 81.9 X 29.1 = 2 383.3
x. Y,+1 X,+1 Y,
81.9 X 69.9 = 5 724.8 90.0 X 56.9 = 5 121.0
9.8 26.3 f
48.1 X 9.8 = 471.38 90.0 X 78.6 = 7 074.0 94.0 X 69.9 = 6 570.6
26.3 X 23.4 = 615.42 ¡,
48.1 X 57.1 = 2 746.51 81.9 X 23.4 = 1 916.46 i
91.2 X 57.1 = 5 207.52
1
¡ 94.0 X 92.2 = . 8 666.8 98.4 X 78.6 = 7 734.2
81.9 71 .0 = 5814.90
X
97.0 X 71.0 = 6 887.00 ¡
91.2 X 84.1 = 7 669.92
98.4 X 96.9 =
88.5 = 8 584.50 98.4 X 84.1 = 8 275.44 9 535.0 99.5 X 92.2 = 9 173.9
97.0 1
¡
X
98,4 X 91.2 = 8 974.08 99.0 X 88,5 = 8 761.50
99.5 X 91.2 = 9 074.40 99.5 X 100.0 = 9 950.0 100.0 X 96.9 = 9 690.0
99.0 X 94.3 = 9 335.70
99.5 X 95.4 = 9 492.30 99.6 X 94.3 = 9 392.28
100.0 X 95.4 = 9 540 .00 ~(X¡)(Y 1 + 1 ) = 45496.6 }:(X1 + 1 ) (Y1 ) = 41 641.1
99.6 X . LOO.O = 9 960.00
JG = .37
275
274
¡·
\·
1
i
:! ~
Información para prácticas estadísticas
CUADRO 14.8
CAPÍTULO 15
INTEGRACION TERRITORIAL DE LA REPúBLICA MEXICANA
POR GRUPOS DE HABITANTES (1970) NÚMEROS tNDICE DE PRECIOS Y CANTIDADES
% Simples % Acumulados
Locali- Población Locali- Pobla- Locali- Pobla- 15.1 Emple,o de los números índice
Número de dades ci6n
habitantes dade-s (miles) dades ci6n
Los números índice son medidas estadísticas que se emplean fre-
0.00 11.5 0.00 11.5 cuentemente para mostrar los cambios que se operan en un compo-
500 000 y más 4 5 535
nente o grupos de componentes relacionados entre sí: costo de vida
0.01 4.1 0.01 15.6
250 000 a 499 999 6 1 972 al consumidorJ salarios, costo de la alimentación, costo de alquileres,
7.7 0.04 23.3 precios y cantidades de materias primas, de productos manufactu·
100 000 a 249 999 24 3 735 0.03
rados, de productos de importación y exportación, etcétera. Son
0.01 2.3 0.05 25.6 -muchas las decisiones en la economía que toman en consideración
75 000 a 99 999 13 1114
los números índice.
28.2
ººº 0.02 2.6 0.07
74 999 21 1 242 Los procedimientos que se emplean en la obtención de los nú-
50 a
1.8 0.09 30.0 meros índice están basados en la aplicación de los porcentajes.
49 999 19 858 0.02
40 000 a
Por ejemplo: el índice de precios al mayor~C\ en la ciudad de
0.03 2.1 0.12 32.1 México, calculado sobre 210 artículos, fue para el año de 1964
30 000 a 39 999 30 1 016
35.3
de 148. l % si se compara c~n el año de 19541 en el que el índice
0.19
20 000 a 29 999 65 1 532 0.07 3.2
J¡ fue de 100%, Los índices anteriores indican que kts precios al ma-
0.25 7.1 0.44 42.4 ¡' yoreo se incrementaron en 48.1 % de 1954 a 1964.
10 000 a 19 999 248 3 410 f,
13.2 6.56 72.0 Un índice simple e.9 el resultante de dividir el precio, cantidad o
· 1 000 a ·2 499 4 232 6 366 4.34
valor de un artícµlo, en un periodo determinado de tiempo entre
7.66 10.7 14.22 82.7 el precio, cantidad o valor de ese mismo artículo, en \,In per:iodo
500 a 999 7 473 5 190
considerado como base.
28.75 14.3 42.97 97.0
100 a 499 28 055 6 889 frecws relativos. Un ejemplo sencillo de un número índice lo
57 .03 3.0 100.00 100.0 constituye un preicw relativo, que es el porcentaje resultante de divi-
55 650 1 471
1 a 99
--
100.0
dir el precio de un artículo o mercancíai en un tiempo dado,' entre
97 580 48 225 100.00 el precio en otro tiempo llamado base y de multiplicar este co-,
- ciente por cíen.
FUENTE: IX ce-nso general de población, 1970, SIC, DGE. Ejemplo: El precio del kilogramo de sal refinada en la ciudad
\ l
277
!¡i -
276
i;\
J.
. I¡
· i!