Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Escala Nominal
Escala Nominal
2. Hacer una lectura global de los contenidos del curso, los alcances y límites
del mismo, así como el fundamento de los temas que se van a tratar.
Para muchos parece una materia lejana, pero la Estadística y muchas de sus herramientas nos
acompañan diariamente, aunque no nos percatemos de ello. Durante el curso tendremos oportunidad de
ver ejemplos muy familiares y entender algunos términos que escuchamos y manejamos diariamente.
Este primer módulo nos introducirá en el mundo de la estadística, particularmente la estadística
descriptiva, aprendiendo el vocabulario y los conceptos fundamentales para poder abordar los próximos
temas. También repasaremos algunos procedimientos matemáticos que usaremos durante todo el curso..
¿Qué es la ESTADISTICA? Estadística, es algo más que la recolección y publicación (tal cual se
ven en revistas y diarios) de hechos y datos numéricos. Es la aplicación del método científico de análisis
de datos numéricos, con el fin de tomar decisiones racionales.
Estadística será tratada aquí como una Ciencia que trata de la recopilación, presentación, análisis e
interpretación de datos numéricos (estadísticas) con el fin de realizar una toma de decisiones más
efectiva.
Su origen en la historia… La estadística científica tal como se entiende actualmente tiene sus
origenes en el SXIX, cada vez más vinculada a la teoría de la probabilidad. Dos puntos de referencia
básicos son los trabajos de F. Galton, fundador de la biometría, y de K. Pearson que sentó las bases de la
estadística moderna.
Sin embargo, los orígenes de las herramientas estadísticas pueden ser rastreados al menos hasta el
antiguo Egipto y más atrás aún. El interés por el registro sistemático sobre la población y los recursos
económicos y la elaboración de instrumentos matemáticos de resumen de la información aparecen desde
la antigüedad vinculados con la administración y la política de los gobiernos.
2
Si te interesa conocer más sobre la historia de la estadística te recomendamos leer:
El origen de la palabra… La palabra "estadística" procede del latín statisticum collegium ("consejo
de Estado") y de ella deriva el término italiano statista ("hombre de Estado" o "político"). A su vez, el
término alemán Statistik es introducido por Gottfried Achenwall en 1749 al publicar su obra Compendio de
la constitución política de los principales países y pueblos europeos , asociándolo con el análisis de datos
del Estado, es decir, "la ciencia del Estado" . Sin embargo, recién a partir del siglo XIX el término
comienza a ser utilizado en su acepción moderna.
Para entender el alcance que tiene el presente curso debemos en primer lugar entender los conceptos de
ESTADISTICA DESCRIPTIVA y ESTADISTICA INFERENCIAL o INDUCTIVA.
3
Nuestro curso, por la carga horaria y los objetivos que se ha planteado, va a realizar un recorrido básico
por herramientas de estadística descriptiva.
Sin embargo, es necesario considerar que una parte fundamental de la disciplina estadística está
dedicada a la INFERENCIA. En ella, se incorporan los conceptos de variable aleatoria, distribuciones de
probabilidad, estimadores e intervalos de confianza, entre otros, que no utilizaremos en el curso.
Rodriguez, Mayte: Estadística aplicada a las Ciencias Sociales II.Licenciatura de Sociología. Curso 2001/02.Universidad
autónoma de Madrid
http://www.uam.es/personal_pdi/ciencias/mayter/docencia/sociolog/apuntes.pdf
Con las herramientas estadísticas que vamos a trabajar durante este curso vamos a describir el
comportamiento de conjuntos de individuos, instituciones, países, etc. pero no vamos a utilizarlas para
generalizar los resultados a una población mayor. Esto lo veremos con detenimiento al hablar del
concepto de POBLACION y MUESTRA.
Sin embargo, veremos que estos instrumentos y métodos nos habilitan a realizar análisis sumamente
útiles, a partir de la descripción de nuestra población. Y, por otra parte, como plantea el texto de Mayte
Rodríguez, constituyen el punto de partida para los procedimientos de la Estadística Inferencial.
Por ejemplo:
Cuando queremos conocer el perfil de los trabajadores de una empresa podemos averiguar las
características de todos los empleados, con lo cual no necesitamos “inferir” ninguno de los
resultados. Alcanza con generar formas de resumen de la información para describir el
4
comportamiento de toda la plantilla de trabajadores. Es una aplicación de la estadística
descriptiva.
Pero, si la empresa fuera muy grande, podríamos optar por encuestar o averiguar la información
sólo de un subconjunto de esos trabajadores. En este caso, tendríamos que recurrir a la teoría
de muestreo para tener mecanismos que me “garanticen” una elección al azar de los empleados
entrevistar y a la teoría de la probabilidad para a partir de los resultados obtenidos para ese
grupo, generalizar a toda la plantilla de trabajadores. En este caso, entonces, estaríamos frente
a procedimientos propios de la Estadística Inferencial.
Por una parte, en lo que queda de este módulo veremos algunos conceptos fundamentales que nos
permiten comenzar a trabajar con las herramientas estadísticas. Entender qué es una población y
una unidad y cómo caracterizo a esas unidades a través de variables, que tienen un sistema
de categorías y una escala de medición. A partir de estos conceptos podemos elaborar la idea
de matriz de datos originales, que contiene toda la información que tengo sobre la población.
En los módulos 1, 2, 3 y 4 aprenderemos cómo describir una población en base a una de sus
características (descripción univariada), sea a través de tablas, gráficos y medidas resumen
(estadísticos).
En el módulo 5, veremos como describir una población en base a dos características simultáneamente.
Los últimos 3 módulos incluyen herramientas más específicas, que pueden ser de mucha utilidad para la
investigación y los análisis en el ámbito de las relaciones laborales:
En el módulo 6, veremos una forma de medir y comparar el grado de concentración de recursos que se
distribuyen en una población (por ejemplo, qué grado de desigualdad hay en la distribución del ingreso
total del país, o la masa salarial de una empresa, entre todos los miembros de esa población).
El módulo 7 está dedicado a la presentación de algunos estadísticos que nos permiten analizar el
comportamiento del mercado de trabajo. Los estadísticos que vamos a estudiar habitualmente se
construyen en base a muestras y constituyen estimaciones de los valores de la población (parámetros),
pero no vamos a profundizar en este aspecto sino que trataremos de entender su construcción y uso.
Finalmente, el módulo 8 presenta dos herramientas que están vinculadas al análisis temporal de datos.
Veremos en primer lugar los números índice nos permiten analizar la evolución de una característica
numérica en el tiempo. Algunos números índice tienen incidencia cotidiana en nuestra vida, como
tendremos oportunidad de ver al llegar a ese módulo final del curso. También nos familiarizaremos con los
5
conceptos de inflación, precios corrientes y precios constantes, y obtendremos una herramienta que nos
permite comparar precios tomados en distintos momentos del tiempo.
Los estadísticos, en cambio, son medidas de resumen calculadas sobre los datos provenientes de una
muestra, que en estadística inferencial se utilizan para estimar los valores correspondientes a nivel de la
población (parámetros). Es decir, son herramientas que asumen determinados valores, construidas en
base a los datos de observaciones. También podemos encontrarlas mencionadas como estadísticas.
En el curso aprenderemos a calcular varios estadísticos. No los veremos, sin embargo, en su “función” de
estimación de los valores poblacionales, ya que no trabajaremos con la inferencia estadística.
POBLACIÓN o UNIVERSO: Es el conjunto de elementos sobre el que se realiza el estudio. Debe estar
acotada en espacio y tiempo.
Ejemplos de poblaciones en estudios de ciencias sociales:
habitantes de un barrio o un país, alumnos de una escuela, empresas, organizaciones, partidos políticos,
ciudades, países, etc.
Lo fundamental al definir una población es que sea acorde a los objetivos que nos planteamos en el
estudio y que esté delimitada en el tiempo y en el espacio, de modo que sea identificable y podamos
distinguir entre quienes componen la población y quienes no.
MUESTRA: Al recoger datos relativos a las características de una población muchas veces es difícil,
costoso o poco práctico observar todo el grupo, sobre todo cuando se trata de conjuntos grandes.
En ese caso, se relevan los datos sólo para una parte de la población, a la cual se le llama MUESTRA.
Una muestra tomada con determinados criterios de aleatoriedad (para ello nos servimos de la teoría del
muestro) puede considerarse representativa de la población y los estadísticos que construyamos a partir
de ella permiten realizar estimaciones sobre lo que sucede con esas características en toda la población.
6
Como ya dijimos, estas estimaciones corresponden a la estadística inferencial, que se basa en la teoría
de las probabilidades. Existe un margen de incertidumbre sobre las conclusiones que se sacan para la
población y se trabaja bajo determinados supuestos sobre la pertinencia de generalizar a la población a
partir de la información obtenida en al muestra. En estos casos, la estadística descriptiva se encarga de
resumir la información y analizar solamente la muestra, sin inferir conclusiones sobre la población.
Por ejemplo: para estudiar el mercado de trabajo en Uruguay periódicamente, no se entrevista a todos los
habitantes del país sino que se toma una muestra de hogares e integrantes de los mismos, a los cuales
se les aplica la Encuesta Continua de Hogares.
En cambio, cuando se realiza un Censo de Población, se entrevista a todas las personas que se
encuentran en el país ese día. Dentro de los temas que releva el Censo de Población se incluye el del
mercado de trabajo.
En el caso de la Encuesta de Hogares, obtenemos el número de desocupados de la muestra, el cual sirve
para estimar la desocupación a nivel de toda la población (por lo cual hay una margen de error, una
incertidumbre sobre en qué medida ese valor es el que corresponde a la población). En el caso del
Censo, el número de desocupados nos indica (salvo errores de relevamiento) la desocupación en el país,
sin esa “incertidumbre”.
Durante este curso vamos a trabajar bajo el supuesto que siempre estamos observando a todos los
elementos de la población, es decir, realizando un CENSO.
Extraído de Bueno, Concepción y Escudero, Tomás: Apuntes de Estadística para profesores.Curso 2006/2007.Instituto de
Ciencias de la Educación.Universidad de Zaragoza
7
La población está compuesta por las UNIDADES DE ANALISIS.
La UNIDAD DE ANALISIS es el elemento mínimo de una población y de una muestra, en tanto se lo
considera como poseedor de ciertas propiedades, atributos o características denominadas variables. Por
ejemplo: los estudiantes univesitarios son unidades de análisis si consideramos su año de ingreso, su
centro de estudios o su edad. O, por ejemplo, los centros de estudio universitario son unidades de análisis
si consideramos su número de estudiantes; cantidad de salones; números de docentes por materia. En
nuestros estudios, nos interesará relevar las carácterísticas de la unidades de análisis y sacar
conclusiones sobre la población en base a esta información.
Para obtener los datos de las unidades de análisis debemos relevar la información. Las herramientas para
relevar la información pueden ser entrevistas (encuestas) pero también podemos obtener información de
registros administrativos, documentos, artículos de prensa, observación directa.
La UNIDAD DE RELEVAMIENTO es la Unidad que aporta la información para la construcción del dato
estadístico. Muchas veces coincide con la unidad de análisis, pero en otros casos no. Por ejemplo, si
estamos interesados en estudiar características de los hogares (por ejemplo: los ingresos del hogar, el
número de miembros que trabajan, etc.) nuestro relevamiento lo haremos sobre los miembros del hogar
(les preguntaremos por sus ingresos y su condición laboral). Pero cuando construyamos los datos,
tomaremos esa información y caracterizaremos con ella al hogar. En este caso, la unidad de relevamiento
son los miembros del hogar pero la unidad de análisis (que es la que queremos estudiar) son hogares.
Hemos visto que nos interesa caracterizar a nuestra unidades de análisis. De ahora en adelante
hablaremos de VARIABLES, como los instrumentos que nos permiten hacer esa caracterización. Una
VARIABLE es una propiedad, atributo o característica de una unidad de análisis, susceptible de adoptar
diferentes valores o categorías.
Los valores o categorías que adopta una variable constituyen un SISTEMA DE CATEGORIAS. Este
sistema tiene dos propiedades fundamentales: sus categorías deben ser MUTUAMENTE EXCLUYENTES
y el sistema debe ser EXHAUSTIVO para la población en estudio.
Sigamos con el ejemplo del estudio de los hogares de acuerdo a su nivel de ingresos y al número de
miembros del hogar que trabajan.
Tenemos dos variables.
La primera podemos llamarla INGRESOS DEL HOGAR, y vamos a construir un sistema de categorías
para ella. Supongamos que relevamos los ingresos de todos los miembros de un hogar. Con esta
información podemos obtener el dato que corresponde a ese hogar. Deberemos hacer lo mismo con cada
uno de los hogares que constituyen nuestra población en estudio.
Obtenidos nuestros datos para todos los hogares, queremos expresar el sistema de categorías de esta
variable.
8
Un sistema de categorías posible podría ser cada uno de los valores obtenidos, por ejemplo: $2000,
$4500, $ 7000, etc.
Para explicitar un sistema de categorías así (que tiene muchos valores posibles), lo mejor es buscar el
valor más bajo y el más alto y expresarlo como:
$ 2000, ….., $ 70000.
Otro sistema de categorías posible, si no nos interesa tener tan desagregada la información, podría ser
identificar a los hogares en esta variable en tramos de ingreso.
Por ejemplo: $ 2000 a $10000, $10001 a $40000, $40001 a 70000.
En este caso tendríamos tres categorías en nuestro sistema y los hogares tendrían como valor o
categoría en esta variable su pertenencia a uno de los tres tramos (nos “olvidamos” de sus valores
originales.
Pero nos interesa entender las propiedades del sistema de categorías. Supongamos que tenemos este
segundo sistema.
Si hubiéramos armado los tramos de esta manera: $2000-10000, $10000-40000, $40000-70000,
tendríamos dificultades para saber a qué categoría corresponde un hogar que tiene $10000 como
ingreso. ¿En qué categoría lo coloco? ¿En la primera (2000 a 10000) o en la segunda (10000 a 40000)?
A esto nos referimos con la idea que las categorías deben ser mutuamente excluyentes. Frente al
sistema, no tengo que tener duda de cuál es la categoría que le corresponde a cada unidad.
Supongamos ahora que mi sistema es $ 5000 a $10000, $10001 a $40000, $40001 a 70000. ¿Cuál es la
categoría que le corresponde al hogar que gana $2000? No tengo ninguna categoría que lo incluya. La
idea de exhaustividad implica que mi sistema debe “cubrir” todos los valores posibles de la variable para
mi población.
La exhausitividad de un sistema de categorías está relacionado con la población en estudio: si por
ejemplo estamos estudiando el nivel educativo de un país, nuestro sistema de categorías para esa
variable tendría que tener por ejemplo, las siguientes categorías:
Sin instrucción, Primaria, Secundaria-UTU, Terciaria y posterciaria.
Sin embargo si estoy estudiando el nivel educativo de una población de menores de 16 años, alcanza con
tener el siguiente sistema: Sin instrucción, Primaria, Secundaria-UTU, ya que la educación terciaria no ha
de aparecer como categoría para ninguna de las unidades de análisis de esta población por la edad que
tienen.
La información sobre nuestra población la vamos organizar en una MATRIZ DE DATOS. Una matriz de
datos contiene en sus filas a cada una de las unidades, en sus columnas a las variables que caracterizan
a esas unidades. Y cada celda está compuesta por el valor que asume la variable de esa columan para la
unidad de análisis de esa fila.
9
Un DATO, en el contexto de nuestra disciplina es el valor que toma una variable en una unidad de
análisis. Por esta razón se dice que su estructura es “tripartita”: refiere simultáneamente a la unidad de
análisis, a la variable y a la categoría o valor.
En la matriz de datos esta estructura tripartita se hace visible, al presentar las unidades en las filas, las
variables en las columnas y el DATO como “cruce” de esos dos “vectores”.
Siguiendo nuestro ejemplo de los hogares, una matriz de datos podría ser:
Ingresos del Número de miembros que
hogar trabajan
Hogar 1 $2000 2
Hogar 2 $70000 4
Hogar 3 $ 4500 0
….
Que indica que el hogar uno tiene $ 2000 de ingreso y trabajan 2 de sus miembros, en el hogar 2, el
ingreso es $ 70000 y trabajan 4 miembros, etc.
La matriz de datos tiene tantas filas como el tamaño de la población y tantas columnas como variables.
10
«MEDICIÓN Y ESCALAS DE MEDICIÓN»
¿Qué se mide?
«La medición es un método que permite establecer correspondencias entre magnitudes de un mismo
género, y ciertas clases de números (integrales, racionales o reales)» en Russell (1938);
«Medir es asignar numerales a las propiedades de los sistemas materiales según las leyes que presiden
esos atributos» (Campbell, 1938);
«Es la atribución de numerales a los objetos o sucesos conforme con leyes o reglas» (Stevens, 1951).
Lo que destaca de cualquiera de estas definiciones es que si bien la medición se realiza sobre los
elementos u objetos (unidades de estudio) son las variables las que posibilitan la división en clases. Esto
nos abre a la necesidad de conocer la naturaleza de las variables para conocer como medir sus
propiedades.
Comenzaremos con un ejemplo que nos introducirá en la idea de naturaleza distinta de las variables.
Dada una población puede decirse cuáles de los individuos son solteros, casados, divorciados o
cualquiera otra categoría de la variable "estado civil". Pero sobre estos mismos individuos se puede decir
cuáles no tienen hijos y cuales sí. Sobre este segundo atributo de las unidades de registro se puede,
además medir cuales no tienen hijos, cuales tienen un hijo, cuales dos, etc…. Ahora bien, si relevamos
la característica “tener o no tener hijos” es diferente de si relevamos cuantos hijos tiene, a pesar que las
característica de interés es la misma. Lo que difiere son las mediciones en los modos en que se
manifiesta la variable.
En el caso de "tener hijos", el acto queda restringido a clasificar las unidades de registro y/o análisis que
muestran la presencia o ausencia de un atributo; se le puede asignar un número a esta característica,
pero no es cuantificable. Son características cualitativas. En el segundo caso, se puede estimar
objetivamente no sólo la presencia o ausencia de determinado atributo (tener hijos), sino también la
intensidad con que la propiedad se manifiesta, propiedad que se asume en cantidades.
Basándose en esta diferencia entre las formas de clasificar variables por referencia a este criterio de
calidad-cantidad, la Estadística distingue, ya en un grado mayor de complejidad, la medición de acuerdo
al tipo de escala o nivel de medición, en que se encuentran expresados los atributos que queremos medir.
11
Se trata de operaciones clasificatorias, o sea, ubicación de las unidades de análisis en clases, clases que
tienen ciertas propiedades formales. De estas propiedades se deducen definiciones exactas de las
características de la escala mucho más precisas de lo que pueden darse en términos verbales. Estas
propiedades pueden formularse en forma más abstracta de lo hasta aquí expresado, mediante un
conjunto de axiomas que delinean las operaciones para elaborar las escalas y las relaciones entre los
objetos a que se aplican.
A. LA ESCALA NOMINAL
Consiste en clasificar objetos o fenómenos, según ciertas características, tipologías o nombres, dándoles
una denominación o símbolo, sin que implique ninguna relación de orden, distancia o proporción entre los
objetos o fenómenos.
En la escala nominal los números sólo sirven para distinguir categorías, estos no poseen propiedades
cuantitativas y sirven solamente para identificar las clases. Por lo tanto, los numerales utilizados en la
clasificación no son cuantitativos. Ni siquiera se puede realizar un orden de las observaciones con
sentido.
La medición se da a nivel elemental en estos casos (se dice que es el nivel más bajo de medición)
En una escala nominal, la operación de escalamiento consiste en partir de una característica dada y
formar un subconjunto de clases que se excluyen mutuamente. La única relación implicada es la de
equivalencia. Esto es, los miembros de cualquier clase deben ser equivalentes en la propiedad medida.
La relación de equivalencia es reflexiva (x = x para todo x), simétrica (x = y luego y = x) y transitiva (x = y
et y = z luego x = z).
Los símbolos que designan a los diferentes grupos en una escala nominal pueden intercambiarse sin
alterar la información esencial de la escala; debido a esto, las estadísticas de tipo descriptivo admisibles
son aquellas que no se alteran por este proceso: el modo, la frecuencia, el conteo, la proporción, etc. Se
pueden desarrollar procesos analíticos acerca de la distribución de las categorías, así como la posible
12
relación entre dos o más características clasificadas mediante este tipo de escala que llamaremos
“variables cualitativas”.
B. LA ESCALA ORDINAL
Para las mismas personas también se pueden medir propiedades donde la clasificación debe seguir un
orden jerárquico. Se trata de la escala ordinal. Con ella se establecen posiciones relativas de los objetos o
fenómenos en estudio respecto a alguna característica de interés, sin que se reflejen distancias entre
ellos.
Suponga que a los clientes en un negocio se les hace unas preguntas para valorar la
calidad del servicio. Los clientes valoran la calidad de acuerdo a las siguientes respuestas:
1 (Muy satisfecho), 2 (satisfecho), 3 (Insatisfecho), 4 (Muy insatisfecho). Estos datos son
ordinales. Note que una valoración de 1 no indica que el servicio es dos veces mejor que
cuando se da una valoración de 2. Sin embargo podemos decir que la valoración de 1 es
preferiblemente mejor que 2, y así en los demás casos.
Puede suceder que los objetos de una categoría de las escala no sean precisamente diferentes a los
objetos de otra categoría de la escala, sino que están relacionados entre sí, guardan una relación de
jerarquía. Los numerales empleados en las escalas ordinales no son cuantitativos, sino que indican
exclusivamente la posición en la serie ordenada y no "cuantifican" la diferencia entre posiciones sucesivas
de la escala.
13
Las relaciones entre los elementos en clasificación, pueden formularse con el signo >, mayor que, o sea
que axiomáticamente la diferencia fundamental entre una escala nominal y una ordinal es que esta última
incorpora no solamente la relación de equivalencia (=) sino también la relación ''mas grande que'' (>).
Esta relación es irreflexiva (no es verdad para ninguna x tal que x > x), asimétrica ( x > y luego x < y ) y
transitiva (x > y et y > z luego x > z ).
Puesto que cualquier transformación tendiente a conservar el orden no altera la información contenida en
una escala ordinal, se dice que la escala es "única hasta una transformación monotónica". Esto es, no
importa que números se den a una pareja de clases o a los miembros de esas clases, siempre que el
número mayor sea dado a los miembros de la clase mayor o mas preferida. Por supuesto, pueden usarse
números menores para grados mas preferidos (3. de primera clase, 2. de segunda clase, 1 de tercera
clase); en tanto se sea consecuente, es indiferente el uso del número mayor o menor para denotar
"mayor" o "mas preferido".
Fundamentalmente, las escalas ordinales se estudian en Estadística, con base en las llamadas
"estadísticas de orden" o "estadísticas de rango": máximos, mínimos, mediana, percentiles, etc…
1º Muy Satisfecho
Satisfecho
2º Insatisfecho
3º
4º Muy insatisfecho
C. LA ESCALA DE INTERVALO
Representa un nivel de medición más preciso, matemáticamente hablando, que las anteriores. No sólo se
establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide también la
distancia entre los intervalos o las diferentes categorías o clases. En este caso, la medición se ejecuta en
el sentido de una escala de intervalo; esto es, si la asignación de números a varias clases de objetos es
tan precisa que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se
ha obtenido una medida de intervalo. Una escala de intervalo está caracterizada por una unidad de
medida común y constante que asigna un número real a todos los pares de objetos en un conjunto
ordenado. En esta clase de medida, la proporción de dos intervalos cualesquiera es independiente de la
14
unidad de medida y del punto cero. En una escala de intervalo, el punto cero y la unidad de medida son
arbitrarios.
Axiomáticamente se puede ver que las operaciones y las relaciones en que se origina la estructura de
una escala de intervalo son tales que las diferencias en la escala son isomórficas a la estructura de la
aritmética. Los números pueden asociarse con las posiciones de los objetos de tal manera que las
operaciones de la aritmética puedan realizarse significativamente con las diferencias entre los números.
La consecuencia de cualquier cambio de los números asociados con los objetos medidos en una escala
de intervalo debe preservar no solamente el orden de los objetos sino también las diferencias relativas
entre ellos. Esto es, la escala de intervalo es "única hasta una transformación lineal". La escala de
intervalo es la primera escala verdaderamente cuantitativa. Las estadísticas paramétricas, son las
aplicables a estudios en estas escalas.
2050
2000
1950
1900
Suponga que se está interesado en algún período histórico específico y se están haciendo proyecciones
demográficas. Se quiere conocer el crecimiento poblacional cada 50 años. Obviamente los datos pueden
ser ordenados (semejante a los datos ordinales) en orden ascendente indicando pasado/s y futuro/s
sucesivamente. Además , las diferencias entre los valores ordenados pueden ser comparadas. Aquí el
intervalo entre los valores de los datos 1900 y 1950 representan un incremento en la historia de 50 años,
y lo mismo en los demás intervalos. Hay que tener encuentra que en esta escala no hay un cero absoluto
o real, el cero es arbitrario; depende del tipo de calendario que estemos usando.
La presente base de datos tiene por objeto presentar información detallada de la población de
los 20 países de América Latina, desglosada por edades simples y años calendario,
correspondiente al período 1950 - 2050. Estas estimaciones se generan a partir de las
proyecciones nacionales utilizando un procedimiento diseñado en el Área de Demografía del
Centro Latinoamericano y Caribeño de Demografía- División de Población
(CEPAL/CELADE). Una parte de esta información (1995 - 2005) se publica en este Boletín
Demográfico (No. 66) y corresponde a las estimaciones y proyecciones vigentes, sustituyendo
así las publicadas en el Boletín Demográfico No. 60 de julio de 1997.
15
año Población Total América
Latina
1950 160.685.269
2000 507.932.043
2050 800.592.305
D: LA ESCALA DE RAZON
Cuando una escala tiene todas las características de una escala de intervalo y además un punto cero real
en su origen, se llama escala de razón. Además de distinción, orden y distancia, ésta es una escala que
permite establecer en que proporción es mayor una categoría de una escala que otra. El cero absoluto o
natural representa la nulidad de lo que se estudia. Las operaciones y relaciones hechas con los valores
numéricos en una escala de razón son correspondientes a una escala isomórfica de la estructura de la
aritmética. Por consiguiente las operaciones de la aritmética son permisibles en los valores numéricos
asignados a los objetos mismos, así como también en los intervalos entre los números como sucede en
las escalas de intervalo. Implican que las relaciones de equivalencia, relación de mayor a menor,
proporción conocida de dos intervalos y proporción conocida de dos valores de la escala, sean posibles
de obtener operacionalmente. Los números asociados con los valores de la escala de razón son
"verdaderos" números con un verdadero cero; solo la unidad de medida es arbitraria. Así la escala de
razón es "única hasta la multiplicación por una constante positiva". Además de los procesos paramétricos
básicos de las escalas de intervalo, en las de razón pueden utilizarse estadísticas como la media
geométrica, el coeficiente de variación, las que requieren el conocimiento del verdadero valor cero
16
Ejemplo de variable de razón: número de miembros del hogar ocupados
Suponga que se quiere medir los ingresos percibidos por las distintas personas empleadas en una
empresa de servicios. Los valores relevados han sido, 2, 1 – 2, 2 – 2,3 …… en miles de pesos. El orden
(ordinal) y la diferencia (intervalo) en el ingreso percibido puede ser comparado, pero también el
incremento de lo percibido de 2.0 a 2.1 es de 100 pesos (o 0,1 miles de pesos), el cual es el mismo que
el que existe entre 2.2 y 2.3 miles de pesos. También, cuando comparamos los pesos de 2.0 a 2.2 miles
de pesos, se encuentra una razón significativa, quien gana 2,2 gana 10 % más que quien gana 2, 0 miles
de pesos.
A menudo, datos provenientes de escalas ordinales numéricas son tratados como si fuera información
verdaderamente cuantitativa, lo que constituye una falacia, pues no miden, aunque sí clasifican. En este caso
se encuadran los tests psicométricos, (las evaluaciones de desempeño, las calificaciones de los alumnos en la
facultad1), los cuales únicamente pueden estimar el orden de puntuación, pero nunca la distancia entre dos
valores. Con mucha frecuencia, las puntuaciones de dichos procedimientos reciben tratamiento de variables
interválicas y, consecuentemente, el cálculo de medidas de tendencia central y dispersión, además de otras
operaciones derivadas de ellas. Dichas operaciones no son válidas por cuanto asignan a las escalas un status
que en realidad no tienen.
1
El texto entre paréntesis es agregado del autor
17
EJERCICIOS
1. En este módulo es importante entender algunos conceptos básicos antes de seguir adelante.
Responde las preguntas y realiza las actividades siguientes, que sintetizan los principales aspectos del
módulo.
Piensa ejemplos de Estadísticos que puedan resultar útiles para aplicar en el campo de las
relaciones laborales.
Distingue entre población y muestra. Cita ejemplos de estudios para los cuales sea factible trabajar
con toda la población (censo) o con muestras. Fundamenta.
Piensa ejemplos de variables con sus sistemas de categorías. Identifica el nivel de medición.
2. Identifica las escalas de medición de las siguientes variables, de acuerdo al sistema de categorías que
se les ha asignado.
Categoría de Patrón
ocupación Empleado público
Empleado privado
Cooperativista
Trabajador por cuenta propia
Trabajador familiar no remunerado
3. Se quiere realizar un estudio para conocer el perfil de la plantilla de trabajadores de una empresa
comercial del área del supermercadismo.
Imagina qué características podrían ser de interés estudiar. Identifica las variables que se corresponden
con esas características y el sistema de categorías que les asignarías. Menciona el nivel de medición de
cada variable.
Construye la estructura de la matriz de datos en la cual se volcaría la información recogida.
18
4.La figura siguiente muestra una de las páginas del formulario de la Encuesta Nacional de Hogares
Ampliada, con preguntas que se relevan de cada integrante del hogar.
Identifica las variables que aparecen, así como sus sistemas de categorías y
niveles de medición.
19
ANEXO: REPASANDO ALGUNOS CONCEPTOS
MATEMATICOS
Sumatoria:
i n
X 1 X 2 ... X n X i
i 1
Por ejemplo:
i 4
Podemos expresar la suma como una sumatoria: X
i 1
i , lo cual simplifica la notación y está
i4
X
i 1
i X 1 X 2 X 3 X 4 3 8 17 5
20
Veremos que esta notación es importante para expresar varias de las herramientas estadísticas que
veremos durante el curso.
La suma de una expresión que es la suma de dos ó más términos es igual a la suma de las
sumas de los términos por separado:
i2
(X
i 1
i Yi Z i ) (2 5 8) (4 1 1) 21
X i Yi Z i (2 4) (5 1) (8 1) 21
i 1 i 1 i 1
• La suma de una constante multiplicada por una variable es igual que la constante multiplicada por la
suma de la variable, esto es
Ejemplo:
aX
i 1
i 3 * 5 3 * 4 3 * 2 33 a X i 3 * (5 4 2) 33
i 1
21
Ejemplo:
i 3
Sea a=4, y n=3, 4 4 4 4 3 * 4 12
i 1
a c ac 2 3 23
ejemplo:
b b b 4 4 4
a*k c*k a c 2 *5 3*5 2 3
*k ejemplo: *5
b d b d 3 4 3 4
Una razón entre dos cantidades es una comparación por cociente, para lo cual nos servimos de las
a
fracciones: , tanto para expresarla como para calcularla. Sin embargo, muchas veces encontramos
b
esta otra notación: a:b.
22
Por ejemplo:
Decimos que hay una razón de 12 obreros cada 5 administrativos en una determinada empresa. En este
caso los obreros están en un conjunto distinto al de los administrativos. En cambio si decimos hay una
razón de 8 obreros cada 20 empleados de la empresa, estamos comparando un subconjunto (obreros)
con el conjunto total (empleados).
a c
La propiedad: a * d b * c , se denomina propiedad fundamental de las proporciones.
b d
La forma de verificar la proporcionalidad es comprobar que los productos cruzados son iguales.
Por ejemplo, el jornal diario de una determinada categoría laboral en una empresa es de $200 por 4 horas
de trabajo. Se paga por hora trabajada, sin que el valor hora se modifique por jornadas con distinta carga
horaria. Entonces, el trabajador que realiza una jornada de 6 horas, va a ganar $300.
200 300
4 6
y esto lo podríamos verificar haciendo el producto cruzado, que debe dar el mismo resultado:
200*6=300*4=1200.
La propiedad fundamental de la proporcionalidad permite aplicar la llamada “regla de tres”, para hallar
un valor que es proporcional a otro.
En el ejemplo que utilizamos, si sabemos que por 4 horas de trabajo pagan $200, y que el jornal es
proporcional al número de horas, entonces podemos hallar cuánto gana alguien que trabaja 6 horas
usando la regla de tres:
4 ----- 200
6 ------ x
Que leemos como: “4 es a 200, como 6 es a x”, haciendo referencia a la idea de proporcionalidad.
23
b*c
c ---- x x
a
Las proporciones a 1: Estas proporciones son fracciones que comparan un número con 1.
a
Para hallar la proporción de a en relación a n: P . Por ejemplo, si queremos saber qué proporción
n
de integrantes de un hogar trabajan, a sería el número de integrantes del hogar y n el total de integrantes
del hogar (dentro de los cuales están incluidos los miembros que trabajan).
Proporción que trabaja = número de integrantes que trabajan/total integrantes del hogar
Los porcentajes: son fracciones que se obtienen al comparar un número con 100.
a *100
P%
n
En el ejemplo anterior:
% que trabaja = número de integrantes que trabajan*100/total integrantes del hogar
Cuando se tiene una proporción, alcanza con multiplicar ésta por 100 para obtener el porcentaje.
En el próximo módulo utilizaremos estas dos herramientas para construir las distribuciones de frecuencias
relativas y las frecuencias relativas porcentuales
24