Está en la página 1de 9

¿QUÉ HAY EN UN NÚMERO?

Los puntos tratados en el presente capítulo son independientes de los temas


estudiados hasta ahora. Al lector, probablemente no se le habrá ocurrido pensarlo antes, pero
lo cierto es que (¡prepárese para la gran revelación!) los números se utilizan de maneras
diferentes. Los números son símbolos, y a veces se los utiliza de manera muy improvisada. No
obstante, por otra parte, cuando satisfacen determinados requisitos, pueden también usarse de
modo sumamente preciso. Tiene importancia saber qué tipo de número es un valor o
puntuación, ya que ello determina, en parte, el tipo de análisis o tratamiento estadístico que
puede aplicarse a los datos.

NIVELES DE MEDIDAS

En primer lugar, vamos a echar un vistazo a los diferentes tipos de números que
existen. Puesto que todos los números describen o miden algo (una variable), se dice que los
distintos tipos de números alcanzan un cierto nivel de medida. Por lo que hace al tipo de
capacidad discriminatoria que poseen, las medidas pueden situarse a un nivel muy tosco e
impreciso, o pueden ser algo más exactas, o sumamente finas. Hay cuatro niveles de medida,
que se relacionan a continuación en orden de precisión creciente.
1. Nominal
2. Ordinal
3. De intervalo
4. De razón (o de proporción, o de cociente)

Los distintos niveles poseen cada uno sus características propias y están o no
permitidas determinadas operaciones matemáticas, en función de las características propias
del nivel en cuestión. Si se violan las reglas, puede muy bien suceder que el resultado de los
cálculos sea un número que parezca tener sentido, pero que al examinarlo más detenidamente,
se vea que es un disparate. Pronto descubrirá el lector qué quiero decir.

1) LA ESCALA NOMINAL

A este nivel, los números se utilizan simplemente para clasificar cosas. Nos dicen algo
acerca de los fenómenos subyacentes, pero no demasiado… De hecho, resultaría igualmente
adecuado utilizar otros símbolos, tales como letras del alfabeto, formas geométricas o colores.
A veces podría utilizarse igualmente una descripción verbal en lugar de un número, pero con
frecuencia se prefieren los números porque las descripciones verbales ocupan más espacio y

Trancripción del libro : Frances Clegg, “ESTADÍSTICA FÁCIL”,Capítulo 10


se tarda más en decirlas o escribirlas. El ejemplo “clásico” del tipo nominal de números lo
constituyen los dígitos que aparecen en los dorsos de las camisetas de los futbolistas. Dichos
números informan acerca de cada uno de los jugadores –por ejemplo, de su posición en el
campo- sin más que darle un vistazo. Es claro que no resultaría factible sustituir tales números
por una descripción verbal. Imagínese las palabras “a mitad de campo, a mano derecha” en
lugar de un solo dígito. Sin embargo, sería perfectamente posible, y tendría sentido, sustituir los
números de las camisetas por letras, o por símbolos geométricos, o incluso por colores
distintos de las propias camisetas. (Aunque, entonces, ¿cómo se reconocerían entre sí los
equipos? Se necesitaría otro sistema.) Tal y como se utilizan, cada dígito representa una
posición; y, para proteger el sano juicio de futbolistas y espectadores, los símbolos se ajustan a
un sistema aceptado internacionalmente.

Otros ejemplos de medidas nominales, que no implican necesariamente números, son


los siguientes: los grupos sanguíneos, los tipos de queso, los esquemas de clasificación
psiquiátrica, la matriculación de automóviles, las líneas de autobús y los números de los
presidiarios. Las letras A, AO, O; las denominaciones gruyere, manchego, de bola; los términos
esquizofrenia, depresión, etc., podrían muy bien sustituirse por números sin que perdieran
sentido o información. Por ejemplo, en el caso de la calificación psiquiátrica, los médicos
podrían ponerse de acuerdo sobre los síntomas que definen una categoría y referirse a dicha
categoría por su número. Nótese que el uso de un único símbolo para indicar una categoría no
significa necesariamente que se trate de una variable sencilla, o que pueda clasificarse
fácilmente. Eso es algo muy distinto.

Propiedades de la escala nominal

Lo único que representa la escala nominal es una equivalencia. Si se asigna un número


determinado a varios objetos o fenómenos es porque, como sucede en los ejemplos anteriores,
éstos son semejantes entre sí. Por ello he dicho que si los futbolistas adoptaran un nuevo
sistema para codificar sus posiciones en el campo, todo el mundo tendría que asumirlo –de lo
contrario, la información sólo sería útil para un equipo determinado y no habría manera de
generalizarlo a otros equipos- . Si todo el mundo utilizara las mismas categorías, pero las
simbolizara de manera diferente, sería posible realizar una traducción. Por ejemplo, se sabría
que la posición representada en un equipo por una estrella es la misma que la representada en
otro por un círculo, o por una camiseta amarilla en un tercero, etc. Así pues, cuando se trata
de datos nominales el único término pertinente es el “igual a” (=). La escala nominal ilustra
adecuadamente por qué las operaciones aritméticas (y los tests estadísticos) dependen de lo
que representen efectivamente los números. Aunque se podrían sumar todos los números de
las camisetas de un equipo de fútbol, obteniendo como resultado 66, ¿qué significaría esa
suma? Se podría incluso ir más allá y calcular un promedio del total, obteniendo una media de
6. ¿Qué diablos representa ese número? Desde luego, no representa la posición que ocupan

Trancripción del libro : Frances Clegg, “ESTADÍSTICA FÁCIL”,Capítulo 10


“por término medio” todos los jugadores en el campo… Los resultados de sumar, restar,
multiplicar o dividir valores nominales están completamente desprovistos de sentido, aunque es
fácil caer en la trampa de creer que, como son números, representan efectivamente alguna
cosa. La situación es muy parecida a la de la precisión espuria mencionada a propósito de las
cifras decimales. Quizá se pregunte el lector por qué demonios se utilizan números con
carácter nominal, aparte de consideraciones relativas al tiempo y al espacio. Hay otra razón y
es que si las categorías se numeran del 1 en adelante, el mayor número usado indicaría
cuántas categorías forman parte del esquema. Ello puede a veces, constituir una información
útil.

2) LA ESCALA ORDINAL

Algo más sofisticada que la escala nominal, la ordinal implica, como sugiere su nombre,
una ordenación o clasificación de la variable que se estudia. Los números de una escala
ordinal no representan simplemente una clase o categoría, sino que ponen de manifiesto una
relación entre los ítems numerados. Cuando hablamos de “superior”, “inferior”, “más fácil”, “muy
frecuentemente”, etc. Utilizamos descripciones verbales para significar el tipo de orden que
existe en una escala ordinal. En este tipo de escala, los números se utilizan sistemáticamente,
de modo que, en cualquiera de ellas, el 0 o el 1 representarán el mínimo o el máximo de todos
los valores posibles. Ejemplos de esta clase de esquemas son: la clasificación en clases
sociales I, II, III, etc.; la numeración de los edificios en las calles; los niveles de calidad I, II, III,
en frutas y verduras; las clasificaciones de un examen (suspenso, aprobado, etc.); las
graduaciones en el ejército y las posiciones de llegada en una carrera (primero, segundo,
tercero); la escala de Mohs, que clasifica de 1 a 10 a los minerales por su dureza.

Propiedades de los números ordinales

Al igual que la escala nominal, la ordinal supone equivalencia (=); pero supone también
tamaño relativo, indicado por los símbolos > (mayor que) y < (menor que). Los números de una
escala ordinal representan una ordenación en categorías que cumple su cometido, pero que no
es lo suficientemente refinada como para que pueda esperarse que la diferencia entre grados
se conserve igual a lo largo de la escala. Por ejemplo, no está garantizado que la diferencia
entre las manzanas de calidades I y II sea la misma que la diferencia entre las calidades II y III.
Lo que es más, los niveles relativos de calidad de las verduras ni siquiera se mantienen
constantes, sino que cambian según las estaciones. Tomates que podrían pasar por ser de
calidad II en invierno pueden descender a III en verano. Por estas razones, no es lícito sumar,
restar, multiplicar y dividir números que expresan datos ordinales, ni tampoco lo es ningún
cálculo que implique dichas operaciones. Como sucede con los datos nominales, el número
que resultaría de dichos cálculos no tendría una interpretación adecuada, en especial si se
tratase de hacer comparaciones entre distintas escalas. Si se tratara de describir un conjunto

Trancripción del libro : Frances Clegg, “ESTADÍSTICA FÁCIL”,Capítulo 10


de números ordinales mediante una medida de la tendencia central, lo adecuado sería utilizar
la mediana y la moda, ya que éstas sólo requieren contar. No existe ninguna medida de la
dispersión que pueda utilizarse, puesto que todas ellas, requieren realizar sumas o restas.
Hay un tipo de escala especialmente controvertida. Se trata de la conocida escala del
cociente de inteligencia –cuyos valores se deducen del resultado de un test del cociente de
inteligencia-. Mientras que muchos psicólogos sostienen que dicha escala alcanza un nivel de
precisión superior al de los datos ordinales, otros la consideran ordinal y tratan con mucho
cuidado los datos que incluyen valores del cociente de inteligencia.

3) LA ESCALA DE INTERVALO

Llegamos ahora al primer nivel de medida en el que se permite realizar operaciones


aritméticas. Ello es así porque, en el nivel de medida de intervalo, los números no solamente
están ordenados sino que, a lo largo de todos los puntos de la escala, los intervalos que
determina cada paso son de igual magnitud. De modo que dos números que sean contiguos en
un punto bajo de la escala (por ejemplo, 3 y 4) están separados exactamente por la misma
distancia que lo están otros dos situados en un punto superior (por ejemplo, 343 y 344). Aquí
es donde se plantea el problema con los valores del cociente de inteligencia: en efecto, se hace
difícil creer que una diferencia de cinco puntos en la escala que se produzca entre los valores
30 y 70 sea lo mismo que una diferencia de 5 puntos que se produzca entre 90 y 110. La zona
media de la escala del cociente de inteligencia está medida con mucha más precisión que
cualquiera de las dos zonas extremas. Puesto que los científicos sociales desean con
frecuencia acometer el análisis de sus datos sirviéndose de métodos aritméticamente precisos,
las más de las veces aspirarán a que los métodos utilizados para medir la variable que
estudien alcancen, al menos , la precisión de la escala de intervalo.
Un importante rasgo característico de las escalas de intervalo, que las distingue de las
más sofisticadas escalas de razón es la de no poseer un cero absoluto, sino solamente puntos
cero arbitrarios. Hay dos ejemplos que permiten comprender lo que ello significa: la escala
(centígrada) de temperaturas y el año civil. En la escala centígrada de temperaturas el cero
queda determinado como punto de congelación del agua, y las temperaturas situadas por
debajo de ésta se indican con un signo negativo. A los años civiles se les asigna el “punto de
partida” 1 en el momento del nacimiento de Jesucristo, y los años anteriores a esa fecha se
designan por el indicativo a. de J.C.

Propiedades de la escala de intervalo

Puesto que, dentro de una cualquiera de dichas escalas, el tamaño de los intervalos es
constante, tendrá sentido llevar a cabo cualquier operación aritmética. No obstante, las
comparaciones entre las escalas distintas (por ejemplo, entre grados centígrados de
temperatura y grados Fahrenheit) deben hacerse con cuidado. La dificultad de la comparación

Trancripción del libro : Frances Clegg, “ESTADÍSTICA FÁCIL”,Capítulo 10


reside en el hecho de que el punto cero no es el mismo para ambas escalas y el tamaño del
intervalo utilizado en cada una es distinto. Es perfectamente posible realizar la conversión de
una a otra escala, pero ello implica por lo general una cierta dosis de malabarismos aritméticos.

4) LA ESCALA DE RAZÓN

Es una escala exactamente igual a la de intervalo en cuanto que está integrada por
números ordenados, con intervalos iguales entre los números a lo largo de toda la escala; pero
difiere de ella por el hecho de poseer, además, un cero absoluto. Ello quiere decir que el 0
tiene el significado de “nada”, en un sentido literal, y no simplemente el de “muy bajo” como en
el caso de las temperaturas medidas en grados centígrados o Fahrenheit. Para recordar qué
significa cero “absoluto” puede memorizarse la expresión “absolutamente nada”. Es una
auténtica escala de razón, es imposible que existan números negativos. Si aparecen signos
menos, ello quiere decir que ha de efectuarse una resta, no que el número que los exhiba sea
negativo. La longitud (expresada tanto en el sistema métrico como en otro sistema), el peso,
el tiempo transcurrido, la velocidad, la temperatura medida (en grados Kelvin) y las frecuencias
constituyen todos ellos ejemplos de medidas según una escala de razón. En la escala de
temperaturas Kelvin la lectura 0 significa la temperatura más baja que puede alcanzarse; es
decir, el punto en el que cesa incluso el movimiento de las moléculas. Está muy por debajo del
cero de las demás escalas; en la escala centígrada, su equivalente es -273º C. Es fácil
reconocer cuando una escala es de razón, puesto que un signo menos convierte a sus valores
en un disparate. No pueden existir -2 seres humanos, -100 g de azúcar, o -10 segundos…

Propiedades de las escalas de razón

En una escala de razón pueden llevarse a cabo todas las operaciones aritméticas; y,
dado que todas las escalas de ese tipo poseen ceros absolutos, es posible realizar la
conversión de una a otra de dichas escalas con relativa facilidad. Ello es así porque las
razones o proporciones entre intervalos fijos, incluso para escalas diferentes, son iguales.

Los niveles de medida de intervalo y de razón se clasifican a veces juntos y reciben la


denominación de escala cardinal. Los números cardinales expresan las cantidades de algo,
mientras que los ordinales sólo expresan orden y los números nominales son simplemente
nombres de categorías.

Trancripción del libro : Frances Clegg, “ESTADÍSTICA FÁCIL”,Capítulo 10


Otra división –esta vez relativa solamente a los números cardinales- es la que se
establece entre discreto y continuo. Unidades discretas son aquellas para las que cada valor
está claramente separado de los contiguos a él. Cuando, por ejemplo, contamos el número de
personas que asisten a un acto, o el dinero, o el número de tiendas que hay en una calle, cada
unidad es una entidad completa a lo que no tiene sentido dividir. Media persona no puede ir
muy lejos, un establecimiento, o bien es una tienda o bien no lo es, y, en las monedas
españolas actuales, el dinero no se divide en unidades menores que la peseta. Todo tipo de
moneda posee una unidad mínima, más allá de la cual no se realiza ninguna subdivisión. Por el
contrario, las unidades continuas son las que pueden dividirse una y otra vez. No existe límite
teórico para el número de veces que es posible subdividir un centímetro, un segundo o un
gramo; las limitaciones son meramente prácticas, y los actuales adelantos tecnológicos
permiten disponer de unidades de medida sumamente finas. Al lector le agradará saber que,
para la mayoría de tests con los que se tropezará, tanto da que las variables que intervienen
sean de naturaleza discreta o continua.

Ejercicio

Establecer el nivel de medida alcanzado con los siguientes tipos de números:

a) Numeración de las locomotoras de vapor; b) edades de un niño; c) categorías en la plantilla


de personal de un hospital; d) goles marcados en el fútbol; e) la escala de Beaufort para medir
la fuerza del viento, de 0 (sin viento) a 12 (huracán); f) el sistema de evaluación en los sondeos
de opinión, de 1(está de acuerdo) a 5 (está en contra); g) el cociente de inteligencia para
tortugas; h) los números de la Seguridad Social; i) centímetros; j) errores de tipo I y II.

Los científicos de toda índole están siempre manejando variables y expresando los
diferentes valores de esas variables mediante unidades numéricas diversas. Esas unidades se
utilizan luego en los ulteriores análisis de los datos. Los químicos, los físicos y los biólogos no
acostumbran a encontrar en ello dificultades, ya que la unidades con las que casi siempre
trabajan son de tipo cardinal y perfectamente adecuadas para recibir un tratamiento aritmético
sofisticado. En realidad, si se le pregunta a un científico o científica “auténtico” (que es como a
ellos les gusta considerarse) por los niveles de medida, lo más probable es que no sepa una
palabra del asunto, ya que en el mundo en que se mueve ello no le crea problemas. Por
desgracia, para los científicos sociales el nivel de medida representa un constante quebradero
de cabeza puesto que muchas de las variables que han de estudiar vienen medidas en
unidades que no alcanzan la sofisticación de la escala de intervalo o de razón y, en
consecuencia, resulta inadecuado aplicarles métodos precisos de análisis. Los tres tests

Trancripción del libro : Frances Clegg, “ESTADÍSTICA FÁCIL”,Capítulo 10


sencillos que he tratado en el capítulo 9 son adecuados para cualquier tipo de números; pero,
como instrumentos matemáticos, carecen de precisión. Pertenecen al grupo de los tests
llamados no paramétricos, y están relativamente exentos de restricciones por lo que hace a su
uso. A diferencia de ellos, los tests paramétricos son más sofisticados y potentes. Estos tests
funcionan sobre la base de que los valores a los que se aplican proceden de una distribución
normal y consiguen aprovechar las propiedades matemáticas de esta distribución para
distinguir conjuntos de datos. Del mismo modo que el test de Wicolxon rechaza correctamente
la hipótesis nula cuando no lo hace el test del signo (fallo constitutivo de un error de tipo II), así
también los sofisticados tests paramétricos están mejor capacitados que los no paramétricos
para rechazar correctamente la hipótesis nula; y de aquí que su potencia sea superior. Los
científicos sociales se ocupan de variables que a veces alcanzan el nivel de intervalo; pero,
puesto que lo más frecuente es que no suceda así, resulta importante para ellos saber qué tipo
de tratamiento estadístico es el adecuado. Si se aplica un instrumento de cualquier tipo a una
materia prima inadecuada, lo más probable es que ello tenga consecuencias lamentables; en el
caso del análisis estadístico, la utilización de una técnica que no es la requerida conduce, o
bien a dejar de percibir la existencia de una diferencia sutil (un error de tipo II), o bien, por el
contrario, a obtener un estadístico que tiene buen aspecto pero que, en realidad, puede ser un
completo disparate. La evaluación de los datos –su “triturado”, como se dice- ha de estar muy
bien sintonizada con la naturaleza de dichos datos.

Examinemos ahora más de cerca los presupuestos en que se basan las técnicas
paramétricas. Existen tres limitaciones principales, relativas a las siguientes características de
los conjuntos de valores:

1) El tipo de medida que representan los valores (es decir, el nivel de medida)
2) La distribución de los valores –por regla general, la principal preocupación se refiere a
si proceden o no de una distribución normal.
3) La dispersión de los valores.

1.- Nivel de medida

Como los tests paramétricos implican la realización de diversas operaciones aritméticas


sofisticadas (pero no forzosamente difíciles), sólo es adecuado usarlos para datos que están en
el nivel de intervalo o de razón. Siempre es posible utilizar los tests no paramétricos, más
sencillos, para datos de nivel alto; pero es como servirse de una persona inexperta para hacer
distinciones sutiles a la hora de catar vinos. Conseguirá con éxito discernir las diferencias entre

Trancripción del libro : Frances Clegg, “ESTADÍSTICA FÁCIL”,Capítulo 10


vinos; pero sus juicios serán vulgares y no dirán gran cosa en comparación con las
informaciones y descripciones precisas que proporcionaría un experto catador. ¿Para qué
servirse de un novato, cuando siempre puede disponerse de un experto catador sin necesidad
de hacer gastos extra, y si el vino a probar no va a ofender al catador?

2.- La distribución de los valores

Como antes he dicho, los tests paramétricos sólo pueden utilizarse con datos
procedentes de una distribución normal (o aproximadamente normal). Quizá sorprenda al lector
saber que existe una cierta controversia entre los estadísticos acerca de hasta qué punto
puede transgredirse esta “regla” y prescindir de ella. Por mi parte, opino que, para los no
iniciados, como es nuestro caso, es mejor pecar de conservador y observarla.
En el supuesto de que se decida ser prudente al respecto, ¿cómo decidir si los datos
corresponden efectivamente a una distribución normal? Cuando el número de valores con que
se trata está entre cinco y cincuenta, la respuesta es: utilice el test del ojímetro; o sea, decida
a base de mirárselos… Una operación que facilita la decisión consiste en disponer los valores
en forma de un diagrama en el que el eje vertical indique la frecuencia, mientras que el
horizontal representa los diversos grupos de unidades (en orden creciente). Pero, ¿qué pasa si
la forma exhibida no es completamente normal? Después de todo sería bastante sorprendente
que cualquier muestra extraída de una población distribuida normalmente, reflejara
exactamente a la población matriz. En el muestreo se introduce siempre un margen de error.
En consecuencia podría aplicarse uno de los tests que, como el test de la bondad del ajuste
(capítulo 12), se han ideado para determinar hasta qué punto la desviación respecto de la
forma normal basta para indicar que los valores proceden de una distribución que no es
normal. En la presente etapa de su carrera estadística, al lector le bastará por lo general con
saber que es preciso tener en cuenta la normalidad de una distribución, sin entrar en más
detalles.
Adviértase que, al decidir si las muestras están o no distribuidas normalmente, hay que
examinar las formas de ambas muestras. Para que pueda utilizarse un test paramétrico, las
dos han de cumplir el requisito de normalidad. No obstante, no es necesario que procedan de
la misma distribución normal –o sea, que tengan idénticas medias-. De hecho, ello es
precisamente lo que se espera que no suceda cuando se emprende el experimento: la
previsión es que, al manipular la VI, se crearán dos grupos de valores procedentes de
poblaciones con medias muy distintas.

3.- La dispersión de los valores

En términos formales, la semejanza entre las dispersiones de las muestras se


denomina homogeneidad de la variancia, y significa que los dos conjuntos de valores poseen
variancias similares. La variancia mide cuán dispersos o esparcidos están los valores de un

Trancripción del libro : Frances Clegg, “ESTADÍSTICA FÁCIL”,Capítulo 10


conjunto; en el capítulo 5 tratamos de ella en detalle y expliqué que está directamente
relacionada con la desviación tipo, otra medida de dispersión. Lo que aquí se afirma es que,
para poder aplicar una técnica paramétrica a dos conjuntos de valores, es preciso que éstos
presenten un grado aproximadamente igual de dispersión. Si los valores que constituyen una
de las muestras están muy dispersos en torno a su media (es decir, poseen una variancia
grande), mientras que los de la otra están muy apiñados en torno a la suya (la variancia es
pequeña), entonces habrá que utilizar una de las técnicas no paramétricas para el análisis de
esos datos. Para recordar qué significa el término por el que formalmente se conoce esta regla,
el lector puede pensar en la

--------------------------------+--------------------------------

Trancripción del libro : Frances Clegg, “ESTADÍSTICA FÁCIL”,Capítulo 10

También podría gustarte