Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Es el conjunto de todos los valores que, en teoría, puede tomar la variable. De acuerdo a su
recorrido, existen diferentes tipos de variables. Se clasifican en dos grandes grupos:
I) las variables categóricas o cualitativas o de atributos,
II) y las variables medibles o cuantitativas.
Los dos primeros ejemplos son de variables cualitativas nominales, que son aquéllas en las cuales
las asignaciones de los números no suponen ningún orden entre ellas. En otras palabras: cualquier
asignación es válida.
Los otros dos ejemplos son de variables cualitativas ordinales, llamadas así pues existe un orden
particular preestablecido entre los diferentes valores que puede tomar una variable.
Mientras que entre los valores de las variables nominales sólo podemos comparar si son iguales o
distintos, entre los de las variables
ordinales podemos establecer la relación " mayor que" o "menor que".
Dentro de este grupo de variables, se distingue entre variables discretas o continuas. Los dos primeros
ejemplos son de variables
cuantitativa discretas, llamadas así pues entre dos valores de la variable no siempre existe otro:
por ejemplo una mujer puede tener 1 o 2 hijos, pero no 1 hijo y medio. Los otros dos ejemplos son de
variables cuantitativas continuas pues dados dos valores de la variable siempre puede existir
(aunque sea en teoría) otro valor: entre una altura de 2 m y otra de 2 m 1 cm, podemos encontrar un
jugador que mida 2 metros ½ cm, y podemos seguir subdividiendo los intervalos y siempre, en teoría,
podremos encontrar un jugador que tenga una altura en dicho intervalo, apesar de que nuestros
instrumentos de medicion, llegará un momento, que no tendrán la presición adecuada como para notar
diferencias.
CATEGORÍAS:
Son los distintos grupos, entre los cuales podemos clasificar los distintos valores que toma una variable.
Surgen de partir su recorrido.
Muchas veces las categorías pueden coincidir exactamente con el recorrido; pero en otros casos es
imposible: el caso de las variables continuas, cuyo recorrido está formado por infinitos números y
entonces debemos particionar su recorrido en intervalos, que serán nuestras categorías.
Sea cual sea el tipo de variable, las categorías en las cuales se agrupan los diferentes valores que
toma la variable, deben serexhaustivas y mutuamente excluyentes.
Categorías exhaustivas: éstas cubren todo el recorrido.Cualquier observación se debe poder colocar en
alguna categoría; por ejemplo, si la persona se niega a contestar, se la coloca en la categoría no sabe,
no contesta.
Categorías mutuamente excluyentes: no se deben superponer.
Cualquier observación se debe colocar sólo en una categoría, no debe haber ambigüedades.
Ejemplos:
Variable X: cantidad de días por semana que trabaja una persona.
Recorrido de X: 0, 1, 2, 3, 4, 5, 6, 7 . Puedo considerar como categorías exactamente el recorrido de la
variable; o sino podría considerar como categorías:0,1,2,3,4,5,6,7.
Variable Y: peso de los bebés en kg, nacidos a término.
Posible recorrido: [2.3, 5] . Puedo tomar como categorías los siguientes intervalos: { [2.3, 2.5), [2.5,
3.5), [3.5, 3.9), [3.9, 5] }, u otros, dependiendo de los intervalos que sean de interés.
OBSERVACION:
Continuando con el ejemplo anterior de los adolescentes y su nivel de glucemia, vamos a trabajar con
una muestra de 20 adolescentes. Las muestras deben ser por lo general de mayor tamaño, pero
tomamos sólo 20 para manejar con facilidad los datos.
Tenemos entonces un conjunto de 20 datos de la variable X la cual definimos como X = nivel de
glucemia en ayunas, medido en miligramos de glucosa por decilitro de sangre (mg/dl). Estos datos son
98, 150, 100, 70, 80, 110, 123, 85, 115, 120,
130, 110, 105, 98, 140, 81, 125, 120, 130, 126
En primer lugar, organizamos estos datos muestrales en una tabla de distribución de frecuencias. Lo
primero que debemos hacer esdeterminar los intervalos, con el fin de que los podamos interpretar
de alguna forma.
Existen ciertos valores límite, para distintas condiciones relacionadas con la cantidad de azúcar en
sangre en ayunas. Según algunos especialistas se puede afirmar lo siguiente:
mg de glucosa por dl de
Condición
sangre
48 a 73 hipoglucemia
74 a 99 glucemia normal
100 a 125 pre-diabetes
126 a 152 diabetes
Adoptaremos la convención de construir intervalos de la forma [ , ): implica que el valor de la izquierda
está en el intervalo pero no el de la derecha. Y recordando que las categorías deben ser exhaustivas,
nuestros intervalos serán ligeramente diferentes a los planteados en la tabla anterior:
Categorías
ni total
[xi-1, xi)
[48, 74) 1
[74, 100) 5
[100, 126) 9
[126, 152) 5
n = 20
A la columna ni se la llama frecuencias absolutas, y en ella se colocan cuántas datos caen en cada
intervalo. Una práctica común para completarla, en leer uno a uno los datos y colocar una marca (/) al
lado del intervalo donde cada dato se encuentra. Luego contamos la cantidad de y obtenemos ni.
Al sumar esta columna debemos obtener n: el tamaño de la muestra.
Es importante tener en cuenta que al organizar los datos en intervalos pierdo la información de los datos
originales, pero gano en un mejor ordenamiento de los datos. Por ejemplo, en la tabla veo que tengo 5
adolescentes en el intervalo [ 74, 100 ) pero a partir de la tabla no sabemos si ellos tienen cerca de 74
mg de glucosa por dl de sangre o tienen un nivel cerca de 99 mg/dl, o están distribuidas de
manera uniforme a lo largo de todo el intervalo.