Documentos de Académico
Documentos de Profesional
Documentos de Cultura
VARIABLES
TABLAS DE FRECUENCIA
REPRESENTACIONES GRÁFICAS
INTRODUCCIÓN
En la presente unidad expondremos el concepto básico de variable y los diferentes
tipos que pueden presentarse al recopilar los datos para una investigación.
OBJETIVOS ESPECÍFICOS
► Que el alumno posea un marco para reconocer el tipo de variables presente en el
estudio, y aprenda como presentar la información recopilada en forma gráfica y tabular.
CONTENIDOS
Clasificación de las variables
Categóricas
Numéricas
Representaciones gráficas
Gráficas de pastel
Gráficos de barras
Histogramas
Polígono de frecuencia
Gráficos de línea
Gráfico de Pareto
ESQUEMA DE CONTENIDOS
VARIABLES
NUMERICAS CATEGORICAS
Histograma Gráfico de
Nominales
barras
Gráficas de
pastel
Pensando en los valores que esas variables pueden adoptar, se podrán observar las
diferencias entre ellas.
La variable edad toma valores numéricos que pueden incluir decimales, por
ejemplo, 33,5 años (33 años y 6 meses). El sexo sólo puede adoptar dos categorías:
femenino y/o masculino. Nivel de educación puede tomar valores que van desde estudios
primarios, secundarios, terciarios, universitarios, de postgrado; esta es una variable que
no solo puede adoptar más de dos respuestas, sino que además, estas categorías siguen
un determinado orden (no se puede tener nivel de educación secundario sin antes tener
nivel primario completo). Cantidad de miembros en la familia sólo puede tomar valores
enteros, es decir, no admite valores con decimales; se pueden tener 1, 2 hijos o ninguno
(0 hijos), pero no se puede tener 1,5 hijos. En relación al lugar de nacimiento, podemos
mencionar muchas categorías o posibles respuestas que hacen referencia a un país, a una
ciudad o una zona, pero en este caso, no hay ninguna categoría que necesariamente
preceda a otra, por lo tanto, es una variable que no acepta un ordenamiento de sus
valores.
Nominales o no ordinales:
aquellas que sólo admiten una
mera ordenación alfabética, pero
no establece orden por su
naturaleza, por ejemplo el color de
pelo, estado civil, etc.
2-1) Luego de relevar en Mayo de 2.003 los Ingenios que van a producir alcohol
durante la zafra de este año, para asentar el número de trabajadores inscriptos
con aportes previsionales se encontró que varios de ellos debían regularizar su
situación.
2-2) Se quiere verificar el nivel auditivo de los trabajadores de una empresa minera
radicada en Sur de Tucumán, en Agosto de 2.007
Estamos
aquí
Presentación de
la información
Frecuencias Frecuencias
Barras Pastel
absolutas relativas
Líneas
Tablas de
contingencia
Tablas de frecuencias
El primer paso es hacer el conteo de los datos y disponerlos en una tabla. Esa
disposición de los datos en forma tabular se llama “distribución de frecuencias”.
1
Cuando la variable es cualitativa nominal o dicotómica, los datos no se arreglan en clases ordenadas , pues
por definición, las categorías de este tipo de variables no se pueden ordenar
Una parte muy importante del análisis de los datos, es observar la manera en que
se relacionan o interactúan dos variables en forma conjunta. En este caso, las dos
variables pueden mostrarse en una tabla de doble entrada: las categorías de una variable
se muestran por fila y las de la otra por columna.
Hay diferente información que puede obtenerse a partir de esta tabla, según se
consideren los totales por fila, por columna o el total del cuadro.
En el ejemplo presentado puede analizarse cuál es el peso que tiene cada artículo
en las zonas.
Este análisis permite observar que en las tres zonas la papelería representa el
mayor peso de los artículos vendidos.
Si se consideran los totales por columna, esta parte del estudio es conocida como
el “perfil columna” y consiste en dividir cada valor de la tabla origina por el total de su
correspondiente columna. En el ejemplo se podrá analizar como se distribuyen las ventas
de cada tipo de artículo en las zonas.
La elección sobre cuál perfil elegir para el análisis, está siempre vinculado a las
variables en estudio y su distribución dentro de la tabla de contingencia. El investigador
debe tener el criterio de elegir cuál de los dos análisis es el adecuado para los objetivos de
su estudio.
Cuando los datos corresponden a variables numéricas continuas (es decir, que la
variable puede tomar infinitos valores en un determinado rango), o bien, la variable es
numérica discreta, pero el rango de la variable es muy amplio, los valores de la variable se
agrupan en intervalos de clase y se construye una tabla de frecuencias en intervalos; los
intervalos deben cumplir las siguientes propiedades:
Para construir los intervalos de clase hay que considerar en primer término cuál es
el rango (R) del conjunto de datos:
Rango (R) = máximo valor de la serie de datos – mínimo valor de la serie de datos
Luego se divide R por la cantidad de intervalos que se utilizarán; este cociente nos indicará
la amplitud (w) de cada intervalo. De manera que:
𝑹𝒂𝒏𝒈𝒐⁄
𝒘= 𝒄𝒂𝒏𝒕𝒊𝒅𝒂𝒅 𝒅𝒆 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔
Esta construcción de intervalos implica que cada uno de ellos tenga un valor
correspondiente al límite inferior y otro al límite superior. Para evitar que algún valor de la
variable se cuente más de una vez, los intervalos deben ser cerrados en su extremo
inferior y abiertos en el superior, con excepción del último intervalo que debe ser cerrado
también en su extremo superior para asegurar que incluya al valor mayor de la variable.
21,3 19,8 18,4 16,7 19,9 11,4 15,5 18,0 11,2 11,3
16,1 8,5 14,3 2,3 17,3 15,1 9,1 11,3 23,3 21,2
20,7 11,8 12,1 10,2 21,5 21,0 10,0 19,3 19,8 17,1
En esta serie de datos, el mayor valor que toma la variable es 23,30 y el menor es
2,3. Por lo tanto:
Rango (R) = = máximo valor de la serie de datos – mínimo valor de la serie de datos
Rango (R) = 23,30 – 2,3 = 21
Si consideramos construir 6 intervalos, la amplitud de cada uno de ellos será:
𝑅𝑎𝑛𝑔𝑜 21
𝑤= = = 3,5
𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 6
Una vez construidos todos los intervalos, se procede a contar cuantos valores de la
serie de datos caen dentro de cada uno de ellos. Observe que el límite superior de un
intervalo coincide con el límite inferior del siguiente intervalo. Pero esta coincidencia es
sólo visual, ya que como se ha explicado, los intervalos son cerrados en su extremo
inferior y abiertos en el superior; de ahí que se utilicen corchetes y paréntesis en cada
extremo respectivamente para indicar la característica señalada.
Temperaturas fa fr Fa Fr
[2,3 - 5,8) 1 0,033 1 0,033
[5,8 - 9,3) 2 0,067 3 0,100 . En esta tabla de frecuencias por
[9,3 - 12,8) 8 0,267 11 0,367 intervalos, se han incluido los cuatro grupos
[12,8 - 16,3) 4 0,133 15 0,500 de frecuencias estudiadas.
[16,3 - 19,8) 6 0,200 21 0,700
[19,8 - 23,3] 9 0,300 30 1,000
30
Estamos
aquí
Presentación de
la información
Frecuencias Frecuencias
Barras Pastel
absolutas relativas
Líneas
Tablas de
contingencia
fa (cantidad
Artículo de productos
vendidos) La variable categórica es “tipo de artículo” y los
A 975 posibles valores que adopta son A, B, C y D. Se puede
B 1115 realizar un gráfico de barras o un diagrama de pastel.
C 485
D 650
Total 3225
Artículo
D Artículo
20% A Las gráficas de pastel convierten las
Artículo 30% frecuencias absolutas y/o relativas en
C
15%
porcentajes. Los ángulos de los sectores
Artículo circulares se obtienen: 360º f ai /n
B
35%
En un gráfico de barras,
cada categoría se describe
mediante una barra cuya longitud
representa la frecuencia (cantidad
de veces) o porcentaje de
observaciones que caen en esa
categoría. Las barras pueden ser
horizontales o verticales, pero
deben tener todas el mismo ancho
Un detalle a tener en
cuenta en la elaboración de
estos gráficos, es el valor
máximo de la escala en el eje Y.
Es conveniente llegar al 100%
para visualizar correctamente
las proporciones reales.
2
El porcentaje se obtiene calculando las frecuencias relativas y multiplicando éstas por 100: fr x 100%
Este gráfico permite identificar que producto tiene mayor incidencia en las ventas
de cada local.
En esta
representación gráfica se
puede observar que
productos se venden más y
cuales menos en cada local.
Otra forma de estudiar y graficar los datos de las ventas de los 4 artículos es a
través del perfil fila, tal como se explicó en el módulo “Frecuencias”. En este caso, se
consideran los totales por fila; en el ejemplo que hemos propuesto, este perfil implica
considerar las ventas totales de cada artículo y su incidencia en las ventas de cada local:
2002 2003
Meses
Ingresos Egresos Ingresos Egresos
Enero 16450 13400 28500 24700
Febrero 10400 7550 22400 18200
Marzo 10800 7500 25700 21000
Abril 8200 5000 26400 21200
Mayo 7750 5200 19300 13900
Junio 9300 6300 17950 15800
Julio 11950 7550 32300 27400
Agosto 11350 8900 35400 30100
Septiembre 9580 8000 21200 18900
Octubre 15050 12000 22200 23500
Noviembre 13700 15500 31300 34200
Diciembre 22900 26000 51100 56000
Otro análisis factible de realizar, es comparar los ingresos y/o egresos en períodos
de tiempo diferentes, como se observa en el siguiente gráfico:
60000
30000
20000
10000
0
Ene Feb Mar Abr May Jun Jul Agos Set Oct Nov Dic
Cuando los datos están agrupados en una tabla de frecuencia con los datos
agrupados en intervalos de clase, la representación gráfica se hace a través de un
histograma.
de que no existe separación entre las barras. Dada la definición de los intervalos de clase,
donde termina cada una de las barras está comenzando la siguiente.
Temperaturas fa fr Fa Fr
[2,3 - 5,8) 1 0,033 1 0,033
[5,8 - 9,3) 2 0,067 3 0,100
[9,3 - 12,8) 8 0,267 11 0,367
[12,8 - 16,3) 4 0,133 15 0,500
[16,3 - 19,8) 6 0,200 21 0,700
[19,8 - 23,3] 9 0,300 30 1,000
30
10
9
Polígono de
8
frecuencia
7
0
0 -2,3 [2,3 - 5,8) [5,8 - 9,3) [9,3 - 12,8) [12,8 - 16,3) [16,3 - 19,8) [19,8 - 23,3]
Los polígonos de frecuencia unen los puntos medios de clase, cerrando el gráfico
al principio y al final de la serie con la misma amplitud del primer o último intervalo
correspondiente.
Otro tipo de gráfico que pueden realizarse con las variables numéricas es el
correspondiente a las frecuencias acumuladas. En este caso la representación gráfica es
una curva que recibe el nombre de “ojiva”.
35
30 30
25
20 21
15 15
10 11
5
3
0 1
[2,3 - 5,8) [5,8 - 9,3) [9,3 - 12,8) [12,8 - 16,3) [16,3 - 19,8) [19,8 - 23,3]
en condiciones de eliminar casi todas esas pérdidas dejando de lado las causas numerosas
y triviales.
Porcentaje
Formas de ocurrencia Frecuencia Porcentajes
Acumulado
A Pisadas, choques o golpes por objeto 202017 31,80% 31,80%
B Otras formas de accidentes 152334 24,00% 55,80%
C Caídas de personas 112554 17,70% 73,50%
D Esfuerzos excesivos 82164 12,90% 86,40%
E Sin datos 25201 4,00% 90,40%
F Atrapamiento por un objeto o entre objetos 22004 3,50% 93,80%
G Caída de objetos 21675 3,40% 97,20%
H Exposición al contacto con temperaturas extremas 8917 1,40% 98,60%
I Exposición al contacto con sustancias nocivas o radiaciones 7482 1,20% 99,80%
J Exposición al contacto con la corriente eléctrica 1218 0,20% 100,00%
Total 635.566 100,00%
100%
600000
90%
500000 80%
70%
400000
60%
50%
300000
40%
200000 30%
20%
100000
10%
0 0%
A B C D E F G H I J
Diagrama de caja y bigote – Box plots: Esta es una representación gráfica que permite
visualizar fácilmente como se distribuyen los valores de una variable en estudio. Consta de
una caja y un par de “bigotes” tal como muestra la imagen: