Está en la página 1de 7

ESTADÍSTICA DESCRIPTIVA

La estadística descriptiva ofrece modos de presentar y evaluar las características


principales de los datos a través de tablas, gráficos y medidas de resumen.

Algunas herramientas para ordenar los datos son las distribuciones de frecuencias en
tablas estadísticas. El ordenamiento es un arreglo convencional de los datos obtenidos
en una investigación muestral.

Distribución de frecuencias

La distribución de frecuencias es una forma de presentación de los datos que facilita su


tratamiento. Es un ordenamiento de los datos en clases o categorías con las
observaciones (frecuencias) que corresponden a cada una.

Tabla de distribución de frecuencias para DATOS NO AGRUPADOS

Es una tabla en la que se presentan en forma ordenada todas las categorías o valores
de una variable y su correspondiente frecuencia. En estas distribuciones cada dato
mantiene su propia identidad, siguiendo un orden lógico con sus respectivas
frecuencias.

Las tablas para datos no agrupados se utilizan para variables cualitativas y


cuantitativas (cuando se trabaja con una reducida cantidad de valores de una
variable)

EJEMPLO 1:

Se presentan los datos obtenidos en un relevamiento realizado en 70 hogares de un


barrio de la ciudad de Resistencia, a través del mismo se desea analizar la cantidad de
menores de edad por hogar.
Los valores obtenidos en el relevamiento de los hogares se presentan a continuación:

6 5 7 7 8 6 5 7 7 8
2 5 4 3 2 2 3 3 4 4
4 1 1 5 6 4 5 4 3 3
4 2 2 3 3 1 1 4 4 2
2 6 4 3 3 1 4 3 3 3
5 1 4 2 5 3 4 3 4 2
2 3 5 4 2 4 5 6 4 4

Analicemos algunas cuestiones:

¿Qué tipo de variable se está analizando? Variable Cuantitativa Discreta


¿Qué valores toma la variable según el relevamiento? Valor mínimo 1 y máximo 8
A la diferencia entre el máximo valor de la variable y el menor, denominamos rango.

Para confeccionar la tabla, como primer paso, ubicamos los valores de la variable de
menor a mayor.
Luego, calcularemos las distintas frecuencias; para ello definiremos, previamente, cada
una de las mismas:

 frecuencia absoluta (fa): es la cantidad de veces que se repite cada valor o


categoría de la variable.

La sumatoria de las frecuencias absolutas debe ser igual a la cantidad del total
analizado, suele representarse con la letra N.

 frecuencia absoluta acumulada (Fa): es la suma acumulada de las frecuencias


absolutas y el último valor de la variable debe ser igual al número del total analizado.

 frecuencia relativa (fr): indica en qué proporción se presenta cada una de las
frecuencias de los valores de la variable respecto del total.

Es igual a la división entre fa y N.

Se la suele expresar en porcentaje (%), que es la frecuencia relativa multiplicada


por 100.

 frecuencia relativa acumulada (Fr): es la suma acumulada de las frecuencias


relativas y el último valor de la frecuencia acumulada de la variable debe ser 1.

Frecuencia
MENORES Frecuenci absoluta Frecuencia Frecuencia Porcentaje
DE EDAD a acumulada relativa relativa %
POR HOGAR absoluta Fa fr acumulada
fa Fr
1 6 6 6/70 6/70 8,57 %
2 11 17 11/70 17/70 15,71 %
3 15 32 15/70 32/70 21,43 %
4 18 50 18/70 50/70 25,71 %
5 9 59 9/70 59/70 12,86 %
6 5 64 5/70 64/70 7,14 %
7 4 68 4/70 68/70 5,72 %
8 2 70 2/70 70/70 = 1 2,86 %

Total 70 1 100 %

A partir de esta tabla de distribución de frecuencias, se pueden realizar distintas


lecturas acerca del comportamiento de la variable en cuestión. Por ejemplo:

 Según la frecuencia absoluta: en 18 de los hogares relevados, viven 4 menores de


edad en cada uno de ellos.
 Según la frecuencia absoluta acumulada: en el barrio hay 50 familias en las que hay
como máximo 4 menores de edad; o dicho de otro modo, tienen 4 menores de edad o
menos.
 Según la frecuencia relativa: los hogares que tienen 4 menores de edad representan
una proporción de 0,25 (18/70) del total.
 Según el porcentaje: representan el 25,71 % del total de familias relevadas.
 Según la frecuencia relativa acumulada: las familias que tienen 4 integrantes o
menos, representan una proporción de 0,71 (50/70) del total.

Las frecuencias absolutas y relativas son aplicables a cualquier tipo de variable,


y de ahí su importancia; además, dan lugar a conceptos muy importantes, como el de
proporción, y son la base sobre la que se construye cualquier resumen de los datos.

No ocurre lo mismo con las frecuencias acumuladas, ya que éstas sólo tienen sentido
cuando se trabaja con variables cuantitativas o cualitativas ordinales, dado que
permiten realizar lecturas acerca de cuántos datos se encuentran por debajo de un
determinado valor o categoría, por ejemplo.

NOTA: En el ejemplo 1, señalamos que en el barrio hay 50 hogares en los que hay 4
menores de edad o menos, es decir, hay 50 datos por debajo del valor 4, que
representa el número de menores.

EJEMPLO 2:

Se ha registrado el grupo sanguíneo de 200 personas que donaron sangre para un


hospital durante una campaña de concientización sobre la donación de sangre.

GRUPO Frecuencia Frecuencia Porcentaj


SANGUÍNEO absoluta relativa e
(fa) (fr) %
0 85 85/200 42,5 %
A 53 53/200 26,5 %
B 48 48/200 24 %
AB 14 14/200 7%

TOTAL 200 100%

En este ejemplo, la variable que se analiza es del tipo cualitativa, por ello se
calculan sólo frecuencias absolutas y relativas. Mediante una tabla de distribución
de frecuencias se puede resumir y leer fácilmente, lo que no sería posible con una
tediosa lista de doscientos datos desordenados.
Tabla de distribución de frecuencias para DATOS AGRUPADOS

Se utilizan para analizar variables cuantitativas discretas cuando los valores de la


variable son muchos y numéricamente distintos o para las variables cuantitativas
continuas. Los datos pierden individualidad (se deja de conocer la frecuencia particular
de cada uno) porque se presentan en clases o categorías que agrupan a un conjunto de
valores. Estos grupos se denominan intervalos de clases.

En el caso de las variables continuas, el número de valores distintos que puede tomar
la variable es infinito, teóricamente, y en la práctica puede ser bastante grande. Si se
midiera, por ejemplo, la estatura en centímetros de un cierto número de personas
podemos tener tantos valores como personas medidas. Esto provoca que los datos sean
muy numerosos. Para evitarlo, se trabaja con datos agrupados en intervalos de igual
amplitud, de tal manera que en ellos queden contenidos el valor mínimo y el valor
máximo de la variable.

En tablas de distribuciones de frecuencias con datos agrupados, las frecuencias se


contabilizan para cada intervalo, no para cada valor de la variable; por lo tanto, hay una
pérdida de información con respecto a una tabla de datos no agrupados.

Los datos se agrupan en intervalos, mediante el siguiente procedimiento:

 Se determina el rango, haciendo la diferencia entre el valor máximo de la variable y


el valor mínimo.
 Se divide el rango en la cantidad de intervalos que se desea tener, obteniéndose así
la amplitud o tamaño  de cada intervalo. 
 Comenzando por el mínimo valor de la variable, que será el extremo inferior del
primer intervalo, se suma a este valor la amplitud para obtener el extremo superior y
así sucesivamente.

Ejemplo:
Se realiza un registro de las alturas de un grupo de deportistas para seleccionar los
integrantes del equipo de baloncesto. Las alturas (en centímetros) de los 40
estudiantes que integran el grupo son las siguientes:

164 160 154 155


173 161 165 173
155 161 162 173
156 165 166 175
157 163 176 167
158 180 170 178
158 163 169 163
152 159 162 171
164 153 160 172
154 160 164 172

Rango o recorrido

El rango o recorrido (R) se define como la variación numérica de la variable, es el recorrido que toma la
variable desde el valor más pequeño hasta el valor más alto. Se calcula mediante la siguiente ecuación:

R= [Ls - Li]

R: rango o recorrido.
Li: límite inferior (menor valor de la variable).
Ls: límite superior (mayor valor de la variable).

En el ejemplo:
Ls - Li =  180 - 152 =  28
Por lo tanto el Rango = 28

Número de intervalos o clases

El número de intervalos (i) se define de forma convencional, procurando mantenerse entre 5 y 20


intervalos o clases. Sin embargo, para evitar caer en los extremos, es posible obtener una aproximación
usando la fórmula propuesta por Sturges:

i = 1 + 3.3 x log n

Donde n es el número total de datos. En caso de que se analice la totalidad de elementos de la población,
ésta se representa por N.

Para el ejemplo, el número de intervalos es:

i = 1 + 3.3 x log 40
i = 6,28

Otra fórmula para establecer el número de clases o intervalos, es la siguiente: i=


√n
Según esta fórmula, para el ejemplo, el número de intervalos sería: i = √ 40=6,32
Entonces, en este caso es posible construir 6 o 7 intervalos, pero éste debe ser definido en el paso siguiente,
al calcular la amplitud del intervalo.

Amplitud del intervalo de clase

La amplitud de los intervalos (A) es conveniente que sea la misma para todos los intervalos.

Para el cálculo de la amplitud de los intervalos se toma el cociente


entre el rango (R) y el número de intervalos (i) que se considere más
adecuado, teniendo en cuenta que este resultado (A) debe ser una
cantidad exacta.

Siguiendo el ejemplo, la amplitud del intervalo sería:

Si se tomara i = 6, la amplitud del intervalo sería A = 28/6 = 4,66


Si i = 7, la amplitud del intervalo sería A = 28/7 = 4

En este caso se recomienda usar 7 intervalos, con una amplitud de 4 centímetros, ya que estamos
analizando alturas de personas.
Si la amplitud del intervalo no es exacta con ninguno de los dos valores arrojados por la fórmula de
Sturges, el número de intervalos se puede variar hasta hacer la división exacta.

Límites de los intervalos

Al construir los intervalos, cada uno de ellos está determinado por dos extremos: límite inferior (Li) y límite
superior (Ls). Para el primer intervalo, el límite inferior es igual al límite inferior del rango y el límite
superior de este intervalo se conforma sumando la amplitud (A) al límite inferior. El segundo intervalo
parte del límite superior del primer intervalo y se le suma la amplitud para obtener el límite superior. Este
proceso se repite para el total de intervalos en los cuales se agrupó el conjunto de datos.

Los datos serían agrupados de la siguiente manera:

Alturas (cm)
[152, 156]
(156, 160]
(160, 164]
(164, 168]
(168, 172]
(172, 176]
(176, 180]

Es importante aclarar que, en el primer intervalo se puede tomar el límite inferior y el


superior, es decir, armar un intervalo cerrado en ambos extremos, mientras que los
demás intervalos no toman el extremo inferior pero sí toman el superior, es decir, son
intervalos abiertos en extremo inferior y cerrados en el extremo superior. De esta forma
se da continuidad a los valores asumidos por la variable.

Tabla de distribución de frecuencias con datos agrupados


Luego de construir los intervalos, se procede al conteo de los datos, determinando la frecuencia absoluta
para cada intervalo o clase, para luego determinar el resto de las frecuencias como ya se explicó
anteriormente.

Marca clase o centro de la clase (Xi): es la semisuma de los límites de cada clase y
representa a todos los datos que están contenidos en una clase.

Frecuenc Frecuenc
Frecuenc ia Frecuenc ia
Marca de Porcenta
Alturas ia absoluta ia relativa
clase je
(cm) absoluta acumula relativa acumula
Xi %
fa da fr da
Fa Fr
[152, 156] 154 7 7 7/40 7/40 17,5 %
(156, 160] 158 7 14 7/40 14/40 17,5 %
(160, 164] 162 10 24 10/40 24/40 25 %
(164, 168] 166 4 28 4/40 28/40 10 %
(168, 172] 170 5 33 5/40 33/40 12,5 %
(172, 176] 174 5 38 5/40 38/40 12,5 %
(176, 180] 178 2 40 2/40 1 5%
Total
n = 40 1 100%

También podría gustarte