Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MARTÍNEZ DE LA TORRE
Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por
filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La
finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen
los datos.
La inspección de los datos originales no permite responder fácilmente a cuestiones como cuál es la
actitud mayoritaria del grupo, y resulta bastante más difícil determinar la magnitud de la diferencia
de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable acompañados
del número de veces (la frecuencia) que aparece cada valor:
Generalmente las tablas incluyen varías columnas con las frecuencias relativas (son el número de
ocurrencias dividido por el total de datos, y se simbolizan "𝑓𝑟" o "𝑃𝑖"), frecuencias acumuladas (la
frecuencia acumulada es el total de frecuencias de los valores iguales o inferiores al de referencia,
y se simbolizan "𝑓𝑎" o "𝑛𝑎". No obstante, la frecuencia acumulada también es definida incluyendo
al valor de referencia), frecuencias acumuladas relativas (la frecuencia acumulada relativa es el total
de frecuencias relativas de los valores iguales o inferiores al de referencia, y se simbolizan "𝑓𝑟" o
"𝑝𝑎").
Un polígono de frecuencias se forma uniendo los extremos de las barras de un diagrama de barras
mediante segmentos. También se puede realizar trazando los puntos que representan las
frecuencias y uniéndolos mediante segmentos.
Ejemplo:
Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones:
Con esta herramienta gráfica pueden representarse variables cuantitativas o distribuciones
diferentes, cosa que tradicionalmente no hace un histograma, de un modo rápido y sencillo.
Además, cuenta con la virtud de ser apreciable a simple vista.
Por esta razón es sumamente empleado dentro de las ciencias sociales y ciencias
económicas, permitiendo así establecer comparaciones útiles entre los distintos resultados
de un mismo proceso.
En un histograma el eje de las 𝑥 (o abscisas) consiste del rango en el cual se encuentran los datos.
Ahora, las bases de los rectángulos consisten de los intervalos en los cuales agrupamos dichos datos.
Por otro lado, en el eje de las 𝑦 (u ordenadas) tenemos más opciones, dependiendo estas opciones
es el tipo de histograma que tenemos. Los dos tipos principales de histogramas son los siguientes:
Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias
acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva,
y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual.
Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de
ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia.
Ejemplo:
Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas,
desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que
aparecen reflejados en la siguiente tabla.
Para representar una ojiva y una ojiva porcentual de la serie, es necesario calcular las frecuencias
acumuladas (𝑛𝑖 = frecuencia absoluta, 𝑁i = frecuencia absoluta acumulada; 𝐹𝑖 frecuencia relativa
acumulada; % = porcentaje de la frecuencia relativa acumulada).
Puesto que la ojiva representa las frecuencias acumuladas, es una curva creciente. A cada valor de
la variable le corresponde, en la ojiva, su frecuencia más la frecuencia de todos los datos
anteriores a él.
Cuando la ojiva representa las frecuencias absolutas acumuladas, el último valor de la ojiva
corresponde al total de datos. Cuando se trata de una ojiva porcentual, el último valor de la
variable en la ojiva corresponde al valor 100.
Si a dos valores consecutivos les corresponde el mismo valor en la ojiva, significa que la frecuencia
del segundo valor es cero, y, por tanto, sumada a la del valor anterior vuelve a dar el mismo
resultado.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor
a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto
de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda. Las
medidas de dispersión en cambio miden el grado de dispersión de los valores de la variable. Dicho
en otros términos las medidas de dispersión pretenden evaluar en qué medida los datos difieren
entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto
de datos entregando información acerca de su posición y su dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la
forma en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística
diremos que se encuentran “agrupados” y si los datos no están en una tabla hablaremos de datos
“no agrupados”.
Según este criterio, haremos primero el estudio de las medidas estadísticas para datos no agrupados
y luego para datos agrupados.
Se identifica como datos agrupados a los datos dispuestos en una distribución de frecuencia. En tal
caso las fórmulas para el cálculo de promedio, mediana, modo, varianza y desviación estándar
deben incluir una leve modificación. A continuación, se entregan los detalles para cada una de las
medidas.
LA MEDIA: es el valor promedio de un conjunto de datos numéricos, calculada como la suma del
conjunto de valores dividida entre el número total de valores. La media, a diferencia de la esperanza
matemática, es un término matemático. Por su parte, la esperanza matemática es un término
estadístico, relacionado con las probabilidades. El cálculo de ambas variables viene, muchas veces,
a ser el mismo. No obstante, no siempre se utilizan en el mismo contexto.
Existen muchas formas de calcular una media. La más conocida es la media aritmética. Aun así, hay
otras formas para calcular la media de un conjunto de valores, como la media geométrica, la
ponderada o la armonizada. Vamos a verlas una a una:
Media aritmética
Es la forma que todos conocemos en la que todas las observaciones tienen la misma ponderación y
la solemos calcular con la siguiente fórmula:
MEDIA PONDERADA: La media ponderada es un tipo de media que otorga diferentes pesos a los
distintos valores sobre los que se calcula.
Una de las medias más utilizadas por su versatilidad es la media ponderada. Se diferencia de la
media aritmética en que no les da la misma importancia a todos los valores. De hecho, como
veremos más tarde, en realidad la media aritmética es una media ponderada en la que todos los
valores son igual de importantes.
La media ponderada se hace muy útil, por ejemplo, para calcular notas de una asignatura. Queremos
tener en cuenta para valorar la nota final que un alumno haya realizado los ejercicios, los trabajos y
haya participado en clase. Claro que, no podemos darle la misma importancia que al examen final.
En el examen final debe mostrar que, efectivamente, ha adquirido los conocimientos. Un profesor
de matemáticas podría, por ejemplo, indicar que la nota del examen tiene una ponderación del 70%,
la realización de ejercicios un 20% y la participación en clase un 10%.
Para cada uno de los casos anteriores, tendremos una nota distinta. Por ejemplo, en el examen un
8,5, en los ejercicios un 7,3 y en la participación en clase un 9,3. ¿Cómo calculamos la media si
tenemos valores diferentes, con diferentes porcentajes? Para ello se utiliza la media ponderada.
MEDIANA: La mediana es un conjunto es un valor que se encuentra a la mitad de los otros valores,
es decir que, al ordenar los números de menor a mayor, éste se encuentra justamente en medio
entre los que están por arriba.
Algunas características de la media son:
MODA: La moda estadística de un conjunto de datos, se define como el número que está
representado más veces dentro de esos datos, es decir, aquel número que presenta una mayor
frecuencia absoluta dentro de la muestra.
La moda puede ser calculada tanto para variables cuantitativas como para variables cualitativas.
Tipos de Moda Estadística
Podemos distinguir distintos tipos de moda estadística, en función del número de números que se
repitan una misma cantidad de veces, siendo ese número de repeticiones, el máximo del conjunto.
Dicho así parece algo complicado, pero es un término mucho más simple de lo que pueda parecer.
RELACIÓN ENTRE ELLAS: La media suele ser la medida de tendencia central más usada por su alto
grado de utilidad para múltiples contextos.
Sin embargo, cuando en una población se presentan casos que cuentan con datos muy por arriba o
por debajo de los que presenta el resto del grupo, se recomienda usar la mediana o la moda, pues
la media es más afectada por los valores extremos.