Está en la página 1de 9

INSTITUTO TECNOLÓGICO SUPERIOR DE

MARTÍNEZ DE LA TORRE

Materia: Probabilidad y Estadística Descriptiva.

Trabajo: Resumen de la distribución de frecuencia, polígonos de frecuencia,


histogramas y ojivas, medidas de tendencia central para un conjunto de datos y
datos agrupados, media, media ponderada, mediana, moda y su relación entre
ellas.

Maestro: Víctor Guillermo Asad Zetina

Alumno: Shareni Guadalupe Romo Carrillo

No. Control: 200i0058

Vega de Alatorre Ver; a 06 de noviembre 2021


La distribución de frecuencias es la forma en la que un conjunto de datos se clasifica en distintos
grupos excluyentes entre sí. Es decir, si un dato pertenece a un grupo no puede pertenecer a otro.

La distribución de frecuencias, en otras palabras, es la manera en la que se ordena una serie de


observaciones en diferentes grupos, y normalmente en modo ascendente o descendente.

Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por
filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La
finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen
los datos.

Ejemplo: Quieren conocer si un grupo de individuos está a favor o en contra de la exhibición de


imágenes violentas por televisión, para lo cual han recogido los siguientes datos:

La inspección de los datos originales no permite responder fácilmente a cuestiones como cuál es la
actitud mayoritaria del grupo, y resulta bastante más difícil determinar la magnitud de la diferencia
de actitud entre hombres y mujeres.

Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable acompañados
del número de veces (la frecuencia) que aparece cada valor:

X: Símbolo genérico de la variable.

f: Frecuencia (también se simboliza como ni).


La distribución de frecuencias de los datos del ejemplo muestra que la actitud mayoritaria de los
individuos del grupo estudiado es indiferente.

La interpretación de los datos ha sido facilitada porque se ha reducido el número de números a


examinar (en vez de los 20 datos originales, la tabla contiene 5 valores de la variable y 5 frecuencias).

Generalmente las tablas incluyen varías columnas con las frecuencias relativas (son el número de
ocurrencias dividido por el total de datos, y se simbolizan "𝑓𝑟" o "𝑃𝑖"), frecuencias acumuladas (la
frecuencia acumulada es el total de frecuencias de los valores iguales o inferiores al de referencia,
y se simbolizan "𝑓𝑎" o "𝑛𝑎". No obstante, la frecuencia acumulada también es definida incluyendo
al valor de referencia), frecuencias acumuladas relativas (la frecuencia acumulada relativa es el total
de frecuencias relativas de los valores iguales o inferiores al de referencia, y se simbolizan "𝑓𝑟" o
"𝑝𝑎").

Un polígono de frecuencias se forma uniendo los extremos de las barras de un diagrama de barras
mediante segmentos. También se puede realizar trazando los puntos que representan las
frecuencias y uniéndolos mediante segmentos.

Ejemplo:

Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones:
Con esta herramienta gráfica pueden representarse variables cuantitativas o distribuciones
diferentes, cosa que tradicionalmente no hace un histograma, de un modo rápido y sencillo.
Además, cuenta con la virtud de ser apreciable a simple vista.

Por esta razón es sumamente empleado dentro de las ciencias sociales y ciencias
económicas, permitiendo así establecer comparaciones útiles entre los distintos resultados
de un mismo proceso.

Un histograma es la representación gráfica en forma de barras, que simboliza la distribución de un


conjunto de datos. Sirven para obtener una "primera vista" general, o panorama, de la distribución
de la población, o de la muestra, respecto a una característica, cuantitativa y continua.

En un histograma el eje de las 𝑥 (o abscisas) consiste del rango en el cual se encuentran los datos.
Ahora, las bases de los rectángulos consisten de los intervalos en los cuales agrupamos dichos datos.

Por otro lado, en el eje de las 𝑦 (u ordenadas) tenemos más opciones, dependiendo estas opciones
es el tipo de histograma que tenemos. Los dos tipos principales de histogramas son los siguientes:

• Histograma de frecuencias absolutas. Representa la frecuencia absoluta mediante la altura


de las barras.
• Histograma de frecuencias relativas. Representa la frecuencia relativa mediante la altura
de las barras.

Recibe el nombre de ojiva un gráfico que, mediante el trazado de una línea, muestra las frecuencias
acumuladas de la serie. Si representa frecuencias absolutas acumuladas se llama simplemente ojiva,
y si representa los porcentajes de las frecuencias relativas acumuladas se llama ojiva porcentual.
Para representar una ojiva, se marcan en el eje de abscisas los valores de la variable y en el eje de
ordenadas las frecuencias acumuladas. Se utiliza para representar series atemporales de frecuencia.

Ejemplo:

Vamos a representar una ojiva de la serie correspondiente a los complementos salariales (dietas,
desplazamientos...) expresados en euros de los 130 empleados y empleadas de una empresa, que
aparecen reflejados en la siguiente tabla.

Para representar una ojiva y una ojiva porcentual de la serie, es necesario calcular las frecuencias
acumuladas (𝑛𝑖 = frecuencia absoluta, 𝑁i = frecuencia absoluta acumulada; 𝐹𝑖 frecuencia relativa
acumulada; % = porcentaje de la frecuencia relativa acumulada).

Ilustración 1 Ejemplo de Ojiva


Ilustración 2 Ejemplo de Ojiva Porcentual

INTERPRETACIÓN DE UNA OJIVA

Puesto que la ojiva representa las frecuencias acumuladas, es una curva creciente. A cada valor de
la variable le corresponde, en la ojiva, su frecuencia más la frecuencia de todos los datos
anteriores a él.

Cuando la ojiva representa las frecuencias absolutas acumuladas, el último valor de la ojiva
corresponde al total de datos. Cuando se trata de una ojiva porcentual, el último valor de la
variable en la ojiva corresponde al valor 100.

Si a dos valores consecutivos les corresponde el mismo valor en la ojiva, significa que la frecuencia
del segundo valor es cero, y, por tanto, sumada a la del valor anterior vuelve a dar el mismo
resultado.

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor
a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto
de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda. Las
medidas de dispersión en cambio miden el grado de dispersión de los valores de la variable. Dicho
en otros términos las medidas de dispersión pretenden evaluar en qué medida los datos difieren
entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto
de datos entregando información acerca de su posición y su dispersión.

Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la
forma en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística
diremos que se encuentran “agrupados” y si los datos no están en una tabla hablaremos de datos
“no agrupados”.

Según este criterio, haremos primero el estudio de las medidas estadísticas para datos no agrupados
y luego para datos agrupados.
Se identifica como datos agrupados a los datos dispuestos en una distribución de frecuencia. En tal
caso las fórmulas para el cálculo de promedio, mediana, modo, varianza y desviación estándar
deben incluir una leve modificación. A continuación, se entregan los detalles para cada una de las
medidas.

LA MEDIA: es el valor promedio de un conjunto de datos numéricos, calculada como la suma del
conjunto de valores dividida entre el número total de valores. La media, a diferencia de la esperanza
matemática, es un término matemático. Por su parte, la esperanza matemática es un término
estadístico, relacionado con las probabilidades. El cálculo de ambas variables viene, muchas veces,
a ser el mismo. No obstante, no siempre se utilizan en el mismo contexto.

Formas de calcular la media

Existen muchas formas de calcular una media. La más conocida es la media aritmética. Aun así, hay
otras formas para calcular la media de un conjunto de valores, como la media geométrica, la
ponderada o la armonizada. Vamos a verlas una a una:

Media aritmética

Es la forma que todos conocemos en la que todas las observaciones tienen la misma ponderación y
la solemos calcular con la siguiente fórmula:

Donde x es el valor de la observación i, y N el número total de observaciones.

MEDIA PONDERADA: La media ponderada es un tipo de media que otorga diferentes pesos a los
distintos valores sobre los que se calcula.

Una de las medias más utilizadas por su versatilidad es la media ponderada. Se diferencia de la
media aritmética en que no les da la misma importancia a todos los valores. De hecho, como
veremos más tarde, en realidad la media aritmética es una media ponderada en la que todos los
valores son igual de importantes.
La media ponderada se hace muy útil, por ejemplo, para calcular notas de una asignatura. Queremos
tener en cuenta para valorar la nota final que un alumno haya realizado los ejercicios, los trabajos y
haya participado en clase. Claro que, no podemos darle la misma importancia que al examen final.
En el examen final debe mostrar que, efectivamente, ha adquirido los conocimientos. Un profesor
de matemáticas podría, por ejemplo, indicar que la nota del examen tiene una ponderación del 70%,
la realización de ejercicios un 20% y la participación en clase un 10%.

Para cada uno de los casos anteriores, tendremos una nota distinta. Por ejemplo, en el examen un
8,5, en los ejercicios un 7,3 y en la participación en clase un 9,3. ¿Cómo calculamos la media si
tenemos valores diferentes, con diferentes porcentajes? Para ello se utiliza la media ponderada.

Fórmula de la media ponderada

La fórmula de la media ponderada es la siguiente:

MEDIANA: La mediana es un conjunto es un valor que se encuentra a la mitad de los otros valores,
es decir que, al ordenar los números de menor a mayor, éste se encuentra justamente en medio
entre los que están por arriba.
Algunas características de la media son:

• Las operaciones para calcular el valor son muy sencillas de realizar.


• La medida no depende de los valores de las variables, solamente de su orden.
• Generalmente, los valores son enteros.
• Se puede calcular, aunque los números que se encuentren arriba y abajo no tengan límites.

Como sacar la Mediana

Los pasos para sacar la mediana son:

1. Ordena todos los números del más pequeño al más grande.


2. Encuentra el número del medio del conjunto.
• Si tienes una cantidad impar: Tacha el número al final de la izquierda, después el primero a la
derecha, y repite el proceso hasta quedarte con un número, que será la mediana.
• Si tienes una cantidad par, al final quedarás con dos números en el centro. Súmalos y divídelos
entre 2 para obtener la mediana.

MODA: La moda estadística de un conjunto de datos, se define como el número que está
representado más veces dentro de esos datos, es decir, aquel número que presenta una mayor
frecuencia absoluta dentro de la muestra.

¿Cómo se calcula la moda?

La moda puede ser calculada tanto para variables cuantitativas como para variables cualitativas.
Tipos de Moda Estadística

Podemos distinguir distintos tipos de moda estadística, en función del número de números que se
repitan una misma cantidad de veces, siendo ese número de repeticiones, el máximo del conjunto.
Dicho así parece algo complicado, pero es un término mucho más simple de lo que pueda parecer.

• MODA UNIMODAL: cuando el máximo número de repeticiones se da para un solo número.


• MODA BIMODAL: cuando el máximo número de repeticiones se da para dos números.
• MODA MULTIMODAL: cuando el máximo número de repeticiones se da para tres o más
números.

RELACIÓN ENTRE ELLAS: La media suele ser la medida de tendencia central más usada por su alto
grado de utilidad para múltiples contextos.

Sin embargo, cuando en una población se presentan casos que cuentan con datos muy por arriba o
por debajo de los que presenta el resto del grupo, se recomienda usar la mediana o la moda, pues
la media es más afectada por los valores extremos.

También podría gustarte