Está en la página 1de 12

FRECUENCIAS, TABLAS Y

REPRESENTACIÓN
GRAFICA
Unos cuantos términos…
Un conjunto de datos describe individuos, que pueden ser personas pero también objetos.

De las variables asociadas a este conjunto de datos, distinguiremos entre variable


cuantitativa , que asocia un numero a cada individuo, o variable cualitativa , que coloca
cada individuo en una categoría.

Distribución de una variable X asociada a un conjunto de datos: Describe la distribución de X


corresponde a establecer la lista de los valores que toma X junto con la frecuencia con la que
toma cada valor.

Frecuencia absoluta: denota el numero de veces que aparece este valor en el conjunto de
datos
Frecuencia relativa corresponde a la proporción (o el porcentaje) de veces que aparece este
valor (determinar si el conjunto de datos presenta mucha o poca variabilidad).
Representaciones gráficas
Para variable cualitativa
Para cada valor que toma la
variable en el conjunto y que
indicamos en el eje horizontal,
representamos en el eje
vertical su frecuencia absoluta
o relativa, en forma de una
barra.

Si el conjunto no presenta demasiados valores distintos, también podemos


utilizar el diagrama de sectores, donde cada valor ocupa un sector circular cuya
área es proporcional a su frecuencia.
Representaciones gráficas
Para variable cuantitativa
Las representaciones
gráficas describen la
distribución de la
variable en el
conjunto.

Al examinarlos hay
que intentar contestar
a las siguientes
preguntas, para
resumir las
características de la
distribución.
1. ¿Es el histograma simétrico? Es decir, ¿aparece un punto central, respecto al cual,
los valores se van repartiendo de manera aproximadamente simétrica?
2. ¿Posee la distribución colas largas?
3. ¿Posee un máximo claro y único? En este caso hablamos de histograma unimodal.
4. ¿Aparecen datos atípicos? es decir datos que se alejan del patrón global de los datos.
5. ¿Donde localizamos el centro aproximado de los datos?
6. ¿Presentan los datos mucha dispersión?, lo que se traduce en la forma
puntiaguda o chata del histograma.
Medidas numéricas
Para variables cuantitativas, se suele acompañar las representaciones
graficas de las distribuciones con medidas numéricas que proporcionen
un resumen de sus características principales.

• Medidas de tendencia central


• Media
• Mediana
• Moda

• Medidas de dispersión
• Varianza
• Desviación estándar o típica
• Rango intercuartil
Tendencia central
• Media: Representa el centro de gravedad de los datos, es decir que la media
representa el punto en el que el conjunto esta en equilibrio (es muy susceptible a
los datos atípicos).

• Mediana: es el punto que deja el 50 % de los datos a su izquierda y el otro 50 %


a su derecha. Es una medida de centralización mas adecuada que la media en el
caso en que la distribución de los datos es asimétrica ( lo que se ve en el
histograma) o si hay datos atípicos. Si la distribución es simétrica, la media y la
mediana coinciden.
Medidas de Dispersión
• La desviación típica: Mide lo lejos que están situados los datos respecto de su
centro de gravedad, la media.

• La varianza: representa aproximadamente el promedio de las distancias al


cuadrado entre los datos y su media. La desviación típica s es la raíz cuadrada de
s2
El rango intercuartlico (RIC)

Los cuartiles se definen como los puntos que separan el conjunto en cuatro partes de mismo
tamaño.

El primer cuartil Q1 deja el 25 % de los datos ordenados a su izquierda, y el otro 75 % a su


derecha, mientras que el tercer cuartil Q3 deja el 75 % de los datos ordenados a su
izquierda, y el otro 25 % a su derecha.

Por lo tanto el par (Q1, Q3) nos proporciona información sobre la dispersión presente en los
datos: cuanto mas alejados estén los cuartiles, mas dispersos están los datos.

También podría gustarte