Está en la página 1de 25

ESTADISTICA DESCRIPTIVA EN DATOS NO

AGRUPADOS
Medidas de Tendencia Central
A las medidas de tendencia central con frecuencia se les suele llamar promedios, su
propósito es indicar con precisión el centro de un conjunto de observaciones. Son
medidas de tendencia central la moda, media y mediana.
Moda
● Es el valor de las observaciones que aparece con más frecuencia. La
moda es calculable en todos los niveles de medición, pero es
especialmente útil para describir niveles de medición ordinal y
nominal, tiene la ventaja de que no se ve afectada por valores
extremadamente grandes o extremadamente pequeños. Para un
conjunto de datos pueden existir 2 modas, que en su caso se llamaría
“Bimodal”, es decir, hay dos observaciones que tiene la misma
frecuencia más alta, si hay 3 o más modas se le suele llamar
“Multimodal”, si todas las observaciones tienen la misma frecuencia
entonces no existe la moda, este caso se nombra “Amodal”.
● Ejemplos:

45 81 62 53 60
53 70 45 45 72

62 53 80 53 80

La moda es 53, el dato que más ocasiones se repite.


4 8 10 12 6

6 2 4 3 7

● Caso bimodal, 4 y 6 son los datos con mayor frecuencia


10 10 30 40
20 20 30 50

● Caso Multimodal donde 10, 20 y 30 son los números que tienen mayor
frecuencia
150 170 190 250
160 180 200 300

● Caso Amodal, no hay ningún dato que tenga mayor frecuencia


Mediana
● Es la observación central de los valores, una vez que estos han sido
ordenados, de manera ascendente o de manera descendente. La
mediana es única, solo existe una mediana para un conjunto de datos.
Al igual que la moda, no es afectada por valores extremadamente
grandes o extremadamente pequeños. Se puede calcular en los niveles
ordinal, de intervalo y de razón y es apreciable en las distribuciones de
frecuencias.
● Para calcular la mediana debemos tomar en cuenta el número total de
las observaciones (n para el caso de una muestra, N para el caso de una
población). El procedimiento se ve afectado si este número es par o si
es impar.
● Ejemplo:

Mediana =60

Mediana = (20+30)/2= 25
Media


5 7 5 7 6 10 21 12 13 28
8 6 3 9 4 15 18 30 27 11
Medidas de Dispersión
● Si consideramos únicamente el valor central de un conjunto de datos, o si
comparamos varios conjuntos de datos usando los valores centrales,
podemos llegar a conclusiones erróneas. Además de los valores centrales
debemos considerar la dispersión, llamada con frecuencia variación o
diseminación, de los datos.
● Un valor pequeño en la dispersión indica que los datos se encuentran
estrechamente agrupados alrededor de la media; entonces se la media se
considera representativa de los datos. De manera inversa, si la dispersión es
un número grande indica que los datos no se encuentran estrechamente
agrupados alrededor de la media, entonces la Media no es confiable, no es
representativa de los datos.
● Consideramos Medidas de Dispersión: Rango, Desviación Media, Desviación
Estándar, Varianza y Coeficiente de Variación
Rango

15 10 31 24 5 22 29 30
Desviación Media

103 97 101 106 103


Varianza y Desviación Estándar

Coeficiente de Variación

Medidas de Posición
Las Medidas de Posición es un método que determina la localización de
valores que divide al conjunto de observaciones en partes iguales, dentro
de estas medidas tenemos cuartiles, deciles y percentiles. Para el cálculo
de posiciones los datos deben estar ordenados.
Los cuartiles dividen al conjunto de observaciones en cuatro partes
iguales, el primer cuartil es llamado Q1, por debajo de él se encuentra el
25% de los datos y sobre él está el 75%, el segundo cuartil es llamado Q2
y coincide con el valor de la mediana, el Q3 es inverso al cuartil 1. De
manera muy similar ocurre con los deciles, que dividen el conjunto de
observaciones en diez partes iguales y que son nombradas D1, D2, D3 y
así sucesivamente, por debajo del decil 1 se encuentra el 10% de los datos
y por encima de él el 90%.

1460 1471 1637 1721 1758


1787 1940 2038 2047 2054
2097 2205 2287 2311 2406
Medidas de Forma
● Simetría y Sesgo
● Mide las desviaciones de las medidas de tendencia central, ya que el sesgo
es el grado de asimetría o falta de asimetría, de una distribución, si el
polígono de frecuencias visualizado de una distribución tiene una cola más
larga a la derecha del máximo central que a la izquierda, se dice que la
distribución esta sesgada a la derecha o que tiene sesgo positivo (asimetría
positiva) y si al contrario se dice que tiene sesgo o asimetría negativa.
● La asimetría es la medida que indica la simetría de la distribución de una
variable respecto a la media aritmética, sin necesidad de hacer la
representación gráfica. Los coeficientes de asimetría indican si hay el
mismo número de elementos a izquierda y derecha de la media.
● Existen tres tipos de curva de distribución según su asimetría:
● Asimetría negativa: la cola de la distribución se alarga para valores
inferiores a la media.
● · Simétrica: hay el mismo número de elementos a izquierda y derecha
de la media. En este caso, coinciden la media, la mediana y la moda. La
distribución se adapta a la forma de la campana de Gauss, o
distribución normal.
● · Asimetría positiva: la cola de la distribución se alarga para valores
superiores a la media.

Curtosis
● La curtosis (o apuntamiento) es una medida de forma que mide cuán
escarpada o achatada está una curva o distribución. Este coeficiente
indica la cantidad de datos que hay cercanos a la media, de manera que
a mayor grado de curtosis, más escarpada (o apuntada) será la forma de
la curva.

También podría gustarte