Está en la página 1de 9

Moda (estadística)

En estadística, la moda es el valor con mayor frecuencia en


una de las distribuciones de datos. Esto va en forma de una
columna cuando encontremos dos modas, es decir, dos datos
que tengan la misma frecuencia absoluta máxima. Una
distribución trimodal de los datos es en la que encontramos
tres modas. En el caso de la distribución uniforme discreta,
cuando todos los datos tienen la misma frecuencia, se puede
definir las modas como indicadas, pero estos valores no
tienen utilidad. Por eso algunos matemáticos califican esta
distribución como «sin moda».

El intervalo modal es el de mayor frecuencia absoluta. Cuando


tratamos con datos agrupados antes de definir la moda, se ha
de definir el intervalo modal.

La moda, cuando los datos están agrupados, es un punto


que divide al intervalo modal en dos partes de la forma p y
c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos
anterior y posterior, respectivamente, al intervalo modal.

Moda de datos agrupado


Para obtener la moda en datos agrupados se usa la siguiente fórmula:

Dónde:
Li = Límite inferior de la clase modal.
D1 = es el delta de frecuencia absoluta modal y la frecuencia absoluta premodal.
D2 = es el delta de frecuencia absoluta modal y la frecuencia absoluta postmodal.
Ai = Amplitud del intervalo modal

Propiedades
Sus principales propiedades son:

 Cálculo sencillo.
 Interpretación muy clara.
 Al depender sólo de las frecuencias, puede calcularse para variables cualitativas.
Es por ello el parámetro más utilizado cuando al resumir una población no es posible
realizar otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las
características más frecuentes de determinado sector social. Esto se conoce
informalmente como "retrato robot".
Inconvenientes
 Su valor es independiente de la mayor parte de los datos, lo que la hace muy
sensible a variaciones muestrales. Por otra parte, en variables agrupadas en
intervalos, su valor depende excesivamente del número de intervalos y de su amplitud.
 Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos
fuera de la moda, no afectan en modo alguno a su valor.
 No siempre se sitúa hacia el centro de la distribución.
 Puede haber más de una moda en el caso en que dos o más valores de la variable
presenten la misma frecuencia (distribuciones bimodales o multimodales).

Moda de Datos repetidos


Para averiguar la moda en un grupo de números:

 Ordena los números según su tamaño.


 Determina la cantidad de veces de cada valor
numérico.
 El valor numérico que más se repite es la moda.
 Puede haber más de una moda cuando dos o
más números se repiten la misma cantidad de
veces y además este es el máximo número de
veces del conjunto.
 No hay moda si ningún número se repite más de una vez.

Ejemplo: La moda de 2, 4, 5, 5, 5, 7, 8, 8, 9, 12 es 5.

Moda de Datos no repetidos


La moda de un conjunto de datos es el dato que más veces se repite, es decir, aquel que tiene
mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos valores de la variable que
tengan la mayor frecuencia absoluta, habría dos modas. Si no se repite ningún valor, no existe
moda.

Ejemplo:

Delos siguientes casos que se presentan calcular la moda para cada caso:

a) 5; 1; 6; 5; 3; 4.

¿Cuál es el dato que más se repite en el ejemplo anterior?


El dato que más se repite es el 5, es el que tiene mayor frecuencia absoluta (2 veces).

La moda del número de hermanos es

Mo = 5 ES UNIMODAL

b) 7; 4; 5; 4; 8; 5; 2; 4
 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia
es la máxima, tiene varias modas.
 La moda es el valor que tiene mayor frecuencia absoluta.
 Se representa por Mo.
 Se puede hallar la moda para variables cualitativas y cuantitativas

Mo = 4 Mo = 4

Mo = 5

c) 11; 13; 8; 7; 11: 14; 13

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la
máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.

Mo = 11 BIMODAL (MULTIMODAL)

Mo = 13

d) 3; 23; 33; 43

NO HAY MODA, debido a que ningun dato se repite.

Desviación
La desviación es una medida de la diferencia entre el valor observado de una variable y
algún otro valor, a menudo la media de esa variable. El signo de la desviación informa del
sentido de esa diferencia (la desviación es positiva cuando el valor observado excede el
valor de referencia). La magnitud del valor indica el tamaño de la diferencia

Tipos

Una desviación que es una diferencia entre un valor observado y el valor verdadero de una
cantidad de con significado estadístico (como la media de una población) es un error, y una
desviación que es la diferencia entre el valor observado y una estimación del valor verdadero
(tal estimación puede ser una media muestral) es un residuo. Estos conceptos son aplicables
para datos en los niveles de medición de intervalo y de valor relativo.

Sin signo o desviación absoluta

En estadística, la desviación absoluta de un elemento de un conjunto de datos es la diferencia


absoluta entre ese elemento y un punto dado. Por lo general, la desviación se calcula a partir
de un valor central, y se interpreta como algún tipo de promedio, con mayor frecuencia la
mediana o, a veces, la media del conjunto de datos
donde
Di es la desviación absoluta,
xi es un elemento del conjunto de datos
y m (X) es la medida elegida de las medidas de tendencia central del conjunto de
datos, a veces la media ( ), pero más a menudo la mediana.
Medidas

 Desviación media con signo

Cuando se considera un estimador no sesgado, el promedio de las desviaciones con signo en el


conjunto de todas las observaciones del valor del parámetro de población no observada,
promedia cero en un número arbitrariamente grande de muestras. Sin embargo, por
construcción, el promedio de las desviaciones con signo de los valores con respecto al valor
medio de la muestra siempre es cero, aunque la desviación con signo promedio de otra
medida de tendencia central, como la mediana de la muestra, pueda no ser cero
necesariamente.

 Dispersión

Las estadísticas de la distribución de desviaciones se utilizan como medidas de dispersión.

 Desviación típica: es la medida de dispersión utilizada con más frecuencia: utiliza


desviaciones de cuadráticas y tiene propiedades deseables, pero no es robusta.
 Desviación media: es la suma de los valores absolutos de las desviaciones dividida por
el número de observaciones.
 Desviación absoluta mediana: es una indicador estadístico robusto que usa las
desviaciones absolutas respecto a la mediana (no respecto a la media).
 Máxima desviación absoluta: es una medida muy poco robusta, que utiliza la
desviación absoluta máxima.

Normalización

Las desviaciones tienen unidades de la escala de medición (por ejemplo, metros o pulgadas si
se miden longitudes). Es posible adimensionalizarlas de dos maneras.

Una forma es dividir por una medida de escala (una medida de dispersión), la mayoría de las
veces es la desviación estándar de la población, en unidades tipificadas, o la desviación
estándar de la muestra, cuando se studentiza (por ejemplo, el residuo studentizado).

En cambio, se puede escalar por la ubicación, en vez de por la dispersión: la fórmula para
calcular una desviación porcentual es restar el valor observado menos el valor aceptado, y
dividir la diferencia por el valor aceptado, multiplicando el resultado por 100%.

Medidas de dispersión
estadística, las medidas de dispersión (también
llamadas variabilidad, dispersión o propagación) es el grado en que una distribución se
estira o exprime.

Ejemplos comunes de medidas de dispersión estadística son la varianza, la desviación


estándar y el rango intercuartil.
Las medidas de dispersión se contrastan con la ubicación o la tendencia central, y juntas
son las propiedades más utilizadas de las distribuciones
Una medida de dispersión estadística es un número real no negativo que es cero si todos
los datos son iguales y aumenta a medida que los datos se vuelven más diversos.
La mayoría de las medidas de dispersión tienen las mismas unidades que la cantidad que
se mide. En otras palabras, si las medidas están en metros o segundos, también lo es la
medida de dispersión. Los ejemplos de medidas de dispersión incluyen:

 Desviación Estándar
 Rango intercuartil (IQR)
 Rango
 Diferencia absoluta media (también conocida como diferencia absoluta media de
Gini)
 Mediana desviación absoluta (MDA)
 Desviación media absoluta (o simplemente llamada desviación media)
 Desviación estándar de distancia
Estos se usan con frecuencia (junto con factores de escala)
como estimadores de parámetros de escala, en cuya capacidad se
denominan estimaciones de escala. Las medidas de escala robustas no se ven afectadas
por un pequeño número de valores atípicos, e incluyen el IQR y el MAD.
Existen otras medidas de dispersión:

 Varianza (el cuadrado de la desviación estándar): invariante de ubicación pero no


lineal en escala.
 Relación de varianza a media: se utiliza principalmente para los datos de conteo
cuando se usa el término coeficiente de dispersión y cuando esta relación no tiene
dimensiones, ya que los datos de conteo son adimensionales, de lo contrario.
Algunas medidas de dispersión tienen fines especializados, entre ellos la varianza de Allan
y la varianza de Hadamard.
Para las variables categóricas, es menos común medir la dispersión por un solo número;
ver variación cualitativa. Una medida que lo hace es la entropía discreta

PROPIEDADES
Guarda las mismas dimensiones que las observaciones. La suma de valores absolutos es
relativamente sencilla de calcular, pero esta simplicidad tiene un inconveniente: Desde el
punto de vista geométrico, la distancia que induce la desviación media en el espacio de
observaciones no es la natural (no permite definir ángulos entre dos conjuntos de
observaciones). Esto hace que sea muy engorroso trabajar con ella a la hora de hacer
inferencia a la población.

Cuando mayor sea el valor de la desviación media, mayor es la dispersión de los datos. Sin
embargo, no proporciona una relación matemática precisa entre su magnitud y la posición de
un dato dentro de una distribución.
La desviación media al tomar los valores absolutos mide una observación sin mostrar si la
misma está por encima o por debajo de la media aritmética.

RANGO

El rango, también conocido como recorrido es la diferencia entre el valor


más alto y el más bajo de un conjunto de datos. En cierto modo, se
puede considerar que es el mismo concepto que el dominio de una
función continua.

Rango
Indica la dispersión entre los valores extremos de una variable. se calcula como la
diferencia entre el mayor y el menor valor de la variable. Se denota como R.

Para datos ordenados se calcula como:

R = x(n) - x(1)

Donde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.

Desviació n media
Es una medida que se utiliza para calcular cuánto varían de su medida de valores
de un conjunto de datos. También se conoce como desviación media o desviación
media absoluta

Es la media aritmética de los valores absolutos de las diferencias de cada dato


respecto a la media.

Donde:

xi: valores de la variable.

n: número total de datos

ejemplo:
Desviació n está ndar
La desviación estándar mide el grado de dispersión de los datos con respecto a la
media, se denota como s para una muestra o como σ para la población. Se define
como la raíz cuadrada de la varianza según la expresión:

Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde


se divide entre n; también existe la fórmula de desviación típica donde el
denominador es n pero se prefiere n-1.

Mientras menor sea la desviación estándar, los datos son más homogéneos, es
decir existe menor dispersión, el incremento de los valores de la desviación
estándar indica una mayor variabilidad de los datos.

Media aritmética

Una de las medidas que caracterizan a una distribución es la media aritmética,


que se obtiene sumando los valores xi introducidos, y dividiendo entre el
número total N.
Sea x es el array que guarda las n medidas. La codificación de la
función valor Medio que calcula y devuelve el valor medio no reviste
dificultad.

Media cuadrática.
Media cuadrática, valor cuadrático medio o RMS, es una medida estadística
de la magnitud de una cantidad variable. Puede calcularse para una serie de
valores discretos o para una función de variable continua. El nombre deriva
del hecho de que es la raíz cuadrada de la media aritmética de los cuadrados
de los valores.

A veces la variable toma valores positivos y negativos, como ocurre, por


ejemplo en los errores de media. En tal caso se puede estar interesado en
obtener un promedio que no recoja los efectos del signo. Este problema se
resuelve, mediante la denominación media cuadrática. Consiste en elevar al
cuadrado todas las observaciones (así los signos negativos desaparecen), en
obtener después su media aritmética y en extraer, finalmente, la raíz cuadrada
de dicha media para volver a la unidad de media original. La desviación
estándar es una media cuadrática.

Para datos agrupados

Para datos no agrupado

La media cuadrática se haya por medio de la raíz cuadrada de la media


aritmética de los cuadrados de los datos dados.
Varianza
Es otro parámetro utilizado para medir la dispersión de los valores de una variable
respecto a la media. Corresponde a la media aritmética de los cuadrados de las
desviaciones respecto a la media. Su expresión matemática es:

donde Xi es el dato i-ésimo y   es la media de los N datos.

Coeficiente de Variació n
Permite determinar la razón existente entre la desviación estándar (s) y la media.
Se denota como CV. El coeficiente de variación permite decidir con mayor claridad
sobre la dispersión de los datos.

También puede ser expresado en por ciento.

También podría gustarte