Está en la página 1de 3

CUADRADO MEDIO DEL ERROR

En estadística, el error cuadrático medio (ECM) de un estimador mide el promedio de los


errores al cuadrado, es decir, la diferencia entre el estimador y lo que se estima. El ECM es una
función de riesgo, correspondiente al valor esperado de la pérdida del error al cuadrado o
pérdida cuadrática. La diferencia se produce debido a la aleatoriedad o porque el estimador no
tiene en cuenta la información que podría producir una estimación más precisa.

El ECM es el segundo momento (sobre el origen) del error, y por lo tanto incorpora tanto la
varianza del estimador, así como su sesgo. Para un estimador insesgado, el ECM es la varianza
del estimador. Al igual que la varianza, el ECM tiene las mismas unidades de medida que el
cuadrado de la cantidad que se estima. En una analogía con la desviación estándar, tomando la
raíz cuadrada del ECM produce el error de la raíz cuadrada de la media o la desviación de la
raíz cuadrada media (RMSE o RMSD), que tiene las mismas unidades que la cantidad que se
estima; para un estimador insesgado, el RMSE es la raíz cuadrada de la varianza, conocida
como la desviación estándar.

DESVIACIÓN ESTÁNDAR (PARA QUÉ ES IMPORTANTE)


La desviación estándar es un índice numérico de la dispersión de un conjunto de datos (o
población). Mientras mayor es la desviación estándar, mayor es la dispersión de la población.
La desviación estándar es un promedio de las desviaciones individuales de cada observación
con respecto a la media de una distribución. Así, la desviación estándar mide el grado de
dispersión o variabilidad. En primer lugar, midiendo la diferencia entre cada valor del conjunto
de datos y la media del conjunto de datos. Luego, sumando todas estas diferencias
individuales para dar el total de todas las diferencias. Por último, dividiendo el resultado por el
número total de observaciones (normalmente representado por la letra “n”) para llegar a un
promedio de las distancias entre cada observación individual y la media. Este promedio de las
distancias es la desviación estándar y de esta manera representa dispersión.

Matemáticamente, la desviación estándar podría, a primera vista, parecer algo complicada. Sin
embargo, es en realidad un concepto extremadamente simple. En realidad, no importa si usted
no sabe calcular con exactitud la desviación estándar, siempre y cuando usted comprenda
claramente el concepto.

La desviación estándar es un indicador en extremo valioso con muchas aplicaciones. Por


ejemplo, los estadísticos saben que cuando un conjunto de datos se distribuye de manera
“normal”, el 68% de las observaciones de la distribución tiene un valor que se encuentra a
menos de una desviación estándar de la media. También saben que el 96% de todas las
observaciones tiene un valor no es mayor a la media más o menos dos desviaciones estándar

LA VARIANZA
En teoría de probabilidad, la varianza o variancia de una variable aleatoria es una medida de
dispersión definida como la esperanza del cuadrado de la desviación de dicha variable
respecto a su media. Su unidad de medida corresponde al cuadrado de la unidad de medida de
la variable: por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en
metros al cuadrado. La varianza tiene como valor mínimo 0. La desviación estándar (raíz
cuadrada positiva de la varianza) es una medida de dispersión alternativa, expresada en las
mismas unidades que los datos de la variable objeto de estudio.

FRANSHELY GÓMEZ
2021-0982
Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no
se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas.
En tales casos se recomienda el uso de otras medidas de dispersión más robustas.

COEFICIENTE DE VARIACIÓN
El coeficiente de variación o coeficiente de variación de Spearman es una medida estadística
que ofrece información respecto de la dispersión relativa de un conjunto de datos. Esta
medida es muy utilizada en la ciencia de las estadísticas, relacionando la media aritmética y la
desviación estándar de un conjunto de datos. Así, en resumen, el coeficiente de variación sería
la variación ambicionada de un conjunto de datos respecto de su media aritmética.

Este coeficiente es utilizado para comparar conjuntos de datos de poblaciones distintas,


teniéndose en cuenta el valor de la media aritmética, lo que nos permite eliminar las
eventuales distorsiones de las medias de dos o más poblaciones.

PROMEDIO
El concepto de promedio se vincula a la media aritmética, que consiste en el resultado que se
obtiene al generar una división con la sumatoria de diversas cantidades por el dígito que las
represente en total. Claro que esta noción también se utiliza para nombrar al punto en que
algo puede ser dividido por la mitad o casi por el medio y para referirse al término medio de
una cosa o situación.

El promedio, por lo tanto, es un número finito que puede obtenerse a partir de la sumatoria de
diferentes valores dividida entre el número de sumandos. Por ejemplo: si en una cena, ocho
personas beben cinco litros de vino, puede decirse que los comensales han bebido un
promedio de 0,625 litros de vino por persona.

MEDIANA
La mediana es un conjunto es un valor que se encuentra a la mitad de los otros valores, es
decir, que, al ordenar los números de menor a mayor, éste se encuentra justamente en medio
entre los que están por arriba.

Algunas características de la media son:

- Las operaciones para calcular el valor son muy sencillas de realizar.


- La medida no depende de los valores de las variables, solamente de su orden.
- Generalmente, los valores son enteros.
- Se puede calcular, aunque los números que se encuentren arriba y abajo no tengan
límites.

RANGO
El rango es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de
una población o muestra estadística.

El rango suele ser utilizado para obtener la dispersión total. Es decir, si tenemos una muestra
con dos observaciones: 10 y 100 euros, el rango será de 90 euros.

FRANSHELY GÓMEZ
2021-0982
Sobre todo, en finanzas, el rango es muy útil para observar cuán grande podría llegar a ser una
variación o cambio. Vale la pena mencionar también que, en no pocas ocasiones, el rango no
es una medida fija. Por ejemplo, imaginemos que el crecimiento del producto interior bruto
(PIB) de un país, ha estado entre el 3 y el 5% durante los últimos 20 años. El rango para estos
datos será del 2% pero esto no quiere decir que siempre vaya a ser ese. De modo que si en el
año 21, el crecimiento es del -1%, el rango de los últimos 21 años pasará del 2% al 6%.

MODA
La moda estadística de un conjunto de datos se define como el número que está representado
más veces dentro de esos datos, es decir, aquel número que presenta una mayor frecuencia
absoluta dentro de la muestra.

Por lo tanto, para calcular la moda de un conjunto de datos estadísticos basta con contar el
número de veces que aparece cada dato en la muestra, y el dato más repetido será la moda.

La moda sirve para definir una distribución estadística, ya que el valor más repetido suele estar
por el centro de la distribución.

La moda también se puede decir moda estadística o valor modal. Asimismo, cuando los datos
están agrupados en intervalos, el intervalo más repetido es el intervalo o clase modales.

En general, se utiliza el término Mo como símbolo de la moda estadística, por ejemplo, la


moda de la distribución X es Mo(X).

FRANSHELY GÓMEZ
2021-0982

También podría gustarte