Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Variables estadísticas
ANUNCIOS
Es decir:
Visto desde un punto de vista más conceptual, la media aritmética es el
centro de los datos en el sentido numérico, ya que intenta equilibrarlos por
exceso y por defecto. Es decir, si sumamos todas las diferencias de los datos a
la media da cero.
Mediana
La mediana (Me(X)) es el elemento de un conjunto de datos ordenados
(X ,X ,…,X ) que deja a izquierda y derecha la mitad de valores.
1 2 N
Media geométrica
La media geométrica (MG) de un conjunto de números estrictamente
positivos (X , X ,…,X ) es la raíz N-ésima del producto de los N elementos.
1 2 N
Todos los elementos del conjunto tienen que ser mayores que cero. Si algún
elemento fuese cero (X =0), entonces la MG sería 0 aunque todos los demás
i
Media armónica
La media armónica (H) de un conjunto de elementos no nulos (X , X ,…,X )
1 2 N
Media cuadrática
La media cuadrática o RMS (Root Mean Square) de un conjunto de valores
(X , X ,…,X ) es una medida de posición central. Esta se define como la raíz
1 2 N
Percentiles
El percentil es una medida de posición no central. Los percentiles P soni
los 99 puntos que dividen una serie de datos ordenada en 100 partes iguales, es
decir, que contienen el mismo número de elementos cada una. El percentil 50 es
la mediana.
Sea (X , X ,…,X ) una muestra de N elementos. El percentil P es:
1 2 N i
Medidas de dispersión
Las medidas de dispersión o medidas de variabilidad muestran
la variabilidad de un conjunto de datos, indicando la mayor o menor
concentración de datos respecto a las medias de centralización.
Rango
El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y
el mínimo de un conjunto de elementos.
Rango intercuartílico
El rango intercuartílico (IQR) (o rango intercuartil) es una estimación
estadística de la dispersión de una distribución de datos. Consiste en la diferencia
entre el tercer y el primer cuartil. Mediante esta medida se eliminan los valores
extremadamente alejados. El rango intercuartílico es altamente recomendable
cuando la medida de tendencia central utilizada es la mediana (ya que este
estadístico es insensible a posibles irregularidades en los extremos).
Asimetría y curtosis
La asimetría y curtosis informan sobre la forma de la distribución de
una variable. Estas medidas permiten saber las características de su asimetría y
homgeneidad sin necesidad de representarlos gráficamente.
Asimetría
La asimetría es la medida que indica la simetría de la distribución de
una variable respecto a la media aritmética, sin necesidad de hacer la
representación gráfica. Los coeficientes de asimetría indican si hay el mismo
número de elementos a izquierda y derecha de la media.
Existen tres tipos de curva de distribución según su asimetría:
Asimetría negativa: la cola de la distribución se alarga para valores
inferiores a la media.
Simétrica: hay el mismo número de elementos a izquierda y derecha de
la media. En este caso, coinciden la media, la mediana y la moda. La
distribución se adapta a la forma de la campana de Gauss, o distribución
normal.
Asimetría positiva: la cola de la distribución se alarga para valores
superiores a la media.
Curtosis
La curtosis (o apuntamiento) es una medida de forma que mide cuán
escarpada o achatada está una curva o distribución.
Este coeficiente indica la cantidad de datos que hay cercanos a la media, de
manera que a mayor grado de curtosis, más escarpada (o apuntada) será la
forma de la curva.
Frecuencias
X , es decir:
i
Frecuencia relativa
La frecuencia relativa (f ) de un valor X es la proporción de valores iguales
i i
Gráficos
ANUNCIOS
Diagrama de Pareto
El diagrama de Pareto (también llamado diagrama ABC) fue creado
por Vilfredo Pareto, para representar datos cualitativos. El italiano comprobó
que el 20% de la población italiana acaparaban el 80% de riquezas y propiedades.
El principio de Pareto afirma que el 20% de las causas vitales originan
alrededor del 80% de los efectos. O visto desde el punto de vista matemático, que
el 20% de las categorías representan el 80% de las observaciones.
El diagrama de Pareto se construye siguiendo estos dos pasos:
1. Ordenar los datos por frecuencia relativa o absoluta.
2. Representar cada una de las categorías de la variable mediante
un rectángulo proporcional a su frecuencia (como en el diagrama de
barras).
Diagrama de caja
El diagrama de caja es un gráfico utilizado para representar una variable
cuantitativa (variable numérica). El gráfico es una herramienta que permite
visualizar, a través de los cuartiles, cómo es la distribución, su grado de
asimetría, los valores extremos, la posición de la mediana, etc. Se compone de:
Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q y Q ).
1 3
Histograma
Un histograma es una representación gráfica de datos agrupados mediante
intervalos. Los datos provienen de una variables cuantitativas continuas. Gracias
a él puedes hacerte rápidamente una idea de la distribución de los datos
o muestra.
También cabe emplear variables cualitativas ordinales, siendo necesario que
el número de datos sea alto.
Un histograma es un conjunto de rectángulos que representan
las frecuencias absolutas de cada uno de los intervalos. Los intervalos abarcan
todo el conjunto sin cortarse, de manera que un elemento está solo en un
intervalo.
Polígono de frecuencias
El polígono de frecuencias es un gráfico que permite la rápida visualización
de las frecuencias de cada una de las categorías del estudio.
Normalmente se utiliza el polígono de frecuencias con frecuencias absolutas,
pero también se utiliza con frecuencias relativas.
Pictograma
Un pictograma es un tipo de gráfico que representa mediante dibujos la
característica estudiada. Éstos representan las frecuencias relativas o absolutas de
una variable cualitativa o discreta.
SI TE H