Está en la página 1de 3

MEDIDAS NUMÉRICAS Limites de Fronteras de Marca Frec. Frec.

Frec. Frec.
Mediante la tabla de distribución de frecuencias y las gráficas es posible realizar cierta clase clase de clase Rel. Acum.
fi Acum.Fi
descripción del comportamiento de los datos en la muestra, pero sabemos que una Li LRi xi f'i Rel. F'i
representación gráfica puede no ser lo precisa que uno desearía, por lo que además de una 4 5 3.5 5.5 4.5 5 5 0.25 0.25
gráfica requerimos de valores que sean representativos del comportamiento de los datos
6 7 5.5 7.5 6.5 3 8 0.15 0.40
y que dependan únicamente de dichos datos. A estos valores se les llama “medidas
numéricas” y se utilizan para ayudar a describir el comportamiento de la muestra con más 8 9 7.5 9.5 8.5 9 17 0.45 0.85
precisión. 10 11 9.5 11.5 10.5 3 20 0.15 1.00

Las medidas numéricas, por el tipo de información que proporcionan se clasifican en: Tendríamos:
- Medidas de tendencia central media para datos agrupados:
- Medidas de dispersión
- Medidas de forma
media para datos sin agrupar:
Medidas de tendencia central
Son valores que se encuentran dentro del rango de la muestra, situados en la parte central
de la misma y que se consideran como representativos de la muestra. Las medidas de
tendencia central más conocidas son la media, la mediana y la moda. b) Mediana: Es el valor que divide al conjunto de datos de la muestra en dos
conjuntos de igual tamaño, en otras palabras, la mediana es aquel valor para el
a) Media aritmética: La media aritmética es más conocida únicamente como media. cual el 50% de los datos son menores o iguales a él. Se denota por 𝑥𝑥� .
Es el promedio de un conjunto de valores. Es la medida de tendencia central más
Cuando los datos no están agrupados, éstos se deben ordenar en forma
utilizada y por lo general es la más representativa. Se denota por 𝑥𝑥̅ (es muy
ascendente o descendente y seleccionar el valor central (si los datos son impares).
importante que la x sea minúscula, sino se estará denotando algo diferente).
Si los datos son pares, entonces se toma el promedio de los dos valores centrales;
Se define de la siguiente forma: n n
Si x1, x2, x3, …, xn son los datos contenidos en una muestra, y se encuentran sin es decir, los datos que se encuentren en los lugares y ( + 1).
2 2
agrupar , entonces:
1 n Para nuestro ejemplo el valor de la mediana para datos sin agrupar es:
x = ∑ ,xdonde
i n es el tamaño de la muestra y
n i =1 xi es cada una de los valores de la muestra
Cuando los datos están agrupados, entonces se realiza una interpolación lineal
Si los datos se encuentran agrupados en una tabla de distribución de frecuencias, utilizando las fronteras y la frecuencia acumulada, (los datos de la ojiva), para
se define la media aritmética como: 𝑛𝑛
1 m encontrar el valor de x en el cual la frecuencia acumulada es de .
x = ∑ xi f i 2
n idel
Donde: m es el número de intervalos, xi es la marca de clase =1 intervalo y fi es la Con la distribución de frecuencias obtenida, se utilizan las columnas de fronteras
frecuencia del intervalo. y de frecuencia acumulada.

Para los siguientes datos: Frontera de clase


superior Frecuencia acumulada Fi
4 4 5 5 LRi
5.5 5
5 6 6 6
7.5 8
8 8 8 8 9.5 17
8 9 9 9 11.5 20
9 10 10 10
Y se realiza la interpolación para obtener el valor de x, para el cual la frecuencia
𝑛𝑛 20
acumulada sea de = = 10
2 2
Se tiene la siguiente tabla de distribución de frecuencias:

1
Frontera de clase Rango, es la medida de dispersión más simple, proporciona información inmediata acerca
superior Frecuencia acumulada Fi de la variabilidad que tienen los datos entre sí.
LRi El rango de un conjunto de datos es la diferencia entre el mayor valor menos el menor valor.
7.5 8 Se denota por Rango o R, (por lo general no se realiza la operación de resta y solamente
x� 10 se indica).
9.5 17 Para el caso de los datos agrupados, se emplean como mayor y menor valor, el límite de
clase mayor y menor respectivamente.
Interpolando se obtiene: Para los datos de nuestro ejemplo tenemos:
Datos agrupados:
Datos NO agrupados:

Desviación media
La desviación media o desviación promedio de un conjunto de datos es el promedio de las
distancias de cada valor con respecto a la media. Se denota por DM.

c) Moda: Se denota como mo o xmo, es el valor que se repite con mayor frecuencia
dentro de la muestra. Puede existir más de una moda en la misma muestra,
entonces se dice que los datos tienen distribución bimodal (2 modas) o
multimodal (más de 2 modas).

Varianza.
La varianza de un conjunto de datos es el promedio de las distancias cuadradas de cada
valor con respecto a su media. De denota por s2

d) Cuartiles, Deciles y percentiles.


Asi como la mediana es el valor que divide a un conjunto de datos ordenados en
dos conjuntos de igual tamaño, los datos pueden dividirse en cuatro conjuntos de
igual tamaño (cuartiles), en 10 conjuntos de igual tamaño (deciles) y en 100
conjuntos de igual tamaño (percentiles).

Los cuartiles se denotan generalmente por Q1, Q2 y Q3, (el segundo cuartil coincide con la Como las unidades de los datos y los de su varianza no coinciden, (la varianza queda en
mediana). unidades cuadradas), por esta razón se extrae la raíz cuadrada de s2 , y se obtiene así la
Los deciles se denotan D1, D2,…, D9; el quinto decil D5 coincide con la mediana y con el
segundo cuartil. desviación estándar.
Los percentiles se denotan P1, P2,…, P99; el percentil 50 coincide con la mediana, con el
segundo cuartil y con el quinto decil. (Se pueden encontrar muchas otras relaciones.) Desviación estándar
Es la medida de dispersión más utilizada. Para un conjunto de datos, la desviación estándar
Medidas de dispersión es la raíz cuadrada de la varianza, se denota por s.
Existen varias medidas de dispersión, la mayoría se miden con respecto a la media por ser
esta una medida que se encuentra alrededor del centro del rango de la muestra y 𝑠𝑠 = �𝑠𝑠 2
considerarse una medida representativa de los datos.
Las medidas de dispersión proporcionan un indicador del alejamiento de los datos. También Coeficiente de variación
se les llama medidas de variación. Es una medida de la dispersión de un conjunto de datos en relación con su media. No tiene
Las medidas más comunes son: el rango, la desviación media, la varianza, la desviación unidades y se define mediante el cociente de la desviación estándar entre la media. Se
estándar y el coeficiente de variación. denota CV.
𝑠𝑠
𝐶𝐶𝐶𝐶 =
𝑥𝑥̅
2
Curtosis, mide el grado de aplanamiento de la distribución de un conjunto de datos.
𝑚𝑚4
Se denota por a4 y se define como: 𝑎𝑎4 = , m4 es el 4to momento respecto a la media
(𝑠𝑠)4
s es la desviación estándar

La curtosis se compara contra tres, porque tres es la curtosis de la distribución normal


(ampliamente utilizada en la probabilidad y la estadística).
Medidas de forma
Las medidas de forma de un conjunto de datos son el sesgo y la curtosis.
Para definir las medidas de forma, primero es necesario definir los momentos.

Momentos.
Distribución platicúrtica Distribución mesocúrtica Distribución leptocúrtica
Los momentos en probabilidad, solo se utilizan como herramienta para la determinación a4<3 a4=3 a4>3
de ciertos parámetros. Se pueden definir respecto a cualquier punto “a”, pero los más
usuales son respecto al origen y con respecto a la media. EJERCICIO:
En cierta ciudad se registraron las temperaturas diarias (en °C) del mes de julio de 2014.
Los datos registrados se agruparon en la siguiente tabla de distribución de frecuencias.

Sesgo, es una medida del grado de simetría (o asimetría) de un conjunto de datos.


𝑚𝑚3
Se denota por a3 y se define como: 𝑎𝑎3 = , m3 es el 3er momento respecto a la media Obtenga: las medidas de dispersión y las medidas de forma de los datos agrupados.
(𝑠𝑠)3
s es la desviación estándar

El sesgo se compara con cero.

Sesgo negativo a3<0 Distribución simétrica a3=0 Sesgo positivo a3>0

Bibliografía:
-Sánchez, Ernesto; et al. Probabilidad y estadística. Patria, 1ª edición. México, 2013.
-Bañuelos, Leonardo. Apuntes de clase. Facultad de Ingeniería, UNAM.

También podría gustarte