Está en la página 1de 18

UNIVERSIDAD NACIONAL DE INGENIERÍA

FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA

Estadı́stica y Probabilidades

Medidas de Dispersión

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de Posición

Las medidas de posición sono conocidas en general


cuantiles y se pueden clasificar en grupos: Cuartiles,
Deciles, Percentiles.
Cuartiles: son los tres valores de la variable de una
distribución que la dividen en cuatro partes iguales,
es decir, al 25 %, 50 % y 75 %. Se representan por
Q1: Cuartil1; Q2:Cuartil2:mediana; Q3:Cuartil3

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de Posición

Los Deciles: Corresponden a los 9 valores que divi-


den a estos en 10 partes iguales es decir, al 10 %,
al 20 %... y al 90 %. Los Deciles se designan por
D1 , D2 , ..., D9
Los Percentiles: Son los noventa y nueve valores
de la variable de una distribución que la dividen en
cien partes iguales es decir, al 1 %, al 2 %... y al
99 % de los datos. Los percentiles se designan por
P1 , P2 , ...P99

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de Posición

Q1 = P25 ; D3 = P30
D7 = P70 ; Q2 = P50 = M e

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Diagrama de cajas

El diagrama de caja y bigotes (boxplot) es una re-


presentación gráfica de un conjunto de datos que fa-
cilita la percepción visual de la posición, extensión y
del grado y la dirección del sesgo. También permi-
te identificar los datos atı́picos. Es especialmente útil
cuando se desean comparar dos o más conjuntos de
datos.

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Diagrama de cajas

Atı́pico → b
Máx(x)|x ≤ Ls

Ls = Q3 + RIC · 1,5

Q3 (75 %)
6
Mediana RIC = Q3 − Q1
(50 % de datos)
Q1 (25 %) ?
Li = Q1 − RIC · 1,5
Mı́n(x)|x ≥ Li

RIC: Rango Intercuartil

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de dispersión

Son números que miden el grado de separación de


los datos con respecto a un valor central, que ge-
neralmente es la media aritmética que generalmente
permiten verificar si determinadas medidas son sigi-
nificativas o no. Entre los principales tenemos Rango,
Varianza, Desviación Estándar y Coeficiente de Va-
riación.

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de dispersión

Rango: La diferencia entre el mayor y menor valor del


conjunto de datos. Su valor no puede ser negativo, la
desventaja es que no describe la variabilidad
La varianza y la desviación estándar: Son me-
didas de dispersión muy importantes, la desviación
estándar indica como están dispersos los datos res-
pecto de su media aritmética, el cual también es la
raı́z cuadrada positiva de la varianza.

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de dispersión

Hay dos tipos de varianza:


Varianza poblacional que se representa (σ 2 )
Varianza muestral se representa (S 2 )
En ambos casos el valor de la varianza no sera la
misma para un mismo conjunto de datos, ademas la
raı́z cuadrada de cada una de ellas se llama desviación
estándar poblacional y muestral respectivamente.

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de dispersión

Si se tiene una poblacion de N o una muestra de m


las varianzas que se tienen son:

Varianza poblacional que se representa (σ 2 )


PN
2 i=1 (xi − x)2
σ =
N
Varianza muestral se representa (S 2 )
Pm
(xi − x)2
S 2 = i=1
m−1

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Propiedades para una varianza poblacional

Si definimos:
X: variable numérica
a y b: valores reales constantes
Var(): Varianza
1 Var(a)=0
PN
x2
2 Var(X) = i=1
N
i
− x2
3 Var(aX ± b)=a2 Var(X)

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Coeficiente de Variación

Es una medida de dispersión relativa, que se define


como la desviación estándar dividido por la media
aritmética.
desviacion
CV = · 100 %
|x|
Buena dispersión si es menor a 10 %
Normal dispersión de 10 % a menos de 25 %
Regular dispersión de 25 % a menos de 50 %
Mala dispersión de 50 % a mas

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Propiedad de Chebyshev

Para un conjunto de datos no importando cual sea


la forma de la distribución la proporción de ellos que
cae en el intervalo:
[µ − 2σ; µ + 2σ]
hay por lo menos el 75 % de los datos.
[µ − 3σ; µ + 3σ]
hay por lo menos el 89 % de los datos.

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Asimetrı́a

Si sk =0 la distribución es simétrica
Si sk es positivo la distribución es sesgada a la dere-
cha
Si sk es negativo la distribución es sesgada a la iz-
quierda

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Asimetrı́a en función de cuartiles

Fue dada por Yule Bowley

Q1 + Q3 − 2Q2
sk =
Q3 − Q1
Donde:
Q1 : Cuartil 1 o Percentil 25
Q2 : Cuartil 2 o mediana
Q3 : Cuartil 3 o Percentil 75

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Curtosis

Esta medida determina el grado de concentración que


presentan los valores en la región central de la distri-
bución. La curtosis puede alcanzar valores reales.
Si K=0 la distribución es mesocurtica
Si K es positivo la distribución es leptocurtica
Si K es negativo la distribución es platicurtica

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Curtosis

la fórmula de la curtosis para datos agrupados esta


dada en función de la media, frecuencia y la desvia-
ción estándar.
Pn
(xi − x)4 fi
K = i=1 −3
n(σ)4

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel
Curtosis

Universidad Nacional de Ingenierı́a (FIEE) M.Sc. Ing. López Esquivel Miguel Ángel

También podría gustarte