Está en la página 1de 14

MEDIDAS DE DISPERSIÓN

Para describir un conjunto de datos no es


suficiente con conocer solo las medidas de
tendencia central (media aritmética, moda,
mediana), para concluir un análisis es
necesario tener una idea del grado de
concentración o dispersión de los datos
alrededor de un valor central.
Entre las principales tenemos:
MEDIDAS DE DISPERSIÓN
• VARIANZA. 𝑺𝟐 (𝒙) 𝒐 𝝈𝟐 𝒙 . Es la medida de
dispersión más importante. Expresa el grado
de dispersión de los datos respecto a la
media. Se define como la media de los
cuadrados de las desviaciones de los datos
respecto a la media.
MEDIDAS DE DISPERSIÓN

σ𝑛
𝑖=1 𝑥𝑖 𝑓𝑖 224
• 𝑥ҧ = = = 4.48
𝑛 50
𝑛 2
σ𝑖=1 𝑥𝑖 𝑓𝑖 1322
• 𝑆2 𝑥 = σ𝑛
− 𝑥ҧ 2 = − 4,48 2 = 6,37
𝑖=1 𝑓𝑖 50
PROPIEDADES DE LA VARIANZA

• Sea ¨C¨ una constante y 𝑆 2 𝑥𝑖 = 𝛽


a) Si la variable estadística es una constante, entonces la varianza
es nula.
Si 𝒙𝒊 = 𝑪 → 𝑺𝟐 (𝑪) = 𝟎
b) Si a la variable estadística se le suma una constante C, entonces
la varianza no
cambia.
𝑺𝟐 (𝒙𝒊 + 𝑪) = 𝜷
c) Si a la variable estadística se multiplica por una constante C,
entonces la
varianza se multiplica por C2
𝑺𝟐 (𝑪𝒙𝒊 ) = C2𝜷
MEDIDAS DE DISPERSIÓN
• DESVIACIÓN ESTANDAR O TÍPICA
𝑺(𝒙) 𝒐 𝝈 𝒙 )(𝒙𝝈𝒏) .
Se define como la raíz cuadrada de la varianza
𝑆 𝑥 = 𝑆 2 (𝑥)
La desviación típica muestra cuanta variación hay
con respecto a la media y da una idea de la
forma de la distribución.
 Una desviación típica baja muestra que los
datos tienden a estar muy cerca de la media.
 Una desviación típica alta indica que los datos
están dispersos sobre un amplio intervalo de
valores.
PROPIEDADES DE LA DESVIACIÓN TÍPICA
La desviación típica solo se utiliza para
medir la variación o dispersión alrededor
de la media de un conjunto de datos.
La desviación típica nunca es negativa.
La desviación típica es sensible a valores
no esperados. Un solo valor no esperado
puede aumentar la desviación típica y a la
vez desvirtuar la representación de la
dispersión.
DISTRIBUCIONES BIDIMENSIONALES
• En las distribuciones bidimensionales se
estudian dos conjuntos de datos que varían a la
vez, cada elemento de la distribución está
definido por dos valores (x,y).
• Cuando representamos gráficamente una
distribución bidimensional en un sistema
cartesiano obtenemos lo que
llamamos diagrama de dispersión ó nube de
puntos.
La forma que adopta la nube de puntos nos
indica el tipo y grado de relación o dependencia
entre ambas variables.
RECTA DE REGRESIÓN
• Hablaremos de correlación lineal cuando los datos
tienden a agruparse alrededor de una recta.
Si esta recta tiene pendiente positiva la correlación
o dependencia es directa, incrementos positivos en
una variable implican aumentos en la otra.
Si la recta tiene pendiente negativa la correlación o
dependencia es inversa, al aumentar una
disminuye la otra.
CORRELACIÓN LINEAL
• LA COVARIANZA ( 𝜎𝑥𝑦 )es una medida de la
dependencia estadística entre dos variables. Se
calcula mediante la fórmula:

σ 𝑥𝑖 𝑦𝑖
𝜎𝑥𝑦 = − 𝑥ҧ 𝑦ത
𝑛
El signo de la covarianza determina el sentido
de la correlación.
• Aún así resulta difícil interpretar el valor de la
covarianza por lo que se calcula el valor del
coeficiente de PEARSSON
COEFICIENTE DE CORRELACIÓN LINEAL
COEFICIENTE DE PEARSSON
• Coeficiente de correlación lineal:
𝜎𝑥𝑦
r= 0.75 ≤ 𝑟 ≤ 1
𝜎𝑥 𝜎𝑦
Este coeficiente, llamado de Pearsson, es una
medida objetiva de la correlación lineal entre dos
variables.
• .0 ≤ 𝑟 ≤ 0.25 relación muy débil.
• .0.25 ≤ 𝑟 ≤ 0.5 relación débil
• .0.5 ≤ 𝑟 ≤ 0.75 relación moderada
• .0.75 ≤ 𝑟 ≤ 1 relación fuerte
RECTA DE REGRESIÓN
• Llamamos línea de regresión a la curva que mejor se ajusta
a la nube de puntos, es una curva ideal en torno a la que se
distribuyen los puntos de la nube. Se utiliza para predecir la
variable dependiente (Y) a partir de la independiente (X).
La diferencia entre el valor real (yi) y el teórico (yi*) se
llama residuo.
En nuestro caso esta línea es una recta que se calcula
imponiendo dos condiciones:
• Debe pasar por el punto 𝑥ҧ , 𝑦ത , centro de gravedad de la
distribución.
• La suma de los cuadrados de los residuos debe ser mínima.
• Con esto obtenemos la ecuación de la
RECTA de REGRESIÓN de Y sobre X:
𝜎𝑥𝑦
𝑦 − 𝑦ത = 2
(𝑥 − 𝑥)ҧ
𝜎𝑥

También podría gustarte