Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Rango o recorrido
Desviación media
Di = x - x
Vari an za
Propiedades de la varianza
Es decir, que, si calculamos las distancias de todos los valores de la muestra a una
constante k y hacemos la media de sus cuadrados, esa distancia se hace mínima cuando
es respecto a la media aritmética. Dicho de otro modo, la varianza es la mínima
distancia cuadrática de todos los valores de la muestra a una constante k.
𝟐
∑𝒏𝒊=𝟏 𝒙𝟐𝒊 . 𝒏𝒊
𝑺 = ̅𝟐
− 𝒙
𝑵
La varianza permanece invariable ante translaciones, es decir, si a todos los
valores de la muestra les sumamos una constante, la varianza no varía:
𝑺𝟐 (𝑿 + 𝒂) = 𝑺𝟐 (𝑿)
Si realizamos cambios de escala a la variable, es decir, si multiplicamos por un
valor constante todos los valores de la muestra, la varianza queda multiplicada
por el cuadrado de este valor:
𝑺𝟐 (𝑿 . 𝒃) = 𝑺𝟐 (𝑿)
Desviación típica
Coeficiente de Variación
Necesitamos, por tanto, una media adimensional, es decir, una media que no tenga
unidades asociadas, para, así, poder comparar la representatividad de las medias o la
variabilidad o dispersión que presentan distintas variables, sean cuales sean las unidades
de media en las que se midan.
El coeficiente de variación es una de las medidas de dispersión adimensionales más
importantes. Se define como el cociente entre la desviación típica y la media aritmética:
𝑆
𝑉=
𝑋̅
Como ambas medidas tienen las mismas unidades que la variable original, dividirlas
hace que desaparezcan las unidades y nos proporciona una medida de dispersión o
variabilidad adimensional.
Regresión Lineal
Correlación lineal.
El coeficiente de correlación lineal es una media del grado de dependencia estadística
que presentan dos variables. Se calcula como el cociente entre su varianza y el producto
de sus desviaciones típicas, es decir:
𝑺𝒙𝒚
𝒓=
𝑺𝒙 . 𝑺𝒚
De forma más precisa, podemos decir que nos indica hasta qué punto dos variables
están linealmente relacionadas entre sí. El coeficiente de correlación lineal toma
siempre valores entre -1 y 1:
- Si toma el valor 1, podemos decir que existe una dependencia funcional positiva
entre las variables, es decir, que presentan una relación lineal perfecta y, además,
cuando una toma valores más grandes la otra también.
- Si toma el valor -1, podemos decir que existe una dependencia funcional
negativa entre las variables, es decir, que presentan una relación lineal perfecta,
pero cuando una toma valores más grandes la otra disminuye.
- Si toma valor 0, podemos decir que las variables son linealmente
independientes. Sin embargo, esto no quiere decir que las variables no presenten
algún tipo de estructura de dependencia que no sea lineal.
- Lo normal será que tome valores entre 0 y 1 o entre -1 y 0.
- Si toma valores entre 0 y 1, estaremos ante una relación estadística positiva, que
será más fuerte si el valor está cerca de 1 y menos si está más cerca de 0.
Si toma valores entre -1 y 0, estaremos ante una relación estadística negativa, que será
más fuerte cuanto más se aproxime el valor a -1.
Diagramas De Caja.
Los diagramas de caja son una forma útil de graficar datos divididos en cuatro
cuartiles, cada uno con igual cantidad de valores. El diagrama de caja no grafica
frecuencia ni muestra las estadísticas individuales, pero en ellos podemos ver
claramente dónde se encuentra la mitad de los datos. Es un buen diagrama para
analizar la asimetría en los datos.
A continuación, te dejamos algunas palabras que debes tener en cuenta cuando
graficas diagramas de caja:
Q1 – Cuartil 1, la mediana de la mitad menor de los datos.
Valores extremos – Los valores más pequeños y los más grandes de los datos.
Valores atípicos
Los valores atípicos son aquellos mucho más grandes o mucho más pequeños
que el resto de los datos. Se representan con un punto en cualquier extremo del
diagrama. En nuestro ejemplo no hubo ningún valor atípico; y aunque 53 parece
ser mucho más pequeño que el resto, en realidad no fue lo suficientemente
pequeño.
Para ser considerado un valor atípico, el valor debe ser:
mayor que Q3 por, al menos, 1.5 veces el rango Inter cuartil (IQR), o menor que
Q1 por, al menos, 1.5 veces el IQR.
Los valores atípicos son aquellos que:
1.5(IQR) > Q3
1.5(IQR) < Q1