Documentos de Académico
Documentos de Profesional
Documentos de Cultura
∑ ( x i−x )2
s2= t=1
N
Donde representa la media de todos los valores y N representa el número de observaciones o el tamaño de la
muestra.
Con frecuencia x no es un número entero, entonces las desviaciones suelen ser números decimales. Las
operaciones de elevar al cuadrado cada una de las desviaciones ( x i−x ) y multiplicarlas por las frecuencias
respectivas pueden resultar sumamente laboriosas, por ello se suele usar otra fórmula en la que se evitan estos
cálculos.
FÓRMULA (RESUMEN TEXTUAL ALTERNATIVO
La desviación estándar o típica (S) se obtiene de la raíz cuadrada positiva de la varianza. Esta medida nos permite
determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación
estándar nos da como resultado un valor numérico que representa la media de diferencia que hay entre los datos
y la media. De su cálculo resulta por tanto un número más manejable, siendo este un parámetro más usado que la
varianza.
s= √ s2
Técnicas de inferencia estadística
Con las técnicas de inferencia, se persigue tomar decisiones y obtener conclusiones sobre una característica
desconocida de la población a partir de la información contenida en una o más muestras representativas de esa
población. La herramienta teórica que utiliza es la teoría de la probabilidad.
El estudio del grado de dependencia existente entre las variables será el contenido propio de la conocida como
teoría de la correlación (si se trata solo de dos variables, se habla de correlación simple, y cuando se trata de más
de dos variables, se habla de correlación múltiple), mientras que para la determinación de aquella estructura de
dependencia que mejor expreses el tipo de relación de la variable y con los demás, será objeto de estudio de la
teoría de la regresión (que también será simple o múltiple).
Analicemos dos tipos de indicadores muy utilizados como técnicas de inferencia estadística:
Coeficiente de determinación: va a ser el porcentaje de variancia de Y que se puede explicar por X, y se le
suele llamar calidad del ajuste, porque valora lo cerca que está la nube de puntos de la recta de regresión
(o, dicho de otro modo, lo ajustada que está la nube de puntos a la recta de regresión. Se representa
como:
2
2 s xy
R= 2 2
sx ⋅ s y
Siendo: R2 el coeficiente de determinación; S xy la covarianza; Sx la desviación típica de x; S y la desviación
típica de y.
El coeficiente de determinación se aplica cuando hay distintas variables dependientes. ¿Cuál es su
interpretación? Su valor tiene que oscilar entre: 0<R2<1.
o Si R2 es igual a 1: la dependencia estadística es exacta.
o Si R2 es igual a 0: no hay dependencia.
Por ejemplo, si R2 es 0,86 para unas variables x e y, podemos decir que la calidad del ajuste es bastante
alta, aunque no sabemos si la recta de regresión es creciente o decreciente.
Coeficiente de Correlación r de Pearson: mide el grado de dependencia entre las variables cuantitativas, o
también se define como una medida de la intensidad de la relación lineal entre las variables. Se
representa a través de la siguiente ecuación:
s xy
r=
sx s y
Siendo: Sxy, conocida como Covarianza, igual a:
∑ xy
s x y= −x y
N
Sx y Sy, conocidas como desviaciones típicas (son la raíz cuadrada de la varianza).
Siendo: r el coeficiente de correlación; Sxy la covarianza; Sx la desviación típica de x; Sy la desviación típica
de y; x la variable independiente; y la variable dependiente; x la media de x; N el número total de datos.
Otra forma de representar el coeficiente de correlación lineal es siguiente:
n∑ xy −∑ x ∑ y
r=
√ [ n ∑ x −( ∑ x ) ] [ nΣ ∕ 2− ( ∑ y ) ]
2 2 2