Está en la página 1de 3

1.- FÓRMULAS ESTADÍSTICA DESCRIPTIVA

a) PARA TODOS LOS DATOS DE LA MUESTRA:

Supongamos una muestra con n elementos ordenada de menor a mayor:

1 n
MEDIA: X   xi
n 1

MEDIANA: La mediana es el dato central, una vez ordenados de menor a mayor, si n es impar. Si n es par
la mediana será la media de los dos datos centrales.

MODA: El dato que más se repita en la muestra.


2 2

   
1 n
1 n
VARIANZA: s 2 
n 1
xi  X CUASIVARIANZA: s ' 2   xi  X
n 1 1

DESVIACIÓN TÍPICA: s   s 2 DESVIACIÓN ESTÁNDAR: s '   s ' 2

s
COEFICIENTE DE VARIACIÓN: CV 
X

RANGO: El rango de una muestra siempre es el mayor menos el menor de los valores aparecidos en la
muestra:
Rango = xmax− xmin

RANGO INTERCUARTÍLICO: Para calcular el rango intercuartílico hemos de calcular primero el tercer
cuartil (q 75 % ) y el primer cuartil (q 25 % ). El rango intercuartílico será la diferencia entre ambos valores
q 75 %− q 25 %:

q es un dato de la muestra, ordenada de menor a mayor, tal que el 75 % de los datos de la


75 %
75 * n
muestra son menores o iguales a él. Como la muestra tiene n datos, el 75 % de n sería , que
100
redondearemos a número entero, y si suponemos que nos da “a” el q 75 % es el dato que ocupa la
posición “a” en la muestra.

q es un dato de la muestra, ordenada de menor a mayor, tal que el 25 % de los datos de la


25 %
25 * n
muestra son menores o iguales a él. Como la muestra tiene n datos, el 25 % de n sería , que
100
redondearemos a número entero, y si suponemos que nos da “b” el q 25 % es el dato que ocupa la
posición “b” en la muestra.

Rango intercuartílico = q 75 %− q 25 %

b) PARA DATOS AGRUPADOS EN UNA TABLA DE FRECUENCIAS:

Supongamos una muestra con n elementos agrupada en una tabla de frecuencias con k clases,
donde las frecuencias relativas están expresadas en % :

1 k
MEDIA: X  
n 1
ni xi* . Siendo xi* la marca de la clase i.

MEDIANA: La mediana coincide con el cuantil del 50 %, es decir:


50 %  Fi 1
me = Linfi  Ai . Siendo i la clase donde por primera vez se supera el 50 % de Frecuencia
Fi  Fi 1
Relativa Acumulada. Linf i es el límite inferior de la citada clase. Ai es la amplitud de la citada clase. Fi la
frecuencia relativa acumulada de esta clase y Fi-1 la frecuencia relativa acumulada de la clase anterior.

MODA: En este caso se habla de clase modal que es la clase con mayor número de datos, o lo que es lo
mismo, con mayor frecuencia relativa (fi).
2 2

n  x   
1 k
1 k
VARIANZA: s 
n
2

1
i
*
i X CUASIVARIANZA: s '  2

n 1 1
ni xi*  X

DESVIACIÓN TÍPICA: s   s 2 DESVIACIÓN ESTÁNDAR: s '   s ' 2

s
COEFICIENTE DE VARIACIÓN: CV 
X
RANGO: El rango de una tabla siempre es el límite superior de la última clase menos el límite inferior de la
primera clase.

RANGO INTERCUARTÍLICO: Para calcular el rango intercuartílico hemos de calcular primero el tercer
cuartil (q 75 % ) y el primer cuartil (q 25 % ). El rango intercuartílico será la diferencia entre ambos valores q 75
%− q 25 %:

75%  Fi 1
q 75 % = Linfi  Ai . . Siendo i la clase donde por primera vez se iguala o supera el 75 % de
Fi  Fi 1
Frecuencia Relativa Acumulada
25%  Fi 1
q 25 % = Linfi  Ai . . Siendo i la clase donde por primera vez se iguala o supera el 25 % de
Fi  Fi 1
Frecuencia Relativa Acumulada
Rango intercuartílico = q 75 %− q 25 %

CUANTIL GENERAL: Si nos pidieran que calculáramos un cuantil del X % utilizaríamos la fórmula
general para el cálculo de cuantiles:

X %  Fi 1
q X % = Linfi  Ai . . Siendo i la clase donde por primera vez se supera el X % de Frecuencia
Fi  Fi 1
Relativa Acumulada

2.- CORRELACIÓN. REGRESIÓN.

COVARIANZA: es una medida que nos permitirá evaluar la variabilidad conjunta de dos variables
numéricas (cuantitativas).

 n  x  y 
1 h k
1 
 
h k
s xy 
N
ij i X j Y s xy    n x y ij i j   X ꞏY
i 1 j 1 N i 1 j 1 
VARIABLES INDEPENDIENTES: dos variables son independientes si la frecuencia relativa conjunta es
igual al producto de las frecuencias relativas marginales.

nij ni* n* j
f ij  f i* ꞏ f* j , i , j ó  ꞏ , i , j
N N N
REGRESIÓN LINEAL SIMPLE:

 s xy
Ajuste: y  a  bx b a  Y  bX
s x2

 n  x  X  y 
h k

ij i j Y
s xy i 1 j 1
Coeficiente de correlación lineal: r   debe estar entre ─1 y 1
sx ꞏs y
 x   
h 2 k 2
i*  X ꞏ y* j  Y
i 1 j 1

Coeficiente de determinación: r2 debe estar entre 0 y 1

Otros modelos resolubles mediante regresión lineal:

y  Aebx 
 ln y  ln A  bx
y  ax b 
 ln y  ln a  b ln x
y  ab x 
 ln y  ln a  x ln b
b 1
ya 
 y  a  b 
x x

También podría gustarte