Está en la página 1de 16

Guía - Resumen de fórmulas estadísticas

En el siguiente cuadro se especifica la notación correspondiente a distintas medidas de frecuencia utilizadas en estadística.

Concepto Población Muestra

Valor de la variable bajo estudio correspondiente a la i-ésima observación xi xi

Frecuencia absoluta simple de un valor de la variable o de un intervalo de valores fai fai

Tamaño de la población o muestra N= ∑fai n= ∑fai

Frecuencia relativa de un valor de la variable o de un intervalo de valores fri = fai/N fri =fai/n

Frecuencia relativa porcentual de un valor de la variable o de un intervalo de valores fri %= fai/N*100 fri% =fai/n*100

Frecuencia absoluta acumulada hasta un valor de la variable o un intervalo de valores Fai Fai

Frecuencia relativa acumulada hasta un valor de la variable o un intervalo de valores Fri = Fai/N Fri =Fai/n

Frecuencia relativa porcentual de un valor de la variable o de un intervalo de valores Fri %= Fai/N*100 Fri% =Fai/n*100

Material preparado por Lic. Adriana Ibero 1


En el siguiente cuadro se especifica la notación correspondiente a distintas medidas utilizadas en estadística de acuerdo a si se estudia una
población en cuyo caso es un parámetro; o si se estudia una muestra en cuyo caso es un estimador.

Población Muestra
Medida o concepto
Parámetro Estimador

Media aritmética μ x

Modo Mo mo

Mediana Ma ma

Proporción π p

Variancia σ2 S2

Desvío estándar σ S

Coeficiente de variación porcentual CV% cv%

Coeficiente de correlación ρ r

Coeficiente de determinación r2

Material preparado por Lic. Adriana Ibero 2


Uso de Calculadora para Medidas descriptivas. De acuerdo al modelo se siguen las instrucciones por columna. Dada la situación se recomienda
buscar el manual de uso o videos en Internet que permitan el manejo de la calculadora en modo estadístico

SIN NAVEGADOR
Poner en modo estadístico Mode •
Borrar los datos cargados. Shift AC
Carga de datos Valor de la variable Frecuencia M+

Ejemplo: 2 X 3 M+
N Shift 6
Suma de xi Shift 5
Suma de xi2 Shift 4
µ Shift 7
σ Shift 8
S Shift 7
CON NAVEGADOR CHICO
Poner en modo estadístico Mode 2
Borrar los datos cargados. Shift AC = AC
Carga de datos Valor de la variable Shift , Frecuencia M+

Ejemplo: 2 Shift , 3 M+
N RCL Hyp
Suma de xi RCL º, ,,
Material preparado por Lic. Adriana Ibero 3
Suma de xi2 RCL -
µ Shift 1
σ Shift 2

S Shift 3
CON NAVEGADOR GRANDE
Poner en modo estadístico Mode 2
Borrar los datos cargados. Shift Mode 1 = AC

Carga de datos Valor de la variable Shift , Frecuencia M+


Ejemplo: 2 Shift , 3 M+
N Shift 1 3 =
Suma de xi Shift 1 2 =
Suma de xi2 Shift 1 1 =
µ Shift 2 1 =
σ Shift 2 2 =
S Shift 2 3 =

Material preparado por Lic. Adriana Ibero 4


CON TABLA
Poner en modo estadístico Mode Stat 1-Var
Borrar los datos cargados. Shift - 1 Editar Del
Poner Frec: Shit - Mode -↓ - 4Stat - On
Se cargan los datos en la columna X con un igual. Luego las
frecuencias.

Carga de datos Finalmente se apreta el AC


N Shift - 1 - Var 1 =
Suma de xi Shift - 1 - Sum 2 =
Suma de xi2 Shift - 1 - Sum 1 =
µ Shift - 1 - Var 2 =
σ Shift - 1 - Var 3 =
S Shift - 1 - Var 4 =

Material preparado por Lic. Adriana Ibero 5


Fórmulas de estadística descriptiva

Medidas de Posición central


Datos sin agrupar Datos agrupados por frecuencia Datos agrupados por intervalos
 PMi  fai
μ  i μ 
x x i  fai μ
Población N
N N
Media PMi = (Li+Ls) /2 Punto Medio
aritmética  PMi  fai
x  i x 
x x i  fai x
Muestra n
n n
PMi = (Li+Ls) /2 Punto Medio
Se menciona cual es el intervalo donde
Población Mo: Valor de la variable que posee mayor frecuencia absoluta simple
Modo está el modo
Se menciona cual es el intervalo donde
Muestra mo: Valor de la variable que posee mayor frecuencia absoluta simple
está el modo
Posición de la mediana j=K*(N+1) /100, con K=50
Si N impar: la observación del lugar j-ésimo Se menciona cual es el intervalo donde
Población
Si N par: semisuma de los valores correspondientes a la observación del está la mediana
Mediana
lugar de la parte entera de j y de j+1
(Datos
Posición de la mediana j=k*(n+1) /100, con k=50
ordenados)
Si n impar: la observación del lugar j-ésimo Se menciona cual es el intervalo donde
Muestra
Si n par: semisuma de los valores correspondientes a la observación del está la mediana
lugar de la parte entera de j y de j+1
Medidas de Posición No Central

Datos sin agrupar Datos agrupados por frecuencia Datos agrupados por intervalos
Posición del percentil K= j=K*(N+1) /100
Población Si N impar: la observación del lugar j-ésimo
Percentiles k Si N par: semisuma de los valores correspondientes a la observación del lugar de la parte entera de j y de j+1
Pk Posición del percentil k= j=k*(N+1) /100
Muestra Si n impar: la observación del lugar j-ésimo
Si n par: semisuma de los valores correspondientes a la observación del lugar de la parte entera de j y de j+1
1º Cuartil Q1 K = 25 3º Cuartil Q3 K = 75
Material preparado por Lic. Adriana Ibero 6
Medidas de Variabilidad o Dispersión

Datos sin agrupar Datos agrupados por frecuencia Datos agrupados por intervalos

x i  μ 2  fai  PMi  μ 2  fai


 σ 
2

σ2   xi  μ 2 σ 2
 N
N
N
Población
σ   i  μ2
 PMi  fai
2
x2
σ2  
2
xi2  fai σ  2
 μ2
N  μ2 N
N
PMi = (Li+Ls)/2 Punto Medio
Variancia
  PM  x   fa i
2
 x i  x   x i  x   fai
2 2
S2  S2  S 2

n-1 n-1 n-1
Muestra
x   x i  /n x  fai  n  x 2  PM2i  fai  n  x 2
2 2 2
S2 

2 i

i
S2 S n1
n -1 n1
PMi = (Li+Ls)/2 Punto Medio
Desvío Población σ  σ2
Estándar Muestra S  S2
Coeficiente σ
Población CV%   100
de μ
Variación S
Muestra cv%   100
% x

Medidas de Forma y curtosis


3
Coeficiente de n x x μ - Mo
Forma   i  CAP 
asimetría n  1  n  2  S  σ
 n  n  1  xi  x   3  n  1
4 2

 
Coeficiente de
Curtosis   
Curtosis  n  1  n  2  n  3  S   n  2  n  3

Material preparado por Lic. Adriana Ibero 7


Números índice

Índice Relativo Simple Índice Relativo Eslabón


x x Índice Relativo en Cadena
R s i/o  i  100 R e i/i - 1  i  100 R c i/i - 1  R ei/i - 1  R ei - 1/i - 2  ...  R c 1/o  100
xo x i-1
Índice de Agregado no Ponderado
n
Índice de Promedios de Relativos no Ponderado
 xi j n x

ij
i1
IA j/o   100 i1 xio
n
IR j/o   100
 xio n
i1

Índices de Agregados Ponderados

Índice de Precios de Laspeyres Índice de Precios de Paasche


n n
 p i j  qi o  p i j  qi j Índice de Precios de Fisher
i1 i1
I P j/o 
L
n
 100 I P j/o 
P
n
 100 IPF  IPL  IPP
 p i o  qi o  p i o  qi j
i1 i1
Índice de Cantidades de Laspeyres Índice de Cantidades de Paasche
n n
 qi j  p i o  qi j  p i j Índice de Cantidades de Fisher
i1 i1
I Q j/o 
L
n
 100 I Q j/o 
P
n
 100 IQ F  IQ L  IQ P
 qi o  p i o  qi o  p i j
i1 i1
Índice de Promedio Ponderado de Relativos de Índice de Promedio Ponderado de Relativos de
n p n p
  p i o  qi o   p i o  qi j
ij ij

i1 p i o i1 p
Laspeyres I PR L j/o  n
 100 Paasche I PR P j/o  n i o  100
 p i o  qi o  p i o  qi j
i1 i1
Índice de Promedio Ponderado de Relativos de Índice de Promedio Ponderado de Relativos de
Laspeyres Paasche

Material preparado por Lic. Adriana Ibero 8


n qi j n qi j
  p i o  qi o   p i j  qi o
i1 qi o i1 qi o
I Q R j/o 
L
n
 100 I Q R j/o 
P
n
 100
 p i o  qi o  p i j  qi o
i1 i1
n
 p i j  qi j Ínidce(j)
i1
Índice de Valor I V j/o  n
 100 Cambio de Base IMA o 100 (j)   100
Ínidce(o)
 p i o  qi o
i1

Probabilidad: La probabilidad es una medida de la incertidumbre.


Casos favorables
Definición clásica o de Laplace P(A) 
Casos posibles

 Toda probabilidad varía entre 0 y 1 0  P(A)  1

 P(A) + P( A ) = 1
a
Definición frecuencial (Bernoulli) lím   siendo n la cantidad de veces que se repite un experimento y a la cantidad de veces que se observa un
n n 

evento
Propiedades de la frecuencia relativa:
 0 fr (A) 1 cualquiera que sea el suceso A.
 f r( ) = fr(A) + fr(B) si = Ø.
 fr(E) = 1 fr(Ø) = 0.
Definición axiomática. (Kolmogorov), La Probabilidad de cada suceso es un número que verifica:
 Cualquiera que sea el suceso A, P(A) 0.
Material preparado por Lic. Adriana Ibero 9
 Si dos sucesos son incompatibles, la probabilidad de su unión es igual a la suma de sus probabilidades.
 =Ø P( ) = P(A) + P(B).
 La probabilidad total es 1. P(E) = 1.
Probabilidad total:

 mutuamente no excluyentes (Regla de la Suma) P(A ó B)  P(A  B)  P(A)  P(B)- P(A B)

 mutuamente excluyentes (Regla del Producto) P(A ó B)  P(A  B) = P(A)  P(B)

P(A ∩B) P(A ∩B)


Probabilidad condicional P(A / B) = Ó P(B / A) =
P(B) P(A)

Probabilidad conjunta:

 Mutuamente excluyentes P(A  B) = P(A y B)  0

Sucesos independientes P(A y B)  P(A)  P(B)


 Mutuamente no excluyentes 
Sucesos dependientes P(A y B)  P(A)  P(B/A)  P(B)  P(B/A)

Distribuciones de probabilidad
Discreta Continua
n 
P(X = x) = p(xi) pi  0,  pi  1
Probabilidad puntual: i 0
P(X = x) = F(x) = 0 f ( x)  0  f ( x)  1


Gráfico de bastones
Probabilidad entre intervalos P(a< x < b) = P(X =b) - P(X =a) Gráfico escalonado P(a< x < b) = F(a) –F(b) Area
Probabilidad acumulada: es P(X< x) = F (x) =  p(x i ) Gráfico escalonado
xi

siempre creciente, o a lo sumo xi x


P(X< x) = F (x)=  f (x)  dx

Área
constante

Material preparado por Lic. Adriana Ibero 10


Esperanza E(x)   x i  p(x i ) E(x)   x i  p(x i )  dx

V (x)  E (x   )2  E (x 2 )  E (x)2 V (x)  E (x   )2  E (x 2 )  E (x)2


2 2
Variancia n
 n  
 
V (x)   x  p(x i )    x i  p(x i ) 
2
i V (x)   x f (x)dx    x 2 f (x)dx 
2

i 0  i 0     

Distribución Binomial X ~ Bi (n; p) X: cantidad de éxitos en n pruebas Dominio 0 ≤ x ≤ n

n
Probabilidad puntual: PBi(X = x /n; p)=   • p x • 1 - pn- x , E(x) = μ = n · p, V(x) = σ2 = n · p · (1-p) Parámetros de la distribución: n y p. Gráfico de bastones
x
Distribución de Poisson X ~ Po (λ) x: cantidad de éxitos en un continuo de extensión t Dominio 0 ≤ x
 : número medio de éxitos por unidad de continuo

e    x
Probabilidad puntual: PPo (X =x / λ) = E(x) = λ V(x) = σ2 = λ Parámetro: λ
x!
Distribución Normal o de Gauss – Laplace X ≈ N (μ x ; σ x ) Características:

a)  ,  2 son los parámetros de la distribución.


b) Tiene forma campanular, simétrica y asintótica al eje x,

2
1  x μ  
1   
c) f(x)   e 2 σ 
Cumple con las condiciones: f(x) ≥ 0;  f(x)  1
2πσ
-
d) La esperanza matemática es  que coincide con la mediana y el modo, y la variancia es  2
x - μx
e) Variable normal estandarizada o tipificada Z  N (0;1) z = , E(z) = 0, V(z) = 1
σx

x  μx
Teorema central del límite, aplicado a la media aritmética: X ~ N(μ; σ2/n) y por lo tanto = Z ~ N(0; 1)
σ/ n
Material preparado por Lic. Adriana Ibero 11
Estimación de parámetros por Intervalo de confianza-- Una Muestra

Tamaño de muestra con


Parámetro Información Estimación del Intervalo de confianza del (1-α)% un nivel de confianza de
(1- α)% y un error e
2
Tamaño de muestra grande.  z 1α/2  σ x 
P(x - Z 1-α/2 .σ x / n  μ  x + Z 1-α/2 .σ x / n) = 1 - α n   
Variancia conocida o desconocida.  e 
Promedio μ
2
Tamaño de muestra pequeña  t n-1; 1α/2  S x 
P(x - t n-1; 1-α/2 .S x / n  μ  x + t n-1; 1-α/2 .S x / n) = 1 - α n   
Variancia desconocida. Población normal.  e 
 p̂. (1 - p̂) p̂. (1 - p̂)  Z 
2
Proporción π Tamaño de muestra grande. P p̂ - Z1-α/2 .    p̂  Z1-α/2 .  = 1- α n   1-α/2  .p̂. (1 - p̂)
n n 
Teorema Central del Límite    e 
 (n  1)  S 2 (n  1)  S 2 
Variancia σ2 P 2  σ2    1  α
 χ n 1;1 α/2 χ 2 n 1;α/2 

Estimación de parámetros por Intervalo de confianza -- Dos Muestras

Parámetro Información Estimación del Intervalo de confianza del (1-α)%


 σ2 σ2 σ2 σ2 
Muestras Independientes P (x 1 - x 2 ) - Z 1-α/2 . 1  2  μ 1 - μ 2  (x 1 - x 2 )  Z 1-α/2 . 1  2  = 1 - α
 n1 n2 n1 n2 
Diferencia de Variancias conocidas.  
medias
μ1- μ2 Muestras Independientes  1 1 1 1 
Variancias desconocidas e P (x 1 - x 2 ) - t n1 n2 -2; 1-α/2 .S a    μ 1 - μ 2  (x 1 - x 2 )  t n1 n2 -2; 1-α/2 .S a    = 1-α

 n1 n 2 n1 n 2 
iguales.

Material preparado por Lic. Adriana Ibero 12


(n1  1)  S12  (n2  1)  S22
Variancia amalgamada: S2 a 
n1  n2 - 2

 S2 S2 S2 S2 
P (x1 - x2 ) - t ; 1-α/2 . 1  2  μ 1 - μ 2  (x1 - x2 )  t ; 1-α/2 . 1  2  = 1 - α
 n1 n2 n1 n2 

  2
Muestras Independientes 
 S 2 S 2 
 1  2
Variancias desconocidas y 
 n n 

Grados de libertad:  1 2 
distintas. 

2 2
 S2   S2 
 1  1   1
    2  
 n1  n1  1  n2  n2  1
   

P( d - tn-1; 1-α/2 .Sd / n  μ d  d + tn-1; 1-α/2 .Sd / n) = 1 - α


Muestras Dependientes o

S2d  
Apareadas  di d2i - n  d 2
di  x 1 - x 2 d
n n-1
Diferencia de  p̂ .q̂ p̂ .q̂ p̂ .q̂ p̂ .q̂ 
P (p̂ 1 - p̂ 2 ) - Z 1-α/2 . 1 1  2 2  π 1 - π 2  (p̂ 1 - p̂ 2 )  Z 1-α/2 . 1 1  2 2  =1- α
proporciones  n1 n2 n1 n2 
π1 – π2  
Cuadro para la utilización de Z o t en intervalos de confianza y test de hipótesis de la media de la media

Población Tamaño σ2 conocido σ2 desconocido

x -μ x -μ
Grande n>100 Z= n Z= n
Con hipótesis de σ S
normalidad x -μ x -μ
Pequeña n≤100 Z= n t= n
σ S
Sin hipótesis de x -μ x -μ
Grande n>100 Z= n Z= n
normalidad σ S

Material preparado por Lic. Adriana Ibero 13


Test de hipótesis

Una población

Parámetro Hipótesis Estadístico de prueba

Con variancia conocida


x μ0
H0 : μ = μ0 z ~ N(0; 1)
σx/ n
Promedio μ H1: μ ≠ μ0
Población normal. Con variancia desconocida. n< 100
μ > μ0
μ < μ0 x μ0
tn  ~ t n-1
Sx / n
H0 : π = π0
p - π0
Proporción π H1: π ≠ π 0 Zn = ~ N(0; 1)
π >π 0 π 0  (1 - π 0 )/n
π < π0

Dos Poblaciones

Parámetro Hipótesis Estadístico de prueba

Diferencia de promedios H0 : μ1 - μ2 = δ0 Con variancias conocidas y distintas


x  x 2   μ 1  μ 2 
Dos muestras H1: μ1 - μ2 ≠ δ0 Zn  1
~ N(0; 1)
 12  22
independientes 
μ1 - μ2 > δ0 n1 n2

Material preparado por Lic. Adriana Ibero 14


μ1 - μ2 < δ0 Con variancias desconocidas e iguales
x 1  x 2   μ 1  μ 2  (n 1  1)  S12  (n 2  1)  S 22
tn  ~ t n1n2-2 Sa 
1 1 n1  n 2  2
Sa  
n1 n 2

 2

 S 2 S 2 
 1  2
Con variancias desconocidas y distintas 
 n n 

 1 2 
tn 
x 1  x 2   μ1  μ2  ~ t 

 2
S12 S 22  S2   S2 
2
  2   
n1 n 2  1   1  2   1
 n  n 1 n  n 1
 1  1  2 2
 

Diferencia de promedios H0 : μd = μ0 di = x1 – x2 d
d i

d - μd n
Dos muestras H1: μd ≠ μ0 t= n ~ t n-1
dependientes μd > μ0
Sd
Sd 
d 2
i  n  d2
μd < μ0 n 1
H0 : π1 - π 2 = δ0 1 1
S p1p2  p  1  p     
H1: π 1 - π 2 ≠ δ0 p̂ 1  p̂ 2   δ 0  n1 n 2 
Diferencia de proporciones Zn  ~ N(0; 1)
S p̂1p̂2
π 1 - π 2 > δ0 x 1  x 2 p̂ 1  n1  p̂ 2  n 2
p 
π 1 - π 2 < δ0 n1  n 2 n1  n 2

H0 : σ12  σ22
S12
Comparación de Variancias F ~ Fn1 -1; n2 -1; 1-α/2
H1: σ12  σ22 S22

Material preparado por Lic. Adriana Ibero 15


Chi cuadrada
El estadístico de prueba es la distribución Ji o Chi cuadrada con (# fila -1) ∙ (# columna -1) grados de libertad χ 2 = 
k
fo i - fe i 2
i=1 fe i
Siendo fo: frecuencia observada en la muestra fe: frecuencia esperada

Análisis de regresión

Modelo de regresion: Yi   0  1 * X i  ei Funcion de regresion Muestral: Yi  b0  b1 * X i

n n
 (yi  y )*(x i  x )  (x i * yi )  n * x* y
Cov( x, y)  i 1  i 1 ( Muestral )
n 1 n 1
esta notación Sxx   x i2 -  x i   1/n Syy   yi2 -  yi   1/n Sxy   (x i yi ) -  x   y  1/n
2 2 2 2
Considerando i i
n

Cov( x, y ) i1(x i * yi )  n * x* y Sxy


Coeficientes de Regresión Pendiente: b1   n
(los divisores n-1 pueden cancelarse) b1 =
Var( x)  xi  n * x
2 2 Sxx
i 1

Ordenada al origen: b 0  y  b 1  x

2
n 
  xi yi - n  x  y 
Coeficiente Determinación r2  n  i1  
Suma Cuadrado Regresion
r 2

Sxy 
2

   n

  x2i - n  x 2     y2i - n  y 2 
Suma Cuadrado Total Sx  Sy
 i 1   i 1 

n
 x i y i - n  x  y Cov( x, y ) Sxy 
i1
Coeficiente Correlación r   r   r2 
n 2  n  Var( x) * Var(y) Sx   Sy 
  x i - n  x 2     y 2i - n  y 2 
 i1   i1 

Material preparado por Lic. Adriana Ibero 16

También podría gustarte