Está en la página 1de 3

Fiyuberth Hernández Probabilidad y Estadı́stica I

Formulario.
Prueba 1.
Estadı́grafos de tendecia central.
∗ Promedio aritmético.
N
x1 + · · · + xN 1 X
µ= = xi . (1)
N N
i=1
N
x1 f1 + · · · + xN fN 1 X
µ= = xi fi (datos agrupados en clases). (2)
N N
i=1

∗ Propiedades del promedio aritmético.


Sean X = x1 , . . . , xN e Y = y1 , . . . , yN dos variables aleatorias (v.a.), y sea a ∈ R − {0} una constante
entonces, respecto del promedio aritmético (o simplemente media) se cumplen las siguientes propiedades.

µ(a) = a (a ∈ R). (3)


µ(aX) = aµ(X). (4)
µ(X ± a) = µ(X) ± a. (5)
µ(X + Y ) = µ(X) + µ(Y ). (6)

En particular si X e Y son variables aleatorias independientes entonces se cumple que

µ(X · Y ) = µ(X) · µ(Y ). (7)

∗ La moda (MO ) es el valor que aparece con mayor frecuencia absoluta en el conjunto de datos, si lo
hubiera. Para datos agrupados en clases el valor aproximado de la moda se calcula como

DLi−1 + dLi
MO = , (8)
D+d
donde:
Li−1 : lı́mite inferior del intervalo que contienen la frecuencia más alta.
Li : lı́mite superior del intervalo que contienen la frecuencia más alta.
D: diferencia entre la frecuencia más alta y la del intervalo siguiente.
d: diferencia entre la frecuencia más alta y la del intervalo anterior.
La moda se preserva bajo transformaciones lineales. Esto es, sea MO (X) la moda la variable aleatoria
X = x1 , . . . , xN , y se define Y = aX + b con a y b dos constantes cualesquiera entonces la moda de Y es

MO (Y ) = a · MO (X) + b. (9)

∗ La mediana es un valor que separa a los datos (ordenados de menor a mayor incluyendo repeticiones)
en dos partes con igual número de datos. La mediana también corresponde al percentil cincuenta (P50 ).
La mediana se preserva bajo transformaciones lineales. Esto es, sea ME (X) la mediana la variable aleatoria
X = x1 , . . . , xN , y se define Y = aX + b con a y b dos constantes cualesquiera entonces la mediana de Y
es

ME (Y ) = a · ME (X) + b. (10)

1
Fiyuberth Hernández Probabilidad y Estadı́stica I

Estadı́grafos de posición.
∗ Formula para el calculo (aproximado) de percentiles para datos tabulados.
 
kN ci
Pk = Li−1 + − Ni−1 , (11)
100 ni
donde:
Li−1 : lı́mite inferior del intervalo que contiene el percentil k.
k: percentil buscado.
N : cantidad de datos.
Ni−1 : frecuencia acumulada en el intervalo anterior al intervalo donde se encuentra el percentil k.
ni : frecuencia del intervalo donde se encuentra el percentil k.
ci : longitud del intervalo donde se encuentra el percentil k.
Estadı́grafos de variabilidad.
∗ Varianza.
N
1 X
Var(X) = (xi − µ)2 . (12)
N
i=1

∗ Propiedades de la varianza.
Sean X = x1 , . . . , xN e Y = y1 , . . . , yN dos variables aleatorias. Sean µ(X) = µX y µ(Y ) = µY sus
respectivos promedios aritméticos. Sea a ∈ R − {0} una constante entonces, respecto de la varianza se
cumplen las siguientes propiedades.

Var(a) = 0. (13)
Var(aX) = a2 Var(X). (14)
Var(X ± a) = Var(X). (15)
Var(X + Y ) = Var(X) + Var(Y ) + 2µ [(X − µX )(Y − µY )] . (16)

En el caso particular que las variables aleatorias X e Y sean independientes entonces se cumple que

Var(X + Y ) = Var(X) + Var(Y ). (17)

∗ Desviación estándar.
v
u
u1 XN
σ(X) = t (xi − µ)2 . (18)
N
i=1

∗ Propiedades de la desviación estándar.


Sean X = x1 , . . . , xN e Y = y1 , . . . , yN dos variables aleatorias, y sea a ∈ R − {0} una constante entonces,
respecto de la desviación estándar se cumplen las siguientes propiedades.

σ(a) = 0. (19)
σ(aX) = |a|σ(X). (20)
σ(X ± a) = σ(X). (21)
p
σ(X + Y ) = Var(X) + Var(Y ) + 2µ [(X − µX )(Y − µY )]. (22)

2
Fiyuberth Hernández Probabilidad y Estadı́stica I

En el caso particular que las variables aleatorias X e Y sean independientes entonces se cumple que
p
σ(X + Y ) = Var(X) + Var(Y ). (23)

∗ Rango o recorrido.
Rango = X(N ) − X(1) . (24)

∗ Coeficiente de variabilidad.
σX
CV (X) = · 100 %. (25)
|µ|

∗ Criterio para determinar si los datos son homogéneos o heterogéneos.


Si el CV (X) ≤ 5 % los datos son muy homogéneos.
Si el 5 % < CV (X) ≤ 25 % los datos son homogéneos.
Si el 25 % < CV (X) ≤ 50 % los datos son heterogéneos.
Si el CV (X) > 50 % los datos son muy heterogéneos.
∗ Sesgo.
µ(X) − MO (X)
Sesgo(X) = . (26)
σX
Cuando no haya moda o exista más de una el sesgo se calcula como
µ(X) − ME (X)
Sesgo(X) = 3 . (27)
σX

∗ Curtosis.
1 Q3 − Q1
K= − 0, 263. (28)
2 P90 − P10
Si K > 0 se dice que la curva es Leptocúrtica.
Si K = 0 se dice que la curva es Mesocúrtica.
Si K < 0 se dice que la curva es Platicúrtica.
Estadı́stica Bivariada.
∗ Coeficiente de correlación de Pearson.
µ(XY ) − µ(X)µ(Y )
ρ(X,Y ) = ρX,Y = . (29)
σ(X) · σ(Y )

∗ Criterio.
Si −1 ≤ ρ(X,Y ) < −0, 5 hay correlación lineal inversa.
Si 0, 5 < ρ(X,Y ) ≤ 1 hay correlación lineal directa.
Si −0, 5 ≤ ρ(X,Y ) ≤ 0, 5 no hay correlación.
∗ Covarianza.
Cov(X, Y ) = µ(XY ) − µ(X)µ(Y ). (30)

También podría gustarte