Formularioi P1

Fiyuberth Hernández Probabilidad y Estadı́stica I
Formulario.
Prueba 1.
Estadı́grafos de tendecia central.
∗ Promedio aritmético.
N
x1 + · · · + xN 1 X
µ= = xi . (1)
N N
i=1
N
x1 f1 + · · · + xN fN 1 X
µ= = xi fi (datos agrupados en clases). (2)
N N
i=1
∗ Propiedades del promedio aritmético.

Sean X = x1 , . . . , xN e Y = y1 , . . . , yN dos variables aleatorias (v.a.), y sea a ∈ R − {0} una constante
entonces, respecto del promedio aritmético (o simplemente media) se cumplen las siguientes propiedades.
µ(a) = a (a ∈ R). (3)

µ(aX) = aµ(X). (4)
µ(X ± a) = µ(X) ± a. (5)
µ(X + Y ) = µ(X) + µ(Y ). (6)
En particular si X e Y son variables aleatorias independientes entonces se cumple que
µ(X · Y ) = µ(X) · µ(Y ). (7)
∗ La moda (MO ) es el valor que aparece con mayor frecuencia absoluta en el conjunto de datos, si lo
hubiera. Para datos agrupados en clases el valor aproximado de la moda se calcula como
DLi−1 + dLi
MO = , (8)
D+d
donde:
Li−1 : lı́mite inferior del intervalo que contienen la frecuencia más alta.
Li : lı́mite superior del intervalo que contienen la frecuencia más alta.
D: diferencia entre la frecuencia más alta y la del intervalo siguiente.
d: diferencia entre la frecuencia más alta y la del intervalo anterior.
La moda se preserva bajo transformaciones lineales. Esto es, sea MO (X) la moda la variable aleatoria
X = x1 , . . . , xN , y se define Y = aX + b con a y b dos constantes cualesquiera entonces la moda de Y es
MO (Y ) = a · MO (X) + b. (9)
∗ La mediana es un valor que separa a los datos (ordenados de menor a mayor incluyendo repeticiones)
en dos partes con igual número de datos. La mediana también corresponde al percentil cincuenta (P50 ).
La mediana se preserva bajo transformaciones lineales. Esto es, sea ME (X) la mediana la variable aleatoria
X = x1 , . . . , xN , y se define Y = aX + b con a y b dos constantes cualesquiera entonces la mediana de Y
es
ME (Y ) = a · ME (X) + b. (10)
1
Estadı́grafos de posición.
∗ Formula para el calculo (aproximado) de percentiles para datos tabulados.

kN ci
Pk = Li−1 + − Ni−1 , (11)
100 ni
donde:
Li−1 : lı́mite inferior del intervalo que contiene el percentil k.
k: percentil buscado.
N : cantidad de datos.
Ni−1 : frecuencia acumulada en el intervalo anterior al intervalo donde se encuentra el percentil k.
ni : frecuencia del intervalo donde se encuentra el percentil k.
ci : longitud del intervalo donde se encuentra el percentil k.
Estadı́grafos de variabilidad.
∗ Varianza.
N
1 X
Var(X) = (xi − µ)2 . (12)
N
i=1
∗ Propiedades de la varianza.
Sean X = x1 , . . . , xN e Y = y1 , . . . , yN dos variables aleatorias. Sean µ(X) = µX y µ(Y ) = µY sus
respectivos promedios aritméticos. Sea a ∈ R − {0} una constante entonces, respecto de la varianza se
cumplen las siguientes propiedades.
Var(a) = 0. (13)
Var(aX) = a2 Var(X). (14)
Var(X ± a) = Var(X). (15)
Var(X + Y ) = Var(X) + Var(Y ) + 2µ [(X − µX )(Y − µY )] . (16)
En el caso particular que las variables aleatorias X e Y sean independientes entonces se cumple que
Var(X + Y ) = Var(X) + Var(Y ). (17)
∗ Desviación estándar.
v
u
u1 XN
σ(X) = t (xi − µ)2 . (18)
N
i=1
∗ Propiedades de la desviación estándar.

Sean X = x1 , . . . , xN e Y = y1 , . . . , yN dos variables aleatorias, y sea a ∈ R − {0} una constante entonces,
respecto de la desviación estándar se cumplen las siguientes propiedades.
σ(a) = 0. (19)
σ(aX) = |a|σ(X). (20)
σ(X ± a) = σ(X). (21)
p
σ(X + Y ) = Var(X) + Var(Y ) + 2µ [(X − µX )(Y − µY )]. (22)
2
En el caso particular que las variables aleatorias X e Y sean independientes entonces se cumple que
p
σ(X + Y ) = Var(X) + Var(Y ). (23)
∗ Rango o recorrido.
Rango = X(N ) − X(1) . (24)
∗ Coeficiente de variabilidad.
σX
CV (X) = · 100 %. (25)
|µ|
∗ Criterio para determinar si los datos son homogéneos o heterogéneos.

Si el CV (X) ≤ 5 % los datos son muy homogéneos.
Si el 5 % < CV (X) ≤ 25 % los datos son homogéneos.
Si el 25 % < CV (X) ≤ 50 % los datos son heterogéneos.
Si el CV (X) > 50 % los datos son muy heterogéneos.
∗ Sesgo.
µ(X) − MO (X)
Sesgo(X) = . (26)
σX
Cuando no haya moda o exista más de una el sesgo se calcula como
µ(X) − ME (X)
Sesgo(X) = 3 . (27)
σX
∗ Curtosis.
1 Q3 − Q1
K= − 0, 263. (28)
2 P90 − P10
Si K > 0 se dice que la curva es Leptocúrtica.
Si K = 0 se dice que la curva es Mesocúrtica.
Si K < 0 se dice que la curva es Platicúrtica.
Estadı́stica Bivariada.
∗ Coeficiente de correlación de Pearson.
µ(XY ) − µ(X)µ(Y )
ρ(X,Y ) = ρX,Y = . (29)
σ(X) · σ(Y )
∗ Criterio.
Si −1 ≤ ρ(X,Y ) < −0, 5 hay correlación lineal inversa.
Si 0, 5 < ρ(X,Y ) ≤ 1 hay correlación lineal directa.
Si −0, 5 ≤ ρ(X,Y ) ≤ 0, 5 no hay correlación.
∗ Covarianza.
Cov(X, Y ) = µ(XY ) − µ(X)µ(Y ). (30)

Formularioi P1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Formularioi P1

Cargado por

Copyright:

Formatos disponibles

Fiyuberth Hernández Probabilidad y Estadı́stica I

∗ Propiedades del promedio aritmético.

µ(a) = a (a ∈ R). (3)

En particular si X e Y son variables aleatorias independientes entonces se cumple que

µ(X · Y ) = µ(X) · µ(Y ). (7)

Var(X + Y ) = Var(X) + Var(Y ). (17)

∗ Propiedades de la desviación estándar.

∗ Criterio para determinar si los datos son homogéneos o heterogéneos.

También podría gustarte