Documentos de Académico
Documentos de Profesional
Documentos de Cultura
IMPUTACIÓN DE DATOS
2.1 Introducción
1
, X α, β
f ( x) β α (2.1)
0 ,
para el resto de X
GRÀFICO 2.1
Efectos de la Imputación en el análisis de datos multivariados
Densidad de la Distribución Uniforme
f(x)
1
x
Elaborado por: G. Cuenca
27
β β
1 x2 β2 α2
E ( X ) xf(x)dx x
dx
α
β α 2(β α) α 2(β α) 2(β α)
β 2 α 2 (β α)(β α) β α (2.2)
μ
2(β α) 2(β α) 2
GRÁFICO 2.2
Efectos de la Imputación en análisis de datos multivariados
Media de la distribución uniforme
f (x)
x
2
Además si X ~ U α, β ,
β β
1 1 1 x3
E(X ) x f(x)dx x
β α α
2 2 2
dx x 2
dx
β α β α 3 α
1 β3 α3
1 β 3 α 3 β α β 2 αβ α 2
β α 3 3 β α 3 3 β α
β 2 αβ α 2 α β β 2 αβ α 2 α 2 2α β 2
2
Var(X)
3 2 3 4
4 β 2 αβ α 2 3 α 2 2α β 2
4β 2 4α 4α 2 3α 2 6α 3β 2
12
β 2 2α α 2 β α
2 (2.3)
12 12
GRÁFICO 2.3
Efectos de la Imputación en análisis de datos multivariados
Números en el intervalo X Є ( , )
f (x )
a b c d β
← Δ → ← Δ →
1
, X α, β
f ( x) β α
0 ,
para el resto de X
Además, el intervalo (a, b) está incluido en α, β al igual que (c, d), esto es:
b a x
b
P X a, b
1 1
dx
a
d c x
d
P X c, d
1 1
dx
c
30
x
Por tanto P X a, b P X c, d (2.4)
Caso particular: Si 1 y 10 ; X U ( 1, 10 )
1
X 1,10
f ( x) 9
0 resto de X
si a 2, b 5
5
P X 2 , 5 dx 5 2
1 1 3
2
9 9 9
si c 1, d 4
4
P X 1, 4 dx 4 1
1 1 3
entonces x 3
1
9 9 9
aleatoria es uniforme.
3
probabilidad de que algo ocurra en dicho intervalo, no es .
9
si h 1, i 6 entonces x 6 1 5
6
P X 1,6 dx 6 1
1 1 5
1
9 9 9
31
0 si X α
xα (2.5)
P(X x) F(x) si α X β
β α
1 si X β
0 si X 0
Si X U ( 0 , 1 ) ; F(x) x si X (0 , 1)
1 si X 1
continua X es:
M X (t) E e Xt e Xt f ( x)dx (2.6)
Uniforme
32
M X (t) E(etX ) e
tX
f(x)dx ,
1 1
M X (t) e tX
dx e tX dx
1
t
1 β
* e tX α
1 1
* e tβ e tα
t
e tβ e tα
, t 0 (2.7)
tβ α
una muestra aleatoria de una población que tiene una distribución dada.
Cuadro 2.1
Efectos de la Imputación en el Análisis de Datos Multivariados
Contraste de Hipótesis de la Prueba de Bondad de Ajuste
muestrales.
parámetro conocido 3
Tabla 2.1
Efectos de la Imputación en el análisis de datos multivariados
Prueba de Bondad de Ajuste
Frecuencia Probabilidad
Observada
i Poisson ei
fi 3
0 18 0.050 22.000
1 53 0.149 65.700
2 103 0.224 98.600
3 107 0.224 98.600
4 82 0.168 73.900
5 46 0.101 44.440
6 18 0.050 22.200
7 10 0.022 9.680
8 3 0.012 5.280
Cuadro 2.2
Efectos de la Imputación en el análisis de datos multivariados
Prueba de Bondad de Ajuste
H0: La distribución de la población donde se obtuvo la muestra es Poisson 3
vs.
H1: No es verdad H0
(f i e i ) 2
m
Estadístico de Prueba es :
i 1
ei
= 6.828
Valor p = 0,998
Elaborado por: G. Cuenca
34
0 si X X (1)
k
F̂n (x) si X (k) X X (k 1) ; si k 1,2,...,n 1
n
1 si X X (n)
35
Cuadro 2.3
Efectos de la Imputación en el Análisis de Datos Multivariados
Contraste de Hipótesis de la Prueba de Kolmogorov-Smirnov
j= 1,2,3,4,5
Tabla 2.2
Efectos de la Imputación en el análisis de datos multivariados
Matriz de Datos de variables aleatorias independientes
con distribución Normal (0, 1)
Tamaño de muestra n=4
0.464 0.137 2.455 -0.323 -0.068
0.906 -0.513 -0.525 0.595 0.881
-0.482 1.678 -0.057 -1.229 -0.486
-1.787 -0.261 1.237 1.046 -0.508
Tabla 2.3
Efectos de la Imputación en el análisis de datos multivariados
Prueba de Kolmogorov-Smirnov
Cuadro 2.4
Efectos de la Imputación en el análisis de datos multivariados
Prueba de Kolmogorov-Smirnov
H0: La distribución de la población donde se obtuvo la muestra es Normal(0,1)
vs.
H1: No es verdad H0
Estadístico de Prueba es : max Fˆn (x) F0 (x) = 0.149
Valor p = 0.766
Elaborado por: G. Cuenca
en los números que genera, ya que estos números deben cumplir ciertas
respectivamente.
multiplicativo. [2]
recurrencia es la siguiente:
Donde
investigador;
TABLA 2.4
Efectos de la Imputación en el análisis de datos multivariados
Método Congruencial Mixto
Números pseudos aleatorios del generador X n 1 (5 X n 7) mod 8
Números
n Xn (5Xn+7)/8 Xn+1
Uniformes
0 4 3+3/8 3 0.375
1 3 2+6/8 6 0.750
2 6 4+5/8 5 0.625
3 5 4+0/8 0 0.000
4 0 0+7/8 7 0.875
5 7 5+2/8 2 0.250
6 2 2+1/8 1 0.125
7 1 1+4/8 4 0.500
8 4 3+3/8 3 0.375
9 3 2+6/8 6 0.750
10 6 4+5/8 5 0.625
11 5 4+0/8 0 0.000
12 0 0+7/8 7 0.875
X n 1 (5 X n 7) mod 8
si n 0
X 1 (5 X 0 7) mod 8
5(4) 7 27 3
3 3.375
8 8 8
3
donde es el residuo y al dividir 3 para 8, el resultado es el
8
si n 1
X 2 (5 X 1 7) mod 8
5(3) 7 22 6
2 2.75
8 8 8
6
donde el residuo es y al dividir 6 para 8, el resultado es el
8
si n 2
X 3 (5 X 2 7) mod 8
5(6) 7 37 5
4 4.62
8 8 8
5
donde el residuo es y al dividir 5 para 8, el resultado es el
8
0.125 y 0.500.
períodos indeseables.
TABLA 2.5
Efectos de la Imputación en el análisis de datos multivariados
Método Congruencial Mixto
Números pseudoaleatorios del generador X n 1 7 X n 7 mod 10
Números
n Xn (7Xn+7)/10 Xn+1
Uniformes
0 7 5+6/10 6 0.600
1 6 4+9/10 9 0.900
2 9 7+0/10 0 0.000
3 0 0+7/10 7 0.700
4 7 5+6/10 6 0.600
5 6 4+9/10 9 0.900
6 9 7+0/10 0 0.000
es 7:
X n 1 7 X n 7 mod 10
si n 0
X 1 (7 X 0 7) mod 10
7(7) 7 56 6
5 5.600
10 10 10
6
donde es el residuo y al dividir 6 para 10, el resultado es el
10
si n 1
X 2 (7 X 1 7) mod10
7(6) 7 49 9
4 4.900
10 10 10
9
donde es el residuo y al dividir 9 para 10, el resultado es el
10
si n 2
X 3 (7 X 2 7) mod 10
7(9) 7 70 0
7 7.000
10 10 10
44
0
donde es el residuo y al dividir 0 para 10, el resultado es el
10
si n 3
X 4 (7 X 3 7) mod 10
7 ( 0) 7 7 7
0 0.700
10 10 10
7
donde es el residuo y al dividir 7 para 10, el resultado es el
10
completo”. [1]
relación de recurrencia:
X n 1 aX n mod m , (2.9)
TABLA 2.6
Efectos de la imputación en el análisis de datos multivariados
Método Congruencial Multiplicativo
Números pseudoaleatorios del generador X n 1 5 X n mod 32
Números
n Xn 5Xn / 32 Xn+1
Uniformes
0 5 0+25/32 25 0.781
1 25 3+29/32 29 0.906
2 29 4+17/32 17 0.531
3 17 2+21/32 21 0.656
4 21 3+9/32 9 0.281
5 9 1+13/32 13 0.406
6 13 2+1/32 1 0.031
7 1 0+5/32 5 0.156
8 5 0+25/32 25 0.781
9 25 3+29/32 29 0.906
10 29 4+17/32 17 0.531
11 17 2+21/32 21 0.656
número generado.
X n 1 5 X n mod 32
si n 0
X 1 5X 0 mod 32
5(5) 25 25
0 0.781
32 32 32
47
25
donde es el residuo y al dividir 25 para 32, el resultado es el
32
si n 1
X 2 5X 1 mod 32
5(25 ) 125 29
3 3.906
32 32 32
29
donde el residuo es y al dividir 29 para 32, el resultado es el
32
si n 2
X 3 5X 2 mod 32
5(29 ) 145 17
4 4.531
32 32 32
17
donde el residuo es y al dividir 17 para 32, el resultado es el
32
0.031 y 0.156.
inversa. [1]
x, a partir de:
F(x) y
F -1 ( F ( x)) F 1 (y)
x F 1 (y) (2.10)
49
deseada.
1 x /
e si x 0 (2.11)
f(x)
0 si x 0
1 e x / si x 0
P(X x) F(x) (2.12)
0 si x 0
0 y 1:
1 ex / y
ex / 1 y
50
ln e x / ln(1 y)
x ln(1 y) (2.13)
ejemplo y=0.25.
x 2 ln(1 0.25)
x 0.575
1 x
2
1
f ( x) e 2
x (2.14)
2
51
hacer uso del Teorema del Límite Central el cual establece que la
se aproxima al infinito.
conoce que:
1 1
y 2
2 12
X i n
Z i 1
(2.15)
n
12
que:
52
12 12
X i 12 X i 12 (1 / 2)
12
X i 6
(2.16)
Z i 1
i 1
12 .
1
12 .
1 i 1
12 12
X
estándar esto es, X ~ N ( , 2 ) , entonces Z es normal
estándar.
λ xeλ
P(X x) para x=0, 1, 2, … (2.17)
x!
transformada inversa.
pi 1 P(X i) pi ; i 0 (2.18)
i 1