Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capítulo 2
Capítulo 2
IMPUTACIÓN DE DATOS
2.1 Introducción
1
, X α, β
f ( x) β α
0
, para el resto de X (2.1)
GRÀFICO 2.1
Efectos de la Imputación en el análisis de datos multivariados
Densidad de la Distribución Uniforme
f(x)
1
β β
1 x2 β2 α2
E( X ) xf(x)dx
α β α
x dx
2(β α)
α
2(β α) 2(β α)
β2 α2 (β α)(β α) βα
μ
2(β α) 2(β α) 2 (2.2)
GRÁFICO 2.2
Efectos de la Imputación en análisis de datos multivariados
Media de la distribución uniforme
f (x )
x
2
Además si X ~ U α, β ,
28
β β
1 1 1 x3
E(X ) x f(x)dx x
β α α
2 2
dx
2
x 2
dx
β α β α 3 α
1 β 3 α3
1 β3 α3
β α β 2 αβ α 2
β α 3 3 β α 3 3 β α
2
β 2 αβ α 2 α β β 2 αβ α 2 α 2 2α β 2
Var(X)
3 2 3 4
4 β 2 αβ α 2 3 α 2 2α β 2
4β 2 4α 4α 2 3α 2 6α 3β 2
12
β 2 2α α 2
β α 2
12 12
(2.3)
GRÁFICO 2.3
Efectos de la Imputación en análisis de datos multivariados
Números en el intervalo X Є ( , )
f (x )
a b c d β
← Δ → ← Δ →
1
, X α, β
f ( x) β α
0 , para el resto de X
Además, el intervalo (a, b) está incluido en α, β al igual que (c, d), esto es:
Si a,b α, β y c, d α, β
x
Por tanto P X a, b P X c, d
(2.4)
30
Caso particular: Si 1 y 10 ; X U ( 1, 10 )
aleatoria es uniforme.
3
probabilidad de que algo ocurra en dicho intervalo, no es .
9
si h 1, i 6 entonces x 6 1 5
6
1 1 5
P X 1,6 9 dx 9 6 1 9
1
0
Si X U ( 0 , 1 ) ;
0 si X
F(x) x si X ( 0 , 1)
1 si X 1
continua X es:
M X (t) E e Xt e
Xt
f ( x ) dx (2.6)
Uniforme
M X (t) E(e tX ) e
tX
f(x)dx ,
1 1
M X (t) e tX dx e tX dx
* e α * e tβ e tα
1 1 tX β 1 1
t t
e tβ e tα
, t 0
t β α
(2.7)
una muestra aleatoria de una población que tiene una distribución dada.
Cuadro 2.1
Efectos de la Imputación en el Análisis de Datos Multivariados
Contraste de Hipótesis de la Prueba de Bondad de Ajuste
muestrales.
parámetro conocido 3
Tabla 2.1
Efectos de la Imputación en el análisis de datos multivariados
Prueba de Bondad de Ajuste
Frecuencia Probabilidad
De acuerdo i Observada Poisson ei a los
fi 3
resultados 0 18 0.050 22.000 obtenidos
1 53 0.149 65.700
mediante la 2 103 0.224 98.600 prueba de
3 107 0.224 98.600
4 82 0.168 73.900
bondad de 5 46 0.101 44.440
ajuste, el valor
6 18 0.050 22.200
p es 0.998, 7 10 0.022 9.680 por lo tanto no
8 3 0.012 5.280
existe evidencia
Valor p = 0,998
Elaborado por: G. Cuenca
33
0 si X X (1)
k
F̂n (x) si X (k) X X (k 1) ; si k 1,2,..., n 1
n
1 si X X (n)
Cuadro 2.3
Efectos de la Imputación en el Análisis de Datos Multivariados
Contraste de Hipótesis de la Prueba de Kolmogorov-Smirnov
j= 1,2,3,4,5
Tabla 2.2
Efectos de la Imputación en el análisis de datos multivariados
Matriz de Datos de variables aleatorias independientes con
distribución Normal (0, 1)
Tamaño de muestra n=4
0.464 0.137 2.455 -0.323 -0.068
0.906 -0.513 -0.525 0.595 0.881
-0.482 1.678 -0.057 -1.229 -0.486
-1.787 -0.261 1.237 1.046 -0.508
Tabla 2.3
Efectos de la Imputación en el análisis de datos multivariados
Prueba de Kolmogorov-Smirnov
Xn ˆ (x)
F F0(x) ˆ (x) F (x)
max Fn 0
20
Cuadro 2.4
Efectos de la Imputación en el análisis de datos multivariados
Prueba de Kolmogorov-Smirnov
H0: La distribución de la población donde se obtuvo la muestra es Normal(0,1)
vs.
H1: No es verdad H0
Estadístico de Prueba es : max F ˆ (x) F (x) = 0.149
n 0
Valor p = 0.766
Elaborado por: G. Cuenca
en los números que genera, ya que estos números deben cumplir ciertas
X 2 respectivamente.
recurrencia es la siguiente:
X n 1 ( aX n c) mod m ,
(2.8)
Donde
investigador;
incremento;
TABLA 2.4
Efectos de la Imputación en el análisis de datos multivariados
Método Congruencial Mixto
Números pseudos aleatorios del generador
Números
n Xn (5Xn+7)/8 Xn+1
Uniformes
0 4 3+3/8 3 0.375
1 3 2+6/8 6 0.750
2 6 4+5/8 5 0.625
3 5 4+0/8 0 0.000
4 0 0+7/8 7 0.875
5 7 5+2/8 2 0.250
6 2 2+1/8 1 0.125
7 1 1+4/8 4 0.500
8 4 3+3/8 3 0.375
9 3 2+6/8 6 0.750
10 6 4+5/8 5 0.625
11 5 4+0/8 0 0.000
12 0 0+7/8 7 0.875
X n 1 (5 X n 7) mod 8
X n 1 (5 X n 7) mod 8
si n 0
X 1 (5 X 0 7) mod 8
5(4) 7 27 3
3 3.375
8 8 8
3
donde es el residuo y al dividir 3 para 8, el resultado es el
8
si n 1
X 2 (5 X 1 7) mod 8
5(3) 7 22 6
2 2.75
8 8 8
6
donde el residuo es y al dividir 6 para 8, el resultado es el
8
si n 2
X 3 (5 X 2 7) mod 8
5(6) 7 37 5
4 4.62
8 8 8
5
donde el residuo es y al dividir 5 para 8, el resultado es el
8
0.125 y 0.500.
períodos indeseables.
41
Elaborado
por: G. Cuenca
TABLA 2.5
Efectos de la Imputación en el análisis de datos multivariados
Método Congruencial Mixto
Números pseudoaleatorios del generador X n 1 7 X n 7 mod10
Números
n Xn (7Xn+7)/10 Xn+1
Uniformes
0 7 5+6/10 6 0.600
1 6 4+9/10 9 0.900
2 9 7+0/10 0 0.000
3 0 0+7/10 7 0.700
4 7 5+6/10 6 0.600
5 6 4+9/10 9 0.900
6 9 7+0/10 0 0.000
es 7:
X n 1 7 X n 7 mod 10
si n 0
X 1 (7 X 0 7) mod 10
7(7) 7 56 6
5 5.600
10 10 10
6
donde es el residuo y al dividir 6 para 10, el resultado es el
10
si n 1
X 2 (7 X 1 7) mod 10
7(6) 7 49 9
4 4.900
10 10 10
42
9
donde es el residuo y al dividir 9 para 10, el resultado es el
10
si n 2
X 3 (7 X 2 7) mod 10
7(9) 7 70 0
7 7.000
10 10 10
0
donde es el residuo y al dividir 0 para 10, el resultado es el
10
si n 3
X 4 (7 X 3 7) mod 10
7(0) 7 7 7
0 0.700
10 10 10
7
donde es el residuo y al dividir 7 para 10, el resultado es el
10
completo”. [1]
43
relación de recurrencia:
X n 1 aX n mod m , (2.9)
TABLA 2.6
Efectos de la imputación en el análisis de datos multivariados
Método Congruencial Multiplicativo
Números pseudoaleatorios del generador X n 1 5 X n mod 32
Números
n Xn 5Xn / 32 Xn+1
Uniformes
0 5 0+25/32 25 0.781
1 25 3+29/32 29 0.906
2 29 4+17/32 17 0.531
3 17 2+21/32 21 0.656
4 21 3+9/32 9 0.281
5 9 1+13/32 13 0.406
6 13 2+1/32 1 0.031
7 1 0+5/32 5 0.156
8 5 0+25/32 25 0.781
9 25 3+29/32 29 0.906
10 29 4+17/32 17 0.531
11 17 2+21/32 21 0.656
número generado.
X n 1 5 X n mod 32
si n 0
45
X 1 5X 0 mod 32
5(5) 25 25
0 0.781
32 32 32
25
donde es el residuo y al dividir 25 para 32, el resultado es el
32
si n 1
X 2 5X 1 mod 32
5(25) 125 29
3 3.906
32 32 32
29
donde el residuo es y al dividir 29 para 32, el resultado es el
32
si n 2
X 3 5X 2 mod 32
5( 29) 145 17
4 4.531
32 32 32
17
donde el residuo es y al dividir 17 para 32, el resultado es el
32
0.031 y 0.156.
inversa. [1]
x, a partir de:
47
F(x) y
F -1 ( F ( x )) F 1 (y)
x F 1 (y)
(2.10)
deseada.
1
e x / si x 0
f(x) (2.11)
0 si x 0
0 y 1:
1 ex / y
ex / 1 y
48
ln e x / ln(1 y)
x ln(1 y) (2.13)
ejemplo y=0.25.
x 2 ln(1 0.25)
x 0.575
2
1 x
1
f ( x) e2 x (2.14)
2
49
hacer uso del Teorema del Límite Central el cual establece que la
se aproxima al infinito.
conoce que:
1 1
y 2
2 12
X i n
Z i 1
(2.15)
n
12
tiene que:
50
12 12
X i 12 X i 12(1 / 2)
12 (2.16)
Z i 1
i 1
X i 6
1 1 i 1
12 . 12 .
12 12
X
estándar esto es, X ~ N( , 2 ) , entonces Z es normal
estándar.
transformada inversa.
pi 1 P(X i) pi ; i 0 (2.18)
i 1