Está en la página 1de 20

MUESTREO

1) A continuación se tiene una Base de datos de 104 empleados de gran empresa


agroexportadora del norte del país, durante el presente año. Contiene el nivel de
endeudamiento en compras con tarjeta de crédito mensual (en dólares) y el sexo del
empleado.
Deuda Deuda
Orden Sexo Orden Sexo
mensual ($) mensual ($)
1 500 M 53 1320 F
2 1430 M 54 1300 F
3 1230 M 55 1240 F
4 1000 M 56 456 M
5 1348 F 57 2530 F
6 1230 M 58 400 M
7 600 F 59 2456 F
8 1320 F 60 3456 M
9 1120 F 61 465 F
10 2345 F 62 1230 M
11 1430 M 63 1100 F
12 740 M 64 3456 F
13 1100 F 65 1100 M
14 1100 F 66 5678 F
15 1430 F 67 465 F
16 2344 M 68 480 F
17 2300 M 69 580 F
18 1340 F 70 580 F
19 400 F 71 5768 M
20 2300 M 72 2345 M
21 4500 M 73 2345 M
22 1340 M 74 5760 M
23 2200 F 75 1100 M
24 1650 F 76 1230 M
25 5600 F 77 1346 M
26 1680 M 78 1356 F
27 1300 M 79 1324 F
28 2300 M 80 2346 F
29 1860 M 81 2700 M
30 2356 F 82 4321 F
31 4566 M 83 785 F
32 1220 F 84 4321 M
33 1860 F 85 2456 M
34 3456 F 86 1230 M
35 1980 F 87 2345 M
36 860 F 88 3467 M
37 3456 M 89 1230 F
38 3020 M 90 1100 F
39 1230 F 91 1300 F
40 1235 F 92 785 M
41 3456 M 93 1300 M
42 1245 M 94 3568 M
43 2600 F 95 2345 F
44 670 F 96 2589 M
45 2500 F 97 890 F
46 2780 M 98 3456 M
47 2807 F 99 960 F
48 4500 M 100 2589 F
49 2688 F 101 2345 F
50 5600 M 102 1230 M
51 1230 F 103 1230 M
52 1000 M 104 3468 H

a) Usando la tabla de números aleatorios publicada en el aula virtual y con arranque


(5,3), halle una muestra piloto que represente el 6% de la población.

Solución:

np=0.06x104=6.24 → np=6

 Usando la tabla de números aleatorios y con arranque A(5,3),


hallamos la muestra piloto. Luego calculamos la media aritmética y la
desviación estándar.
N° N° aleatorio≤104 Deuda (Xi- ) (Xi- )^2
mensual ($)

1 002 1430 20 400

2 058 400 -1010 1020100


3 053 1320 -90 8100

4 063 1100 -310 96100

5 057 2530 1120 1254400

6 026 1680 270 72900

𝑛
1410 2452000
∑(𝑋𝑖 − 𝑋)2
𝑖=1

𝑛 490400
∑𝑖=1(𝑋𝑖 − 𝑋)^2/n-1
S2
S 700.28

b) Construya una muestra de 20 personas mediante muestreo aleatorio estratificado


con asignación proporcional. ¿Qué personas deben estar incluidas en la muestra?

Solución:
Np=20

 Se fijan dos estratos( de 1 a 52 y de 53 a 104)


 Se supone un arranque A(5,5) para el estrato de 1 a 52.
N1p=20(52/104)=10
N° N° aleatorio≤104 Deuda (Xi- ) (Xi- )^2
mensual ($)

1 010 2345 242.3 58709.29

2 030 2356 253.3 64160.89

3 019 400 -1702.7 2899187.29

4 035 1980 -122.7 15055.29


5 072 2345 242.3 58709.29

6 042 1245 -857.7 735649.29

7 034 3456 1353.3 1831420.29

8 048 4500 2397.3 5747047.29

9 063 1100 -1002.7 1005407.29

10 093 1300 -802.7 644327.29

𝑛
13059674.29
∑(𝑋𝑖 − 𝑋)2
=2102.7 𝑖=1

𝑛 1451074
∑𝑖=1(𝑋𝑖 − 𝑋)^2/n-1

S2
S 1204.6

 Se supone un arranque A(5,10) para el estrato de 53 al 104.


N2p=20(52/104)=10

N° N° aleatorio≤104 Deuda (Xi- ) (Xi- )^2


mensual ($)

1 092 1430 -934.5 873290.250

2 101 2345 -19.25 380.250

3 068 480 -1884.5 3551340.250

4 074 5760 3395.5 11529420.250


5 058 400 -1964.5 3859260.250

6 081 2700 335.5 112560.250

7 087 2345 -19.5 112560.25

8 072 2345 -19.5 380.25

9 022 1340 -1024.5 1049600.25

10 021 4500 2135.5 4560360.25

∑(𝑋𝑖 − 𝑋)2
25536972.50
=2364.5 𝑖=1

𝑛 2837441.39
∑𝑖=1(𝑋𝑖 − 𝑋)^2/n-1

S2
S 1684.47

 Cálculo de la media aritmética estratificada

ST=∑(Ni/N)Xi

ST= (52/104)x2102.7 + (52/104)x2364.5 = 2233.6

CONTRASTE DE HIPÓTESIS
2) La empresa de la pregunta (1) afirma que el NIVEL DE ENDEUDAMIENTO
PROMEDIO de sus empleados es al menos $2200. Para verificar la afirmación,
realice un contraste de hipótesis paramétrico con los datos de la muestra dada.
Solución (calculando para un nivel de confianza de 99%)
 Cálculo de la media aritmética, desviación estañar y varianza.
Orden Deuda mensual ($) (Xi- ) (Xi- )^2

1 500 -1524.75 2324862.56


2 1430 -594.75 353727.563
3 1230 -794.75 631627.563
4 1000 -1024.75 1050112.56
5 1348 -676.75 457990.563
6 1230 -794.75 631627.563
7 600 -1424.75 2029912.56
8 1320 -704.75 496672.563
9 1120 -904.75 818572.563
10 2345 320.25 102560.063
11 1430 -594.75 353727.563
12 740 -1284.75 1650582.56
13 1100 -924.75 855162.563
14 1100 -924.75 855162.563
15 1430 -594.75 353727.563
16 2344 319.25 101920.563
17 2300 275.25 75762.5625
18 1340 -684.75 468882.563
19 400 -1624.75 2639812.56
20 2300 275.25 75762.5625
21 4500 2475.25 6126862.56
22 1340 -684.75 468882.563
23 2200 175.25 30712.5625
24 1650 -374.75 140437.563
25 5600 3575.25 12782412.6
26 1680 -344.75 118852.563
27 1300 -724.75 525262.563
28 2300 275.25 75762.5625
29 1860 -164.75 27142.5625
30 2356 331.25 109726.563
31 4566 2541.25 6457951.56
32 1220 -804.75 647622.563
33 1860 -164.75 27142.5625
34 3456 1431.25 2048476.56
35 1980 -44.75 2002.5625
36 860 -1164.75 1356642.56
37 3456 1431.25 2048476.56
38 3020 995.25 990522.563
39 1230 -794.75 631627.563
40 1235 -789.75 623705.063
41 3456 1431.25 2048476.56
42 1245 -779.75 608010.063
43 2600 575.25 330912.563
44 670 -1354.75 1835347.56
45 2500 475.25 225862.563
46 2780 755.25 570402.563
47 2807 782.25 611915.063
48 4500 2475.25 6126862.56
49 2688 663.25 439900.563
50 5600 3575.25 12782412.6
51 1230 -794.75 631627.563
52 1000 -1024.75 1050112.56
53 1320 -704.75 496672.563
54 1300 -724.75 525262.563
55 1240 -784.75 615832.563
56 456 -1568.75 2460976.56
57 2530 505.25 255277.563
58 400 -1624.75 2639812.56
59 2456 431.25 185976.563
60 3456 1431.25 2048476.56
61 465 -1559.75 2432820.06
62 1230 -794.75 631627.563
63 1100 -924.75 855162.563
64 3456 1431.25 2048476.56
65 1100 -924.75 855162.563
66 5678 3653.25 13346235.6
67 465 -1559.75 2432820.06
68 480 -1544.75 2386252.56
69 580 -1444.75 2087302.56
70 580 -1444.75 2087302.56
71 5768 3743.25 14011920.6
72 2345 320.25 102560.063
73 2345 320.25 102560.063
74 5760 3735.25 13952092.6
75 1100 -924.75 855162.563
76 1230 -794.75 631627.563
77 1346 -678.75 460701.563
78 1356 -668.75 447226.563
79 1324 -700.75 491050.563
80 2346 321.25 103201.563
81 2700 675.25 455962.563
82 4321 2296.25 5272764.06
83 785 -1239.75 1536980.06
84 4321 2296.25 5272764.06
85 2456 431.25 185976.563
86 1230 -794.75 631627.563
87 2345 320.25 102560.063
88 3467 1442.25 2080085.06
89 1230 -794.75 631627.563
90 1100 -924.75 855162.563
91 1300 -724.75 525262.563
92 785 -1239.75 1536980.06
93 1300 -724.75 525262.563
94 3568 1543.25 2381620.56
95 2345 320.25 102560.063
96 2589 564.25 318378.063
97 890 -1134.75 1287657.56
98 3456 1431.25 2048476.56
99 960 -1064.75 1133692.56
100 2589 564.25 318378.063
101 2345 320.25 102560.063
102 1230 -794.75 631627.563
103 1230 -794.75 631627.563
104 3468 1443.25 2082970.56
=2024.75 179032356

𝑛 1738178.21
∑𝑖=1(𝑋𝑖 − 𝑋)^2/n-1

S2
S 1318.40

 n=104 (cantidad de datos)


=2024.75 (media)
S=1318.40 (desviación estándar)
1-α=0.99
 Hipótesis:
H0= µ≤2200
H1= µ>2200

 Valor crítico:
Z1-α=Z0.99=2.32

 Estadística de prueba:

Z=(( -µ0)√n)/S = ((2024.75-2200)√104)/1318.40 = -1.35

 Decisión
-1.35≤2.32 → aceptar H0

 Decisión:
Con una confianza del 99%, podemos afirmar que existen pruebas
suficientes para dudar de lo sustentado por la empresa.

CHI CUADRADO
3) Una muestra aleatoria de 150 empleados de una compañía de telecomunicaciones
casados, se clasifica de acuerdo con la educación y el número de hijos:
Nivel Número Nivel Número Nivel Número
Sexo Sexo Sexo
educativo de hijos educativo de hijos educativo de hijos
M ST 0 F SU 1 M SU 0

M SU 1 M ST 1 F ST 4

F PG 3 F ST 0 F PG 0

M SU 0 F SU 2 F SU 4

F PG 2 M SU 0 M PG 0

M SU 2 F PG 2 F SU 2

F PG 2 F SU 3 M PG 1

F SU 1 M PG 1 F ST 1

F SU 2 F ST 3 M PG 0

M PG 0 M SU 2 M SU 4

F ST 4 F PG 0 M SU 2

F SU 1 M SU 0 M SU 2

F PG 1 F SU 2 M SU 1

M ST 3 M SU 1 M SU 2

F SU 2 F SU 2 M PG 1

M SU 1 M ST 1 F ST 3

F SU 2 F ST 2 M ST 3

M SU 4 M ST 4 F ST 3

F SU 1 M PG 1 M ST 2

M SU 3 M PG 1 F ST 1

F PG 1 M ST 3 M ST 3

M ST 3 F SU 1 F ST 2

F SU 2 M PG 0 F ST 2

M PG 4 F ST 3 M ST 3

F ST 3 F SU 1 M ST 2

F SU 2 M PG 3 F SU 2

M PG 1 F ST 2 F PG 0

F SU 3 F SU 0 M ST 2

M SU 2 M PG 0 M SU 2

F SU 1 F ST 4 F PG 1

M ST 3 M SU 1 M ST 2

F ST 1 F PG 3 M SU 2

M ST 3 F ST 4 F PG 1
F SU 2 F ST 2 M ST 3

M PG 1 M SU 1 M SU 3

M ST 3 F PG 1 F PG 1

M SU 0 M ST 2 M ST 4

M PG 1 F SU 1 M PG 1

M PG 1 M ST 3 F ST 3

M PG 0 M SU 1 M SU 0

M PG 1 F ST 4 M PG 1

F ST 3 F SU 2 M ST 3

M SU 2 M ST 1 F SU 2

F ST 1 M PG 2 M PG 1

M PG 1 M ST 2 F ST 3

F ST 2 M SU 1 M SU 2

M SU 1 M PG 4 F PG 1

M PG 1 M ST 2 M ST 3

M ST 2 M SU 1 F SU 2

F SU 0 F PG 0 M PG 1

NIVEL EDUCATIVO:

ST = SUPERIOR TECNICO; SU=SUPERIOR UNIVERSITARIO; PG=POSGRADO

a) Elabore una tabla de contingencia con las variables sexo y nivel educativo.
Interprete.
b) Elabore una tabla de contingencia con las variables nivel de instrucción y número de
hijos. . Interprete.
c) Pruebe la hipótesis, de que el tamaño de la familia es independiente del nivel de
instrucción del padre, a un nivel de significancia de 0,05.

Solución a)
Nivel educativo Superior Superior Posgrado total
Sexo técnico universitario
Masculino 27 30 26 83

Femenino 27 24 16 67

Total 54 54 42 150

 Existen 27 trabajadores varones con estudios de superior técnico.


 Existen 27 trabajadores mujeres con estudios de superior técnico.
 Existen 30 trabajadores varones con estudios de superior universitario.
 Existen 24 trabajadores mujeres con estudios de superior universitario.
 Existen 26 trabajadores varones con estudios de posgrado.
 Existen 16 trabajadores mujeres con estudios de posgrado.

Solución b)

Nivel de instrucción Superior Superior Posgrado Total


# de hijos técnico universitario

0 2 8 10 20

1 7 18 23 48

2 14 24 4 42

3 21 4 3 28

4 7 3 2 12

Total 51 57 42 150

 Existen 2 trabajadores con estudios superior técnico que no tienen hijos.


 Existen 8 trabajadores con estudios superior universitario que no tienen
hijos.
 Existen 10 trabajadores con estudios de posgrado que no tienen hijos.
 Existen 7 trabajadores con estudios superior técnico que tienen 1 hijo.
 Existen 18 trabajadores con estudios superior universitario que tienen 1
hijo.
 Existen 23 trabajadores con estudios de posgrado que tienen 1 hijo.
 Existen 14 trabajadores con estudios superior técnico que tienen 2 hijos.
 Existen 24 trabajadores con estudios superior universitario que tienen 2
hijos.
 Existen 4 trabajadores con estudios de posgrado que tienen 2 hijos.
 Existen 21 trabajadores con estudios superior técnico que tienen 3 hijos.
 Existen 4 trabajadores con estudios superior universitario que tienen 3
hijos.∑
 Existen 3 trabajadores con estudios de posgrado que tienen 3 hijos.
 Existen 7 trabajadores con estudios superior técnico que tienen 4 hijos.
 Existen 3 trabajadores con estudios superior universitario que tienen 4
hijos.
 Existen 2 trabajadores con estudios de posgrado que tienen 4 hijos.

Solución c)

 Hipótesis:
H0: No existe relación entre el tamaño de la familia y el nivel de instrucción.
H1: Sí existe relación entre el tamaño de la familia y el nivel de instrucción.

 Valor crítico:

X21-α,(F-1)(C-1) = X20.95,8 = 15.507


 Estadística de prueba:

X2 = ∑∑(O ij – eij)2/ eij = 52.32


Nivel de instrucción Superior Superior Posgrado fi
# de hijos técnico universitario

0 2 8 10 20
6.8 7.6 5.6

1 7 18 23 48
16.32 18.24 13.44

2 14 24 4 42
14.28 15.96 11.76

3 21 4 3 28
9.52 10.64 7.84

4 7 3 2 12
4.08 4.56 3.36

fj 51 57 42 n=150

 Decisión.
X2= 52.32 € RR → Rechazar H0

 Conclusión:
Con una confianza de 95%, podemos afirmar que si existe relación entre
el tamaño de la familia y el nivel de instrucción.

DISEÑO DE EXPERIMENTOS
4) En la siguiente tabla, se tiene la calificación de una prueba a los promotores de un
nuevo servicio de telefonía celular que fueron sometidos a una intensa capacitación.
Se intenta es probar si existe o no diferencia en el promedio de las calificaciones.
CALIFICACIÓN CALIFICACIÓN CALIFICACION

GRUPO A GRUPO B GRUPO C
1 67.15 39.56 43.28
2 64.36 39.07 41.03
3 60.91 38.71 41.53
4 55.38 34.95 43.38
5 53.91 34.27 39.98
6 53.34 34.27 39.42
7 52.15 67.63 38.45
8 51.86 62.77 39.80
9 51.12 60.88 37.09
10 50.63 56.55 41.13
11 50.35 51.76 34.42
12 48.38 53.63 40.28
13 47.07 50.77 43.28
14 44.09 50.89 40.79
15 43.41 48.66 33.09
16 43.23 52.67 32.18
17 41.82 47.98 58.49
18 41.57 48.23 56.18
19 41.21 46.83 51.46
20 40.82 45.52 53.41

 Cálculo de desviación estándar de cada grupo


Nº CALIFICACIÓN (Xi-X) (Xi-X)2
GRUPO A
1 67.15 17.012 289.408
2 64.36 14.222 202.265
3 60.91 10.772 116.036
4 55.38 5.242 27.479
5 53.91 3.772 14.228
6 53.34 3.202 10.253
7 52.15 2.012 4.048
8 51.86 1.722 2.965
9 51.12 0.982 0.964
10 50.63 0.492 0.242
11 50.35 0.212 0.045
12 48.38 -1.758 3.091
13 47.07 -3.068 9.413
14 44.09 -6.048 36.578
15 43.41 -6.728 45.266
16 43.23 -6.908 47.720
17 41.82 -8.318 69.189
18 41.57 -8.568 73.411
19 41.21 -8.928 79.709
20 40.82 -9.318 86.825
𝑛
∑ni 1002.76 1119.136
∑(𝑋𝑖 − 𝑋)2
𝑖=1

𝑛
Media( ) ∑𝑖=1(𝑋𝑖 − 𝑋)2/n-1 58.902
50.138 S2

Nº CALIFICACIÓN (Xi-X) (Xi-X)2


GRUPO B

1 39.56 -8.720 76.038


2 39.07 -9.210 84.824
3 38.71 -9.570 91.585
4 34.95 -13.330 177.689
5 34.27 -14.010 196.280
6 34.27 -14.010 196.280
7 67.63 19.350 374.423
8 62.77 14.490 209.960
9 60.88 12.600 158.760
10 56.55 8.270 68.393
11 51.76 3.480 12.110
12 53.63 5.350 28.623
13 50.77 2.490 6.200
14 50.89 2.610 6.812
15 48.66 0.380 0.144
16 52.67 4.390 19.272
17 47.98 -0.300 0.090
18 48.23 -0.050 0.003
19 46.83 -1.450 2.103
20 45.52 -2.760 7.618
𝑛
∑ni 965.6 1717.206
∑(𝑋𝑖 − 𝑋)2
𝑖=1
𝑛 90.379
∑𝑖=1(𝑋𝑖 − 𝑋)2/n-1
=48.28
S2

Nº CALIFICACION
GRUPO C (Xi-X) (Xi-X)2

1 43.280 0.847 0.717


2 41.030 -1.403 1.970
3 41.530 -0.903 0.816
4 43.380 0.947 0.896
5 39.980 -2.454 6.020
6 39.420 -3.013 9.081
7 38.450 -3.983 15.868
8 39.800 -2.634 6.935
9 37.090 -5.343 28.553
10 41.130 -1.303 1.699
11 34.420 -8.013 64.216
12 40.280 -2.153 4.638
13 43.280 0.847 0.717
14 40.790 -1.644 2.701
15 33.090 -9.343 87.301
16 32.180 -10.254 105.134
17 58.490 16.057 257.811
18 56.180 13.747 188.966
19 51.460 9.027 81.478
20 53.410 10.977 120.484
𝑛
848.67 986.000
∑(𝑋𝑖 − 𝑋)2
𝑖=1

=42.434 𝑛 51.895
∑𝑖=1(𝑋𝑖 − 𝑋)2/n-1
S2
Solución:
K=3 N=15
S21=58.9 S22=90.38 S23=51.89
n1= 20 n2=20 n3=20
 Hipótesis:
H0: µ1=µ2=µ3

H1: Al menos una µi es diferente.

 Valor crítico.(a un nivel de 1%) F1-α,k-1,N-k


F0.99,2,12=6.927
 Estadística de prueba.
Fuente de variación Grados de Suma de Cuadrado F
libertad cuadrados Medio

Tratamientos 2 646.62

Error 12

total 14
REGRESIÓN Y CORRELACION
5) A continuación se tienen datos relacionados con el total de horas trabajadas por
personal de una empresa y el nivel de consumo semanal en productos alimenticios
y para el hogar. La muestra es de 34 personas. Se trata el costo de las casas como
la variable dependiente.

Total de horas Consumo Total de horas Consumo


trabajadas semanal (S/.) trabajadas semanal (S/.)
53 670 8 360
10 630 40 760
14 600 8 870
49 540 8 890
46 580 12 920
14 450 20 820
27 640 16 930
16 740 24 820
36 640 55 930
23 740 6 820
20 820 77 800
53 784 0 762
10 580 44 920
14 450 55 820
49 640 26 930
46 740 40 820
37 640 16 930

a) Muestre el diagrama de dispersión.

1000

900

800

700

600

500

400

300

200

100

0
0 10 20 30 40 50 60 70 80 90
b) Determine la recta de regresión y el coeficiente de determinación.
No se puede determinar la recta de regresión debido a que cualquier recta que
se trace deja puntos alejados de ella. Hacer un análisis de regresión no tiene
sentido.
c) ¿Cuál sería el nivel de consumo de un trabajador que labora 42 horas?
No se podría calcular debido a que no se puede ajustar los datos a un análisis
de regresión.
d) ¿Sería adecuada una regresión cuadrática en este caso? Explique
No, porque la gráfica de puntos de dispersión no se ajustan a una este tipo de
regresión.

También podría gustarte