Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Actividad 1 (Semana 3)
En esta sección y en los ejercicios futuros asuman que los 47.734 datos corresponden
a la población de clientes de la cadena de almacenes que obtuvo la información de la
base de datos descargada. Se quiere estudiar cómo fueron las compras en esa
jornada, por lo que se analizará principalmente la variable PURCHASE.
a. Dado que la población es finita, estime cuál debe ser el tamaño de muestra si se
desea un margen de error E = US$600, un nivel de confianza del 95% y se conoce
por estudios anteriores que la desviación estándar poblacional es
aproximadamente US$4986.
b. Use Excel para extraer una muestra aleatoria del tamaño determinado en el ítem
a. Deben explicar el paso a paso, fórmulas de Excel y adjuntar la muestra en
formado .xlsx (Solo la muestra, el archivo no debe contener fórmulas ni procesos
allí usados). Este archivo es el único adjunto válido para esta actividad dado que el
grupo deberá trabajarlo en la próxima entrega y en el siguiente ítem, para esto
deben escoger una sola muestra por equipo y trabajarla.
Solución:
Donde;
Valor crítico
Para un nivel de significancia α =0.05 , el valor critico en la tabla de distribución Normal,
viene dado por
Z α =Z 0.05 =1.96
(1− )
2
b) Ahora el siguiente paso es extraer una muestra aleatoria del tamaño 264
representativa de la población
Para realizar dicha selección se implementará un mecanismo de selección llamado
coordinado negativo, cuyo algoritmo se ilustra a continuación.
Para la población:
La media poblacional
∑ xi 446053507
i=1
μ= = =9344,57
N 47734
En Excel:
La desviación estándar poblacional.
√
n
∑ ( xi −μ )2
i=1
σ= =√ ¿¿ ¿
N
En Excel:
Para la muestra:
Intervalo de
2
clases Mc f fr F Fr ( M c∗f ) (M c −X ) f
393 2977 1684,94 18 0,068 18 0,07 30329,00 1024993417
2977 5561 4268,83 36 0,136 54 0,20 153678,00 886458144,5
5561 8145 6852,72 82 0,311 136 0,52 561923,22 463837881,7
8145 10729 9436,61 53 0,201 189 0,72 500140,39 2239000,931
12020,5
10729 13312 0 21 0,080 210 0,80 252430,50 163398787,6
14604,3
13312 15896 9 22 0,083 232 0,88 321296,56 635195166,7
17188,2
15896 18480 8 8 0,030 240 0,91 137506,22 506536672,7
19772,1
18480 21064 7 22 0,083 262 1,0 434987,67 2444521732
22356,0
21064 23648 6 2 0,008 264 1,0 44712,11 344530255,7
2437003,6
Total 264 7 6471711059
Media muestral
n
√
n
∑ ( M c −X )2 ¿ ni
√
2 2
i=1 [ ( 1699,6−9231,1 ) ( 18 ) +. . .+ ( 22524,4−9231,1 ) ( 6 ) ] 6471711059
S= = = =4960,6
n−1 264−1 264−1
De donde se tiene el siguiente resumen:
Con base a la teoría consultada se puede decir que media muestral es un estimador de la
media poblacional, mientras que la desviación estándar de la muestra es un estimador de
la desviación estándar de la población, en consecuencia.
Desviación Estándar σ S
Por últimos se calcula la probabilidad aplicando el teorema de limite central (TLC)
P ( X ≥ μ 0 )=1−P ( X ≤ μ 0)
Esto es;
( )
9344,57−9344,57
P ( X ≥ μ 0 )=1−P X ≤ =1−P ( Z ≤ 0 )=1−∅ ( 0 )=1−0,5=0,5
(4960,6
√ 264 )
Por lo tanto, la probabilidad de que la que la variable media muestral sea mayor o igual
que el valor de la poblacional, es de 0.5
2. Actividad 2 (Semana 4)
Solución:
Considerando la muestra seleccionada en la actividad 1, se procede a desarrollar
X −Z
( 1−
α
2
() √σn )≤ μ ≤ X +Z ( )( √σn )
1−
α
2
Variable (Compra)
Tamaño de muestra 264
Media muestral 9231,07
Desviación Estándar muestral 4960,57
8728,90 ≤ μ ≤ 9733,25
P−Z
( )
1−
α
2
√ P ( 1−P )
n
≤ π ≤ P+ Z α
(1− √
2
)
P (1−P)
n
Considerando la variable
X := ventas superiores a US$7.000, de donde se tiene
Ventas superiores
$7000
n 264
X 182
P 0,69
( 0,69 ) −( 1,960 )
√ ( 0,69 ) (1−0,69 )
264 √
≤ π ≤ ( 0,69 ) + ( 1,960 )
0,634 ≤ π ≤ 0,745
( 0,69 )( 1−0,69 )
264
√ √
2 2 2 2
S1 S2 S1 S 2
( X 1−X 2 ) −t 1− α ; v + ≤ μ 1−μ2 ≤ ( X 1−X 2 ) +t α +
( 2 ) n1 n 2 (1− 2 ;v ) n1 n2
Para este caso, se asume que las varianzas desconocidas y diferentes
Compras Mujeres
( )
2 2 2
S1 S 2 2
(4938) (5002)
+ +
n1 n2 196 68
v= = =115
( ) ( ) ( ) ( )
2 2 2 2 2 2 2 2
S1 S2 (4938) (5002)
n1 n2 196 68
+ +
n1 −1 n2−1 196−1 68−1
Valor critico Para α =0.1, el valor crítico de la distribución t con 115 grados de
libertad es
t α =t 0.1 =1,658
( 1− 2 ; v ) (1−
2
;115)
Mediante Excel;
√ √
2 2 2 2
( 4938 ) ( 5002 ) (4938) (5002)
( 9437−9228 ) −( 1,658 ) + ≤ μ 1−μ2 ≤ ( 9437−9228 )+ (1,658 ) +
196 68 196 68
−954,456 ≤ μ1−μ2 ≤1372,550
3. Actividad 3 (Semana 5)
Solución:
{
H 0 : μ=9344,57
contra
H 1 : μ> 9344.57
De la muestra el siguiente resumen
Variable (PURCHASE)
Tamaño de muestra 264
Media Muestral 9231,07
Desviación Estándar 4960,57
Media poblacional 9344,57
Z c=
√ n( X−μ) = √264 (9231,07−9344,57) =−0,372
σ 4960,57
( )
2
( )
S21 S 22 2
(4938) (5002)
2 2
+ +
n1 n2 196 68
v= = =115
( ) ( ) ( ) ( )
2 2 2 2 2
S1 S2
2
(4938)2 (5002)2
n1 n2 196 68
+ +
n1 −1 n2−1 196−1 68−1
Valor critico Para α =0.01 , el valor crítico de la distribución t con 115 grados de
libertad es
t α =t 0.01 =2,622
(1− 2 ; v ) (1−
2
;108)
Mediante Excel;
√ √
2 2 2 2
S1 S2 (4938) ( 5002)
+ +
n1 n2 196 68
Dado que el valor absoluto del estadístico de prueba t c =0,765<2,622, no se
rechaza la hipótesis nula H 0, en consecuencia, no existe diferencia entre las
compras promedio de hombres y mujeres