Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Primera Entrega Estadistica 2
Primera Entrega Estadistica 2
En esta sección y en los ejercicios futuros asuman que los 47.734 datos corresponden
a la población de clientes de la cadena de almacenes que obtuvo la información de la
base de datos descargada. Se quiere estudiar cómo fueron las compras en esa jornada,
por lo que se analizará principalmente la variable PURCHASE.
1. Dado que la población es finita, estime cuál debe ser el tamaño de muestra si se
desea un margen de error E=$ 500, un nivel de confianza del 90% y se conoce por
estudios anteriores que la desviación estándar poblacional es aproximadamente
US$4986.
2. Use Excel para extraer una muestra aleatoria del tamaño determinado en el ítem
a. Deben explicar el paso a paso, fórmulas de Excel y adjuntar la muestra en
formado .xlsx (Solo la muestra, el archivo no debe contener fórmulas ni procesos
allí usados).
3. De la variable PURCHASE, determine el valor de la media y la desviación estándar
poblacionales y muéstrales (tienen la población y una muestra). Explique
brevemente quién es el estimador de quién allí. Además calcule la probabilidad de
que la variable media muestral sea mayor o igual que el valor de la poblacional.
4. Haga el histograma de la variable PURCHASE, calcule el sesgo, la curtosis e indique
con ellos brevemente si la variable parece distribuirse de forma normal o no.
Solución:
Zα2 σ2 N
n=
Z α 2 σ 2+ ( N −1 ) ϵ 2
Z α =Z 0.1 =¿1.644854
(1− )
2
La media poblacional
n
∑ xi 20502+5851+. . .+9888+20207
μ= i=1 = =9344,57 ≈ 9345
N 47734
σ=
√ ∑ ( x i−μ )2
i=1
N
=√ ¿ ¿ ¿
Media y desviación estándar de la muestra.
¿ de intervalos=1+3,32∗log (268)≈ 9
Maximo=23320
Minimo=566
Rango=Maximo−Minimo=23320−566=22754
Rango 22754
Amplitud= = =2528,22
¿ de intervalos 9
Luego
Intervalo de clases Mc ni fi Ni Fi
566 3094 1830 17 0,06 17 0,06
3094 5622 4358 46 0,17 63 0,24
5622 8151 6887 75 0,28 138 0,51
8151 10679 9415 42 0,16 180 0,67
10679 13207 11943 27 0,10 207 0,77
13207 15735 14471 22 0,08 229 0,85
15735 18264 16999 19 0,07 248 0,93
18264 20792 19528 17 0,06 265 0,99
20792 23320 22056 3 0,01 268 1,0
Total 268
Media muestral
n
√
2
∑ ( M c − X́ ) ¿ ni
i=1
S= =√ ¿ ¿ ¿
n−1
De acuerdo a lo anterior, se puede decir que la media muestral es un estimador de la
media poblacional, mientras que la desviación estándar de la muestra es un estimador de
la desviación estándar de la población, en consecuencia.
En otras palabras
σ2
( )
X́ N μ ,
n
P ( X́ ≥ μ 0 )=1−P( X́ ≤ μ 0)
9345−9349
(
P ( X́ ≥ μ 0 )=1−P X́ ≤
(4987
)
√ 268 )
=1−P ( Z ≤−0.013 )=1−∅ (−0.013 ) =0.5052
Intervaos de clases
Sesgo (Asimetría)
Curtosis