Está en la página 1de 7

lOMoARcPSD|10170725

Actividad 1 estadisticas 2

Estadística II (Universidad de Pamplona)

StuDocu is not sponsored or endorsed by any college or university


Downloaded by Maria Paula Quiroz (maripa112@gmail.com)
lOMoARcPSD|10170725

Actividad 1(semana 3)

En esta sección y en los ejercicios futuros asuman que los 47.734 datos corresponden a la
población de clientes de la cadena de almacenes que octavo la información de la base de datos
descargada. Se quiere estudiar como fueron las compras en esa jornada, por lo que se analizara
principal mente la variable PURCHASE.

a. Dado que la población es finita, estime cual debe ser el tamaño de muestra si se desea un
margen de error E=$500, un nivel de confianza del 90% y se conoce por estudios anteriores
que la desviación estándar poblacional es aproximadamente US$4986.
b. Use Excel para extraer una muestra aleatoria del tamaño determinado en el ítem a. deben
explicar el paso a paso, fórmulas de Excel y adjuntar la muestra en formato .xlsx (solo la
muestra, el archivo no debe contener formulas ni procesos allí usados)

c. De la variable PURCHASE, determine el valor de la media y la desviación estándar


poblacionales y muestrales (tienen la población y una muestra). Explique brevemente
quién es el estimador de quién allí. Además, calcule la probabilidad de que la variable
media muestral sea mayor o igual que el valor de la
poblacional.

d. Haga el histograma de la variable PURCHASE, calcule el sesgo, la curtosis e indique con


ellos brevemente si la variable parece distribuirse de forma normal o no. (Use la
población).

Solución:
1. El tamaño de la muestra correspondiente se calcula mediante la fórmula para el
tamaño muestra para la media población finita, la cual viene dada por:

2 2
Za σ N
N= 2 2 2
Z a σ +(N −1) ϵ

Para nuestro caso, consideremos


N=47734; E=500, σ =¿ 4.986 y a=0.1
Para a = 0.1, el valor critico en la tabla de distribución normal es

0.1
Za =Z ( ) = ¿1.644854
2

En Excel mediante la siguiente función

Downloaded by Maria Paula Quiroz (maripa112@gmail.com)


lOMoARcPSD|10170725

Luego al remplazar en la formula, se tiene

4986 ¿2 (47734)
¿
500 ¿2
¿
2
N= 4986 ¿ +(47734−1)¿
1,644854 ¿ 2 ¿
¿
1,644854 ¿ 2 ¿
¿
¿
2. Para la selección de la muestra aleatoria simple de tamaño 268,
se implementará un mecanismo de selección llamado coordinado
negativo, cuyo algoritmo se ilustra a continuación.

Método coordinado negativo

 Generar N realizaciones de una variable aleatoria ξk (K


ϵ U ) con distribución uniforme (0,1).
 Asignar ξk al elemento K-`estimo de la población.
 Ordenar la lista de elementos descendente (o
ascendentemente) con respecto a ese número aleatorio ξk.
 A continuación, seleccionar los n principios (o los n
`últimos) elementos. Esta selección corresponde a la
muestra realizada.

A continuación, se evidencia las primeras y ultimas observaciones de la


muestra aleatoria simple seleccionada de tamaño 268, mediante el método de
selección ya mencionada.

Downloaded by Maria Paula Quiroz (maripa112@gmail.com)


lOMoARcPSD|10170725

Downloaded by Maria Paula Quiroz (maripa112@gmail.com)


lOMoARcPSD|10170725

3. Considerando la variante PURCHASE, mencionada inicialmente, se


procede a determine el valor de la media y la desviación estándar
poblacional y muestrales.
 Media y desviación estándar de la población.

La media población

n
∑ xi
i=I 20500+5851+…+9888+20207
μ= = =9344,57=9345
N 47734

la desviación estándar poblacional.

De acuerdo a lo interior, se puede decir que la media muestra


es un estimulador de la media poblacional, mientras que la
desviación estándar de la muestra es un estimador de la
desviación estándar de la población, en consecuencia.
nombre Parameros Parámetros
poblacionales muestrales
(Estimadores)
Media μ X
Varianza σ 2 S
2
s
Desviación σ S
Estándar

Distribución muestral de la media

En otras palabras
2
σ
X N (μ , )
n

En este caso nos piden calcular


P(X ≥ μ )=1-p(x ≥ μ )

Downloaded by Maria Paula Quiroz (maripa112@gmail.com)


lOMoARcPSD|10170725

Aplicación el teorema de limite central

En consecuensia, la probavilidad de que la

En consecuensia, la probavilidad de que la variable media muestral sea mayor o igual que el valor
de la poblacion, es de 0.5052

4. Ahora para identificar la forma de la distribución de la variable


PURCHASE, se calcula el sesgo, la curtosis.

Inicial mente se realiza el histograma de frecuencias

 Sesgo (Asimetría)

El coeficiente de asimetría muestral para datos agrupados viene dado por

Downloaded by Maria Paula Quiroz (maripa112@gmail.com)


lOMoARcPSD|10170725

Como A, =0,6427 ¿ 0, entonces se puede decir que la distribución para la


variable PURCHASE, será asimétrica positiva.

 Curtosis

La curtosis para datos agrupados viene dada por

Como el coeficiente de curtosis k= - 0,3173 ¿ 0, hay muy poca concentración de los


datos en la media, presentando una forma muy achatada, la distribución es
Platicurtica.
De acuerdo a la representación gráfica (histograma de frecuencias) y medidas de
formas se puede concluir que la variable (PURCHASE), no parece distribuirse de forma
normal.

Downloaded by Maria Paula Quiroz (maripa112@gmail.com)

También podría gustarte