Está en la página 1de 12

Semana 3 Actividad 1

1. Determine si se puede considerar que las variables Millaje y Price se distribuyen


normalmente. Para hacer esto pueden calcular e interpretar cada una de las siguientes
medidas o procedimientos, y finalmente concluir.
a. El sesgo 
b. La curtosis
c. Una gráfica de la curva normal (q-q plot)
d. La regla empírica.

Solución:

Para las variables en estudios Millajes y Price, veamos si se distribuyen normal, para
comprobar esto se calcula cada una de las siguientes mediadas o procedimientos.

 Millajes

a) El sesgo

El coeficiente de Sesgo determina el grado de asimetría (alargamiento de la


distribución hacia la izquierda o hacia la derecha). Para determinar el sesgo de
una distribución de frecuencias se utiliza el

m3
Coeficiente sesgo=
s3

Calculando el valor del sesgo en Excel se tiene.

Coeficiente sesgo=¿-0.1310016

Si el coeficiente de sesgo
tiene un valor negativo se
dice que la
Del resultado se tiene que la distribución es sesgada a la izquierda o que
tiene sesgo negativo
b) La curtosis
Un coeficiente de apuntamiento o de curtosis es el cuarto momento con respecto a
la media estandarizado que se define como:
µ4
β 2=
σ4
Calculando el valor de la curtosis en Excel se tiene.

β 2=¿3.175314

Como el coeficiente es positivo, la distribución se llama leptocurtica, hay una


mayor concentración de los datos en torno a la media.

c) Ahora veamos una representación de la curva normal mediante histograma


y mediante normal (q-q plot)
d) Luego realizando la respectiva regla empírica de Shapiro-Wilks y Kolmogorov-
Smirnov

H 0 :los datos son normales

{ vs
H 1 :los datos no son normales
Nivel de significancia α =0.05

 Shapiro-Wilks

Shapiro-Wilk normality test

data: Millajes
W = 0.98418, p-value = 1.25e-07

 Kolmogorov-Smirnov

Lilliefors (Kolmogorov-Smirnov) normality test

data: Millajes
D = 0.063749, p-value = 3.324e-08

De los anteriores resultados se puede observar que el p-valor para ambas prueba
resultaron menor que el nivel de significancia α =0.05 , por lo que se rechaza la hipótesis
nula H 0,de este hecho podemos decir que los datos no son normales.
 Price
a) El sesgo

m3
Coeficiente sesgo=
s3

Calculando el valor del sesgo en Excel se tiene.

Coeficiente sesgo=¿1.572852

Si el coeficiente de sesgo
tiene un valor negativo se
dice que la
Del resultado se tiene que la distribución es sesgada a la derecha o que
tiene sesgo positivo.

Si el coeficiente de sesgo
tiene un valor positivo se
dice que la
 La curtosis
Un coeficiente de apuntamiento o de curtosis es el cuarto momento con respecto a
la media estandarizado que se define como:

µ4
β 2=
σ4
Calculando el valor de la curtosis en Excel se tiene.

β 2=¿6.263235
Como el coeficiente es positivo, la distribución se llama leptocurtica, hay una
mayor concentración de los datos en torno a la media.

c) Ahora veamos una representación de la curva normal mediante


histograma y mediante normal (q-q plot)
d) Luego realizando la respectiva regla empírica de Shapiro-Wilks y Kolmogorov-
Smirnov

H 0 :los datos son normales

{ vs
H 1 :los datos no son normales

 Shapiro-Wilks

Shapiro-Wilk normality test

data: Price
W = 0.8615, p-value < 2.2e-16

 Kolmogorov-Smirnov

Lilliefors (Kolmogorov-Smirnov) normality test

data: Price
D = 0.13979, p-value < 2.2e-16

De los anteriores resultados se puede observar que el p-valor para ambas prueba
resultaron menor que el nivel de significancia α =0.05 , por lo que se rechaza la hipótesis
nula H 0,de este hecho podemos decir que los datos no son normales.

2. Asuman que los datos corresponden a una población. Van a seleccionar una muestra
usando el muestreo aleatorio simple. Supongan conocido el tamaño de la población
¿Qué tamaño de muestra escogen? Justifiquen su respuesta.
Seleccionen la muestra y muestren o expliquen cómo la obtuvieron.

 Procedimiento de muestreo

Utilizando la estrategia de muestreo completamente al azar sin remplazo (MAS) y con el


método de selección Fan Müller se selecciona una muestra representativa para las
variables

Como la población es finita, es decir conocemos el total de la población y


deseásemos saber cuántos del total tendremos que estudiar la fórmula sería:

N Z 2 pq
n= (1)
( N −1 ) E 2+ Z 2 Pq

Donde, se tiene lo siguiente:


N= Total de la población
Z= el cuantil de la distribución normal estándar al nivel de significancia que se
establezca.
p= proporción esperada (en este caso = 0.5)
q = 1 – p (en este caso 1-0.5 = 0.5)
E : precisión (en este caso use un 5%).
Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95%
Para la base de datos se tienen:
N=804
P=0.5
q=0.5
Z α /¿=1.96 ¿
E=0.05

Remplazando los datos en la ecuación 1 se tiene la estimación del tamaño de la muestra

( 804 ) (1.96 )2 ( 0.5 ) (0.5)


n= =261
( 804−1 ) ( 0.05)2 + ( 1.96 )2 (0.5)(0.5)
Teniendo en cuenta los resultados anteriores, realicemos una selección de
elementos para una muestra, utilizando el algoritmo del coordinado negativo.
Veamos la implementación del algoritmo del coordinado negativo. Para realizar
una selección de elemento para una muestra.

Para extraer la muestra de tamaño n de un universo de N objetos.

 Generar N realizaciones de una variable aleatoria ε k(k ∈U) con distribución


uniforme (0,1).

 Asignar ε kal elemento k-´esimo de la población.


 Ordenar la lista de elementos descendente (o ascendentemente) con
respecto a este número aleatorio ε k.
 A continuación, seleccionar los n primeros (o los n últimos) elementos. Esta
selección corresponde a la muestra realizada.

También podría gustarte