Está en la página 1de 10

lOMoARcPSD|8026645

Consolidado Grupal Actividad 1 Semana 3 - Estadística


Inferencial
Estadística Inferencial (Politécnico Grancolombiano)

StuDocu no está patrocinado ni avalado por ningún colegio o universidad.


Descargado por Leidy Johanna Londoño M (leidi1109@hotmail.com)
lOMoARcPSD|8026645

ACTIVIDAD EVALUATIVA SEMANA 3


ACTIVIDAD 1

Descargado por Leidy Johanna Londoño M (leidi1109@hotmail.com)


lOMoARcPSD|8026645

POLITECNICO GRANCOLOMBIANO
ESTADÍSTICA INFERENCIAL
2021
SEMANA 3 - ACTIVIDAD 1

1. Determine si se puede considerar que las variables Millaje y Price se distribuyen


normalmente. Para hacer esto pueden calcular e interpretar cada una de las
siguientes medidas o procedimientos, y finalmente concluir.

a. El sesgo
b. La curtosis
c. Una gráfica de la curva normal (q-q plot)
d. La regla empírica.

A. EL SESGO
 Var
iabl
ePr
ice:
Par
ahal
l
arelses
godel
avar
iabl
e"Pr
ice"seusal
asi
gui
ent
efor
mul
a:
Sesgo=3(
Medi
a-Medi
ana)
Des
viac
iónest
ándar

Hal
lamoslosvaloresdemedi
a,medi
anaydes
viac
iónest
ándarconl
abasededat
os
ent
regadaenelejerci
ci
o.

 Dat
osi
nici
ales:
Medi
a:

Descargado por Leidy Johanna Londoño M (leidi1109@hotmail.com)


lOMoARcPSD|8026645

Medi
ana:

Elval
or402.5corr
espondealascel
das402(
18005)y403(
18010)del
abas
ededat os
ent
regada,sereal
izaunpromedi
odel osdosval
oresyelvalordel
amedianaseri
a
18,
025.
Desvi
aci
ónest
ándar
:

Ent
onces,r
eempl
azamos elv
alorde l
avar
ianz
a en l
afór
mul
a de l
a des
viaci
ón
est
ándar
.

Teniendolosvalor
esdemedi
a,medi
anaydes
viac
iónest
ándarl
osr
eempl
azamosenl
a
for
mul adelsesgo:
Es
teesel
val
ordelses
gopar
alav
ari
abl
ePr
ice.

 Var
iabl
eMi
ll
aje:
Ahora,t
enemosquer
eal
i
zarel
mismopr
ocedi
mient
opar
ahal
l
arel
val
ordelses
goenl
a
var
iabl
eMill
aj
e.
Medi
a=19831,
9341

Descargado por Leidy Johanna Londoño M (leidi1109@hotmail.com)


lOMoARcPSD|8026645

Medi
ana=20913,
5
Des
viac
iónest
ándar=140,
8259
Sesgo=-
23,
0404902

B. LA CURTOSIS

para encontrar la curtosis en este caso se debe utilizar la siguiente formula:

Reemplazando el la formula obtenemos:


 Curtosis variable price: 3.29112012
 Curtosis variable Millaje: 0.1839093

Las curvas se pueden clasificar en tres grupos según el signo de su curtosis, es


decir, según la forma de la distribución:

 Leptocúrtica: la Curtosis>0. Los datos están muy concentrados en la media,


siendo una curva muy apuntada.
 Mesocúrtica: la Curtosis=0. Distribución normal.
 Platicúrtica: la Curtosis<0. Muy poca concentración de datos en la media,
presentando una forma muy achatada

Descargado por Leidy Johanna Londoño M (leidi1109@hotmail.com)


lOMoARcPSD|8026645

C. GRÁFICA DE LA CURVA NORMAL (Q-Q PLOT)

D. REGLA EMPÍRICA

Realizando la respectiva regla empírica de Shapiro – Wilks y Kolmogorov -


Smimov

Nivel de significancia

 Shapiro – Wilks
Shapiro – Wilk normality test
Data: millages
W= 0.98418
p-value= 1.25e-07

 Kolmogorov – Smimov
Kolmogorov – Smimov normality test
Data: millages
D= 0.063749

Descargado por Leidy Johanna Londoño M (leidi1109@hotmail.com)


lOMoARcPSD|8026645

p-value= 3.324e-08

De los resultados anteriores se puede ver que los p-valores de las dos pruebas
son menores que el nivel de significancia por lo que se rechaza la hipótesis nula
Ho, de esta manera, podemos decir que los datos no son normales.

2. Asuman que los datos corresponden a una población. Van a seleccionar una
muestra usando el muestreo aleatorio simple. Supongan conocido el tamaño de
la población
¿Qué tamaño de muestra escogen? Justifiquen su respuesta.
Seleccionen la muestra y muestren o expliquen cómo la obtuvieron.

Teni
endoencuentaquesesol
i
cit
aqueseasumaquel osdatoscorr
espondenauna
pobl
aci
ón,sedest
acal
ascar
act
erí
sti
casdelconcept
odePobl
ación:
 Pobl ación:s er efiereaunconj untodemedi dasor ec uentospos i
blesdet odasl as
unidadesquet ienenunaov ari
ascaracterí
sti
casencomún.Lapobl ac i
ónpuedeser
fini
t
aoi nfini
t
a según elnúmer o de unidades o element os que la consti
tuyen.
Asimi smo,l a pobl ación debe estarperfect
ament e defini
da en elt i
empo yen el
espaci o.Porl otant o,sedebecui darqueelconj unt
odeel ementosquel aint
egr an
quededel i
mi t
ado.Porej empl o,parahacerunanál i
sisdel aspequeñasempr esas,
sedebeespec i
ficarcuálessonyenquéper íododet i
emposeanal iz
an( pequeñas
empr esasdel acapi taldelpaís,enelaño2018) .
Sedet
erminaqueesunapoblaci
ónfini
t
acon804per
sonas
,det
almaner
adet
oma
comor
efer
enci
alasi
gui
ent
eecuaci
ón:

Pobl
aci
ónfini
t
a

 n=Tamañodel
amuest
raques
ebusca.
 N=Tamañodel
apobl
aci
ón
 Za=Par
ámet
rodeconfianz
aquedependedel
niv
eldeconfianz
a
 e=er
rordel
aest
i
mac
iónmáx
imaacept
ada
 p=pr
obabi
l
idaddequeocur
raunev
ent
oest
udi
ado

Descargado por Leidy Johanna Londoño M (leidi1109@hotmail.com)


lOMoARcPSD|8026645

 q=Pr
obabi
l
idaddequenoocur
raelev
ent
oest
udi
ado

Reempl
azandol
osdat
osdel
afor
mul
asedet
ermi
nal
ossi
gui
ent
esdat
os:

n=261

Seest imaquelapobl
aci
ónaest udi
aresde804per sonas,seescogeunpar ámetr
ode
confianzadel95% queequivaleaZal faa1.96ysemanej ar
aunpor cent
ajedeer r
or
del5% equi val
ent
eendeci
mala0. 05,sedefinequepors erunmuestreonuev onose
ti
enepr obabi
li
daddeéxi
tonipr obabi
li
daddequenoset engaéx i
t
o,porlotanto,sele
daacadaunadeest asvar
iantesunapr obabi
lidaddel50% mani f
est
adaendeci males
como0. 5.
Deesamanerasedet
ermi
naquel
apobl
aci
ónr
epr
esent
ati
vapar
aquel
amuest
rasea
exi
t
osaesde261per
sonas
.

Descargado por Leidy Johanna Londoño M (leidi1109@hotmail.com)


lOMoARcPSD|8026645

El intervalo de confianza se expresa mediante la siguiente fórmula:

Para una población N=804, determinamos un tamaño de la muestra n=603. Para determinar el tamaño de la
muestra definimos un margen de error que no supere el ±2%

Promedio 19042,4295

Desviación estándar7703,75838

Confianza 95%

Tamaño muestra 603

Z= 196

Alfa= 2%

Reemplazamos en la formula

INTERVALO DE CONFIANZA

LIMITE INFERIOR 18427,54

LIMITE SUPERIOR 19657,32

Estos datos se escogieron debido a lo enunciado anteriormente, sabiendoque

Para determinar el tamaño de la muestra definimos que deseamos un margen de error que no supere
el ±2% con un nivel de confianza de 95%. teniendo en cuenta que, si extraemos un número determinado de
muestras del mismo tamaño de una población con un parámetro de valor constante, el 95% de los intervalos de

Descargado por Leidy Johanna Londoño M (leidi1109@hotmail.com)


lOMoARcPSD|8026645

confianza construidos a partir de esas muestras contendrán el valor del parámetro que buscamos y el 5%
restante no lo contendrán.

Sin embargo, el promedio de la población está fuera a del nivel de confianza observado para la muestra

Descargado por Leidy Johanna Londoño M (leidi1109@hotmail.com)

También podría gustarte