Está en la página 1de 10

lOMoARcPSD|13947250

lOMoARcPSD|13947250

Estadística Inferencial

 José Gabriel García Morales

Profesor:
 Sergio Castañeda

Ingeniería industrial
3er semestre – Homologación SENA

2023
Actividad 1.

1. Determine si se puede considerar que las variables Millaje y Price se distribuyen


normalmente. Para hacer esto pueden calcular e interpretar cada una de las siguientes
medidas o procedimientos, y finalmente concluir.

1. El sesgo:
Es el grado de asimetría que tiene la distribución de los datos, lo que nos indica que tan
dispersos se encuentran de respecto a la media aritmética, un estimador cuyo sesgo es
nulo se llama insesgado o centrado, si el valor se distribuye positivamente nos indica
que el grupo de datos del sesgo va a la derecha, y por el contrario si el sesgo es
negativo el grupo de datos ira a la izquierda.

Calcular para Price:

• La media:
n

∑x 1
X = i=1 X =21343.13
n

• La mediana:
( n+ 1)
¿ =18025
2

• La moda:
∆1
MO=li+ ∗C=10922
∆1+ ∆ 2

• Desviación estándar:

Xi−¿
¿
X
¿
¿
n
1
n−1 ∑
¿
i=0
S= √ ¿

• Varianza:
¿
¿2
¿
¿
n

S=∑ ¿
i=0

• Sesgo:
Media−Moda
AS= =1,57579638
Desviación
Calcular para Millaje:

• La media:
n

∑x
i=1
1
X= X =19831,9341
n
• La mediana:
( n+ 1)
¿ =20913,5
2

• La moda:
∆1
MO=li+ ∗C =18910
∆1+ ∆ 2

• Desviación estándar:

Xi−¿
¿
X
¿
¿
n
1
n−1 ∑
¿
i=0
S= √ ¿

• Varianza:
¿
¿2
¿
¿
n

S=∑ ¿
i=0

• Sesgo:
Media−Moda
AS= =−0,1312466
desviación

2. La curtosis:

Es una medida estadística que determina el grado de concentración que presentan los
valores de una variable alrededor de la zona central de la distribución de frecuencias.
También es conocida como medida de apuntamiento [1].

1. Leptocúrtica: Existe una gran concentración de los valores en torno a su


media (g2>3)

2. Mesocúrtica: Existe una concentración normal de los valores en torno a su media


(g2=3).
lOMoARcPSD|13947250

3. Platicúrtica: Existe una baja concentración de los valores en torno a su media


(g2<3)

Dependiendo de la agrupación o no de los datos, se utiliza una fórmula u otra.


➢ Datos sin agrupar:

X 1 − X ¿4
¿
¿
∑¿
1
g2= ¿
n
➢ Datos agrupados en tablas de frecuencias:

X 1 − X ¿4
¿
f i¿
∑¿
1
g2= ¿
n
➢ Datos agrupados en intervalos:

mX1 −X ¿4
¿
f i¿
∑¿
1
g2= ¿
n
= Coeficiente de curtosis

=Número de datos

=valor i-ésimo de las observaciones


=Media aritmética de la distribución
6=desviación típica de la distribución
=frecuencia absoluta del dato i-ésimo =
marca de la clase.

La interpretación del resultado en este caso sería la siguiente: g2-3 >

0 -> distribución leptocúrtica.

g2-3 = 0 -> distribución mesocúrtica (o normal). g2-3

< 0 -> distribución platicúrtica.

Price: n=804
Formula Curtosis Price: 3,291120122 de acuerdo con el grado de concentración de las
variables es Leptocúrtica: Existe una gran concentración de los valores en torno a su media
(g2>3).
140

120

100

80
Frecuencia

60

40

20

17512,71
13075,85
21949,57
30823,28
33041,71
26386,42
35260,14
41915,42
48570,71 y 57444,42
50789,14
64099,71
68536,57
59662,85
429 714 143 571 429 857 286 857 429 mayo 857 286 429 143 714
r...
Clase
Frecuencia

Millaje: n=804
Formula Curtosis Millaje: 0,183909299 de acuerdo con el grado de concentración de
las variables es Platicúrtica: Existe una baja concentración de los valores en torno a su
media (g2<3).
lOMoARcPSD|13947250

100
90
80
70
60
Frecuencia

50
40
30
20
10
0
23536,4
19956,3
27116,5
28906,5
16376,3
7426,14
11006,2
30696,6 34276,6 378543226,8 y 45016,8
2056,03 48596,9
6429 9286 3571 7143 2143 2857 1429 0714 5714 7857 6,75 5714 mayo 9286 6429
r...

Clase

Frecuencia

C. Una gráfica de la curva normal (q-q plot)


Se construye gráfica para Price.

Grafica 1 – Curva Price (Ver anexo hoja Curva Price)


En la gráfica Price se puede evidenciar gran parte de los datos se encuentran
alejados de la línea recta y se concluye que nos es una distribución normal y
descartamos la nulidad de esta.

Se construye gráfica para Millaje:


Grafica 2 – Curva Millaje (Ver anexo hoja Curva Millaje)
D. Regla Empírica:
Price:

Coeficiente de asimetría: 1,576


Media (x con _ encima): 21343,1
Desviación estándar (s): 9884,8
CS:

CI:
lOMoARcPSD|13947250

De acuerdo con los valores arrojados en la regla empírica para Price:

➢ 68 % de los datos se encuentran entre 11458,30 y 31227,98


➢ 95 % de los datos se encuentran entre 1573,45 y 41112,82
➢ 99.7 % de los datos se encuentran entre -8311,39 y 50997,66
Millaje:

Coeficiente de asimetría: -0,1312


Media (x con _ encima): 19831,9
Desviación estándar (s): 8196,3
CS:

CI:

De acuerdo con los valores arrojados en la regla empírica Millaje:

➢ 68 % de los datos se encuentran entre 11635.6 y 28028.2


➢ 95 % de los datos se encuentran entre 3439.3 y 36224.5
➢ 99.7 % de los datos se encuentran entre -4757.0 y 44420.9
Conclusión punto 1:

Podemos evidenciar que en la gráfica de Millaje, que la mayoría de los datos se


encuentran muy cerca o sobre la línea recta con lo cual concluimos que estos datos
siguen los parámetros de una distribución normal, se realizó la comprobación de los
datos por medio de las fórmulas y el resultado de estos evidencian que la distribución
normal se encuentra mejor distribuida en el los datos de Millaje.
Actividad 2.

2. Asuman que los datos corresponden a una población. Van a seleccionar una
muestra usando el muestreo aleatorio simple. Supongan conocido el tamaño de la
población ¿Qué tamaño de muestra escogen? Justifiquen su respuesta. Seleccionen la
muestra y muestren o expliquen cómo la obtuvieron.

Para hallar el número de muestra Utilizamos la siguiente ecuación:

Z 2 Npq
α
n= e 2 (N −1)+Z 2 pq
α

n= tamaño de la muestra (número de encuestas que vamos a hacer).

Error aceptado de estimación: estimamos un +-2% de error, con un % de nivel de


confianza del 95% = 1,96 (z)

Parámetro Valor
N 804 Tamaño de población o Universo
Z 1,96 Coeficiente (Nivel de confianza)
p 0,5 parámetro estadístico depende de
N
q 0,5 (1-p) =probabilidad de que no
ocurra
e 2% error de estimación máximo
aceptado.
Reemplazamos los valores en la fórmula:

n=603

✓ El tamaño de muestra en esas condiciones sería de 603 datos.

Para los pasos de un muestreo aleatorio:

1. Se enumeran primero los datos.


2. Se inserta una columna con 603 datos en el que se agrega
=ALEATORIO.ENTRE(1,603)
3. Luego se copian estos datos correspondientes a cada uno

Para determinar el tamaño de la muestra definimos que deseamos un margen de


error que no supere el ±2% con un nivel de confianza de 95%. Estos parámetros los
definimos deseando que nuestra muestre represente los valores de la población.

También podría gustarte