Está en la página 1de 12

TRABAJO DE ESTADISTICA II

JENNIFER CONSTANZA CALDERON GARCIA

ADMINISTRACION DE EMPRESAS

POLICTECNICO GRANCOLOMBIANO

2018
Parte 1

Tamaño de la muestra

- Histograma y descripción según forma y curtosis

EDADES
14000
12000
10000
8000
6000
4000
2000
0

EDADES

Teniendo en cuenta que la media aritmética de la muestra es 30,525. La


mediana es 28 y es una serie bimodal al tener a 13 y 25 con frecuencias
absolutas iguales, tenemos una forma asimétrica positiva ya que la moda es
menor que la mediana, y ésta a su vez es menor que la media aritmética. Con
resecto la curtosis, tenemos lo siguiente:

Primero hallamos la desviación estándar:

𝜎
1 (0 − 30,525)2 + (0 − 30,525)2 + (0 − 30,525)2 + (0 − 30,525)2 + (0 − 30,
=√ [
320 − 1 +(0 − 30,525)2 + (0 − 30,525)2 + (1 − 30,525)2 + (1 − 30,525)2 … … … … …

1
𝜎=√ [123497,8]
319
𝜎 = √387,1404389

𝜎 ≈ 19,68

Ahora tenemos que la curtosis:

∑𝑛𝑖=1(𝑥𝑖 − 𝑥)4
𝑔2 = 𝑛 −3
𝜎4
(0 − 30,525)4 + (0 − 30,525)4 + (0 − 30,525)4 + (0 − 30,525)4 + (0 − 30,525)4 + (0 − 30,525)4
+(0 − 30,525)4 + (0 − 30,525)4 + (1 − 30,525)4 + (1 − 30,525)4 … … … … … … … … + (85 − 30,525)4
𝑔2 = 320 −3
19,684

106944271,2
𝑔2 = 320 −3
19,684
334200,8476
𝑔2 = −3
149877,719
𝑔2 = 2,229823411 − 3

𝑔2 = 2,229823411 − 3

𝑔2 ≈ −0,77

Esto nos quiere decir que la gráfica es platicurtica, lo que significa que tiene
baja concentración de valores en la región central de la distribución.

- Descripción numérica y descripción como es la población

La población encuestada nos permite ver que más del 50% de la población
está por debajo de la media 30,525, ya que la mediana es 28 y nos indica la
edad que tiene la persona que ocuparía el centro de la distribución, si la
ordenamos, pero la media es apenas el 38.2% de la edad máxima de la
muestra, lo que nos da a entender que la muestra tiene más concentración de
personas jóvenes que no pasan de los 30, comparados con los que hay de ésta
edad hasta la máxima edad que es 85, por otro lado, es una serie bimodal en
donde tenemos que hay igual cantidad de personas con 13 y con 25 años,
estas edades a su vez, también son menores que la media. El número de
personas que corresponden a las edades de las modas es 22, 11 por cada una,
lo que significa que las modas captan el 6,9 % de la población.

- Calcular la nueva variable


2
𝑃6040𝑛𝑒𝑤 = 𝑃60403
2
𝑃6040𝑛𝑒𝑤 = 603573

𝑃6040𝑛𝑒𝑤 = 1538

- Tamaño de muestra:

𝑛0
𝑛= 𝑛
1+ 0
𝑁
𝑍2𝑆2
𝑛0 = 2
𝛿

Hallamos desviación estándar

1 (0 − 31,8)2 + (0 − 31,8)2 + (0 − 31,8)2 + (0 − 31,8)2 + (0 − 31,8)2 + (0 − 31,8)2


𝑠=𝜎=√ [ ]
1538 +(0 − 31,8)2 + (0 − 31,8)2 + (1 − 31,8)2 + (1 − 31,8)2 … … … … … … … … + (95 − 31,8)2

1
𝑠=√ [712157,62]
1538

𝑠 = √463,0478023

𝑠 ≈ 21,52

Para hallar Z, hallamos según las tablas de distribución lo siguiente:


𝛼
1 − 𝛼 = 0.95 ; 𝛼 = 0.05 ; = 0.025
2
𝑍𝑎 = 1,96
2

Ahora, reemplazamos en la segunda fórmula:

𝑍2𝑆2
𝑛0 = 2
𝛿
1,96 21,522
2
𝑛0 =
0,52
1779,085
𝑛0 =
0,25
𝑛0 = 7116.34

Y en la primera fórmula:
7116.34
𝑛=
7116.34
1+
1538
𝑛 = 1264,68
𝑛 ≈ 1265
- Logaritmo negativo en el archivo de Excel
- Comparar la media poblacional y muestral, y determinar la variación
relativa

NUEVA VARIABLE

N= 1538

µ= 31.8

MUESTRA

N= 1265

Ẋ= 32,15

La media muestral es mayor con respecto a la media poblacional. Y para


determinar la variación relativa:
𝑌Ẋ − 𝑌µ
𝑚 = 100 ∗
𝑌µ
32,15 − 31,8
𝑚 = 100 ∗
31,8
𝑚 = 100 ∗ 0.011

𝑚 = 1,1%

La media aumenta con una variación del 1,1% entre la media poblacional y la
media muestral.

INTERVALO DE CONFIANZA PARA DOS VARIABLES NUMERICAS

- Histograma de hombres y mujeres

MUJERES
35
30
25
20
15
10
5
0

Frecuencia
HOMBRES
35
30
25
20
15
10
5
0

Frecuencia

Las principales diferencias son la superioridad en algunos rangos de


escolaridad como el 6 y 8 por parte de los hombres, pero también podemos
notar la superioridad que muestran las mujeres en el rango 18, donde los
hombres tienen valor de frecuencia

- Estudio descriptivo

Si tomamos los datos de los gráficos anteriores como una sola serie, tenemos
tres modas que son el rango 2 de los hombres, el rango 2 de las mujeres y el
rango 12 de las mujeres, pero si no distinguimos sexos, tendríamos una sola
moda que sería el rango 2 de escolaridad. En ambos casos, el rango máximo de
escolaridad es 20, aunque para los hombres en realidad se presenta un dato o
valor atípico, ya que el último rango en que se presenta una frecuencia
significativa es el 16.

Las frecuencias en rangos de escolaridad en mujeres forman una curva que


muestra la disminución de las frecuencias a medida que aumenta el rango, a
excepción de una ligera subida de la frecuencia en los rangos 10 y 14,
situación que podría estar relacionada con la notoria frecuencia que tiene en
el rango 12, la misma condición presenta la gráfica que representa los rangos
de escolaridad en los hombres frente a sus frecuencias, pero a diferencia de el
gráfico de las mujeres, el de los hombres muestra más de una frecuencia
notoria, ya que se pueden apreciar tres picos que corresponden a los rangos 2,
6 y 12.

De lo anterior podemos inferir que sin importar el sexo, que de la muestra de


la población encuestada, el 38,4% del total le corresponde solamente a los
rango 2 y 12 de escolaridad, también se puede inferir que tan sólo el 2,2% de
los encuestados tienen un rango de escolaridad mayor o igual a 18, y que de
éste último porcentaje, los hombres representan apenas el 0.3%. En general
los rangos entre 2 y 10 representan el 65% de los encuestados, lo que significa
que el restante 35% de las personas aquí representadas tienen un rango de
escolaridad al menos de 12.

- Intervalos para le escolaridad

MUJERES
𝜎
Ẋ ± 𝑍𝑎 ∗
2 √𝑛
5.1
7.4 ± 1.96 ∗
√164
7.4 ± 0.78

≈ 8.18

≈ 6.62

Se puede decir que la escolaridad media en mujeres está entre los rangos
6.62 y 8.18, con una confiabilidad del 95%

HOMBRES

𝜎
Ẋ ± 𝑍𝑎 ∗
2 √𝑛
4.96
7 ± 1.96 ∗
√157
7 ± 0.78

≈ 7.78

≈ 6.22

Se puede decir que la escolaridad media en hombres está entre los rangos
6.22 y 7.78, con una confiabilidad del 95%

- Intervalo de la diferencia de lo anterior


Ẋ𝑚𝑢𝑗𝑒𝑟𝑒𝑠 − Ẋℎ𝑜𝑚𝑏𝑟𝑒𝑠 = 7.4 − 7 = 0.4

(7.4 − 7.2)2 + (7 − 7.2)2


𝜎=√ = 0.2
2
𝜎
Ẋ𝑑𝑖𝑓 ± 𝑍𝑎 ∗
2 √𝑛

0.2
0.4 ± 1.96 ∗
√2
0.4 ± 0.28

≈ 0.68

≈ 0.12

Se puede asegurar que la diferencia entre las escolaridades de hombres y


mujeres la podemos encontrar entre los valores que van desde 0.12 hasta
0.68, con un 95% de confiabilidad.

PARTE 2
- DIAGRAMA DE BARRAS
MUJERES; 115
120
Título del eje 100 HOMBRES; 112

80
60
40
20
0
MUJERES

HOMBRES VACIO
NO
SI

Las diferencias son muy mínimas, ya que en cada opción manejan las
mismas proporciones.
- Intervalo de confianza hombres:
Los que si van son 32 y el total son 157, entonces:

ᵱ(1 − ᵱ) ᵱ(1 − ᵱ)
ᵱ − 𝑍𝑎 √ < 𝑝 < ᵱ + 𝑍𝑎 √
2 𝑛 2 𝑛
32 32 32 32
32 √157 (1 − ) 32 √157 (1 − )
− 1.96 157 <𝑝< + 1.96 157
157 157 157 157
32 32
− 0.06 < 𝑝 < + 0.06
157 157
0.2 − 0.06 < 𝑝 < 0.2 + 0.06
0.14 < 𝑝 < 0.26
Lo que quiere decir que el porcentaje de hombres que asisten a un
establecimiento oficial está entre el 14 y 26 por ciento, con un 95% de
confiabilidad.

- Intervalo de confianza mujeres


ᵱ(1 − ᵱ) ᵱ(1 − ᵱ)
ᵱ − 𝑍𝑎 √ < 𝑝 < ᵱ + 𝑍𝑎 √
2 𝑛 2 𝑛

36 36 36 36
36 √163 (1 − ) 36 √163 (1 − )
− 1.96 163 <𝑝< + 1.96 163
163 163 163 163
36 36
− 0.06 < 𝑝 < + 0.06
163 163
0.22 − 0.06 < 𝑝 < 0.22 + 0.06

0.16 < 𝑝 < 0.28

Con lo que podemos asegurar con una confiabilidad del 95%, que el
porcentaje de mujeres que asiste a un establecimiento oficial, está entre el
16% y el 28%.

- Prueba de hipótesis

𝐻0 = 𝑃ℎ > 𝑃𝑚

𝐻1 = 𝑃ℎ < 𝑃𝑚
32
𝑃ℎ = = 0.2
157
36
𝑃𝑚 = = 0.22
163
… … … … ..

𝑍𝑐 = 1.64

… … … … ..
𝑃𝑚 − 𝑃ℎ
𝑍𝑝 =
√𝑃ℎ ∗ 𝑞ℎ
𝑛
0.22 − 0.2
𝑍𝑝 =
√0.2 ∗ 0.8
320

𝑍𝑝 = 0.89

El valor de prueba (Zp) es menor que el valor crítico (Zc), lo que nos quiere
decir que el porcentaje de hombres que van a un establecimiento oficial no
supera el 22% que le corresponde a las mujeres, por tanto, se niega la
hipótesis nula.

También podría gustarte