Está en la página 1de 11

PROYECTO: ESTADISTICA II

TRABAJO COLABORATIVO

INTEGRANTES:
Vega Estupiñan Deissy Lizeth– código: 1821980527
Martha Katherine Rojas Aponte – código: 1611982393
Ana Milena Salazar Mejia – código: 1821982144

Tutor
EDWIN HERNANDO ZAPATA CIFUENTES

POLITECNICO GRANCOLOMBIANO INSTITUCION UNIVERSITARIA


Facultad De Ciencias Administrativas, Económicas Y Contables
Escuela de Administración y Competitividad
Colombia 2019
OBJETIVOS
Objetivo general:
analizar, desarrollar e interpretar las diferentes actividades planteadas en las
semanas 3, 4 y 5, con el fin de fortalecer los conocimientos y habilidades
adquiridas durante la ejecución del módulo (estadística II) que serán de vital
importancia tanto para nuestra vida laboral como profesional.

Objetivos específicos:

 Realizar el cálculo del tamaño la muestra tomando como referencia la base


de datos planteada en el módulo.

 Hallar el Intervalo de confianza para dos variables numéricas.

 Realizar la prueba de hipótesis para dos variables cualitativas


CONTEXTO
A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares
(GEIH), realizada por el DANE[1]. Esta encuesta se hace en las 13 ciudades
principales de Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga,
Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y
11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva,
Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se
solicita información sobre las condiciones de empleo de las personas (si trabajan,
en qué trabajan, cuánto ganan, si tienen seguridad social en salud o si están
buscando empleo), además de las características generales de la población como
sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes de
ingresos. La GEIH proporciona al país información a nivel nacional, cabecera -
resto, regional, departamental, y para cada una de las capitales de los
departamentos.

Base de datos: en el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información


sobre las características generales de las personas que respondieron en un mes
en particular. Para este trabajo colaborativo, realice lo siguiente:

Selección de muestra

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a


todos los elementos de una población), se selecciona una muestra,
entendiendo por tal una parte representativa de la población. En ese sentido,
escoja un tipo de muestreo y argumente la viabilidad de esta técnica para la
base de datos dada. Para seleccionar una muestra debe tenerse en cuenta el
cómo seleccionar los elementos que formarán parte de la muestra (tipo de
muestreo) y cuántos elementos debemos seleccionar (Tamaño de muestra).

Respuesta:
Al analizar la base de datos dada se puede identificar que el tipo de muestreo con
el podemos trabajar es muestreo aleatorio o probabilístico específicamente el
muestreo conglomerado puesto que la encuesta refleja información característica
de una población permitiendo observar grupos que se dividen en características
heterogéneas dentro de los mismo y homogéneas entre sí.
2. Utilizando la variable género P(6020) determine el tamaño de la muestra
seleccionando adecuadamente justificando:

a. Fórmula a desarrollar

𝑍 2 ×𝑃×𝑄
Se aplica la siguiente formula: 𝑛0 =
𝐸2

n= tamaño de la muestra

Z= valor que se obtiene de la distribución normal, para el nivel de


significancia

P= proporción de mujeres

Q= proporción de no mujeres

E= Error

b. Estimación de la proporción de mujeres

Estimación de la proporción de mujeres

31969
𝑝= × 100 = 53%
60356

c. Nivel de confiabilidad

Con el 95% de confianza se aplica lo siguiente:

0,9500
= 0,4750
2

Según la tabla Z el resultado es de 1,96 por lo tanto decimos que, Z= 1,96

d. Error de estimación

El error de estimación es del 5%


Datos y aplicación de la fórmula:

Nivel de confianza = 1,96% (95%)


Error de estimación E = 0,05 (5%)
Población N = 60.356
Número total de mujeres = 31.969
Proporción de mujeres P = 0,53 (53%)
Proporción de no mujeres Q = 0,47 (47%)

1,962 × 0,53 × 0,47 0,9569


𝑁0 = 2
= = 382,76
0,05 0,0025

Para concluir el tamaño de la muestra de mujeres es de 383 individuos tomados


de la población total.

INTERVALO DE CONFIANZA PARA DOS VARIABLES NUMÉRICAS


Un investigador, cree determinar que existen diferencias entre los niveles de
estudio de los hombres y las mujeres en Colombia. Para determinar lo anterior,
use la “muestra” encontrada en la semana 3:
1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un
histograma para los hombres y mujeres. Según los resultados, ¿Existen
diferencias?

Respuesta:
Fuente: Elaboración propia.

Fuente: Elaboración propia.

Relacionando a continuación la diferencia de cada género:

Histograma de mujeres: podemos concluir que los niveles de escolaridad


donde se agrupa la mayor parte de población femenina, los observamos en
grado bachiller y va en decadencia seguido de técnico o tecnológico,
universitario y postgrado. Al ver esta estadística podemos deducir que para
las mujeres tanto 11 como 5 años es la cantidad predominante

Histograma de Hombres: podemos identificar que los niveles de


escolaridad donde se agrupa la mayor parte es en básica media y va en
decadencia seguido del universitario – técnico y tecnológico. Al ver esta
estadística podemos deducir que para los hombres 11 años es la cantidad
predominante.

 Según la muestra obtenida aleatoria mente y según resultados se observa


que si hay diferencias entre los géneros ya que las mujeres tienden a
estudiar más que los hombres y tienen niveles más altos de educación en
un porcentaje muy pequeño pero si mayor al de los hombres.

2. Asumiendo que los datos son normales, calcule un intervalo de confianza


del 95% para estimar, la escolaridad promedio de los hombres y de las
mujeres de forma individual, en los niveles de estudio de Bachiller,
Tecnólogo y Universitario.

MEDIA DESV STD

Mujeres 7.777 9.364


Hombres 7.044 8.483

 intervalo de confianza Mujeres

Intervalo de confianza Hombres

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al


95% para estimar la diferencia promedio de escolaridad para los hombres y
mujeres, en los niveles de estudio de Bachiller, Tecnólogo y Universitario.

PRUEBA DE HIPÓTESIS PARA DOS VARIABLES CUALITATIVAS

Un investigador, cree determinar que los hombres asisten más a un colegio oficial
que las mujeres en Colombia. Para determinar lo anterior, use la “muestra”
encontrada en la semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial


(P6175) y sexo (P6020), realice un diagrama de barras comparativo para
los hombres y mujeres en un solo gráfico. Según los resultados, ¿Existen
diferencias?

Respuesta:

Diagrama comparativo
BLANCO 23007
MUJERES

NO 2159

SI 6803 0

BLANCO 19442
HOMBRES

NO 2028

SI 6917 0

Series1 Series2

Fuente: Elaboración propia.

Según el diagrama comparativo reflejado anteriormente podemos identificar que la


mayoría de los hombres asisten a un establecimiento oficial y 2028 hombres no
asisten al mismo, para el caso de las mujeres la mayoría asiste a un
establecimiento oficial y 2159 no asisten.

Pero para ambos género el mayor porcentaje es incierto dado que no dio una
respuesta del mismo.

2. Con un nivel de confianza del 95%, estime e interprete la proporción de


hombres y de mujeres que asisten a un establecimiento oficial.

Respuesta:

Proporción de Hombres
𝑎 𝑠
< 𝑀 > 1 − 𝑎 = 𝑥̅ ± 𝑧 ⁄𝑧 √
𝑛

1 − 𝑎 = 1.29 ± 1.96𝑥 √0,1⁄180

𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 1.29 + 0.046 = 1.33

𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 1.29 − 0.046 = 1.24

1.33 ≥ 1.24

Proporción de Mujeres

𝑎 𝑠
< 𝑀 > 1 − 𝑎 = 𝑥̅ ± 𝑧 ⁄𝑧 √
𝑛

1 − 𝑎 = 1.32 ± 1.96𝑥 √0,1⁄202

𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 1.32 + 0.0436 = 1.36

𝐿𝑖𝑚𝑖𝑡𝑒 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 1.32 − 0.0436 = 1.28

1.36 ≥ 1.28

3. Realice una prueba de hipótesis para determinar la afirmación del


investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir
de lo anterior?

Respuesta:

𝑥̅ − 𝜇
𝑧=𝜎
⁄ 𝑛

11.51 − 11.49
𝑧=
1,16

√180 → 13.416
0.02
𝑧=
1,16⁄
13,416

0.02
𝑧= = 0.23
0.086

𝑅𝐴(𝐻0 )
0,025=25% 0,025=25%
0,95=95%

H1 afirma la hipótesis del


Z= -1.96 Z= 1.96 investigador 0,23
Fuente: Elaboración propia.

Según la gráfica se concluye que la hipótesis es alternativa ya que es


positiva con un valor de 0.23, el cual nos indica que el investigador tiene la
razón al afirmar que los hombres asisten en mayor proporción a un sitio
oficial que las mujeres.
CONCLUSIÓN

Según los datos estadísticos existe una gran diferencia en cuanto al nivel de
escolaridad, entre la proporción de mujeres encuestadas en relación con los
hombres, ya que éstas primeras tienen más acceso a estudios de tipo bachiller,
técnico y tecnólogo, universitario y de postgrado, superando en cantidad (para
cada una de ellas) a la proporción de hombres encuestados.

REFERENCIAS

 https://docs.google.com/spreadsheets/d/1TbCkhUFip0XRekCx4k75z7Gz-
Zf_8ZbDcBrfY-H7MTU/edit?usp=sharing

 https://recordings.rna1.blindsidenetworks.com/instructure-
trial/56926244c3be359347227b4a85b6456f4cc416aa-
1560208108763/presentation/

También podría gustarte