Está en la página 1de 15

INSTITUCION UNIVERSITARIA POLITECNICO GRANCOLOMBIANO

FACULTAD DE CIENCIAS ADMINISTRATIVAS, ECONÓMICAS Y CONTABLES

GRUPO CB/SEGUNDO BLOQUE-ESTADISTICA II-[GRUPO12]

SUBGRUPOS 7

DOCUMENTO FINAL TRABAJO COLABORATIVO

Tutor
ANDY DOMINGUEZ

INTEGRANTES

Karol Julieth Alfonso Garzón


Fany Patricia Delgado Cárdenas

Noviembre de 2018
Contexto

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH),


realizada por el DANE[1]. Esta encuesta se hace en las 13 ciudades principales del
Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira,
Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11 ciudades intermedias (Tunja,
Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia,
Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las condiciones de
empleo de las personas (si trabajan, en qué trabajan, cuánto ganan, si tienen seguridad
social en salud o si están buscando empleo), además de las características generales de la
población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes de
ingresos. La GEIH proporciona al país información a nivel nacional, cabecera - resto,
regional, departamental, y para cada una de las capitales de los departamentos.

Base de datos: en el archivo de Excel (https://goo.gl/zB3Ntf ) se tiene información sobre las


características generales de las personas que respondieron en un mes en particular. Para este
trabajo colaborativo, realice lo siguiente:

RESPUESTA

Para este caso debemos recurrir inicialmente al muestro no aleatorio o probabilístico, bajo
esta técnica de muestreo se usa el conocimiento y la opinión para identificar los elementos
de la población que van a incluirse en la muestra. Esta técnica también se puede utilizar en
un estudio inicial que será llevado a cabo nuevamente utilizando un muestreo probabilístico
estratificado, donde todos los individuos tienen la misma probabilidad de ser elegidos, con
el fin que la muestra extraída sea representativa
Parte 1 (semana 3 - 5)

(semana 3) Selección de muestra

En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los


elementos de una población), se selecciona una muestra, entendiendo por tal una parte
representativa de la población. En ese sentido, escoja un tipo de muestreo y argumente la
viabilidad de esta técnica para la base de datos dada. Para seleccionar una muestra debe
tenerse en cuenta el cómo seleccionar los elementos que formarán parte de la muestra (tipo
de muestreo) y cuántos elementos debemos seleccionar (Tamaño de muestra).

Utilizando la variable género P (6020) determine el tamaño de la muestra seleccionando


adecuadamente y justificando:

a. Fórmula para desarrollar

n= NZα²*p*q/(N-1) *e²+Z²p*q 385,12

N=(Población de hombres y mujeres)

60357
Fórmula utilizada para variables cualitativas cuando se quieren estimar proporciones,

con resultados en %, conociendo N =el tamaño de la población.

b. Estimación de la proporción de mujeres

Para estimar la proporción de mujeres se deben conocer las condiciones de


empleabilidad

 La precisión que deseamos para nuestro estudio.

 Una idea del valor aproximado del parámetro que queremos medir (en este
caso una proporción). Utilizamos el valor p = 0.5 (50%).
c. Nivel de confiabilidad

Niveles de confianza Z alfa


50% 0,674
80% 1,28
90% 1,645
95% 1,96
96% 2,05
98% 2,33
99% 2,58
99,7% 3

El nivel de confiabilidad prefijado es del 95%

d. Error de estimación

Error de estimación: El error máximo admisible y determinado por el investigador está


entre el 1 y 10%, para variables cualitativas, para este caso el error máximo admisible
es del 5%. Teniendo en cuenta lo anterior:

n= Tamaño de la muestra a hallar

Z= Parámetro estadístico que depende el nivel de confianza NC

e= error de estimación máximo aceptado

p= probabilidad que ocurra el evento

q=(1-p)= probabilidad que no ocurra el evento

(semana 4) Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de estudio de
los hombres y las mujeres en Colombia. Para determinar lo anterior, use la “muestra”
encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un


histograma para los hombres y mujeres. Según los resultados,
¿Existen diferencias?

Tablas de distribución por nivel de escolaridad y género


HOMBRES

Tablas de distribución por frecuencias hombres

Frecuencia Frecuencia Frecuencia


Nivel de Frecuencia relativa
N absoluta acumulada- relativa
estudios (xi) acumulada (Hi)
(fi) (Fi) (hi)

1 Preescolar 928 928 0,032691 0,0326910

Básica
2 7524 8452 0,265051 0,2977419
primaria

Básica
3 5623 14075 0,198084 0,4958256
secundaria
4 media 6034 20109 0,212562 0,7083876

5 superior 5256 25365 0,185155 0,8935428

6 ninguno 1589 26954 0,055976 0,9495191

Sin
7 1427 28381 0,050269 0,9997886
Información

no sabe no
8 6 28387 0,000211 1
responde

Total 28387 1

MUJERES
Tablas de distribución por frecuencias mujeres

Frecuencia
Frecuencia Frecuencia Frecuencia relativa
N Nivel de estudios (xi) absoluta
acumulada-(Fi) relativa (hi) acumulada (Hi)
(fi)

1 Preescolar 832 832 0,02602521 0,02602521

2 Básica primaria 8292 9124 0,25937627 0,28540148

3 Básicas secundaria 6032 15156 0,18868279 0,47408427

4 Media 7050 22206 0,22052613 0,6946104

5 Superior 6530 28736 0,20426038 0,89887078

6 Ninguno 1860 30596 0,05818136 0,95705214

7 Sin información 1364 31960 0,04266633 0,99971848

8 no sabe no responde 9 31969 0,00028152 1

total 31969 1

Tablas de frecuencia absoluta por género

Frecuencia absoluta
Nivel de estudios (x) Frecuencia absoluta hombres
mujeres
Preescolar 832 928

Básica primaria 8292 7524

Básica secundaria 6032 5623

media 7050 6034

superior 6530 5256

ninguno 1860 1589

sin información 1364 1427

no sabe no responde 9 6

total 31969 28387

Tablas de frecuencia relativa por género

Nivel de estudios (x) Frecuencia relativa hombres Frecuencia relativa mujeres

Preescolar 0,0327 0,0260

Básica primaria 0,2651 0,2594

Básica secundaria 0,1981 0,1887

media 0,2126 0,2205

superior 0,1852 0,2043

ninguno 0,0560 0,0582

sin información 0,0503 0,0427

no sabe no responde 0,0002 0,0003

total 1 1

Distribución de la muestra por nivel de escolaridad y sexo en %

Género/Nivel preescolar Básica primaria (1o - Básica secundaria (6o -


escolaridad 5o) 9o)
cantidad % cantidad % cantidad %

hombres 928 52,73% 7524 47,57% 5623 48,25%

mujeres 832 47,27% 8292 52,43% 6032 51,75%

total 1760 100,00% 15816 100,00% 11655 100,00%

Media (10o - 13o) Superior o universitaria

cantidad % cantidad %

6034 46,12% 5256 44,60%

7050 53,88% 6530 55,40%

13084 100,00% 11786 100,00%

Según los resultados, ¿Existen diferencias?

De acuerdo con los datos obtenidos si existen diferencias así:

•Los hombres superan a las mujeres en preescolar con el 5,46 % y básica primaria en
5,16%.

•Las mujeres han ingresado al sistema educativo superior, aunque dichas diferencias no
son tan grandes.

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del
95% para estimar, la escolaridad promedio de los hombres y de las mujeres de
forma individual, en los niveles de estudio de Bachiller, Tecnólogo y
Universitario.

Para dar respuesta a este interrogante realicé el crucé las variables P6020 género y P 6220
(mayor nivel educativo que ha recibido), para determinar N por cada estrato
Bachiller 7112

Ninguno 738

Postgrado 545

Técnico o tecnológico 1433

Universitario 1462

(en blanco)

Bachiller 8140

Ninguno 848

No sabe, no informa 2

Postgrado 611

Técnico o tecnológico 2179

Universitario 1800

(en blanco)

Para determinar el tamaño de la muestra en cada estrato, con n= 385 use la afijación
proporcional, que depende del tamaño del sedimento así:

n1=N1*n/N n2=N2*n/N n3=N3*n/N

n1 distribución de la muestra para el estrato 1 reemplazando la fórmula tenemos:

7112*345/10007=273,62 y así para los demás elementos.

Nivel de Escolaridad Población N Hombres Distribución n por estrato

Bachiller 7112 273,62

Tecnólogo 1433 55,13


Universitario 1462 56,25

Total 10007 385,00

Muestra n 385

Nivel de Escolaridad Población N Mujeres Distribución n por estrato

Bachiller 8140 258,59

Tecnólogo 2179 69,22

Universitario 1800 57,18

Total 12119 385,00

Media Población 4039,67

Muestra n 385

Dividida la población en subgrupos se escogió aleatoriamente por estratos en forma


proporcional a través de análisis de datos, funciones para análisis-muestran seleccionando
muestreo aleatorio y el número de muestra para cada estrato. Obteniendo los siguientes
datos:

Desviación estándar σ hombres Desviación estándar σ mujeres

Bachilleres 5,09088988 Bachilleres 4,94610134

Tecnólogos 4,94594931 Tecnólogos 4,94534738

Universitarios 4,94592181 Universitarios 4,94586432

X barra media muestral X barra media muestral

Bachilleres 7,62043796 Bachilleres 7,35135135

Tecnólogos 7,50909091 Tecnólogos 6,30434783

Universitarios 7,44642857 Universitarios 7,54385965


n hombres n mujeres

Bachilleres 274 Bachilleres 259

Tecnólogos 55 Tecnólogos 69

Universitarios 56 Universitarios 57

NC 0,95

α 0,05

α/2 0,025

1,96 datos obtenidos en la tabla de


Zα/2
distribución normal
Se hallo intervalo con el siguiente resultado
Hombres Mujeres
Bachilleres 7,017636 8,223239 Bachilleres 6,748973 7,953729
2 7 2 5
Tecnólogos 6,201944 8,816237 Tecnólogos 5,137462 7,471233
8 1 6
Universitarios 6,151012 8,741844 Universitarios 6,259872 8,827847
4 7 3

Para un nivel de confianza del 95%, podemos estimar que los anteriores intervalos
contienen el promedio de escolaridad en hombres y mujeres.

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al


95% para estimar la diferencia promedio de escolaridad para los hombres y
mujeres, en los niveles de estudio de Bachiller, Tecnólogo y Universitario

Intervalo de confianza para la diferencia de medias

Para muestras grandes de hombres y mujeres


Bachilleres 1,12127752 -0,51884748

Tecnólogos 2,95695747 -0,5474713

Universitarios 1,72650073 -0,09743108

Al ser los resultados uno positivo y el otro negativo se dice que no hay diferencias
significativas respecto a las 2 variables, género y escolaridad.

(semana 5) Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las
mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la
semana 3:
1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175)
y sexo (P6020), realice un diagrama de barras comparativo para los hombres y
mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?

DICEN SI

Hombre :
s 32
Mujeres :
36
TOTAL

Hombres :
157
Mujeres :
163
Diferencias:

 Las mujeres asisten más, en un 11,1 % a un colegio oficial que los hombres en
Colombia.
 Según el grafico obtenido lo concluido por el investigador es algo erróneo, pero si se
hubiese obtenido la información de todos los hombres y mujeres de la población, se
hubiera tenido con más certeza un resultado.

2. Con un nivel de confianza del 95%, estime e interprete la proporción de


hombres y de mujeres que asisten a un establecimiento oficial.

HOMBRES:

Media (x) 0,203

Muestra 32

Desviación Estándar 0,404

Z 1,96

n 157

INTERVALO; [0,23+(1,96) (), 0,23-(1,96) ()] = [ -4,77, 5,23]

MUJERES:

Media (x) 0,220


Muestra 36

Desviación Estándar 0,416

Z 1,96

n 163

INTERVALO; [0,220+(1,96) (), 0,220-(1,96) ()] = [-5,30, 5,74]

3. Realice una prueba de hipótesis para determinar la afirmación del


investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo
anterior?

Al realizar una prueba de hipótesis calculamos el porcentaje de cada uno de los resultados
obtenidos:

Total -HOMBRES Total- MUJERES

157 163

DICEN SI

Hombres 32

Mujeres 36

163 ß 100%
36 à
22,08%

157 ß
100%
32 à20,38%
Se puede concluir que al tener una significancia del 5% la hipótesis se hace falsa