Está en la página 1de 19

INTITUCION UNIVERSITARIA POLITECNICO GRANCOLOMBIANO

TRABAJO COLABORATIVO

Presentado Por

BRAYAN LEONARDO CASTILLO OLMOS

Código 1811024147

LEIDY ALEXANDRA NARANJO BEJARANO

Código 1621020682

Presentado a:

Dayan Peña

ESTADISTICA II

JUNIO 2019

1
INTRODUCCION

El siguiente trabajo colaborativo pretende dar un conocimiento general en los temas de

Estadística II planteados en el foro, sobre conceptos de identificación de población, variable y

muestra, medidas de tendencia central, análisis de datos en gráficos, histogramas y polígonos de

frecuencia, que nos permiten obtener datos y analizar la información presentada para su fácil

acceso y manipulación para que se realice una correcta interpretación de resultados.

Con el desarrollo del presente trabajo se podrán analizar datos y variables de acuerdo a la

temática y teoría suministrada por el tutor durante el desarrollo del módulo, este con el fin de

revisar probabilidades de acuerdo a una muestra especifica suministrada que nos permitirá extraer

datos numéricos para resolver los problemas planteados por el tutor.

2
OBJETIVOS

 Desarrollar capacidades para diseñar y analizar los problemas expuestos por el tutor

 Analizar avances conceptuales y procedimentales acerca de la fundamentación estadística

por medio de un trabajo practico

 Afianzar las capacidades para el desarrollo de la muestra en diferentes poblaciones,

obteniendo resultados estadísticos acordes a lo aprendido en el modulo

 Desarrollar capacidades para relacionar variables continuas mediante métodos de

estadísticos

 Fomentar el trabajo en equipo, mejorando la comunicación y desarrollo de las diferentes

tareas propuestas para el desarrollo del foro.

3
PLANTEAMIENTO DEL PROBLEMA

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH),

realizada por el DANE [1]. Esta encuesta se hace en las 13 ciudades principales de Colombia

(Bogotá, Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira, Ibagué, Cúcuta,

Villavicencio, Montería, Cartagena) y 11 ciudades intermedias (Tunja, Florencia, Popayán,

Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés).  Esta

encuesta, se solicita información sobre las condiciones de empleo de las personas (si trabajan, en

qué trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando empleo),

además de las características generales de la población como sexo, edad, estado civil y nivel

educativo, se pregunta sobre sus fuentes de ingresos. La GEIH proporciona al país información a

nivel nacional, cabecera - resto, regional, departamental, y para cada una de las capitales de los

departamentos.

Base de datos: en el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información sobre las

características generales de las personas que respondieron en un mes en particular. Para este

trabajo colaborativo, realice lo siguiente:

Parte 1 (semana 3 - 5)

(semana 3) Selección de muestra

4
1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los

elementos de una población), se selecciona una muestra, entendiendo por tal una parte

representativa de la población. En ese sentido, escoja un tipo de muestreo y argumente la

viabilidad de esta técnica para la base de datos dada. Para seleccionar una muestra debe

tenerse en cuenta el cómo seleccionar los elementos que formarán parte de la muestra (tipo

de muestreo) y cuántos elementos debemos seleccionar (Tamaño de muestra).

Según lo descrito en el enunciado del trabajo, ya que no es posible efectuar un censo

para obtener la información real, se realizó la Gran Encuesta Integrada de Hogares (GEIH)

a una muestra representativa de la población para las ciudades principales (13) e

intermedias (11) de Colombia, buscando la información requerida sobre las condiciones de

empleo de las personas, además de sus características generales de cada una de ellas.

De acuerdo a lo anterior y basándome en lo visto a lo largo de estas semanas para esta

estadística inferencial, creemos que es un Muestreo Probalístico, ya que es una selección

aleatoria con un margen de error (error de muestreo), de tipo Muestreo Estratificado, ya

que la población se puede dividir en grupos con características homogéneas dentro los

grupos y heterogéneas entre sí.

2. Utilizando la variable género P (6020) determine el tamaño de la muestra seleccionando

adecuadamente justificando:

a) Fórmula a desarrollar:

De acuerdo al algoritmo seleccionado para determinar la muestra a usar en el desarrollo

de este taller, se debe calcular el tamaño de muestra con la siguiente formula:

5
En donde,

N = tamaño de la población

Z = nivel de confianza,

P = probabilidad de éxito, o proporción esperada

Q = probabilidad de fracaso

D = precisión (Error máximo admisible en términos de proporción).

b) Estimación de la proporción de mujeres:

De acuerdo a la información contenida en la base de datos sobre el Censo en Colombia,

se obtiene la siguiente información:

Género Cantidad de Estimación de

mujeres y hombres proporción de

mujeres
Mujer 31.969 52,97%
Hombre 28.387 47,03%
Total, general 60356 100,00%

c) Nivel de confiabilidad

Para tener en cuenta, algunos de los valores de Z de la distribución normal estándar más

comunes en la resolución de ejercicios de estadística, están dados en la siguiente tabla:

6
Nivel de 1–α α/2 z  α/2

confianza

deseado
90% 0,90 0,050 1,645
95% 0,95 0,025 1,960
99% 0,99 0,005 2,575

Para el desarrollo de este taller, se selecciona este nivel de confianza del 95% dado que

es el punto medio los niveles de confianza más usuales

d) Error de estimación

Es el error máximo admisible en términos de proporción. Para el desarrollo de este

taller, dado que no se establece un valor, se establece trabajar en la resolución de este taller

con un error de 0.05.

e) El tamaño de la muestra y la muestra

Una vez se han determinado los valores anteriores, se procede a calcular el tamaño de la

muestra y a seleccionar la muestra.

Z= 1,96
S(pxq)= 0,25
d= 0,05
N= 60356
n= 380,40

7
Por lo tanto, el tamaño de la muestra es 380.

(Semana 4) Intervalo de confianza para dos variables numéricas

Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los

hombres y las mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la

semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los

hombres y mujeres. Según los resultados, ¿Existen diferencias?

8
 

Poblacion:60357

Mujeres:31970

Hombres:28387

Intervalo:56

%MUJERES:0,530/565

%HOMBRES:0,470/502

PROPORCIO CANTIDA

N D
%MUJERES 0,530 565
%HOMBRES 0,470 502

TOTAL MUESTRA 1067

9
Analizando la muestra tomada podemos concluir que a pesar que el número de mujeres es

mayor el histograma muestran ciertas similitudes entre los sexos, pero se observa que el mayor

grado de escolaridad la poseen los hombres.

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% para

estimar, la escolaridad promedio de los hombres y de las mujeres de forma individual, en

los niveles de estudio de Bachiller, Tecnólogo y Universitario.

Para el cálculo del intervalo de confianza se va a utilizar la siguiente formula:

Por lo tanto, utilizando las fórmulas de Excel se determinan los siguientes promedios y

desviaciones estándar para la variable escolaridad en hombres y mujeres, desagregado por

Bachillerato, Tecnólogo y Universidad:

10
Luego, haciendo uso de la formula expuesta, los resultados de los intervalos de confianza para

hombres son:

Intervalo de Bachiller Tecnólogo Universitari

confianza para o

hombres
Con un nivel de 1,645

significancia del

95%, se tiene que Z


Límite Inferior 11,54 14,08 15,72
Límite superior 11,70 14,59 15,88

 El intervalo de confianza para la escolaridad en hombres para Bachillerato es de: (11.54;

11.70)

 El intervalo de confianza para la escolaridad en hombres para Tecnólogo es de: (14.08;

14.59)

 El intervalo de confianza para la escolaridad en hombres para Universidad es de: (15.72;

15.88)

Luego, haciendo uso de la formula expuesta, los resultados de los intervalos de confianza para

mujeres son:

Intervalo de confianza Bachiller Tecnólogo Universitari

o
Con un nivel de 1,645

significancia del 95%, se

tiene que Z
Límite Inferior 11,45 13,53 16,00
11
Límite superior 11,59 13,90 16,00

 El intervalo de confianza para la escolaridad en mujeres para Bachillerato es de: (11.45;

11.59)

 El intervalo de confianza para la escolaridad en mujeres para Tecnólogo es de: (13.53;

13.90)

 El intervalo de confianza para la escolaridad en mujeres para Universidad es de: (16.00;

16.00)

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para

estimar la diferencia promedio de escolaridad para los hombres y mujeres, en los niveles

de estudio de Bachiller, Tecnólogo y Universitario

Para el cálculo del intervalo de confianza se va a utilizar la siguiente formula:

Por lo tanto, utilizando las fórmulas de Excel se determinan los siguientes intervalos de

confianza:

Intervalo de Bachiller Tecnólogo Universitari


12
confianza o
Con un nivel de 1,96

significancia del

95%, se tiene que Z


Límite Inferior 0,0024 0,2920 -0,2986
Límite superior 0,2051 0,9461 -0,1014

 El intervalo de confianza para la diferencia de escolaridad entre mujeres y hombres en

bachillerato es (0.0024; 0.2051)

 El intervalo de confianza para la diferencia de escolaridad entre mujeres y hombres en

Tecnólogo es (0.2920; 0.9461)

 El intervalo de confianza para la diferencia de escolaridad entre mujeres y hombres en

Universidad es (-0,2986;

-0.1014)

(Semana 5) Prueba de hipótesis para dos variables cualitativas

Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las

mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo

(P6020), realice un diagrama de barras comparativo para los hombres y mujeres en un solo

gráfico. Según los resultados, ¿Existen diferencias?

13
De la anterior representación gráfica podemos analizar que hay más mujeres asistiendo a un

establecimiento educativo, igual que a un establecimiento oficial.

2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres y de

mujeres que asisten a un establecimiento oficial.

Intervalo de confianza Hombres Mujeres


Con un nivel de significancia 1,96

del 95%, se tiene que Z


Límite Inferior 22,8% 17,5%
Límite superior 35,9% 29,4%

 Por tanto, con un nivel de significancia del 95%, se tiene que el intervalo de confianza de

hombres que asisten a un establecimiento oficial es (22.8%; 35.9%), dado que el porcentaje

de hombres que asiste a una entidad oficial el de 29.3%


14
 De igual manera, con un nivel de significancia del 95%, se tiene que el intervalo de

confianza de mujeres que asisten a un establecimiento oficial es (17,5%; 23.5%), dado que el

porcentaje de mujeres que asiste a una entidad oficial el de 23.5%

3. Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un

nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

Prueba de hipótesis

Hipótesis: el nivel de asistencia a establecimientos oficiales es mayor en hombres que en

mujeres

Hipótesis nula: la asistencia entre hombres y mujeres a establecimientos oficiales es

similar

La información proporcionada es:

 hombres= 184 mujeres=196

 p_hombres =0.293 p_mujeres= 0.235

 P-hombres -P_mujeres= 0.058

Especifica el nivel de significación de α=. 05 . El valor crítico para la es de 1.64.

Se estima el error estándar de la diferencia de las dos proporciones:

15
1 1
sp
h−m

= P (1−P)
( +
nH nM )
Donde:

n H P H +nM P M
P=
nH +n M

( 184 x 0.293 )+(196 x 0.235)


P= =0.26
380

Por lo tanto:


S= 0.26 x ( 1−0.26 ) x ( 1841 + 1961 )=0.045

Se calcula el estadístico de prueba:

0.058−0
Z= =1.29
0.045

De acuerdo a los resultados, no se rechaza la hipótesis dado que el valor de Z calculado

es menor que el valor crítico 1.96 y mayor que el valor critico -1.96, según el nivel de

significancia establecido por el ejercicio.

16
CONCLUSIONES

Mediante el desarrollo del trabajo anterior podemos entender fundamentos esenciales de la

estadística y lo importante que es para análisis de una población o tema específico, la estadística
17
hace más fácil el proceso de organizar, analizar, y contabilizar, para la toma de decisiones de

acuerdo a los datos proporcionados y los análisis efectuados.

Medidas de tendencia central, de dispersión, el manejo de la muestra utilizando cualquier tipo

de variable, hace posible el desarrollo de habilidades necesarias para aplicarlas en el diario vivir,

los histogramas y graficas que se desarrollan a partir de los datos y análisis realizados, cumplen un

objetivo final en la interpretación de datos y puntos de comparación entre dos o más variables.

Todo esto con el fin de aplicar los conocimientos adquiridos en el proceso de aprendizaje,

reconociendo las fortalezas y debilidades del alumno en cuanto a los temas vistos en la materia.

REFERENCIAS

 https://es.wikipedia.org/wiki/Muestreo_(estad%C3%ADstica)

18
 http://eio.usc.es/eipc1/base/basemaster/formularios-php-

dpto/materiales/mat_g2021103120_estadisticatema4.pdf

19

También podría gustarte