Está en la página 1de 4

DESARROLLO FORO SEMANA 3 AL 5 – ESTADISTICA II

HAIDER ANDRES INFANTE REY


LUIS FERNANDA MARTINEZ LOZADA
EDNER ORUBIO CUERO
ANGELICA PAOLA QUINTERO RAMIREZ

ESTADISTICA II

PROFESOR: ALBERTO BOADA RODRIGUEZ

UNIVERSIDAD POLITÉCNICO GRANCOLOMBIANO


ADMINISTRACIÓN DE EMPRESAS
COLOMBIA
2019
OBJETIVOS

OBJETIVO GENERAL:

Comprender e interpretar los temas teóricos concernientes a: selección de muestras, intervalos de


confianza para dos variables numéricas y prueba de hipótesis para dos variables nominales con el
fin de aplicarlos con datos de la vida real para un posterior análisis y entendimiento de las teorías.

OBJETIVOS ESPECIFICOS:

 Extraer correctamente elementos de una población por medio de un muestreo especifico,


con el fin de obtener la muestra más representativa de la población para un posterior
análisis.
 Estudiar las características de la muestra representativa para obtener la información
deseada del comportamiento de la población.
 Analizar diferencias entre los distintos tipos de variables que puede tener una muestra
representativa, y determinar conclusiones acerca de estas.
 Elaborar diagramas de barras e histogramas y a partir de ellas observar el comportamiento
que pueden tener las variables.
 Comprender y hacer uso de las teorías más representativas de la asignatura para aplicarlos
de manera acertada en el tratamiento de los datos.
 Extraer por medio de las fórmulas, conclusiones verídicas que permiten un análisis
profundo y detallado de las muestras seleccionadas.
 Utilizar herramientas ofimáticas que contribuyan con el desarrollo de los temas para su
apropiación y análisis.
DESARROLLO DE LA ACTIVIDAD

CONTEXTO:

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH), realizada


por el DANE. Esta encuesta se hace en las 13 ciudades principales de Colombia (Bogotá, Medellín,
Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería,
Cartagena) y 11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva,
Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita información
sobre las condiciones de empleo de las personas (si trabajan, en qué trabajan, cuánto ganan, si
tienen seguridad social en salud o si están buscando empleo), además de las características
generales de la población como sexo, edad, estado civil y nivel educativo, se
pregunta sobre sus fuentes de ingresos. La GEIH proporciona al país información a nivel nacional,
cabecera - resto, regional, departamental, y para cada una de las capitales de los departamentos.

(semana 3) Selección de muestra

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los


elementos de una población), se selecciona una muestra, entendiendo por tal una parte
representativa de la población. En ese sentido, escoja un tipo de muestreo y argumente la
viabilidad de esta técnica para la base de datos dada. Para seleccionar una muestra debe
tenerse en cuenta el cómo seleccionar los elementos que formarán parte de la muestra (tipo
de muestreo) y cuántos elementos debemos seleccionar (Tamaño de muestra).

Teniendo en cuenta lo anterior, podemos determinar que el tipo de muestreo más apropiado para
dicha base de datos es el Muestreo Aleatorio o probabilístico, ya que para el tipo de población
que tenemos y debemos analizar, se recomienda utilizar esta técnica de muestreo, porque se
evalúa de forma matemáticamente y objetivamente, y todos los datos tienen la misma posibilidad
de ser elegidos.
además también se va a utilizar el Muestreo Aleatorio Simple porque Se utiliza para una población
finita y una vez extraído la muestra no se puede colocar nuevamente en la población, porque la
volvería infinita; con esta característica se puede utilizar como tipo de técnica de muestreo.
Porque se puede extraer los datos sin modificar su orden, es decir, son 60.356 datos, de los cuales:
28.387 son hombres y 31.969 son mujeres. Se realiza la fórmula de aleatorio en Excel y de acuerdo
a los números aleatorios que salgan que serían los ítems u orden en que se encuentra los datos, se
van seleccionando como la muestra de la población para ser analizados y todos tienen la misma
posibilidad de ser elegidos.

2. Utilizando la variable género P(6020) determine el tamaño de la muestra seleccionando


adecuadamente
justificando:
a. Fórmula a desarrollar
b. Estimación de la proporción de mujeres
c. Nivel de confiabilidad
d. Error de estimación
Una vez mencionado y planteado el tipo de muestreo, debemos plantear el tamaño de la muestra
con la siguiente ecuación:

𝒁𝟐∝ ∗ 𝒑 ∗ 𝒒
𝒏𝟎 =
𝒆𝟐
Esta fórmula es para una población finita, de acuerdo a esto planteamos los siguientes valores
para la fórmula:

=1,96 (Equivale a un nivel de confianza de 95%)


p= 50% (Equivale a la probabilidad de que ocurra el evento)
q= 50% (Equivale a la probabilidad de que no ocurra el evento)
e= 5% (Equivale al error máximo permitido)

Reemplazando en la fórmula:

1.962 ∗ 50 ∗ 50
𝑛0 = = 384
52
Debido a que no está incluido el tamaño de la población realizamos el ajuste con la siguiente
formula:
𝑛0
𝑛=
𝑛 −1
1+ 0
𝑁
Reemplazando:
384
𝑛= = 382
384 − 1
1+
60.356
De acuerdo a la ecuación anterior podemos decir que el tamaño de la muestra es de 382 datos
que se seleccionan de forma aleatoria de la base de datos de una población de 60.356 personas
entre hombres y mujeres.

Finalmente se recolecta una muestra total de 365 datos ya que se eliminan algunos datos de la
muestra que no son relevantes para el objetivo del estudio, quedando un total de 164 datos para
los hombres y 201 datos para las mujeres. (para ver la información detallada ver ANEXO 1)

También podría gustarte