Está en la página 1de 15

ESTADISTICA II

TRABAJO COLABORATIVO

ELABORADO POR:

Sindy Barahona fierro

Jonathan González Yanguma

Claudia Marcela Herrera Hernández

Brayan David Rico Bohórquez

PRESENTADO A:

Andy Rodríguez Domínguez M.

POLITÉCNICO GRAN COLOMBIANO


ADMINISTRACIÓN DE EMPRESAS
AÑO 2019

pág. 1
TABLA DE CONTENIDO

Pág.

❖ INTRODUCCIÓN…………………………………………………………... 3.

❖ OBJETIVOS…………..……………………………………………………..4.

❖ DESARROLLO DEL TRABAJO……………………………………………5

❖ CONCLUSIONES…………………………………………………………..14

❖ BIBLIOGRAFIA……………………………………………………………..15

pág. 2
INTRODUCCIÓN

La estadística es la ciencia que nos ayuda a tomar decisiones acertadas en diferentes


casos; al estudiarla se involucran varios elementos que presentaremos en este trabajo,
como son:
El muestreo que “es el proceso de seleccionar un conjunto de individuos de una
población con el fin de estudiarlos y poder caracterizar el total de la población”;
intervalos de confianza que permite marginar entre varios valores donde se
encontrará la medida poblacional y prueba de hipótesis para las variables
cualitativas mide la dependencia entre dos variables.
Teniendo en cuenta lo anterior se demostrará la aplicación de los elementos descritos
en los ejercicios planteados, teniendo en cuenta la información suministrada que hace
referencia a situaciones concretas.

pág. 3
OBJETIVOS

Reconocer mediante una encuesta realizada por el DANE, las condiciones de las
personas con empleo que habitan en las principales e intermedias ciudades del país,
identificando características como el sexo, nivel educativo, discriminación por género
que asisten a un establecimiento o colegio oficial, tipos de muestreo, histogramas entre
otros.

Utilizar variables para un buen ordenamiento y un efectivo reconocimiento de la


información suministrada en la encuesta.

pág. 4
DESARROLLO DEL TRABAJO

¿|A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares


(GEIH), realizada por el DANE [1]. Esta encuesta se hace en las 13 ciudades
principales de Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga,
Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11
ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva,
Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita
información sobre las condiciones de empleo de las personas (si trabajan, en qué
trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando
empleo), además de las características generales de la población como sexo, edad,
estado civil y nivel educativo, se pregunta sobre sus fuentes de ingresos. La GEIH
proporciona al país información a nivel nacional, cabecera - resto, regional,
departamental, y para cada una de las capitales de los departamentos.

Base de datos: en el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información


sobre las características generales de las personas que respondieron en un mes en
particular. Para este trabajo colaborativo, realice lo siguiente:

Primera parte: Selección de muestras

1. escoja un tipo de muestreo y argumente la viabilidad de esta técnica para la base de


datos dada. Rta

Para el ejercicio a desarrollar se utilizará el tipo de muestreo probabilístico, por el


método aleatorio simple, teniendo en cuenta que está regido por la aleatoriedad
asegurando representatividad, además cada elemento asociado tiene la probabilidad
de ser seleccionado sin reemplazo toda vez que la población es finita, es decir que
será elegido solo una vez.

2. Utilizando la variable género P(6020) determine el tamaño de la muestra1


seleccionando adecuadamente justificando:

a. Fórmula a desarrollar
b. Estimación de la proporción de mujeres
c. Nivel de confiabilidad
d. Error de estimación

pág. 5
Rta. A. Formula a desarrollar
Teniendo en cuenta que la población es finita, la fórmula a desarrollar es la siguiente:

𝑁∗𝑍𝑎2 ∗𝑝∗𝑞
n= 𝑒 2 (𝑁−1)+𝑍𝑎2 ∗𝑝∗𝑞

n= Tamaño de la muestra buscado


N= Tamaño de la población
Z= Nivel de confianza
e= Error de estimación
p= Probabilidad de que ocurra el evento estudiado (éxito)
q= (1-p) probabilidad de que no ocurra el evento estudiado

Rta. B. Estimación de la proporción de mujeres

N= 60356
Número de mujeres= 31969
p= 31969/60356*100= 53% =0,53 (probabilidad de encontrar mujeres en el estudio)
q= (1-53%) = 0,47 (probabilidad de no encontrar mujeres en el estudio)

Rta. C. Nivel de confiabilidad


Tenemos una confiabilidad del 95%; por lo tanto se debe escoger el valor del
parámetro estadístico de acuerdo a la siguiente tabla:

VALOR DE CONFIANZA VALOR DE Z


90% 1.645
95% 1.96
98% 2.33
99% 2.58
Z= 1.96

Rta. D. Error de estimación


Error de estimación del 5%
=0.05

60356∗1.962 ∗0,53∗0.47
n= 0.052 ∗(60356−1)+1.962 ∗0.53∗0.47
n= 57757.23
151.84
n= 381

pág. 6
n= Tamaño de la muestra 381
N= Tamaño de la población 60356
Z= Nivel de confianza 1.96
e= Error de Estimación 0.05
p= Probabilidad de encontrar mujeres en el estudio 0.53
q= Probabilidad de no encontrar mujeres en el estudio 0.47

Segunda parte: Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de estudio
de los hombres y las mujeres en Colombia. Para determinar lo anterior, use la
“muestra” encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para


los hombres y mujeres. Según los resultados, ¿Existen diferencias?

Cuenta Rótulos
de de
SEXO columna
Rótulos Total
de fila 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 21 22 general

Hombre 22 5 7 5 10 23 6 3 11 5 7 48 4 5 4 1 8 1 2 1 1 179

Mujer 27 4 7 14 5 23 9 8 4 12 5 39 4 9 9 1 17 3 2 202
Total
general 49 9 14 19 15 46 15 11 15 17 12 87 8 14 13 2 25 3 3 2 1 1 381

60 0
1
2
3
50
4
5
6
40 7
8
9
10
30 11
12
13
20 14
15
16
17
10 18
19
21
0 22
Hombre Mujer

pág. 7
De la muestra de una población de 381 habitantes, el 47% son hombres y el 53% son
mujeres, donde se presenta una diferencia superior del 8% de los hombres frente a las
mujeres que han culminado el bachillerato. También evidenciamos que el 15% de los
hombres han alcanzado niveles de escolaridad superiores, así como el 22% de las
mujeres superando en un 7% a los hombres el nivel de escolaridad superior; otra
evidencia es que el 12% de los hombres no tiene ningún nivel o año de escolaridad
frente a un 13% de las mujeres sin ningún nivel de escolaridad.

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% para
estimar, la escolaridad promedio de los hombres y de las mujeres de forma individual,
en los niveles de estudio de Bachiller, Tecnólogo y Universitario.

Fórmula para poder hallar un intervalo de confianza

A continuación se incluye los niveles de escolaridad discriminado por género, tomando


la población completa

La desviación estándar es el resultado


de la función aplicada en Excel de la
siguiente manera:
DESVIACIÓNESTÁNDAR DE HOMBRE 1192 =DESVESTP(selección entre la
DESVIACIÓNESTÁNDAR DE LA MUJER 1363 escolaridad desde el nivel 0 hasta el
nivel de escolaridad en blanco). Función
aplicada de forma individual a los
hombres y luego a las mujeres

pág. 8
MEDIA MUESTRAL HOMBRES 8,524 Valor obtenido del promedio de los hombres de la muestra total de (381)
* Z 1,96
DESVIACIÓNESTÁNDAR 1192
n 381
Valor obtenido de la siguiente manera:
=119,7 =1,96*1192/RAIZ(381)

INTERVALO [-111 128] INTERVALO DE CONFIANZA en la escolaridad promedio


de los hombres. Intervalo de confianza es el resultado de la operación entre 8,524-119,7 y 8,524+119,7

MEDIA MUESTRAL MUJERES 10,63


* Z 1,96
Para hallar el INTERVALO DE CONFIANZA en
la escolaridad promedio de las mujeres, se utiliza
DESVIACIÓN ESTANDAR 1363 el mismo método aplicado al intervalo de los
n 381 hombres.
= 136,9

INTERVALO [-126 391,6] INTERVALO DE CONFIANZA en la escolaridad promedio


de las mujeres

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para
estimar la diferencia promedio de escolaridad para los hombres y mujeres, en los
niveles de estudio de Bachiller, Tecnólogo y Universitario.

Para la diferencia de medias de dos distribuciones normales de varianza, se utiliza la


siguiente fórmula o intervalo de confianza.

MEDIA MUESTRAL HOMBRES (X1) 8,52


MEDIA MUESTRAL MUJERES (X2) 10,63
Z (Z) 1,96
DESVIACIÓN ESTÁNDAR HOMBRE ( ) 1192
TOTAL HOMBRES DE LA MUESTRA (n1) 179

pág. 9
DESVIACIÓN ESTANDAR MUJER ( ) 1363
TOTAL MUJERES DE LA MUESTRA (n2) 202

= (8,52-10,63) ±1,96*RAIZ(1192/179+1363/202)
=-2,11±1,96 (3,66)
La diferencia de medias está entre -9,3 y
=-2,11+7,18= 5,1 5,1 con una confiabilidad del 95%
=-2,11-7,18= -9,3

Tercera parte: Prueba de hipótesis para dos variables nominales

Un investigador, cree determinar que los hombres asisten más a un colegio oficial que
las mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en
la semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo


(P6020), realice un diagrama de barras comparativo para los hombres y mujeres en
un solo gráfico. Según los resultados, ¿Existen diferencias?.

A continuación se incluye los niveles de la muestra de la población que asisten a un


colegio o establecimiento oficial discriminado por género.

Cuenta de SEXO Etiquetas de columna

Etiquetas de fila 0 No Sí Total general

Hombre 135 15 29 179

Mujer 147 13 42 202

Total general 282 28 71 381

pág. 10
160
147
140 135

120

100
0
80
No
60 Sí
42
40 29

20 15 13

0
Hombre Mujer

De la muestra de una población de 381 habitantes, el 47% son hombres y el 53% son mujeres
y de acuerdo al diagrama de barras comparativo se evidencia que el 16,2% de los hombres
asisten a un colegio o establecimiento oficial, el 8,4% no asiste a colegios o establecimientos
oficiales y el 75,4% no respondió la pregunta.
Se evidencia que el 20,8% de las mujeres asisten a un colegio o establecimiento oficial, el
6,4% no asiste a colegios o establecimientos oficiales y el 72,8% no respondió la pregunta.
Se presenta una diferencia superior del 4,6% de las mujeres frente a los hombres que asisten
a colegios o establecimientos oficiales.

2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres y de mujeres
que asisten a un establecimiento oficial.

Para interpretar la proporción de hombres y mujeres que asisten a un establecimiento


o colegio oficial, se utiliza la siguiente fórmula o intervalo de confianza para
proporciones de una población.

PROPORCIÓN MUESTRAL HOMBRES ( )


* 0,16
n 179
Z 1,96

pág. 11
P*(1-P) = 0,16*(1-0,16)=0,14 Se estima que entre el 11% y el 22% de la
P*(1-P)/n =0,16*(1-0,16)/179=0,0008 proporción de hombres, si asisten a un
establecimiento o colegio oficial.
=0,16±1,96*RAIZ(0,0008)= [11% 22%]

PROPORCIÓN MUESTRAL MUJERES ( )


* 0,21
n 202
Z 1,96

P*(1-P) = 0,21*(1-0,21)=0,16
P*(1-P)/n =0,21*(1-0,21)/202=0,0008 Se estima que entre el 15% y el 26% de la
proporción de mujeres, si asisten a un
=0,21±1,96*RAIZ (0,0008)= [15% 26%] establecimiento o colegio oficial.

3. Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice
un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

Para ello se debe trabajar sobre la prueba de hipótesis de dos proporciones con la
siguiente fórmula

HIPÓTESIS NULA Ho
* HIPÓTESIS ALTERNA Ha
P1<P2
P1>P2

Z Teórico/Tabla
ALFA=5% (1-5%)= Nivel de confianza= 95% Z=1,96

pág. 12
* Zp Datos por proporciones

PROPORCIÓN DE HOMBRES QUE SI ASISTEN A ESTABLECIMIENTO OFICIAL


P1 0,16
PROPORCIÓN DE MUJERES QUE SI ASISTEN A ESTABLECIMIENTO OFICIAL
P2 0,21
TOTAL DE HOMBRES QUE SI ASISTEN X1 29
TOTAL DE HOMBRES DE LA MUESTRA n1 179
TOTAL DE MUJERES QUE SI ASISTEN X2 42
TOTAL DE MUJERES DE LA MUESTRA n2 202
P 0,19

= ((29/179)-(42/202))/(RAIZ(0,19*(1-0,19)*(1/179+1/202))) “Función realizada en la base


de datos de Excel”

= -1,1401 < 1,96

La proporción de hombres que asisten al establecimiento o colegio oficial es menor


que la de las mujeres, es decir que la hipótesis nula Ho se acepta. La hipótesis alterna
Ha es rechazada por la evidencia empírica presentada, afirmando que el investigador
no tiene razón.

pág. 13
CONCLUSIONES

Diferenciar en resultados, sobre las condiciones de empleo y el nivel educativo entre


los hombres y las mujeres de las ciudades encuestadas del país, aprendiendo que a
través de una variable son más las mujeres que culminaron el bachillerato que los
hombres y son más los hombres que asisten al colegio que las mujeres.

Al tener conocimientos sobre la población nos permite conectar características propias


de cada comunidad, dándonos la oportunidad de analizar la situación en general y
permitiendo generar proyectos que tengan un impacto positivo sobre la población, ya
que la muestra me direcciona para poder argumentar el éxito de cualquier proyecto a
ejecutar.

La estadística es una herramienta esencial para la interpretación de datos en nuestro


diario vivir. Las cifras y datos que la estadística estudia para la obtención de resultados
son importantes en toda empresa para la toma de acertadas decisiones como lo son:
en donde invertir, a que publico llegar, nivel de desempleo, encuestas, entre otros.
De acuerdo al trabajo en grupo se logró evidenciar la dinámica para interactuar y
resolver los planteamientos del proyecto buscando siempre un mutuo acuerdo .

pág. 14
BIBLIOGRAFIA

Alvarado Martinez, R. Muestreo y distribuciones muestrales. ESTADISTICA II

Alvarado Martinez, R. distribuciones muestrales. ESTADISTICA II

Alvarado Martinez, R. Estimacion de parametros. ESTADISTICA II

Alvarado Martinez, R. Intervalos de confianza en dos muentras. ESTADISTICA II

Alvarado Martinez, R. Pasos para probar una hipotesis. ESTADISTICA II

pág. 15

También podría gustarte