Está en la página 1de 11

Proyecto Modelos Lineales.

Universidad Santo Tomas, Bogotá, Colombia.


Integrantes: Yanela Alexandra Mesa Cantillo.
Pedro David Ochoa Rincón.
Modelos Lineales 5B.
Introducción:
El propósito del trabajo es hacer un análisis exploratorio de una base de
datos, la cual fue extraída del Banco Mundial. Este visualiza por medio de una
tabla el avance de cada país con respecto a cada uno de los indicadores por cada
año, ya sean porcentajes, tasas o razones respecto a las variables que se
manejan. Por lo que, un grupo de dos estudiantes pretende realizar un modelo de
regresión, para mostrar el manejo en aplicaciones como R y Python, y lo
aprendido en clase.
La base de datos fue extraída del (Banco Mundial , 2020), ya que nos
interesa visualizar el comportamiento de los indicadores a nivel mundial y por país,
y llegar a concluir por medio de pruebas de hipótesis que contrasten los resultados
que se van a realizar. Además, que es una base limpia en la que se elimina
algunos registros, y se agregan otras variables para manejar con facilidad e
interpretar cada indicador.
Primero, presentamos el contexto de la base como: las variables y los
registros. Segundo, presentaremos algunos gráficos, el porqué de su uso y alguna
interpretación de la que llegamos. Tercero, presentaremos algunas medidas de
tendencia central y de dispersión, para llegar a detallar estadísticos descriptivos
que podrían identificar distribuciones. Y por último, se especifica cómo desarrollar
el modelo a realizar para el estudio.
Contexto de la base:
Como se mencionó se presentan las variables, la información presentada
también fue extraída de la página web y de la base de datos previamente de
limpia:
1. Country Name: Nombre de cada país.
2. Country Code_x: Cada país se representa con un código para identificarlo
a nivel mundial.
3. Indicator Name: Este tiene subconjuntos los cuales son los siguientes:
a. Esperanza de vida al nacer: La esperanza de vida al nacer indica la
cantidad de años que viviría un recién nacido si los patrones de
mortalidad vigentes al momento de su nacimiento no cambian a lo
largo de la vida.
i. se subdivide en la variable Sexo_o_clase como: Hombre,
Mujer.
Proyecto Modelos Lineales.

b. Tasa de fertilidad en adolescentes: La tasa de fertilidad en adolescentes


es la cantidad de nacimientos por cada 1000 mujeres de entre 15 y 19
años de edad.
i. Solo representa Mujer en la variable Sexo_o_clase.
c. Población de refugiados por país: Los refugiados son personas
reconocidas como refugiados según la Convención sobre el Estatuto
de los Refugiados de 1951 o su Protocolo de 1967, por la
Convención de 1969 de la Organización de la Unidad Africana que
rige aspectos específicos del problema de los refugiados en África,
personas reconocidas como los refugiados de acuerdo con el
estatuto de la ACNUR, personas con estatus humanitario de
refugiado y personas a las que se ofreció protección transitoria.
i. Se subdivide en la parte de la variable Sexo_o_clase en asilo
y origen. A lo que se refiere si es en país de asilo, es decir
que no hace perteneciente a ese país y que se quedara por
un tiempo hasta que arregle su situación. O en otro caso si es
país de origen, es decir que solicita refugio por violencia
dentro del país en el convive.
d. Desempleo: El desempleo es la proporción de la población activa que no
tiene trabajo pero que busca trabajo y está disponible para realizarlo. Las
definiciones de población activa y desempleo difieren según el país.
i. se subdivide en la variable Sexo_o_clase como: Hombre,
Mujer.
e. Tasa de población activa: Todas las personas que aportan trabajo para la
producción de bienes y servicios durante un período específico.
i. Para una específica una edad de mayores de 15 años, en la
variable Edad.
ii. Se subdivide en la variable Sexo_o_clase como: Hombre,
Mujer.
f. Tasa de participación en la fuerza laboral: Todas las personas que
aportan trabajo para la producción de bienes y servicios durante un período
específico. Se clasifican según rangos de edades.
i. Se subdivide en la variable Sexo_o_clase como: Hombre,
Mujer y Hombre y Mujer.
ii. Se subdivide en la variable Edad como: 15 a 64 años y 15 a
24 años.
g. Niños económicamente activos: Los niños económicamente activos son
los niños que participaron de actividades económicas durante al menos
una hora en la semana de referencia del estudio.
i. Se subdivide en la variable Sexo_o_clase como: Hombre,
Mujer y Hombre y Mujer.
ii. Se subdivide en la variable Edad como: 7 a 14 años.
h. Niños económicamente activos que solo trabajan:
Proyecto Modelos Lineales.

i. Se subdivide en la variable Sexo_o_clase como: Hombre,


Mujer y Hombre y Mujer.
ii. Se subdivide en la variable Edad como: 7 a 14 años.
i. Niños económicamente activos que solo trabajan y estudian:
i. Se subdivide en la variable Sexo_o_clase como: Hombre,
Mujer y Hombre y Mujer.
ii. Se subdivide en la variable Edad como: 7 a 14 años.
j. Porcentaje de empleo vulnerable: El empleo vulnerable se refiere a los
trabajadores familiares no remunerados y a los trabajadores autónomos
como porcentaje del empleo total.
i. Se subdivide en la variable Sexo_o_clase como: Hombre,
Mujer.
k. Porcentaje de prevalencia de VIH: La prevalencia de VIH es el porcentaje
de personas infectadas con VIH. Las tasas de jóvenes son un porcentaje
del grupo etario correspondiente.
i. Se subdivide en la variable Sexo_o_clase como: Hombre,
Mujer.
ii. Se subdivide en la variable Edad como: 7 a 24 años.
l. Razón de ocupación en parlamentos nacionales: Las mujeres miembros
de los parlamentos son la cantidad de mujeres que ocupan escaños en una
cámara baja o en una cámara única.
m. Razón de educación de mujeres frente a hombres:
i. En la base de datos hay otra variable que es Sexo_o_clase la
cual en esta variable se subdivide así: Terciaria: Índice de
paridad de género de la tasa bruta de matrícula, educación
superior. Corresponde a la proporción entre la tasa bruta de
matrícula femenina en educación superior y la tasa bruta de
matrícula masculina en el mismo nivel. Para calcularlo, se
divide el valor del indicador correspondiente a las mujeres por
el valor del indicador correspondiente a los varones. Un IPG
igual a 1 indica paridad entre varones y mujeres. En general,
un valor inferior a 1 indica una desigualdad a favor de los
varones, mientras que un valor superior a 1 indica que la
desigualdad favorece a las mujeres. y así para las variables
Secundaria, Primaria y Secundaria, Primaria y Alfabetizado.
4. Income_Group: Es la clasificación que hace el Banco Mundial en la que
detalla el nivel de ingresos que recibe cada país en la que mide el nivel
demográfico del país, el PIB y la inflación que presentan los países en cada
año. En el caso del país no clasificado hace referencia a Venezuela, único
país que el Banco Mundial no tiene préstamos activos, por lo que tiene esa
clasificación.
5. Región: Ubicación geográfica de cada país. Encontramos:
a. América del Norte.
b. América Latina y el Caribe.
c. Asia meridional.
Proyecto Modelos Lineales.

d. Asia oriental y el Pacífico.


e. Europa y Asia central.
f. Oceanía.
g. Oriente Medio y Norte de África.
h. África al sur del Sahara.
6. Años: se muestra la variación de cada una de las variables respecto a cada
año del 2000 al 2020.
Interpretación de gráficos:
A continuación se presentan una serie de gráficos, los cuales explican su
uso y una conclusión de la cual llegamos por el manejo desarrollado en el
análisis exploratorio.
1. Gráfico de dispersión:
Es un gráfico en el que solo maneja valores cuantitativos, es decir valores
numéricos. Por lo que permite visualizar dos atributos con valores cuantitativos.
Expresa valores con la posición espacial tanto vertical como horizontal usando
marcas como los puntos. Nos permite encontrar tendencias, puntos atípicos,
distribuciones, correlaciones.

la esperanza de vida de las mujeres es mayor que la de los hombres, en un


país con un ingreso alto hay mayores posibilidades de vivir más años,puesto
que esta varía desde los 70 años en adelante y no está tan dispersa como la
de países de ingresos bajos, además de puede observar que la esperanza de
vida de los países con ingreso alto tienen una diferencia un poco más notoria a
comparación con los otros, inclusive ingresos medio altos ya que se ven más
mujeres mayores a 80 años y hombres mayores a 75
Proyecto Modelos Lineales.

2. Gráficos de barras:
Un gráfico de barras es una tabla en la que usa un valor cuantitativo y un
atributo con llave categórica, pues esta se puede subdividir en otras categorías
que hacen parte de esta llave. En este caso usa marcas de línea, expresa
atributos con valores alineados en la posición horizontal para los anteriores
casos, y separa los atributos llaves en la posición vertical. Este gráfico nos
permite buscar y comparar valores entre categorías.

Fig 1. tasa de fertilidad


Hay un mayor porcentaje de fertilidad en los países de ingresos bajos que
de ingresos altos, la cual tiene el menor porcentaje que el resto de otros
países.esto puede generar un problema para ambos países puesto que en el
caso de los países con ingreso alto a futuro la población se reduzca
repercutiendo en el desarrollo social y económico, para los países con ingreso
bajo tener una tasa de fecundidad tan alta se pueden encontrar a problemas
económicos al no encontrar tantas oportunidades laborales al no tener una
economía lo suficientemente sólida
Proyecto Modelos Lineales.

Fig 2. población de refugiados


Los países que presentan problemas sociales dentro de su territorio debido
a la violencia relevante en países de ingresos bajos o por guerras desatadas
por intereses presentan una población de refugiados en el país de origen, así
mismo se podría concluir que también hacen pertenencia países que aunque
tengan ingresos bajos pueden sostener a refugiados de asilo que son enviados
de parte de otros países. aun así se puede observar que los países de ingreso
bajo la cantidad de refugiados de origen son mayores que los de asilo,pese a
eso en las otras categorías suele ser mayor los refugiados por asilo, además
se puede observar que en los ingresos altos la cantidad de refugiados por
origen es casi nula.

Fig 3. Educación en los países según ingreso


Como representan razones decidimos escoger un gráfico de barras, ya que
nos permite visualizar las razones que son mayores a 1 y determinar la
desigualdad entre mujeres y hombres en la educación. Hay países en los que
Proyecto Modelos Lineales.

se ha logrado equilibrar esa brecha sin embargo aún es procedente en la


educación anterior a la terciaria, quizás sea el número de demográfico entre
hombres y mujeres en el momento de cursar ese grado de educación. los
países de ingreso alto e ingreso mediano alto tienden a tener como mayoría
una educación terciaria, en los países de ingreso bajo se ve una educación en
su mayoría del nivel de primaria y en los países de ingreso mediano bajo se
alcanza a tener en su mayoría un nivel de secundaria sin ser muy notable la
diferencia con los distintos niveles de educación

3. Matriz de dispersión:
Una matriz de dispersión en un gráfico, que nos permite agrupar varias
categorías con otras. Lo que nos permite visualizar campos, lo que es
importante localizar las variables y la escala a la que se maneja en cada
campo permitiendo al usuario descubrir, presentar y derivar información. Esta
visualización nos permite encontrar, identificar y comparar distribuciones,
similitudes, correlaciones y dependencias en cada una de las categorías.
Además de visualizar datos atípicos y tendencias. Lo hace usando marcas
como lo son los puntos.

Fig 4.Matriz de dispersion de fuerza laboral según sexo y edad


Proyecto Modelos Lineales.

Podemos visualizar que hay menores tasas en la participación de mujeres


en la fuerza laboral, mientras que los hombres presentan tasas altas de los 15
a 64 años. Además se puede visualizar una correlación cuadrática entre las
variables de edad.

Fig 5.Matriz de dispersión de niños económicamente activos según ingresos de los


países
Para los países de ingresos bajos los porcentajes de niños
económicamente activos y que solo trabajan son dispersos. Mientras que los
que solo trabajan o trabajan y estudian tienen un comportamiento descendente
tanto de los países de ingresos bajos como los de ingresos altos.
Proyecto Modelos Lineales.

Fig 6.Matriz de dispersión del trabajo según ingreso de los países


Los puntos en cada uno de los campos no están dispersos, es decir que la
relación entre las categorías se concentran y presentan niveles de porcentajes
en esos puntos. Además, el desempleo tiene menor porcentaje en los países
con ingresos altos , una tasa de población activa mayor a comparación de los
demás países , una de las razones se debe a las crisis financieras y que son
más susceptibles a los cambios bruscos en la economía.

4. Mapa de calor:
Es una tabla la que nos permite ordenar atributos clave, es decir generar listas
para mostrar la cantidad o proporción de las categorías que tienen alguna
relación. Este gráfico permite visualizar tendencias, correlaciones, tendencias,
puntos atípicos. Además de ordenar la información de manera detallada.
Proyecto Modelos Lineales.

Este gráfico se realiza para ver el comportamiento de las regiones y cómo


se clasifican cada uno de los países excluyendo los países que tienen altos
ingresos en dichas regiones. Permitiendo visualizar que en África al sur del
Sahara predominan los países de ingresos bajos que del resto de regiones.

5. Conclusiónes:
➢ Los países con mayores ingresos tiene una esperanza de vida con
una diferencia muy notable con los países de ingreso bajo , para el
primero los las edades oscilan entre más de 70 años, mientras que
los otros se ven edades desde los 50 años.esto se puede deber a
que en los países con mayor ingreso los niveles de educación y de
empleo son altos, lo cual pudo ayudar a que la atención y asistencia
sanitaria sean mejores.
➢ la tasa de fecundidad es muy baja para los países de ingreso alto,
como consecuencia en unos años habrá más ancianos que jóvenes
por lo que puede llevar a problemas económicos, en el caso de los
países con ingresos bajos donde la tasa es alta, el problema serán
esos niños que nacen los cuales probablemente se tendrán que
enfrentar con una calidad de vida baja
Proyecto Modelos Lineales.

➢ La calidad de vida es mejor en los países de ingreso alto puesto que


no hay muchos caso de refugiados de origen lo que puede significar
que el nivel de violencia , hacinamiento, delitos, no generan un
crecimiento caótico y no hay aumento de hambre y pobreza como
se ve en los países con ingresos más bajos
➢ En los países de ingreso bajo los niños suelen tener un porcentaje
grande puede ser una gran causa por la que estos países cuentan
con un nivel de educación bajo puesto que los niños no pueden ir a
estudiar porque tienen que trabajar para poder mantenerse a sí
mismos e incluso a su familia debido a la pobreza en la que se
encuentran.

También podría gustarte