Está en la página 1de 15

Proyecto final

Semana: _10_

Nombre del estudiante:


Daniela Deras 21751056
Cesia Reyes 21911241
Shadia Kury 61851181
Ileana Carranza. 11911184
Sede de estudio:
UNITEC SPS

Docente:
Ing. Gracia Pineda

Sección:
608

Fecha de entrega:
22/09/22

CONTENIDO
666769108.docx

INTRODUCCIÓN...........................................................................3
OBJETIVOS..................................................................................4
CREACIÓN DE LA BASE DE DATOS.....................................................5
DESCRIPCIÓN DE LA BASE DE DATOS................................................6
METADATOS DE LA BASE DE DATOS.................................................7
MODELO ENTIDAD-RELACIÓN.........................................................9
CICLO DE VIDA DE LOS DATOS.......................................................10
APLICACIÓN DML (DATA MANIPULATION LENGUAGE)........................11
Consulta Simple con Clausula Where...............................................11
Consulta con Función de Agregación................................................12
Consulta Utilizando Join....................................................................13
CONCLUSIONES..........................................................................14
BIBLIOGRAFÍA............................................................................15

2|Página
666769108.docx

INTRODUCCIÓN

El presente trabajo representa el informe del proyecto final de la clase de


Técnicas Avanzadas de Procesamiento de Datos impartida por la Ing.
Gracia Pineda del Q4 del 2022. El proyecto consistió en aplicar los
conocimientos de SQL aprendidos en clase en un trabajo práctico.
Se seleccionó una base de datos con la cual se desarrolló el presente
trabajo. Se desarrolló una descripción detallada de la base de datos y se
redactaron los metadatos de la misma a través de un diccionario de datos
y el modelo de entidad-relación de la base de datos. Además de una
descripción del ciclo de vida de los datos que se emplearon para este
proyecto.
Seguidamente se llevó a cabo la Aplicación DML (Data Manipulation
lenguage), haciendo uso de sus datos. Se realizaron consultas en MySQL
Workbench que sirvieron como reforzamiento de los temas vistos a lo
largo de la clase. Se realizaron consultas simples, con funciones de
agregación y haciendo uso de los JOINS, tal y como se aprendió en el
curso.
Cabe destacar que el presente proyecto puede ser utilizado para validar
que el grupo encargado de realizarlo en verdad adquirieron los
conocimientos y habilidades que componen la clase.

3|Página
666769108.docx

OBJETIVOS

Objetivo General
Poner en práctica los conocimientos de la clase a través de un proyecto
final de carácter práctico.

Objetivos Específicos
I. Crear la base de datos en MySQL Workbench.
II. Describir la base de datos y sus respectivos metadatos.
III. Redactar el ciclo de vida que se les dio a los datos trabajados.
IV. Desarrollar la aplicación DML a través de consultas en MySQL
Workbench.

4|Página
666769108.docx

CREACIÓN DE LA BASE DE DATOS

5|Página
666769108.docx

DESCRIPCIÓN DE LA BASE DE DATOS

El Índice de Desigualdad de Género es un índice para la medición de la


disparidad de género que se introdujo en la edición del vigésimo
aniversario del Informe sobre Desarrollo Humano de 2010 del Programa
de las Naciones Unidas para el Desarrollo.
En el conjunto de datos, cuanto más alto es el puntaje, más igualitario es
el país.
El índice de desigualdad de género (GII) proporciona información sobre las
disparidades de género en la salud, el empoderamiento y el mercado
laboral. El GII es una medida compuesta que refleja la desigualdad en los
logros entre mujeres y hombres en tres dimensiones: salud reproductiva,
empoderamiento y mercado laboral.
 La dimensión de salud se mide por la tasa de mortalidad materna y
la tasa de fecundidad adolescente.
 La dimensión de empoderamiento se mide por la proporción de
escaños parlamentarios ocupados por cada género y por los niveles
de educación secundaria y superior.
 La dimensión laboral se mide por la participación de la mujer en la
fuerza laboral.
Está diseñado para revelar la medida en que los logros nacionales en
desarrollo humano se ven erosionados por la desigualdad de género y
proporcionar bases empíricas para el análisis de políticas y los esfuerzos
de promoción.
La base de datos cuenta está conformada con datos sobre GII de 136
países del año 2013 y observar la tendencia desde 2006-2013

6|Página
666769108.docx

METADATOS DE LA BASE DE DATOS

Tabla: “Ranks and Scores (Years)”


Entradas: 136
COLUMNA TIPO DE DATO
Country String
ISO3 String
2013 Rank Double
2013 Score Double
2012 Countries Double
2012 Rank Double
2012 Score Double
2011 Rank Double
2011 Score Double
2010 Rank Double
2010 Score Double
2009 Rank Double
2009 Score Double
2008 Rank Double
2008 Score Double
2007 Rank Double
2007 Score Double
2006 Rank Double
2006 Score Double

Tabla: “Ranks and Scores (Detailed)”


Entradas: 136
COLUMNA TIPO DE DATO
Country String
ISO3 String
Overall Rank Integer
Overall Score Double
Economic Participation and Opportunity
Rank Integer
Economic Participation and Opportunity
Score Double
Educational Attainment Rank Integer

7|Página
666769108.docx

Educational Attainment Score Double


Health and Survival Rank Integer
Health and Survival Score Double
Political Empowerment Rank Integer
Political Empowerment Score Double

Tabla: “Changes in Scores (Years)”


Entradas: 143
COLUMNA TIPO DE DATO
Country String
ISO3 String
Change in Score (2012 -
2013) Double
Change in Score (2011 -
2012) Double
Change in Score (2010 -
2011) Double
Change in Score (2009 -
2010) Double
Change in Score (2008 -
2009) Double
Change in Score (2007 -
2008) Double
Change in Score (2006 -
2007) Double
Change in Score (2006 -
2013) Double

8|Página
666769108.docx

MODELO ENTIDAD-RELACIÓN

9|Página
666769108.docx

CICLO DE VIDA DE LOS DATOS

La base de datos “Global Gender Inequality Index”, o en español, Índice de


Desigualdad de Género, fue obtenida en la plataforma Kaggle donde su
comunidad comparte recursos informáticos de manera gratuita. Dicha
base de datos fue subida por Tanya Jain y muestra la desigualdad en los
países. Esta conformada por tres tablas guardada en tres archivos CVS por
separado:
1. Ranking y Puntajes de Igualdad de los Países por Año
2. Ranking y Puntaje de Igualdad de los Países en General y Detallado
por Categorías.
3. Cambios en los Puntajes de Igualdad de los Países por Año
Se descargaron los tres archivos y se cargaron a MySQL Workbench.
Dentro del programa se creó un nuevo esquema con el nombre de la base
de datos. Posteriormente en el nuevo esquema creado se cargaron las tres
tablas con el Table Data Import Wizard de MySQL. De esta forma el
esquema ya contenía todos los datos.
Debido a los requisitos de SQL se debieron a hacer cambios en los
nombres de las tablas y campos. Todas los caracteres se pasaron a
minúsculas, los espacios se reemplazaron por guiones bajos (_), y se
reemplazaron algunos caracteres como “and” y “-” porque el programa los
detectaba como operadores en vez de caracteres. Todos estos cambios se
realizaron al esquema dentro de MySQL Workbench, la fuente original no
fue alterada.
Una vez cargado y modificado el esquema, se continuo con las consultas.
Las consultas fueron para poner en practica los ejercicios visto en clase.
Fueron tres consultas:
1. Una simple con una condición (clausula where), para mostrar los
países con mayor puntaje general de igualdad de género.
2. Una consulta con función de agregación (avarage), para mostrar el
promedio de cambios en el puntaje de igualdad de género de cada
año.
3. Una consulta con join, para crear una tabla resumen con los datos
más importantes del índice, uniendo dos tablas.

10 | P á g i n a
666769108.docx

APLICACIÓN DML (DATA MANIPULATION LENGUAGE)

Consulta Simple con Clausula Where


Consulta:
SELECT Country, ISO3, OverallRank, OverallScore
FROM ranks_scores_detailed
WHERE OverallScore >= 0.80;

Resultado:

11 | P á g i n a
666769108.docx

Consulta con Función de Agregación


Consulta:
SELECT
avg (ChangeInScore2007_2008),
avg (ChangeInScore2008_2009),
avg (ChangeInScore2009_2010),
avg (ChangeInScore2010_2011),
avg (ChangeInScore2011_2012),
avg (ChangeInScore2012_2013)
FROM changes_scores_years;

Resultado:

* Es la misma tabla dividida en dos imágenes, para una mejor


lectura de los resultados.

12 | P á g i n a
666769108.docx

Consulta Uti lizando Join


Consulta:
SELECT ranks_scores_detailed.Country,
ranks_scores_detailed.ISO3,
ranks_scores_detailed.OverallRank,
ranks_scores_detailed.OverallScore,
changes_scores_years.ChangeInScore2006_2013
FROM ranks_scores_detailed
JOIN changes_scores_years
ON ranks_scores_detailed.Country=changes_scores_years.Country;

Resultado:

* La imagen solo muestra los primeros 21 de 136 registros en total.

13 | P á g i n a
666769108.docx

CONCLUSIONES

 Se creó el esquema y se cargaron las tablas de la base de datos “Global


Gender Inequality Index” en MYSQL Workbench.

 Se hizo la descripción detallada de la base de datos y los metadatos de


la misma a través de un diccionario de datos y el modelo de entidad-
relación de la base de datos, que sirve como referencia para entender
de manera precisa los datos.

 El ciclo de vida de los datos utilizados fue redactado, el cual sirve como
una guía de todo el proceso del proyecto.

 La aplicación DML fue desarrollada correctamente a través de


consultas en MySQL Workbench haciendo uso del esquema y tablas de
la base de datos “Global Gender Inequality Index”.

14 | P á g i n a
666769108.docx

BIBLIOGRAFÍA

Jain, T. (2022). Kaggle. Obtenido de Global Gender Inequality Index:


https://www.kaggle.com/datasets/tanyajain3108/global-gender-
gap-index

15 | P á g i n a

También podría gustarte