Está en la página 1de 6

Universidad EIA

Programación
Al finalizar el examen comprima la carpeta la cual usted modificó y que ahora lleva su nombre. Envíe
este archivo comprimido al correo santiago.mendez@eia.edu.co

Desarrolle cada uno de los puntos en las carpetas que llevan sus respectivos nombres.

### Punto #1:

En la carpeta 'datos' se encuentra el archivo 'atletas.csv'. Dicho archivo contiene información acerca de
la cantidad de medallas de oro, plata y bronce que han obtenido atletas de diferentes países a lo largo
de la historia.

- a) (0.3) Cargue el archivo en un dataframe, elimine todas las filas que tengas datos vacíos y elimine las
columnas: id,name,dob,height,weight. Utilice el notebook 'puntoUno' para el desarrollo del programa.

- b) (0.5) Determine cuantos países tienen, aunque sea un atleta en la base de base de datos. Determine
lo mismo, pero para la cantidad de deportes.

- c) (0.8) Separe el dataframe original en uno de hombres y otro de mujeres. Elimine de los nuevos
dataframes las columnas de nacionalidad, sexo y deporte. Encuentre la cantidad total de medallas de
oro, plata y bronce por genero (puede utilizar la función .sum() para facilitar esta tarea), en otras
palabras, haga la sumatoria de cada columna de los dataframes de hombres y mujeres. Encuentre la
diferencia(resta) de medallas de oro, plata y bronce entre géneros. Grafique este resultado en un gráfico
de barras (debe tener 3 barras: 1 de oro, 1 plata, 1 de broce; cada una mostrando la diferencia de
medallas entre un género y el otro).

### Punto #2:

En la carpeta 'datasets' se encuentra el archivo 'datos.csv', siendo este un dataset de aprendizaje para
un modelo de regresión lineal.

- a) (0.5) Preprocesamiento: Descargar el dataset de aprendizaje en un dataframe. Separar en dataset de


entrenamiento y de pruebas. Si el número de su cedula termina en par, seleccione la columna 'Y1' como
su salida, en caso de ser impar seleccione la columna 'Y2' como su salida. Escalizar dichos datasets. Se
debe pedir por consola el nombre con el que se quieren guardar dichos datasets y guardelos en archivos
csv con los nombres ingresados. Estos se deben guardar en la carpeta 'datasets.

- b) (0.5) Entrenamiento: Pedir por consola los nombres de los datasets que se quieren cargar a los
dataframes de entrenamiento y pruebas. Generar un modelo, pero con la siguiente condición, luego de
haber mostrado las exactitudes se va a preguntar por consola si desea guardar o no el modelo, si la
respuesta es si el modelo se debe guardar con un nombre pedido por consola, en caso contrario no se
debe hacer nada. Los modelos se tienen que almacenar la carpeta 'modelos'. Una idea en este caso de
una buena exactitud es 80% aproximadamente.

- c) (0.4) validación: Ingresar por consola el nombre del modelo a cargar. Validar el funcionamiento del
modelo con las siguientes entradas: x1=0.72,x2=712,x3=270,x4=219.2,x5=3.4,x6=5,x7=0.4,x8=1

También podría gustarte