Está en la página 1de 3

Tratamiento y análisis de datos (data science)

Análisis de datos con Pandas

Unidad 1

Entrega Jupyter Notebook en Python usando la librería de Pandas

1. Enunciado
Los objetivos que se pretenden alcanzar en esta actividad son los siguientes:

▪ Ejercitar el tratamiento de datos con la librería Pandas.

▪ Leer, procesar y escribir ficheros de datos con Pandas.

En esta práctica vamos a continuar practicando con la librería Pandas, de una manera
muy similar al ejercicio resuelto que ya vimos en un recurso anterior. Esta vez disponemos
de un set de datos de un centro médico animal, con dos ficheros diferentes:

▪ animal_center_vet.csv: información del centro veterinario de los animales.


Columnas del fichero:

o animal_id: identificador único del animal.

o age_upon_outcome: edad del animal expresada en días.

o animal_type: especie del animal.

o breed: raza del animal.

o age_category: “junior” si tiene un año o menos, “adult” si tiene más de un


año.

▪ animal_center_prop.csv: información de los propietarios de los animales.


Columnas del fichero:

o animal_id: identificador único del animal.

o color: color del animal.

o date_of_birth: fecha de nacimiento del animal.

o name: nombre del animal.

o sex_upon_outcome: sexo del animal.

Sobre el primer fichero, “animal_center_vet.csv”:

1. ¿De qué raza (“breed”) es el animal con identificador “A668644”?

2. ¿Cuál es el listado de perros de raza “Pit Bull Mix” y una edad mayor de un
año (365 días)?

3. ¿Cuántos días (“age_upon_outcome”) tiene el cachorro más pequeño de cada


especie (“animal_type”)?

1 © Copyright Universidad Europea. Todos los derechos reservados


Tratamiento y análisis de datos (data science)
Análisis de datos con Pandas

4. Repetir la anterior pregunta desglosando por categoría de edad


(“age_category”) y obteniendo la media de días en vez del mínimo. Resolver
con “pivot_table”.

5. Mezclando con el segundo fichero, “animal_center_prop.csv”, ¿cuál es la


media de edad (“age_upon_outcome”) de cada sexo (“sex_upon_outcome”)?

6. Escribir en un fichero “report.csv” con el top 10 de animales más pequeños (en


edad, “age_upon_outcome”) de color negro (“Black”). Pista para la ordenación:
sort_values.

2. Detalles de la entrega
Se pide entregar un Jupyter Notebook en Python y usando la librería de Pandas en el
que se muestre el código y las consultas necesarias para responder a las cuestiones
planteadas. A continuación, se muestra un tutorial para la instalación de la herramienta
Anaconda, con la que poder realizar el ejercicio.

3. Anexo: instalación de Anaconda


Se recomienda la instalación y uso de la herramienta Anaconda y los Jupyter Notebooks
para la realización de la actividad. A continuación, se enumeran los pasos para su
instalación y uso:

1. Acceder a la página de descargas de Anaconda. Edición a instalar: “Individual


Edition (Open Source)”: <https://www.anaconda.com/products/individual>

2. Seguir los pasos del instalador.

2 © Copyright Universidad Europea. Todos los derechos reservados


Tratamiento y análisis de datos (data science)
Análisis de datos con Pandas

3. Ejecutar la herramienta una vez instalada. En el menú inicial, seleccionamos


“Jupyter Lab”:

4. Nos redirigirá a una página web abierta desde nuestro navegador por defecto,
donde tendremos la interfaz del Jupyter Notebook:

3 © Copyright Universidad Europea. Todos los derechos reservados

También podría gustarte