Está en la página 1de 19

Análisis de Datos Clase Extra 1

Qué es y su importancia
Relación con Análisis de Datos

Python Librerías
Lógica de Programación Básica
Ejemplos Prácticos
Ejercicio Grupal
Análisis de Datos Clase Extra 2

Python
Es un lenguaje de programación muy utilizado en el mundo del análisis de datos.
Su popularidad se debe, por una parte, a su enfoque en la legibilidad del código y su
énfasis en la productividad y facilidad de uso.

Algunos ejemplos de ámbitos en los que se utiliza son:


Desarrollo web
Desarrollo científico
Análisis de datos
Inteligencia artificial
Automatización de tareas
Desarrollo de videojuegos
Análisis de Datos Clase Extra 3

Python - Conceptos
Gracias a la gran comunidad de Python que existe, se han creado una amplia cantidad de
bibliotecas y herramientas especializadas para trabajar con el lenguaje.
Antes de mencionar algunas de las aplicaciones más comunes que pueden existir,
entendamos los siguientes conceptos:

? Biblioteca (Library): conjunto de módulos y funciones que proporcionan


funcionalidades específicas para realizar tareas o resolver problemas particulares.

? Módulo (Module): Un módulo en Python es un archivo que contiene código Python


reutilizable. Puede contener variables, funciones y clases que se pueden importar y
utilizar en otros programas.
Análisis de Datos Clase Extra 4

Python en Análisis de Datos


✔ Manipulación y limpieza de datos: la biblioteca Pandas proporciona estructuras de
datos flexibles, como DataFrames, que permiten cargar, fusionar, filtrar y
transformar datos.

✔ Visualización de datos: bibliotecas como Matplotlib y Seaborn permiten crear


gráficos estáticos, de líneas, de dispersión, histogramas y otras visualizaciones
personalizadas para explorar y comunicar los datos de manera efectiva.

✔ Análisis estadístico: bibliotecas como NumPy y SciPy proporcionan funciones y


herramientas para realizar cálculos estadísticos, pruebas de hipótesis, ajuste de
distribuciones, regresión y más.
Análisis de Datos Clase Extra 5

Python en Análisis de Datos


✔ Aprendizaje automático (Machine Learning): existen bibliotecas que proporcionan una
amplia gama de algoritmos de aprendizaje automático y herramientas para construir,
entrenar y evaluar modelos predictivos a partir de datos.

✔ Análisis de datos geoespaciales: algunas bibliotecas como GeoPandas y Folium brindan


herramientas para realizar análisis espaciales y crear visualizaciones interactivas
de mapas.
Análisis de Datos Clase Extra 6

Python en Análisis de Datos


Veamos algunos de los gráficos que podemos generar con Python para visualizar datos:

❑ Galería de ejemplos de visualización de Matplotlib:


https://matplotlib.org/stable/gallery/index.html

❑ Tutoriales de visualización de datos con Seaborn:


https://seaborn.pydata.org/tutorial.html

❑ Documentación de Plotly para gráficos interactivos: https://plotly.com/python/


Análisis de Datos Clase Extra 7

Elementos Importantes - Variables


Podemos pensar las variables como un espacio de memoria que nos ofrece nuestro
programa.
Como su nombre lo indica, puede contener distintos valores a lo largo del código, pero
lo que siempre se mantiene igual es el nombre.

Supongamos que tenemos un cajón al que le pegamos una etiqueta o sticker y después no
se lo podemos sacar 🥲

Ese mismo cajón podrá contener distintos objetos tales como papeles, documentos,
objetos, útiles y lo que se les ocurra, pero la etiqueta nunca lo abandonará 🫶
Análisis de Datos Clase Extra 8

Variables - Nomenclatura
Las reglas para asignar nombres de variables en Python son las siguientes:

Deben comenzar con una letra (a-z, A-Z) o un guion bajo (_).
No pueden comenzar con un número o cualquier otro carácter especial.

Después del primer carácter, se pueden usar letras, números y guiones bajos.
Evitar el uso de caracteres especiales como !, @, #, $, %, etc.

Python distingue entre mayúsculas y minúsculas en los nombres de las variables.

Es recomendable utilizar nombres de variables descriptivos y significativos para que


el código sea más legible.
Análisis de Datos Clase Extra 9

Estructuras de Datos
Además de las variables, Python nos ofrece otras estructuras de datos para almacenar y
organizar información. Estas estructuras nos resultan fundamentales para poder trabajar
con los conjuntos de datos.

Listas:

Tupla:

Diccionario:
Análisis de Datos Clase Extra 10

Elementos Importantes - Bucles


Las estructuras de repetición son herramientas que nos permiten ejecutar bloques de
código de manera repetida hasta que se cumpla una condición específica.
Son especialmente útiles cuando queremos realizar una tarea repetitiva sin tener que
escribir el mismo código varias veces.
Análisis de Datos Clase Extra 11

Bucles – For vs While


FOR WHILE
Se utiliza cuando se conoce la cantidad de veces que se Se utiliza cuando se desea repetir un bloque de código
va a repetir el bloque de código. mientras se cumpla una determinada condición.
Recorre una secuencia de elementos tomando uno a uno Se ejecuta siempre y cuando la condición especificada
y ejecutando el bloque de código para cada uno de ellos. sea verdadera punto esta condición se verifica antes de
cada iteración.
El bucle se detiene automáticamente al procesas todos Si la condición es falsa, el bucle while se detiene y el
los elementos de la secuencia. programa continúa con la siguiente instrucción después
de éste.
Es importante asegurarse de que la condición se actualice
dentro del bloque del código para evitar bucles infinitos
que rompen compus. 🤯
Análisis de Datos Clase Extra 12

Condicionales
Las estructuras condicionales te permiten ejecutar diferentes bloques de código según
una condición. El condicional más común es if, pero también se pueden usar elif y else
para manejar múltiples casos.
Análisis de Datos Clase Extra 13

Funciones
Al desarrollar una aplicación compleja, es muy habitual utilizar varias veces las
mismas instrucciones. Cuando una serie de instrucciones se repiten una y otra vez, se
complica demasiado el código fuente de la aplicación, ya que:

• El código de la aplicación se alarga.


• Si se quiere modificar alguna de las instrucciones repetidas, se deben hacer tantas
modificaciones como veces se haya escrito esa instrucción.

Debido a esto acudimos a las funciones:


Función: conjunto de instrucciones que se agrupan para realizar una tarea concreta y
que se pueden reutilizar fácilmente.
Análisis de Datos Clase Extra 14

Funciones
Veamos un ejemplo:
Análisis de Datos Clase Extra 15

Aplicaciones de Python
Para utilizar Python en nuestro dispositivo generalmente tenemos que instalar
distintos programas y herramientas para su correcto funcionamiento. En este caso, no
instalaremos nada pero podremos trabajar con varias librerías desde Google Colab.

Google Colab: Colaboratory, o "Colab" para abreviar, es un producto de Google


Research. Permite a cualquier usuario escribir y ejecutar código arbitrario de Python
en el navegador. Es especialmente adecuado para tareas de aprendizaje automático,
análisis de datos y educación.

Link:
https://colab.research.google.com/drive/1Wns5tntd1c0Ra9Gm0VEC2W8FaDsHm0Vf?usp=sharing
Análisis de Datos Clase Extra 16

Ejercicio Grupal – Análisis


Queremos desarrollar un programa en Python que nos permita registrar nuestras
actividades físicas diarias y visualizar un resumen de los tiempos dedicados a cada
tipo de actividad.

El programa debe cumplir con los siguientes requisitos:


✔ Permitir al usuario ingresar las actividades físicas realizadas y el tiempo
dedicado a cada una en minutos.
✔ Almacenar los datos ingresados en una estructura de datos adecuada.
✔ Calcular y mostrar un resumen que incluya el tiempo total dedicado a todas las
actividades y el porcentaje de tiempo dedicado a cada una.
✔ Mostrar un gráfico de barras que represente visualmente el porcentaje de tiempo
dedicado a cada actividad.
Análisis de Datos Clase Extra 17

Ejercicio Grupal – Análisis


Como recién estamos iniciando con Python, les dejamos una posible solución en un
cuaderno de Google Colab.

Lo que deben hacer en grupo es analizar la mayor cantidad de elementos posibles, para
luego exponer qué es lo que encontraron acerca de cada uno de ellos.

Acá tenés el ejercicio:

📊 CLICK ACÁ 📊
Análisis de Datos Clase Extra 18

Algunos Recursos Interesantes


Playlist de Probabilidades y Estadística:
https://www.youtube.com/playlist?list=PLM7ZBJfsXV3TtK2djMgxu5ezdOxYB6aDY

Análisis de datos con Python:


https://www.freecodecamp.org/learn/data-analysis-with-python/

Curso de Python (Soy Dalto):


https://www.youtube.com/watch?v=nKPbfIU442g&pp=ygUMcHl0aG9uIGN1cnNv

Documentación de Python: https://docs.python.org/3/


¡Gracias por
asistir!

También podría gustarte