Está en la página 1de 41

Ingeniería de Sistemas

Módulo 1
Clase 1 – Junio 6 de 2023
Albeiro Montes Gil

Paradigmas de la Albeiro Montes


Programación

Estamos esperando que sean las 6:00 para empezar…


OBJETIVOS DE LA SESIÓN

1. Contexto general sobre la importancia del análisis de


datos

Introducción al análisis de datos


2. Albeiro Montes

Establecer diferencias sobre algunos conceptos


3.

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 2


Capsula 1

¿Por qué es importante conocer el mundo del análisis de datos?

Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 3


Contexto general sobre la importancia del análisis de datos

¿Por qué es importante conocer el mundo del análisis de datos?

Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 4


Ingeniería de Sistemas
Módulo 1
Clase 2 – Junio 8 de 2023
Albeiro Montes Gil

Paradigmas de la Albeiro Montes


Programación

Estamos esperando que sean las 6:00 para empezar…


OBJETIVOS DE LA SESIÓN

1. Establecer diferencias sobre algunos conceptos

Repaso de conceptos por medio de práctica


2. Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 6


Contexto general sobre la importancia del análisis de datos

¿Por qué es importante conocer el mundo del análisis de datos?

Estadística: Análisis de datos para comprender patrones y tomar decisiones.


Inteligencia de Negocios: Uso de datos para apoyar decisiones empresariales.
Inteligencia Artificial: Desarrollo de sistemas que simulan habilidades
humanas. Albeiro Montes
Minería de datos: Descubrimiento de información valiosa en grandes
conjuntos de datos.

¿Entonces cuál es la diferencia entre datos, información y conocimiento?

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 7


Contexto general sobre la importancia del análisis de datos

Datos: Números de ventas registrados.


Información: Gráfico de ventas mensuales.
Conocimiento: Tendencia de aumento en las ventas durante los meses de Albeiro Montes
verano.

Datos: Temperatura registrada cada hora.


Información: Pronóstico del clima para los próximos días.
Conocimiento: Saber que las temperaturas más altas se dan durante el
mediodía en verano.

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 8


Contexto general sobre la importancia del análisis de datos

Principales herramientas en la ciencia de datos

• Lenguajes de programación

• Herramientas ofimáticas Albeiro Montes

• Modelos estadísticos

• Herramientas de visualización

• Bases de datos

• Manipulación de grandes volúmenes de datos

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 9


Ingeniería de Sistemas
Módulo 1
Clase 3 – Junio 10 de 2023
Albeiro Montes Gil

Paradigmas de la Albeiro Montes


Programación

Estamos esperando que sean las 8:00 para empezar…


Preprocesamiento de Datos

• Comprensión de datos
• Eliminación de datos (si aplica)
• Valores faltantes
• Valores duplicados
• Valores por categoría
• Documentación Albeiro Montes

Ejercicio: Entregue un informe ejecutivo tipo dashboard de acuerdo a los


datos proporcionados. Asegúrese de implementar:
- Análisis descriptivo:
- Gráficos
- Análisis de tendencias (regresión)
- Análisis comparativo
- Correlación entre variables

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 11


Preparación de Datos

Análisis descriptivo:
Medidas de tendencia central:
• Media: es el promedio aritmético de los valores en el conjunto de datos.
• Mediana: es el valor medio en el conjunto de datos ordenado de forma ascendente.
• Moda: es el valor más frecuente en el conjunto de datos.
Medidas de dispersión:
• Rango: es la diferencia entre el valor máximo y mínimo en el conjunto de datos. Albeiro Montes
• Desviación estándar: mide la dispersión de los valores con respecto a la media.
• Varianza: es el promedio de los cuadrados de las desviaciones respecto a la media.
• Coeficiente de variación: es una medida relativa de la dispersión, calculada como la desviación estándar
dividida por la media.
Medidas de posición:
• Cuartiles: son valores que dividen el conjunto de datos ordenado en cuatro partes iguales.
• Percentiles: son valores que dividen el conjunto de datos ordenado en 100 partes iguales.
Medidas de forma:
• Asimetría: mide la falta de simetría en la distribución de los datos.
• Curtosis: mide la concentración de los datos alrededor de la media.

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 12


Ingeniería de Sistemas
Módulo 2
Clase 4 – Junio 13 de 2023
Albeiro Montes Gil

Paradigmas de la Albeiro Montes


Programación

Estamos esperando que sean las 6:00 para empezar…


OBJETIVOS DE LA SESIÓN

1. Introducción a Python

2. Introducción al análisis de datos usando Python


Albeiro Montes

Configuración de ambiente de Python en Nube


3. (Colab)

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 14


Capsula 1

Python, el lenguaje más popular en el mundo de los


datos…
• Sintaxis sencilla y legible Albeiro Montes

• Amplia disponibilidad de bibliotecas

• Comunidad activa y soporte

• Fácil visualización de datos

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 15


Introducción a Python

Python es un lenguaje de programación de alto nivel


(interpretado) débilmente tipado que soporta diferentes
paradigmas que cuenta con una curva de aprendizaje
acelerada.
Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 16


Introducción a Python

Operadores aritméticos en Python.

Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 17


Introducción a Python

Operadores relacionales en Python.

• > Mayor que


• >= Mayor o igual que
• < Menor que
Albeiro Montes
• <= Menor o igual que
• == Igual que
• != --- <> Diferente que

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 18


Introducción a Python

Operadores lógicos en Python.

• and -- &: Se deben cumplir todas las condiciones


• or -- |: Se debe cumplir una de las condiciones Albeiro Montes
• not -- ! : Niega el valor de la condición

Son empleados para comparar dos valores (falso y verdadero).


Su resultado produce valores como verdadero y falso. •Los tres tienen el
mismo nivel de prioridad.

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 19


Capsula 2

Alternativas para optimizar tu tiempo y trabajar con


Python para Análisis de Datos
• Jupyter Albeiro Montes
• Kaggle
• Spyder

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 20


Introducción al Análisis de Datos Usando Python

Google Colab

No es un lenguaje de programación Albeiro Montes


No es una librería
No es un framework…

Es un servicio en la nube creado por Google para fomentar el


análisis de datos por medio de técnicas de Inteligencia Artificial

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 21


Introducción al Análisis de Datos Usando Python

Google Colab

Sólo se requiere de una cuenta de Google para poder usar la


versión gratuita.
Albeiro Montes
Enlace: https://colab.research.google.com/?hl=es

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 22


Introducción al Análisis de Datos Usando Python

Google Colab

Sólo se requiere de una cuenta de Google para poder usar la


versión gratuita.
Albeiro Montes
Enlace: https://colab.research.google.com/?hl=es

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 23


Introducción al Análisis de Datos Usando Python

Google Colab

pandas: librería para manipular datos en formato dataframe.


numpy: librería para cálculo de operaciones matemáticas.
Matplotlib: librería para graficar. Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 24


Introducción al Análisis de Datos Usando Python

Lectura de los datos

Dado que datos abiertos proporciona una API para exponer los
datos, se consumen y se leen los datos usando pandas y
read_csv. Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 25


Introducción al Análisis de Datos Usando Python

Lectura de los datos

Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 26


Introducción al Análisis de Datos Usando Python

Los datos desde este momento están siendo manipulados


en formato dataframe (matrices o estructuras de datos Albeiro Montes
dispuestos en filas y columnas).

Cualquier transformación y/o depuración realizada al


dataset se ejecutará exclusivamente al dataframe y no se
verá reflejado en el conjunto de datos original.

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 27


Introducción al Análisis de Datos Usando Python

Algunas operaciones fundamentales para aplicar (columnas):

Eliminar columnas (las que se indiquen):

• data = data.drop(['estu_nacionalidad', 'estu_tipodocumento', 'estu_genero',


Albeiro Montes
'periodo'], axis=1)

Eliminar todas las columnas(excepto las que se indiquen):

• columnas_mantener = ['cole_codigo_icfes’, ‘estu_genero’]


data = data[columnas_mantener]

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 28


Introducción al Análisis de Datos Usando Python

Algunas operaciones fundamentales para aplicar (filas):

Eliminar filas (las que se indiquen):

• indice_fila_eliminar = [1]
Albeiro Montes
data = data.drop(indice_fila_eliminar)

Eliminar todas las filas (excepto las que se indiquen):

• fila_mantener = [0]
data = data.drop(data.index.difference(fila_mantener))

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 29


Introducción al Análisis de Datos Usando Python

Algunas operaciones fundamentales para aplicar:

Sumar toda una fila

suma_columna_A = data['punt_global'].sum()
Albeiro Montes
Buscar NaN

nan= data['punt_global’].isna().any()

Conversión de fecha

data['estu_fechanacimiento'] = pd.to_datetime(data['estu_fechanacimiento'])

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 30


Introducción al Análisis de Datos Usando Python

Algunas operaciones fundamentales para aplicar:

# Eliminar filas duplicadas


data_sin_filas_duplicadas = data.drop_duplicates()

#Eliminar columnas duplicadas Albeiro Montes


columnas_duplicadas=data.columns[data.columns.duplicated()]
data=data.drop(columns=columnas_duplicadas)

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 31


Ingeniería de Sistemas
Módulo 2
Clase 5– Junio 15 de 2023
Albeiro Montes Gil

Paradigmas de la Albeiro Montes


Programación

Estamos esperando que sean las 6:00 para empezar…


OBJETIVOS DE LA SESIÓN

1. Introducción a la Inteligencia Artificial

2. Introducción a las técnicas de IA


Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 33


Capsula 1

Clasificación de la Inteligencia Artificial


¿Qué es la Inteligencia Artificial?
Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 34


Introducción a la Inteligencia Artificial

La Inteligencia Artificial es una disciplina que busca emular el comportamiento del ser
humano en diferentes sistemas computacionales.

Se soporta en otras áreas de conocimiento como:


- Matemáticas.
- Estadística. Albeiro Montes
- Lógica y razonamiento.

Actualmente tiene diversas aplicaciones como lo son:


• Medicina.
• Seguridad Informática.
• Educación.
• Energía.

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 35


Introducción a la Inteligencia Artificial

La Inteligencia Artificial tiene ramificaciones las cuales tienen sus propios conceptos.

Visión por Computadora: Comprensión de imágenes.


NLP: Comprensión del lenguaje natural del ser humano.
Deep Learning: Hace uso de redes neuronales para extraer características, clasificar
y generar una respuesta. Albeiro Montes
Machine Learning: Realiza clasificaciones por medio de un conjunto de datos
explícito.

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 36


Introducción a la Inteligencia Artificial

Machine Learning vs Deep Learning

Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 37


Introducción a la Inteligencia Artificial

Machine Learning vs Deep Learning

En resumen, mientras que el enfoque de Machine Learning requiere la selección


manual de características, el enfoque de Deep Learning aprende automáticamente Albeiro Montes
representaciones de alto nivel a partir de los datos, lo que puede permitir un mejor
rendimiento en tareas complejas como el reconocimiento de imágenes.

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 38


Introducción a la Inteligencia Artificial

.
Algunos de los principales algoritmos de Machine Learning son:

• Regresión lineal
• Regresión logística
• Árboles de decisión
• Bosques aleatorios Albeiro Montes
• Máquinas de vectores de soporte (SVM)
• Naive Bayes
• K vecinos más cercanos (K-NN)
• Redes neuronales artificiales
• Algoritmos de agrupamiento, como k-means y DBSCAN
• Algoritmos de reducción de dimensionalidad, como Análisis de Componentes
Principales (PCA) y t-SNE.

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 39


Introducción a la Inteligencia Artificial

.
KNN:

K-NN (K vecinos más cercanos) es un algoritmo de clasificación supervisada que


asigna una etiqueta a una muestra basándose en las etiquetas de sus vecinos más
cercanos. Calcula la distancia entre la muestra de entrada y los puntos de
entrenamiento, y clasifica la muestra según la mayoría de las etiquetas de sus Albeiro Montes
vecinos más cercanos.

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 40


Introducción a la Inteligencia Artificial

.
KNN:

Albeiro Montes

16/06/2023 Paradigmas de la Programación - Ingeniería de Sistemas 41

También podría gustarte