0% encontró este documento útil (0 votos)

25 vistas6 páginas

Ciencia de Datos en Python

El documento detalla un curso de ciencia de datos utilizando Python, abarcando desde conceptos básicos hasta técnicas avanzadas de aprendizaje automático y Big Data. Incluye módulos sobre manipulación de datos, visualización, estadística, preprocesamiento, y la implementación de modelos en producción. Además, se destaca la integración de herramientas como PySpark para el manejo de grandes volúmenes de datos y la realización de un proyecto final completo.

Cargado por

Abraham Solis

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

25 vistas6 páginas

Ciencia de Datos en Python

Cargado por

Abraham Solis

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 6

Python es ampliamente utilizado en ciencia de datos debido a su sintaxis simple y su vasta

colección de bibliotecas especializadas como Pandas, NumPy y Scikit-learn, que facilitan el

análisis, procesamiento y modelado de datos. Además, su integración con herramientas de Big
Data como PySpark lo hace ideal para trabajar con grandes volúmenes de información. Su
fuerte comunidad y abundante documentación proporcionan soporte constante. También es
versátil, permitiendo desarrollar desde análisis exploratorios hasta implementaciones de
aprendizaje automático y visualizaciones avanzadas.

Módulo 1: Introducción a la Ciencia de Datos y Python

1. Ciencia de Datos: Conceptos básicos

o ¿Qué es la ciencia de datos?

o Aplicaciones de la ciencia de datos

o Introducción al flujo de trabajo de un proyecto de ciencia de datos

2. Introducción a Python para Ciencia de Datos

o Instalación y configuración de entornos de trabajo: Anaconda, Jupyter, Google

Colab

o Sintaxis básica de Python

o Tipos de datos y estructuras (listas, tuplas, diccionarios, sets)

o Control de flujo y funciones

Módulo 2: Manipulación de Datos con Python

1. Introducción a la Librería Pandas

o Estructuras de datos: Series y DataFrames

o Carga de datos (CSV, Excel, JSON, SQL)

o Exploración de datos (resúmenes, estadísticas, tipos de datos)

2. Limpieza y Transformación de Datos

o Manejo de valores faltantes y duplicados

o Filtrado y selección de datos

o Transformación de columnas (crear, modificar, eliminar)

o Unión y concatenación de DataFrames

3. Manipulación Avanzada de Datos

o Pivot tables y tablas dinámicas

o Agrupaciones y agregaciones

o Manejo de fechas y tiempos

o Indexación jerárquica

Módulo 3: Visualización de Datos

1. Introducción a Matplotlib y Seaborn

o Creación de gráficos básicos: líneas, barras, dispersión

o Personalización de gráficos: colores, etiquetas, estilos

2. Visualización Avanzada

o Gráficos de distribuciones y relaciones (histogramas, boxplots, pairplots)

o Gráficos categóricos y de tiempo

o Mapas de calor y gráficos de correlación

3. Visualización Interactiva con Plotly

o Introducción a gráficos interactivos

o Dashboards básicos en Plotly y Dash

Módulo 4: Estadística Descriptiva e Inferencial

1. Conceptos Básicos de Estadística

o Medidas de tendencia central: media, mediana, moda

o Medidas de dispersión: varianza, desviación estándar

o Distribuciones de probabilidad (normal, binomial, poisson)

2. Inferencia Estadística

o Pruebas de hipótesis

o Intervalos de confianza

o Análisis de correlación y covarianza

o Análisis de regresión lineal simple

Módulo 5: Preprocesamiento y Preparación de Datos

1. Preparación de Datos para Modelos

o Escalado y normalización de datos

o Codificación de variables categóricas (One-hot encoding, label encoding)

o División de los datos en conjuntos de entrenamiento y prueba

2. Manejo de Datos Desbalanceados

o Técnicas para equilibrar clases (undersampling, oversampling, SMOTE)

o Evaluación de modelos en datos desbalanceados

Módulo 6: Aprendizaje Supervisado

1. Introducción al Aprendizaje Supervisado

o Diferencias entre aprendizaje supervisado y no supervisado

o Tipos de algoritmos supervisados: clasificación vs. regresión

2. Modelos de Clasificación

o Regresión logística

o Máquinas de soporte vectorial (SVM)

o K-Nearest Neighbors (KNN)

o Árboles de decisión y Random Forest

o Evaluación de modelos de clasificación (Matriz de confusión, precisión,

recall, F1)

3. Modelos de Regresión

o Regresión lineal múltiple

o Regresión Ridge y Lasso

o Evaluación de modelos de regresión (MAE, RMSE, R²)

Módulo 7: Aprendizaje No Supervisado

1. Introducción al Aprendizaje No Supervisado

o Clustering: K-means, DBSCAN, Hierarchical clustering

o Reducción de dimensionalidad: PCA (Análisis de componentes principales)

2. Análisis de Asociación
o Algoritmos de reglas de asociación (Apriori, FP-Growth)

o Uso en análisis de cesta de compras

Módulo 8: Evaluación y Optimización de Modelos

1. Validación Cruzada y Métricas de Evaluación

o K-fold cross-validation

o Validación leave-one-out

o Métricas de evaluación para clasificación y regresión

2. Optimización de Hiperparámetros

o Grid Search y Randomized Search

o Optimización Bayesiana

3. Ingeniería de Características

o Selección de características (feature selection)

o Extracción de características

Módulo 9: Deep Learning y Redes Neuronales

1. Introducción a Redes Neuronales

o Conceptos básicos de redes neuronales

o Perceptrón y redes neuronales multicapa

o Funciones de activación

2. Redes Neuronales Convolucionales (CNN)

o Aplicación en procesamiento de imágenes

o Capas convolucionales, de pooling y fully-connected

3. Redes Neuronales Recurrentes (RNN)

o Aplicación en series de tiempo y secuencias

o LSTM y GRU

Módulo 10: Ciencia de Datos en Producción

1. Implementación de Modelos en Producción

o Exportación y serialización de modelos (Pickle, joblib)

o APIs para servir modelos: Flask y FastAPI

2. Despliegue en la Nube

o Implementación de modelos en servidores o plataformas en la nube (Heroku,

AWS, Google Cloud)

o Monitorización y actualización de modelos

3. Documentación y Reportes

o Generación de reportes automáticos con Python (Jupyter, nbconvert)

o Buenas prácticas de documentación de proyectos

Módulo 11: Big Data con PySpark en Google Colab

1. Configuración de PySpark en Google Colab

o Introducción a Apache Spark y PySpark

o Instalación y configuración de PySpark en Colab

o Conceptos básicos de RDDs y DataFrames

2. Manipulación y Procesamiento de Grandes Conjuntos de Datos

o Carga de datos en formatos como CSV, JSON y Parquet

o Transformaciones y acciones en PySpark: filtrado, selección, agrupación

o Optimización de consultas y manejo de particiones

3. Procesamiento en Batch y Streaming con PySpark

o Procesamiento de grandes volúmenes de datos en batch

o Introducción al procesamiento en tiempo real con Spark Structured Streaming

o Agregaciones y manejo de ventanas de tiempo en datos en streaming

Módulo 12: Proyecto Final

1. Desarrollo de un Proyecto Completo de Ciencia de Datos

o Definición de la problemática y objetivos

o Recopilación y limpieza de datos

o Exploración y visualización de datos

o Modelado predictivo

o Presentación de resultados y conclusiones

También podría gustarte

Programador-Python Compressed
Aún no hay calificaciones
Programador-Python Compressed
22 páginas
Programador Python Compressed
Aún no hay calificaciones
Programador Python Compressed
24 páginas
Data Science Con Python - Plan de Estudio
Aún no hay calificaciones
Data Science Con Python - Plan de Estudio
4 páginas
Temario Data Science-Jun-30-2025-02-03-31-0861-PM-1
Aún no hay calificaciones
Temario Data Science-Jun-30-2025-02-03-31-0861-PM-1
10 páginas
Syl - Especialización en Python
Aún no hay calificaciones
Syl - Especialización en Python
7 páginas
Python y Machine Learning Online
Aún no hay calificaciones
Python y Machine Learning Online
11 páginas
Curso de Ciencia de Datos y AI en Python
Aún no hay calificaciones
Curso de Ciencia de Datos y AI en Python
4 páginas
Programa de Ciencia de Datos DH
Aún no hay calificaciones
Programa de Ciencia de Datos DH
14 páginas
Introducción A La Ciencia de Datos e Ia
Aún no hay calificaciones
Introducción A La Ciencia de Datos e Ia
4 páginas
Brochure Científico de Datos Con Python
0% (1)
Brochure Científico de Datos Con Python
13 páginas
Syllabus Data Science
Aún no hay calificaciones
Syllabus Data Science
17 páginas
A460 Analitica de Datos
Aún no hay calificaciones
A460 Analitica de Datos
6 páginas
Temario Data Scientist
Aún no hay calificaciones
Temario Data Scientist
9 páginas
Programa de Ciencia de Datos Empresarial
Aún no hay calificaciones
Programa de Ciencia de Datos Empresarial
12 páginas
CD e IA Generativa Con Python 4ta
Aún no hay calificaciones
CD e IA Generativa Con Python 4ta
10 páginas
Análisis de Datos y Data Science
Aún no hay calificaciones
Análisis de Datos y Data Science
12 páginas
Syllabus Verano Analitica Con Python
Aún no hay calificaciones
Syllabus Verano Analitica Con Python
10 páginas
Brochure Python&r
Aún no hay calificaciones
Brochure Python&r
10 páginas
Data Analisys
Aún no hay calificaciones
Data Analisys
18 páginas
Brochure - Ciencia de Datos v2
Aún no hay calificaciones
Brochure - Ciencia de Datos v2
8 páginas
Diplomado - Ciencia de Datos - R y Python
Aún no hay calificaciones
Diplomado - Ciencia de Datos - R y Python
10 páginas
Brochure Bootcamp
Aún no hay calificaciones
Brochure Bootcamp
8 páginas
Documentación Variada
Aún no hay calificaciones
Documentación Variada
18 páginas
Ciencia Datos - Intermedio
Aún no hay calificaciones
Ciencia Datos - Intermedio
1 página
Brochure Cs de Datos Con R y Python
Aún no hay calificaciones
Brochure Cs de Datos Con R y Python
9 páginas
Bootcamp Data Science: Aprende IA y Python
Aún no hay calificaciones
Bootcamp Data Science: Aprende IA y Python
11 páginas
ANALÍTICA DE DATOS CON PYTHON V1 28-Ene 2021
Aún no hay calificaciones
ANALÍTICA DE DATOS CON PYTHON V1 28-Ene 2021
5 páginas
Curso Completo de Machine Learning con Python
Aún no hay calificaciones
Curso Completo de Machine Learning con Python
3 páginas
FC 6241 2122665
Aún no hay calificaciones
FC 6241 2122665
2 páginas
? Temario Del Curso
Aún no hay calificaciones
? Temario Del Curso
8 páginas
Sílabo Especialización Analítica en Ciencia de Datos Con Python - N
Aún no hay calificaciones
Sílabo Especialización Analítica en Ciencia de Datos Con Python - N
26 páginas
Programa Ciencia de Datos y Machine Learning Con Python
Aún no hay calificaciones
Programa Ciencia de Datos y Machine Learning Con Python
11 páginas
Temario Sugerido para Autoaprendizaje
Aún no hay calificaciones
Temario Sugerido para Autoaprendizaje
3 páginas
Especialización en Big Data y Machine Learning
50% (2)
Especialización en Big Data y Machine Learning
5 páginas
Programa Especializado Data Scientist
Aún no hay calificaciones
Programa Especializado Data Scientist
20 páginas
Introducción A La Ciencia de Datos Utilizando PYTHON
Aún no hay calificaciones
Introducción A La Ciencia de Datos Utilizando PYTHON
5 páginas
Brochure Diplomatura en Ciencia de Datos Con R y Python
Aún no hay calificaciones
Brochure Diplomatura en Ciencia de Datos Con R y Python
10 páginas
Machine Learning Con Python Temas Curso Sugerido
Aún no hay calificaciones
Machine Learning Con Python Temas Curso Sugerido
3 páginas
CHICAGO-BROCHURE-ESP-Python para Data Science
Aún no hay calificaciones
CHICAGO-BROCHURE-ESP-Python para Data Science
8 páginas
Guia de Estudio Ciencia de Datos
Aún no hay calificaciones
Guia de Estudio Ciencia de Datos
13 páginas
Curso Análisis de Datos con Python y SQL
Aún no hay calificaciones
Curso Análisis de Datos con Python y SQL
17 páginas
Temario - Ciencia de Datos
Aún no hay calificaciones
Temario - Ciencia de Datos
3 páginas
Python para Profesionales de Datos
Aún no hay calificaciones
Python para Profesionales de Datos
4 páginas
Programa Capacitacion Avazada en CD e IA
Aún no hay calificaciones
Programa Capacitacion Avazada en CD e IA
6 páginas
Curso Internacional Big Data y AI
Aún no hay calificaciones
Curso Internacional Big Data y AI
23 páginas
Data Scientist y Lenguaje R, Guía de Autoformación para El Uso de Big Data - Henri Laude (4543)
Aún no hay calificaciones
Data Scientist y Lenguaje R, Guía de Autoformación para El Uso de Big Data - Henri Laude (4543)
481 páginas
Guía Completa de Data Science y R
90% (10)
Guía Completa de Data Science y R
481 páginas
Plan de Estudios Big Data - CAC 4.0 2022
Aún no hay calificaciones
Plan de Estudios Big Data - CAC 4.0 2022
2 páginas
Diplomado en IA y Aprendizaje Profundo
Aún no hay calificaciones
Diplomado en IA y Aprendizaje Profundo
3 páginas
E337 Big Data
Aún no hay calificaciones
E337 Big Data
8 páginas
Curso Online de Data Science 100% a Distancia
Aún no hay calificaciones
Curso Online de Data Science 100% a Distancia
14 páginas
Python
Aún no hay calificaciones
Python
1 página
B-Santander - CD 1
Aún no hay calificaciones
B-Santander - CD 1
6 páginas
Data Science ONLINE
Aún no hay calificaciones
Data Science ONLINE
10 páginas
Httpsitpe - MXWP Contentuploads202111brochure DIP en CIENCIA DE DATOS PDF
Aún no hay calificaciones
Httpsitpe - MXWP Contentuploads202111brochure DIP en CIENCIA DE DATOS PDF
11 páginas
La Noción de Límites Se Refiere en Términos Coloquiales A Lo Que Nos Lleva Nuestra Intuición
Aún no hay calificaciones
La Noción de Límites Se Refiere en Términos Coloquiales A Lo Que Nos Lleva Nuestra Intuición
4 páginas
Uso inadecuado de datos en redes sociales
Aún no hay calificaciones
Uso inadecuado de datos en redes sociales
1 página
Impacto del Mal Uso de Redes Sociales
Aún no hay calificaciones
Impacto del Mal Uso de Redes Sociales
3 páginas
La Historia Es El Conocimiento de Lo Que Sucedió en El Pasado
Aún no hay calificaciones
La Historia Es El Conocimiento de Lo Que Sucedió en El Pasado
4 páginas
Nomenclatura de Compuestos Químicos
Aún no hay calificaciones
Nomenclatura de Compuestos Químicos
6 páginas
Simulación Dinámica en Bioprocesos
Aún no hay calificaciones
Simulación Dinámica en Bioprocesos
55 páginas
Introducción a la Biotecnología y Química
Aún no hay calificaciones
Introducción a la Biotecnología y Química
3 páginas
E-Logistics y Tendencias Tecnológicas - Semana 1
Aún no hay calificaciones
E-Logistics y Tendencias Tecnológicas - Semana 1
32 páginas
Sobre Datapath
Aún no hay calificaciones
Sobre Datapath
7 páginas
GA8-220501096-AA2-EV0 Taller Sobre Tecnologías Emergentes y Disruptivas
Aún no hay calificaciones
GA8-220501096-AA2-EV0 Taller Sobre Tecnologías Emergentes y Disruptivas
5 páginas
Cibernetica Vs IA
Aún no hay calificaciones
Cibernetica Vs IA
5 páginas
Resumen Data Science
Aún no hay calificaciones
Resumen Data Science
2 páginas
Bootcamp Ciencia de Datos e Inteligencia Artificial 2025
Aún no hay calificaciones
Bootcamp Ciencia de Datos e Inteligencia Artificial 2025
44 páginas
Efectos de La Inteligencia Artificial en Las Empresas
Aún no hay calificaciones
Efectos de La Inteligencia Artificial en Las Empresas
39 páginas
Ciencia de Datos en Python
Aún no hay calificaciones
Ciencia de Datos en Python
6 páginas
IA en Monitoreo de Infraestructura Tecnológica
Aún no hay calificaciones
IA en Monitoreo de Infraestructura Tecnológica
6 páginas
CT-710-1.2023 Propal - Servicios CiberSeguridad - Control y Gestioìn
Aún no hay calificaciones
CT-710-1.2023 Propal - Servicios CiberSeguridad - Control y Gestioìn
11 páginas
BONINA IA Contrataciones Publicas
Aún no hay calificaciones
BONINA IA Contrataciones Publicas
16 páginas
IA y Aprendizaje Adaptativo en Educación
Aún no hay calificaciones
IA y Aprendizaje Adaptativo en Educación
1 página
Inteligencia Artificial
Aún no hay calificaciones
Inteligencia Artificial
21 páginas
Evaluacion Sumativa III - Redes Neuronales
Aún no hay calificaciones
Evaluacion Sumativa III - Redes Neuronales
10 páginas
Deep Blue y DARPA: Hitos en IA
Aún no hay calificaciones
Deep Blue y DARPA: Hitos en IA
26 páginas
Arbol de Decisiones
Aún no hay calificaciones
Arbol de Decisiones
17 páginas
TFM-2763 FernÃ¡ndez Moreno Ia
Aún no hay calificaciones
TFM-2763 FernÃ¡ndez Moreno Ia
83 páginas
Isma
Aún no hay calificaciones
Isma
12 páginas
Big Data: Conceptos y Aplicaciones
Aún no hay calificaciones
Big Data: Conceptos y Aplicaciones
16 páginas
1.2 EBOOK Claves de La Inteligencia Artificial
90% (10)
1.2 EBOOK Claves de La Inteligencia Artificial
152 páginas
Actividad 2. - Mapa Conceptual.
Aún no hay calificaciones
Actividad 2. - Mapa Conceptual.
6 páginas
Imágenes Generadas por IA en 2023
Aún no hay calificaciones
Imágenes Generadas por IA en 2023
10 páginas
Web 3.0, Revolución 4.0 y Robótica
Aún no hay calificaciones
Web 3.0, Revolución 4.0 y Robótica
15 páginas
Minería de Datos: Conceptos y Aplicaciones
Aún no hay calificaciones
Minería de Datos: Conceptos y Aplicaciones
25 páginas
Minaya Esteban
Aún no hay calificaciones
Minaya Esteban
32 páginas
El Rol de Los Sistemas de Administración Del Conocimiento en Los Negocios
Aún no hay calificaciones
El Rol de Los Sistemas de Administración Del Conocimiento en Los Negocios
15 páginas
TB1 Planeamiento
Aún no hay calificaciones
TB1 Planeamiento
12 páginas
Conceptos Basicos de Inteligencia Artificial
Aún no hay calificaciones
Conceptos Basicos de Inteligencia Artificial
5 páginas
T Gcppde Google 2
Aún no hay calificaciones
T Gcppde Google 2
19 páginas
Caso Practico Amazon Ti025 - E-Business y Su Integracion Con Los Sistemas Corporativos de Gestion
100% (1)
Caso Practico Amazon Ti025 - E-Business y Su Integracion Con Los Sistemas Corporativos de Gestion
7 páginas