Está en la página 1de 32

Sobreviviendo a la IA:

Cómo Coexistir con la Automatización en el


Trabajo

Fernando Alberto Velasquez Aguilera


Presentación

• Fernando Alberto Velasquez Aguilera


• Ingeniero de Sistemas
• 25 Años de experiencia
• CSFPC, LCSPC, I27001IA, 11.S198x, SFPC,
OWASP, LPIC-101, LPIC-102, LPIC-201.
• Linux
• Ciberseguridad
• Desarrollo
• Creador de Contenido
Introducción: La Evolución de la IA

• 1950s: Inicios con Alan Turing y el Test de Turing.


• 1943: McCulloch y Pitts proponen un modelo matemático de
redes neuronales.
• 1958: Desarrollo del "Perceptrón" por Frank Rosenblatt.
• Hasta los 80s: Desarrollo de algoritmos básicos de
aprendizaje automático y sistemas expertos.
• Deep Blue y AlphaGo: IA superando las barreras en juegos
de estrategia.
• Recientes: Desarrollo de modelos como GPT-3 con
capacidades avanzadas.
• Actualidad: Influencia de la IA en sociedad, economía y
tecnología.
Fundamentos de la IA y sus Ramificaciones

• Definición: Simulación de la inteligencia humana por


sistemas computacionales.
• Aprendizaje Automático (Machine Learning)
• Funcionamiento: Construye modelos matemáticos a
partir de datos de entrenamiento para realizar tareas
sin programación explícita.
• Tipos de Aprendizaje: Supervisado, no supervisado y
por refuerzo.
• Aprendizaje Profundo (Deep Learning)
• Aplicaciones: Avances en reconocimiento de imágenes
y voz, traducción automática, y generación de texto.
Definición

• La inteligencia artificial (IA) es un campo de la


informática que se dedica a desarrollar sistemas y
tecnologías que permiten a las máquinas aprender,
razonar y tomar decisiones de manera autónoma. En
esencia, busca imitar la inteligencia humana en máquinas
y programas de computadora. Esto implica la capacidad
de procesar datos, reconocer patrones, comprender
lenguaje natural y resolver problemas, todo sin
intervención humana directa. La IA se ha convertido en
un área fundamental para la automatización de tareas y
la toma de decisiones más eficiente en una amplia gama
de aplicaciones, desde asistentes virtuales hasta vehículos
autónomos y diagnósticos médicos avanzados.
Aprendizaje Automático (Machine Learning)

• "El Aprendizaje Automático (Machine Learning) es


una rama de la inteligencia artificial que se centra en
desarrollar algoritmos y modelos computacionales
capaces de aprender de datos y mejorar su rendimiento
en tareas específicas sin una programación explícita.
En esencia, permite a las máquinas adquirir
conocimiento a través de la experiencia y los datos,
identificando patrones y tomando decisiones basadas
en información previa. El Machine Learning tiene
aplicaciones en una amplia variedad de campos, desde
la predicción de tendencias financieras hasta el
reconocimiento de voz y la recomendación de contenido
en línea."
Funcionamiento

• Sistemas que imitan la inteligencia humana.


• Procesa datos, toma decisiones.
• Aplicaciones diversas.
• Redes neuronales profundas.
• Capas de neuronas aprenden características.
• Ajusta pesos con retropropagación.
• Usado en visión y lenguaje, ej. reconocimiento de
imágenes y procesamiento de texto.
Tipos de aprendizaje

• 1. Aprendizaje Supervisado:
• Datos etiquetados.
• Predicciones basadas en ejemplos.

• 2. Aprendizaje No
Supervisado:
• Datos no etiquetados.
• Descubre patrones y agrupaciones.

• 3.Aprendizaje Reforzado.
• - Interacción con entorno.
• - Aprende a través de recompensas.
Predicción de Texto

1. GPT-1 (2018)
1. Lanzamiento: Junio de 2018.
2. Características: Primer modelo GPT, 110 millones de parámetros, uso inicial de la
arquitectura Transformer.
3. Impacto: Estableció las bases para modelos de lenguaje más avanzados.
2. GPT-2 (2019)
1. Lanzamiento: Febrero de 2019.
2. Características: Expansión a 1.5 mil millones de parámetros, mejoras en calidad de texto y
coherencia.
3. Impacto: Generó debates éticos, retraso en lanzamiento completo.
3. GPT-3 (2020)
1. Lanzamiento: Junio de 2020.
2. Características: Salto a 175 mil millones de parámetros, capacidad de "few-shot learning".
3. Impacto: Versatilidad en aplicaciones, discusiones sobre ética y futuro de la IA.
4. Más Allá de GPT-4
1. Desarrollos: Investigación continua para modelos más grandes y eficientes.
2. Expectativas: Aumento en tamaño y sofisticación, desafíos éticos y de sesgo.
Predicción de Texto

Bard (Google)
Anunciado: Febrero de 2023
Características: Basado inicialmente en LaMDA, luego actualizado con
Gemini; búsqueda natural en lenguaje, accesibilidad a servicios de Google.
Impacto: Enfoque en la mejora de la búsqueda de Google y aplicaciones de
chatbot para empresas​​.

LLaMA (Meta AI)


Anunciado: Febrero de 2023
Características: Conjunto de modelos de diferentes tamaños (7B a 65B
parámetros), enfoque en investigación, menor consumo de recursos.
Impacto: Democratización del acceso a modelos de lenguaje grandes,
aplicaciones potenciales en chatbots, asistencia virtual y generación de
contenido​​.
Predicción de Texto

• Ejemplo 1: Contexto Reducido


• Frase de Entrada: "El ratón se comió el..."
• Predicción más Probable: "queso"
• Probabilidad: Alta
• Justificación: Asociación común en
narrativas y expresiones.
Predicción de Texto

• Ejemplo 2: Contexto Expandido


• Frase de Entrada: "Tengo un problema en la
panadería, porque el ratón se comió el..."
• Predicción más Probable: "pan"
• Probabilidad: Aumenta significativamente
respecto al "queso"
• Justificación: El término "panadería"
proporciona un contexto específico que
reajusta las probabilidades favoreciendo
elementos relacionados con panaderías.
¿Que son los parámetros?

• Entradas:
• Género: Acción o Comedia.
• Duración: Corta o Larga.
• Proceso de Red Neuronal:
• Una "neurona" procesa las entradas de género y duración.
• Ponderaciones (Weights):
• Para el Género: Mayor para comedias si se prefiere este género.
• Para la Duración: Mayor para películas cortas si se prefiere menor duración.
• Función: Determinan la importancia relativa de cada entrada (género, duración) en la decisión final.
• Sesgo (Bias):
• Representa una tendencia o preferencia general, independiente de las entradas específicas.
• En este caso, un sesgo positivo indica una predisposición general a disfrutar películas.
• Funcionamiento:
• Multiplica cada entrada (género, duración) por su respectiva ponderación.
• Suma estos valores y agrega el sesgo.
• Compara la suma total con un umbral para predecir si la película gustará o no.
• Ejemplo Práctico:
• Para una comedia corta, ponderaciones altas para comedia y duración corta, junto con sesgo positivo,
predicen que gustará.
Modelos Generativos Basados en Difusión

• ¿Qué Son?
• Definición: Algoritmos de aprendizaje profundo que
generan datos (imágenes, texto) a partir de ruido
aleatorio, imitando un proceso de difusión.
• Proceso: Aprenden a revertir la degradación de datos a
ruido, generando nuevas estructuras similares a los
datos de entrenamiento.
Modelos Generativos Basados en Difusión

• Stable Diffusion:
• Función: Transforma ruido en imágenes realistas mediante
aprendizaje profundo.
• Usos: Arte digital, diseño de conceptos, producción visual.
• DALL-E (OpenAI):
• Función: Crea imágenes desde descripciones textuales,
combinando NLP y generación de imágenes.
• Características: Generación de imágenes creativas y únicas.
• MidJourney:
• Función: Generación de contenido basado en difusión con
enfoques únicos.
• Usos Potenciales: Aplicaciones creativas y experimentales en el
ámbito digital.
Redes Generativas Adversarias (GANs)

1. Concepto: Modelo de aprendizaje automático compuesto por


dos redes neuronales, el generador y el discriminador, que se
entrenan simultáneamente en un proceso adversarial.
2. Componentes:
1. Generador: Crea datos nuevos e imitaciones a partir de ruido
aleatorio.
2. Discriminador: Evalúa los datos generados, distinguiendo entre los
reales (entrenamiento) y los generados.
3. Funcionamiento:
1. Adversarial: El generador y el discriminador compiten entre sí.
2. Aprendizaje: El generador mejora en la creación de datos realistas;
el discriminador mejora en identificar las falsificaciones.
4. Aplicaciones:
1. Generación de Imágenes: Crear arte, imágenes realistas, modificar
estilos de imagen.
2. Modelado de Texto: Generación de texto coherente y realista.
3. Simulaciones: Crear entornos virtuales realistas para entrenamiento
y análisis.
Modelos Generativos Basados en Difusión

1. Entrada: Se inicia con una imagen o una descripción textual.


2. Ruido Inicial: Se introduce ruido en la imagen o se crea una
representación ruidosa a partir del texto.
3. Modelo de Difusión: Se aplica un modelo especializado para
manejar y transformar esta imagen ruidosa.
4. Proceso Iterativo:
1. Se realizan múltiples iteraciones.
2. En cada iteración, se aplica más ruido y luego se utiliza un
modelo generativo para intentar reconstruir la imagen o generar
una nueva basada en la descripción textual, reduciendo
progresivamente el ruido.
5. Imagen Generada: Después de varias iteraciones, se obtiene
una imagen con características visuales mejoradas y menos
ruido.
6. Optimización: Se realizan ajustes finales para mejorar la
calidad y la coherencia de la imagen.
7. Imagen Final: Se produce la imagen estilizada o generada,
lista para ser utilizada.
Espacio Latente

1. Definición: Representación matemática abstracta y de


alta dimensión para codificar datos de manera eficiente.
2. Características:
1. Abstracto: No directamente observable o interpretable.
2. Alta Dimensión: Capaz de capturar información y complejidad Espacio latente
detallada.
3. Codificación Eficiente: Resume características esenciales de los
datos.
3. Aplicaciones en IA:
1. Aprendizaje Profundo: Uso en autoencoders y GANs para
codificar entradas.
2. Generación de Datos: Permite crear nuevos datos (ej. imágenes,
texto) que son similares a los de entrenamiento.
3. Análisis de Datos: Facilita la visualización y comprensión de
datos complejos.
4. Importancia:
1. Permite a los modelos de IA descubrir patrones, realizar
generalizaciones y generar nuevas instancias de datos
manteniendo propiedades clave.
CHAT GPT

1. Definición: ChatGPT es un modelo de lenguaje avanzado desarrollado por OpenAI, basado en la


arquitectura GPT (Generative Pre-trained Transformer).
2. Características:
1. Generación de Texto: Capaz de producir respuestas coherentes y contextuales.
2. Aprendizaje Profundo: Entrenado en una amplia variedad de textos para entender y generar lenguaje
humano.
3. Interactivo: Diseñado para conversaciones fluidas y naturales.
3. Funcionalidades:
1. Respuestas a Preguntas: Capacidad para responder preguntas de manera detallada.
2. Creación de Contenido: Genera textos creativos, desde historias hasta código de programación.
3. Soporte Multilingüe: Funciona en varios idiomas, facilitando la comunicación global.
4. Aplicaciones:
1. Asistencia Virtual: Proporciona soporte y asistencia en diversas áreas.
2. Educación y Aprendizaje: Herramienta para enseñanza y aprendizaje interactivo.
3. Desarrollo de Software: Asiste en la generación de código y solución de problemas de programación.
5. Importancia:
1. Representa un avance significativo en la inteligencia artificial conversacional.
2. Facilita la interacción humana con sistemas informáticos complejos.
CHAT GPT

1. GPT-3.5:
1. Descripción: Versión avanzada de la serie GPT-3 con mejoras en comprensión y
generación de texto.
2. Características: Mayor precisión en respuestas, mejor manejo de contextos
complejos.
3. Uso: Ideal para conversaciones detalladas, redacción de textos, y respuestas
informativas.
2. GPT-4:
1. Descripción: Última versión de la serie GPT con capacidades ampliadas, Análisis,
generación de imagen y navegación.
2. Características: Mejoras significativas en comprensión, lógica y creatividad.
3. Uso: Aplicaciones avanzadas en educación, asistencia virtual, y desarrollo de software.
3. Plugins:
1. Descripción: Extensiones que permiten a ChatGPT interactuar con herramientas y
bases de datos externas.
2. Características: Acceso a información actualizada, habilidades específicas como
búsqueda en la web o generación de gráficos.
3. Uso: Amplía las capacidades de ChatGPT para tareas especializadas y acceso a
información en tiempo real.
Custom instructions

1.Función: Permite a los usuarios establecer instrucciones


específicas para guiar las respuestas de ChatGPT.
2.Personalización: Define criterios como tono, enfoque temático y
restricciones de contenido.
3.Beneficios:
1. Relevancia Mejorada: Asegura respuestas más pertinentes y precisas.
2. Adaptabilidad: Adecua el modelo a diversos contextos y necesidades.
4.Aplicaciones:
1. Desde educación y asesoramiento hasta entretenimiento y creación de
contenido.
5.Interacción Optimizada: Mejora la comunicación entre el
usuario y la IA, alineando las respuestas con las expectativas y
requerimientos específicos.
Chat GPT Lens

• Función Principal: Interpreta imágenes a través de descripciones textuales


generadas por un sistema separado.
• Capacidades:
• Descripción detallada de imágenes (objetos, personas, actividades).
• Respuestas a preguntas específicas sobre el contenido de la imagen.
• Generación de texto relacionado con la imagen (cuentos, explicaciones).
• Análisis y comentarios sobre elementos visuales y estilísticos.
• Herramienta de accesibilidad para usuarios con discapacidad visual.
• Aplicación en educación y aprendizaje.
• Limitaciones:
• Depende de la precisión de las descripciones textuales.
• Consideraciones de privacidad y seguridad de datos.
• Puede no captar contextos o intenciones complejas en imágenes.
• Uso Responsable:
• Conciencia sobre limitaciones.
• Respeto a la privacidad y derechos de autor.
Chat GPT Bing Search
•Descripción General:
• ChatGPT utiliza Bing para acceder a información
actual y específica de internet, complementando su
conocimiento previo.
•Mecanismo de Búsqueda:
• Realiza búsquedas en tiempo real en Bing,
procesando resultados para responder consultas.
•Usos Clave:
• Obtención de noticias recientes, información de
eventos actuales y datos específicos que evolucionan
con el tiempo.
•Limitaciones:
• Dependiente de la calidad y precisión de las fuentes
en línea.
• Cumple con normas de privacidad y seguridad,
evitando datos personales o sensibles.

https://us.as.com/futbol/uefa-champions-league-posibles-alineaciones-del-newcastle-united-ac-milan-n/
Chat GPT Dalle-3
•Generación de Imágenes Avanzada:
• Crea imágenes y arte visual a partir de descripciones
textuales detalladas.
•Interpretación de Estilos Artísticos:
• Capaz de emular una amplia gama de estilos
artísticos y patrones visuales.
Dall-e Dall-e 3
•Flexibilidad Creativa:
2
• Puede seguir instrucciones complejas y abstractas
para producir resultados específicos y creativos.
•Adaptabilidad en el Diseño:
• Genera imágenes que se adaptan a una variedad de
contextos y requerimientos, desde ilustraciones
realistas hasta creaciones fantasiosas.
•Precisión en Detalles: SD
• Mantiene alta fidelidad en detalles y coherencia XL
Cat in police uniform, (whiskers), (blue hat with badge), (tail), holding a
flashlight, wearing sunglasses, standing on two legs, (police belt with
visual, incluso en conceptos imaginativos o no
equipment), in front of a patrol car, cityscape background, (paw on hip),
convencionales. serious expression, (fur detail)
Chat GPT Analitic
•Comprensión de Lenguaje: Entiende lenguaje natural y matices.
•Generación de Texto: Texto fluido en varios estilos.
•Conocimiento Limitado: Basado en datos hasta abril de 2023.
•Contextualización: Mantiene el contexto en conversaciones.
•Tareas Múltiples: Desde traducción hasta programación.
•Instrucciones Complejas: Capaz de seguir pasos detallados.
•Limitaciones: No tiene conciencia ni comprensión del mundo real.
•Estilo de Comunicación: Neutral y adaptable.
Plugins de ChatGPT

• Definición: Componentes de software que añaden


funcionalidades específicas a ChatGPT.
• Funcionamiento: Utilizan APIs para extender y mejorar
las características de ChatGPT.
• Usos Prácticos:
• Automatización de tareas y consultas.
• Integración con servicios y bases de datos externos.
• Creación y gestión de contenido en redes sociales.
• Programación y gestión de citas y eventos.
• Ejemplos de Plugins:
• SmartSlides: Creación de presentaciones.
• Wolfram: Acceso a conocimiento y cálculos avanzados.
• Zapier: Automatización de tareas con aplicaciones.
• Ask Your PDF y Link Reader: Procesamiento de documentos y
páginas web.
Plugins de ChatGPT

• Requisitos para Crear Plugins:


• Conocimientos en programación y manejo de APIs.
• Comprensión de las interfaces de programación
específicas de ChatGPT.
• Adherencia a políticas de seguridad y privacidad en
el desarrollo de software.
• Habilidades en el manejo y procesamiento de datos.
• Limitaciones de los Plugins:
• Dependencia de APIs externas y posibles
problemas de velocidad.
• Riesgos relacionados con la seguridad y privacidad
de los datos.
• Incapacidad de reemplazar completamente el juicio
humano.
• Variabilidad en la complejidad y robustez de los
plugins.
GPTs

• Definición: Versiones personalizadas de ChatGPT para usos


específicos (personal, profesional, educativo).
• Creación Sencilla: Sin necesidad de conocimientos de programación.
Incluye proporcionar instrucciones, conocimientos adicionales y
seleccionar funciones (buscar en web, crear imágenes, etc.).
• GPT Store de OpenAI: Permite compartir GPTs con la comunidad y
posibilidad de generar ingresos.
• Interacción con APIs Externas: Capacidad de realizar acciones
personalizadas en el mundo real (interacción con bases de datos,
aplicaciones de correo, etc.).
• Aplicaciones Educativas: Innovación en enseñanza y aprendizaje,
con enfoque interactivo y personalizado.
• Capacidades Multimodales: Pueden ver, oír y hablar, para
interacción enriquecedora con usuarios.
GPTs

1. Inicio del Proceso:


1. Acceder a la plataforma de ChatGPT.
2. Seleccionar la opción “Crear un GPT”.
2. Propuesta de la Idea:
1. Definir el propósito del GPT (ejemplo: asistencia en programación, creación de contenido,
etc.).
2. Configurar nombre e imagen del GPT.
3. Personalización y Configuración:
1. Responder preguntas del asistente (GPT Builder) para afinar detalles.
2. Especificar funciones deseadas y restricciones.
3. Elegir el tono de las respuestas.
4. Ajustes de Conversación:
1. Modificar inicios de conversación según necesidades de los usuarios.
5. Subida de Archivos (Opcional):
1. Importar textos o datos relevantes para enriquecer las respuestas del GPT.
6. Pruebas y Ajustes:
1. Probar el GPT en la vista previa.
2. Realizar ajustes necesarios para cumplir con las expectativas.
7. Guardado y Compartición:
1. Guardar el GPT una vez satisfecho con el resultado.
2. Decidir si mantener privado, compartir mediante enlace o publicar.
8. Publicación en GPT Store (Opcional):
1. Posibilidad de compartir el GPT en la GPT Store para uso público y monetización (futuro).
GPTs

1. Endpoint de la API: URL: https://api.binance.us/api/v3/depth


2. Método: GET
3. Operación: getMarketDepth
4. Parámetros de la Solicitud:
5. symbol: Símbolo del par de trading (ejemplo: BTCUSDT).
6. Tipo: String
7. Requerido: Sí
8. Respuesta de la API:
9. Código de Respuesta: 200 (Operación exitosa)
10. Formato de Respuesta: JSON
11. Contenido:
12. lastUpdateId: ID de la última actualización de datos de profundidad.
13. bids: Arreglo de órdenes de compra (bid).
14. price: Nivel de precio de la oferta.
15. quantity: Cantidad a este nivel de precio.
16. asks: Arreglo de órdenes de venta (ask).
17. price: Nivel de precio de la demanda.
18. quantity: Cantidad a este nivel de precio.
OPENAI API

GPT-4 Turbo Whisper


• Contexto ampliado (128K tokens). • Reconocimiento automático de voz.
• Conocimiento hasta abril de 2023. • Alta precisión en varios idiomas.
• Aplicaciones en transcripción y
• Precios reducidos.
subtítulos.
DALL·E 3 OpenAI Lens
• Generación de imágenes • Análisis avanzado de imágenes y
personalizadas. texto.
• Integración en aplicaciones. • Aplicaciones en accesibilidad y
• Moderación anti-mal uso. extracción de información.
Text-to-Speech (TTS)
• Conversión de texto a voz.
• Seis voces preestablecidas.
• Dos variantes de modelo: tts-1 y tts-
1-hd.
OPENAI API

1.Basado en Uso
1. Cobro según la cantidad de tokens (texto) procesados.
2. Precios específicos para entrada/salida en GPT-4 Turbo
y otros modelos.
3. Ejemplo: GPT-4 Turbo más económico que GPT-4
estándar.
2.Imagen y Audio
1. DALL·E 3: Precio por imagen generada.
2. Text-to-Speech: Costo por 1,000 caracteres de entrada.
3. Whisper y OpenAI Lens: Tarifas basadas en el
procesamiento y análisis de datos.

También podría gustarte