Documentos de Académico
Documentos de Profesional
Documentos de Cultura
• 1. Aprendizaje Supervisado:
• Datos etiquetados.
• Predicciones basadas en ejemplos.
• 2. Aprendizaje No
Supervisado:
• Datos no etiquetados.
• Descubre patrones y agrupaciones.
• 3.Aprendizaje Reforzado.
• - Interacción con entorno.
• - Aprende a través de recompensas.
Predicción de Texto
1. GPT-1 (2018)
1. Lanzamiento: Junio de 2018.
2. Características: Primer modelo GPT, 110 millones de parámetros, uso inicial de la
arquitectura Transformer.
3. Impacto: Estableció las bases para modelos de lenguaje más avanzados.
2. GPT-2 (2019)
1. Lanzamiento: Febrero de 2019.
2. Características: Expansión a 1.5 mil millones de parámetros, mejoras en calidad de texto y
coherencia.
3. Impacto: Generó debates éticos, retraso en lanzamiento completo.
3. GPT-3 (2020)
1. Lanzamiento: Junio de 2020.
2. Características: Salto a 175 mil millones de parámetros, capacidad de "few-shot learning".
3. Impacto: Versatilidad en aplicaciones, discusiones sobre ética y futuro de la IA.
4. Más Allá de GPT-4
1. Desarrollos: Investigación continua para modelos más grandes y eficientes.
2. Expectativas: Aumento en tamaño y sofisticación, desafíos éticos y de sesgo.
Predicción de Texto
Bard (Google)
Anunciado: Febrero de 2023
Características: Basado inicialmente en LaMDA, luego actualizado con
Gemini; búsqueda natural en lenguaje, accesibilidad a servicios de Google.
Impacto: Enfoque en la mejora de la búsqueda de Google y aplicaciones de
chatbot para empresas.
• Entradas:
• Género: Acción o Comedia.
• Duración: Corta o Larga.
• Proceso de Red Neuronal:
• Una "neurona" procesa las entradas de género y duración.
• Ponderaciones (Weights):
• Para el Género: Mayor para comedias si se prefiere este género.
• Para la Duración: Mayor para películas cortas si se prefiere menor duración.
• Función: Determinan la importancia relativa de cada entrada (género, duración) en la decisión final.
• Sesgo (Bias):
• Representa una tendencia o preferencia general, independiente de las entradas específicas.
• En este caso, un sesgo positivo indica una predisposición general a disfrutar películas.
• Funcionamiento:
• Multiplica cada entrada (género, duración) por su respectiva ponderación.
• Suma estos valores y agrega el sesgo.
• Compara la suma total con un umbral para predecir si la película gustará o no.
• Ejemplo Práctico:
• Para una comedia corta, ponderaciones altas para comedia y duración corta, junto con sesgo positivo,
predicen que gustará.
Modelos Generativos Basados en Difusión
• ¿Qué Son?
• Definición: Algoritmos de aprendizaje profundo que
generan datos (imágenes, texto) a partir de ruido
aleatorio, imitando un proceso de difusión.
• Proceso: Aprenden a revertir la degradación de datos a
ruido, generando nuevas estructuras similares a los
datos de entrenamiento.
Modelos Generativos Basados en Difusión
• Stable Diffusion:
• Función: Transforma ruido en imágenes realistas mediante
aprendizaje profundo.
• Usos: Arte digital, diseño de conceptos, producción visual.
• DALL-E (OpenAI):
• Función: Crea imágenes desde descripciones textuales,
combinando NLP y generación de imágenes.
• Características: Generación de imágenes creativas y únicas.
• MidJourney:
• Función: Generación de contenido basado en difusión con
enfoques únicos.
• Usos Potenciales: Aplicaciones creativas y experimentales en el
ámbito digital.
Redes Generativas Adversarias (GANs)
1. GPT-3.5:
1. Descripción: Versión avanzada de la serie GPT-3 con mejoras en comprensión y
generación de texto.
2. Características: Mayor precisión en respuestas, mejor manejo de contextos
complejos.
3. Uso: Ideal para conversaciones detalladas, redacción de textos, y respuestas
informativas.
2. GPT-4:
1. Descripción: Última versión de la serie GPT con capacidades ampliadas, Análisis,
generación de imagen y navegación.
2. Características: Mejoras significativas en comprensión, lógica y creatividad.
3. Uso: Aplicaciones avanzadas en educación, asistencia virtual, y desarrollo de software.
3. Plugins:
1. Descripción: Extensiones que permiten a ChatGPT interactuar con herramientas y
bases de datos externas.
2. Características: Acceso a información actualizada, habilidades específicas como
búsqueda en la web o generación de gráficos.
3. Uso: Amplía las capacidades de ChatGPT para tareas especializadas y acceso a
información en tiempo real.
Custom instructions
https://us.as.com/futbol/uefa-champions-league-posibles-alineaciones-del-newcastle-united-ac-milan-n/
Chat GPT Dalle-3
•Generación de Imágenes Avanzada:
• Crea imágenes y arte visual a partir de descripciones
textuales detalladas.
•Interpretación de Estilos Artísticos:
• Capaz de emular una amplia gama de estilos
artísticos y patrones visuales.
Dall-e Dall-e 3
•Flexibilidad Creativa:
2
• Puede seguir instrucciones complejas y abstractas
para producir resultados específicos y creativos.
•Adaptabilidad en el Diseño:
• Genera imágenes que se adaptan a una variedad de
contextos y requerimientos, desde ilustraciones
realistas hasta creaciones fantasiosas.
•Precisión en Detalles: SD
• Mantiene alta fidelidad en detalles y coherencia XL
Cat in police uniform, (whiskers), (blue hat with badge), (tail), holding a
flashlight, wearing sunglasses, standing on two legs, (police belt with
visual, incluso en conceptos imaginativos o no
equipment), in front of a patrol car, cityscape background, (paw on hip),
convencionales. serious expression, (fur detail)
Chat GPT Analitic
•Comprensión de Lenguaje: Entiende lenguaje natural y matices.
•Generación de Texto: Texto fluido en varios estilos.
•Conocimiento Limitado: Basado en datos hasta abril de 2023.
•Contextualización: Mantiene el contexto en conversaciones.
•Tareas Múltiples: Desde traducción hasta programación.
•Instrucciones Complejas: Capaz de seguir pasos detallados.
•Limitaciones: No tiene conciencia ni comprensión del mundo real.
•Estilo de Comunicación: Neutral y adaptable.
Plugins de ChatGPT
1.Basado en Uso
1. Cobro según la cantidad de tokens (texto) procesados.
2. Precios específicos para entrada/salida en GPT-4 Turbo
y otros modelos.
3. Ejemplo: GPT-4 Turbo más económico que GPT-4
estándar.
2.Imagen y Audio
1. DALL·E 3: Precio por imagen generada.
2. Text-to-Speech: Costo por 1,000 caracteres de entrada.
3. Whisper y OpenAI Lens: Tarifas basadas en el
procesamiento y análisis de datos.