Conceptos Avanzados de Transformers

Introducción a Conceptos avanzados de Transformers

Cargado por

ferleonmoloney

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

18 vistas1 página

Conceptos Avanzados de Transformers

Introducción a Conceptos avanzados de Transformers

Cargado por

ferleonmoloney

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Otro concepto clave es la codificación posicional.

A diferencia de las RNN, los transformadores procesan todas las palabras a la vez, por lo que
necesitan una forma de conocer el orden. GPT puede aprender este orden a través de embeddings posicionales entrenables (esto es diferente de
los sinusoidales que verás más adelante en BERT/traducción).

Finalmente, construyes un pequeño modelo GPT. Después del entrenamiento, intentas inferencia: alimentando un aviso y dejando que el
modelo genere texto un token a la vez. Esto introduce la idea de generación de texto autorregresiva.

Laboratorio 2: Preentrenamiento de modelos BERT (solo codificador)

Este laboratorio de BERT introduce el lado del codificador de los transformadores. A diferencia de GPT, BERT se centra en leer y entender y no
genera texto paso a paso. En su lugar, observa toda la oración a la vez (de manera bidireccional) y aprende a comprender profundamente el
contexto.

Para entrenar BERT, utilizas dos tareas de preentrenamiento:

Modelado de Lenguaje enmascarado (MLM): Oculta algunas palabras y pide al modelo que las adivine. Esto obliga al modelo a utilizar el
contexto tanto de la izquierda como de la derecha; por ejemplo, en “El perro está persiguiendo el ___”, BERT debe predecir “gato”.
Predicción de la Siguiente Oración (NSP): Proporciona al modelo dos oraciones y pregunta si la segunda sigue lógicamente a la primera.
Esto le ayuda a entender las relaciones entre oraciones, útil en tareas como preguntas y respuestas o resumir.

Embeddings de segmento: Dado que BERT a menudo trabaja con pares de oraciones, los embeddings de segmento ayudan a marcar ‘este token
pertenece a la oración A’ y ‘este a la oración B.’ El entrenamiento muestra cómo BERT aprende representaciones útiles para entender el
lenguaje, no solo para generarlo. Al final, puedes probar el modelo en tareas de pares de oraciones o predicción de palabras enmascaradas.

Lab 3: Modelo Transformer para la traducción de idiomas (codificador-decodificador)

En este laboratorio, combinas ambos mundos: un codificador (como BERT) + un decodificador (como GPT) en un transformador seq2seq
completo. Al igual que un traductor humano, lees toda la oración en alemán y luego produces cuidadosamente las palabras en inglés una por
una, siempre revisando el original.

Este laboratorio demuestra cómo los transformadores pueden mapear una secuencia a otra, no solo generar o entender dentro del mismo
idioma. Las aplicaciones van más allá de la traducción: la resumición, el diálogo e incluso el trabajo de código a texto funcionan de la misma
manera.

Arquitectura Codificador-Decodificador:
Codificador → Lee la oración completa en el idioma fuente (alemán).
Decodificador → Genera la oración objetivo palabra por palabra (inglés). El decodificador mira tanto las palabras pasadas que
generó COMO la oración completa en el idioma fuente.
Para entrenar BERT en PyTorch, preparas las entradas (tokens, segmentos, máscaras) para que el modelo pueda realizar ambas
tareas.
Comparamos la predicción con la palabra real → Calculamos la ‘pérdida’ → Ajustamos el modelo.

Autor(es)
Shilpa Giridhar

También podría gustarte

BERT
Aún no hay calificaciones
BERT
6 páginas
Modelos BERT
Aún no hay calificaciones
Modelos BERT
7 páginas
LLMs BERT
Aún no hay calificaciones
LLMs BERT
27 páginas
N3 S11 S Presentación Transformers
Aún no hay calificaciones
N3 S11 S Presentación Transformers
33 páginas
Ejercicios IA Procesamiento Lenguaje Natural PLN ENTREGAR
Aún no hay calificaciones
Ejercicios IA Procesamiento Lenguaje Natural PLN ENTREGAR
11 páginas
Hugging Face: Modelos y Pipelines AI
Aún no hay calificaciones
Hugging Face: Modelos y Pipelines AI
5 páginas
07MIAR DeepLearning Texto Secuencias1
Aún no hay calificaciones
07MIAR DeepLearning Texto Secuencias1
34 páginas
Redes Transformers
Aún no hay calificaciones
Redes Transformers
25 páginas
Marco Teórico 2.1
Aún no hay calificaciones
Marco Teórico 2.1
11 páginas
Generación Automática de Código con IA
Aún no hay calificaciones
Generación Automática de Código con IA
16 páginas
Language Models 4
Aún no hay calificaciones
Language Models 4
93 páginas
Deep Learning: Transformers y Keras NLP
Aún no hay calificaciones
Deep Learning: Transformers y Keras NLP
13 páginas
BERT: Impacto y Funcionamiento del LLM
Aún no hay calificaciones
BERT: Impacto y Funcionamiento del LLM
1 página
Avances en Procesamiento de Lenguaje Natural
Aún no hay calificaciones
Avances en Procesamiento de Lenguaje Natural
6 páginas
Curso Práctico de Deep Learning con Keras y TensorFlow
Aún no hay calificaciones
Curso Práctico de Deep Learning con Keras y TensorFlow
161 páginas
Introducción a GPT y ChatGPT
100% (2)
Introducción a GPT y ChatGPT
79 páginas
Trabajo Final I.A.
Aún no hay calificaciones
Trabajo Final I.A.
6 páginas
Chat GPT
100% (1)
Chat GPT
28 páginas
Inteligencia Artificial Desarmar La Caja Negra de Los Chatbots
Aún no hay calificaciones
Inteligencia Artificial Desarmar La Caja Negra de Los Chatbots
3 páginas
Tex 1
Aún no hay calificaciones
Tex 1
18 páginas
Session6.1 - Masked Image Modeling
Aún no hay calificaciones
Session6.1 - Masked Image Modeling
23 páginas
Modelos de Deep Learning en Física
Aún no hay calificaciones
Modelos de Deep Learning en Física
27 páginas
Fundamentos de Los Grandes Modelos de Lenguaje Y Aplicación de Técnicas de Prompting en Ias Generativas Equipo Docente
Aún no hay calificaciones
Fundamentos de Los Grandes Modelos de Lenguaje Y Aplicación de Técnicas de Prompting en Ias Generativas Equipo Docente
4 páginas
Oportunidades y Desafíos de IA en Educación
Aún no hay calificaciones
Oportunidades y Desafíos de IA en Educación
12 páginas
Transformers
Aún no hay calificaciones
Transformers
109 páginas
Tema 9. Aplicaciones Del Procesamiento Del Lenguaje Natural
Aún no hay calificaciones
Tema 9. Aplicaciones Del Procesamiento Del Lenguaje Natural
50 páginas
Glosario
Aún no hay calificaciones
Glosario
3 páginas
Aprendizaje Profundo en NLP y Twitter
Aún no hay calificaciones
Aprendizaje Profundo en NLP y Twitter
105 páginas
Deep Learning en Procesamiento de Lenguaje
Aún no hay calificaciones
Deep Learning en Procesamiento de Lenguaje
3 páginas
GPT y Modelos de Lenguaje Extenso
Aún no hay calificaciones
GPT y Modelos de Lenguaje Extenso
9 páginas
Resumen LLM
Aún no hay calificaciones
Resumen LLM
2 páginas
Modelos de Lenguaje y Educación AI
Aún no hay calificaciones
Modelos de Lenguaje y Educación AI
7 páginas
Sistemas de Preguntas y Respuestas NLP
Aún no hay calificaciones
Sistemas de Preguntas y Respuestas NLP
35 páginas
TRANSFORMER ATTENTION IS ALL YOU NEED 1706.03762v7 TRADUCIDO VT 0 DE 64 OK
Aún no hay calificaciones
TRANSFORMER ATTENTION IS ALL YOU NEED 1706.03762v7 TRADUCIDO VT 0 DE 64 OK
15 páginas
Articulo 3
Aún no hay calificaciones
Articulo 3
24 páginas
Hugging Face: Transformadores en NLP
Aún no hay calificaciones
Hugging Face: Transformadores en NLP
2 páginas
Language Models 2 (RNN, LSTM, GRU)
Aún no hay calificaciones
Language Models 2 (RNN, LSTM, GRU)
85 páginas
Portafolio de IA: Redes y Lógica
0% (1)
Portafolio de IA: Redes y Lógica
54 páginas
IA y Asistentes Virtuales en Educación
Aún no hay calificaciones
IA y Asistentes Virtuales en Educación
4 páginas
Manual Tecnico Transformers IA
Aún no hay calificaciones
Manual Tecnico Transformers IA
5 páginas
Arquitectura GPT en 4 Pasos
Aún no hay calificaciones
Arquitectura GPT en 4 Pasos
6 páginas
Attention Is All You Need - Una Revisión A La Arquitectura Transformer
Aún no hay calificaciones
Attention Is All You Need - Una Revisión A La Arquitectura Transformer
8 páginas
Qué Es GPT
Aún no hay calificaciones
Qué Es GPT
26 páginas
Introducción a Transformers en Python
Aún no hay calificaciones
Introducción a Transformers en Python
1 página
Funcionamiento de ChatGPT y PNL
Aún no hay calificaciones
Funcionamiento de ChatGPT y PNL
4 páginas
Aplicaciones del Procesamiento de Lenguaje Natural
Aún no hay calificaciones
Aplicaciones del Procesamiento de Lenguaje Natural
42 páginas
GUIA 5 Legal Prompts para Uso de IA Generativa 10 25
Aún no hay calificaciones
GUIA 5 Legal Prompts para Uso de IA Generativa 10 25
16 páginas
1 Introduccion A LLM
Aún no hay calificaciones
1 Introduccion A LLM
11 páginas
NLU - Estado de La Cuestión
Aún no hay calificaciones
NLU - Estado de La Cuestión
36 páginas
Resumen Del Video de Sofìa Vega
Aún no hay calificaciones
Resumen Del Video de Sofìa Vega
1 página
Articulo 1 NLP Transformers
Aún no hay calificaciones
Articulo 1 NLP Transformers
4 páginas
Introducción a Sentence Embedding en Keras
Aún no hay calificaciones
Introducción a Sentence Embedding en Keras
12 páginas
Modelos de Lenguaje: Evolución y Usos
Aún no hay calificaciones
Modelos de Lenguaje: Evolución y Usos
2 páginas
Tfg-B. 1562
Aún no hay calificaciones
Tfg-B. 1562
119 páginas
5 - LSTM
Aún no hay calificaciones
5 - LSTM
22 páginas
Investigación sobre Modelos LLM y su Futuro
Aún no hay calificaciones
Investigación sobre Modelos LLM y su Futuro
5 páginas
4 - RNN
Aún no hay calificaciones
4 - RNN
20 páginas
Modelos Secuenciales
Aún no hay calificaciones
Modelos Secuenciales
17 páginas
Chatbot LSTM con Aprendizaje Reforzado
Aún no hay calificaciones
Chatbot LSTM con Aprendizaje Reforzado
9 páginas
Clase 1 Estados Evolución
Aún no hay calificaciones
Clase 1 Estados Evolución
12 páginas
Opcional - Creación de Una AWS Lambda
Aún no hay calificaciones
Opcional - Creación de Una AWS Lambda
5 páginas
FALSAS DENUNCIAS Conceptos Básicos
100% (1)
FALSAS DENUNCIAS Conceptos Básicos
9 páginas
Juego de Atención Ejercicios
Aún no hay calificaciones
Juego de Atención Ejercicios
9 páginas
Mejorar Javascript
Aún no hay calificaciones
Mejorar Javascript
6 páginas
Corazon Energetico Traduccion Completa
Aún no hay calificaciones
Corazon Energetico Traduccion Completa
15 páginas
Trabajo en Comandos Red
Aún no hay calificaciones
Trabajo en Comandos Red
5 páginas
Resumen Del Proyecto de Prácticas
Aún no hay calificaciones
Resumen Del Proyecto de Prácticas
1 página
12 Spring Boot
Aún no hay calificaciones
12 Spring Boot
68 páginas
Proyecto de Práctica - Introducción
Aún no hay calificaciones
Proyecto de Práctica - Introducción
2 páginas
Glosario Aprendizaje Por Refuerzo
Aún no hay calificaciones
Glosario Aprendizaje Por Refuerzo
1 página
Hoja de Trucos Git
Aún no hay calificaciones
Hoja de Trucos Git
7 páginas
Aprendizaje Automatico
Aún no hay calificaciones
Aprendizaje Automatico
4 páginas
Laboratorio Permisos
Aún no hay calificaciones
Laboratorio Permisos
2 páginas
Proyecto Final - Visión General y Criterios de Evaluación
Aún no hay calificaciones
Proyecto Final - Visión General y Criterios de Evaluación
2 páginas
Proyecto 2
Aún no hay calificaciones
Proyecto 2
8 páginas
Apunte - Dinamica Sistemas Físicos
Aún no hay calificaciones
Apunte - Dinamica Sistemas Físicos
289 páginas
Licencias de Software de Código Abierto
Aún no hay calificaciones
Licencias de Software de Código Abierto
3 páginas
Glosario Keras
Aún no hay calificaciones
Glosario Keras
1 página
Proyecto
Aún no hay calificaciones
Proyecto
1 página
Evolución de Linux y otros SOs
Aún no hay calificaciones
Evolución de Linux y otros SOs
4 páginas
Semana 1 Florence Scovel Shinn
100% (1)
Semana 1 Florence Scovel Shinn
1 página
wscf2022 ns3
Aún no hay calificaciones
wscf2022 ns3
51 páginas
LOS 7 CHAKRAS PDF by David Leyton
Aún no hay calificaciones
LOS 7 CHAKRAS PDF by David Leyton
10 páginas
Laboratorio Docker
Aún no hay calificaciones
Laboratorio Docker
5 páginas
Aplicaciones de Código Abierto en Linux
Aún no hay calificaciones
Aplicaciones de Código Abierto en Linux
15 páginas
DocEs1 05
Aún no hay calificaciones
DocEs1 05
3 páginas
Doc-2.3 Instalación de Una Aplicación Web
Aún no hay calificaciones
Doc-2.3 Instalación de Una Aplicación Web
3 páginas
Doc-2.5 Securizando IIS
Aún no hay calificaciones
Doc-2.5 Securizando IIS
5 páginas
Doc-1.2 Principales Aplicaciones de Código Abierto
Aún no hay calificaciones
Doc-1.2 Principales Aplicaciones de Código Abierto
4 páginas
Instrucción Bíblica Generacional
Aún no hay calificaciones
Instrucción Bíblica Generacional
13 páginas
1GUÍA Revise Su "PRIMER BORRADOR" 2
Aún no hay calificaciones
1GUÍA Revise Su "PRIMER BORRADOR" 2
3 páginas
Englis III Final
Aún no hay calificaciones
Englis III Final
3 páginas
Vendedoras de Empanadas en 1810
Aún no hay calificaciones
Vendedoras de Empanadas en 1810
9 páginas
Especialidades del Desarrollador Web
Aún no hay calificaciones
Especialidades del Desarrollador Web
2 páginas
Sesión de Aprendizaje #15: Diseño de Sesión de Aprendizaje en L2 para V Ciclo (Comprensión de Texto)
Aún no hay calificaciones
Sesión de Aprendizaje #15: Diseño de Sesión de Aprendizaje en L2 para V Ciclo (Comprensión de Texto)
9 páginas
Confesiones de Fe en la Iglesia Presbiteriana
Aún no hay calificaciones
Confesiones de Fe en la Iglesia Presbiteriana
2 páginas
5 Tecnicas de Lectura Critica - Propuestas Por Daniel Cassany
100% (1)
5 Tecnicas de Lectura Critica - Propuestas Por Daniel Cassany
3 páginas
Claves para una Argumentación Efectiva
Aún no hay calificaciones
Claves para una Argumentación Efectiva
1 página
Biografía de Juan Montalvo
42% (12)
Biografía de Juan Montalvo
7 páginas
Frank Stagg - La Doctrina de Cristo
100% (2)
Frank Stagg - La Doctrina de Cristo
156 páginas
Una Decision Que Marca Tu Vida 2
Aún no hay calificaciones
Una Decision Que Marca Tu Vida 2
16 páginas
Practica de Los Paronimos
Aún no hay calificaciones
Practica de Los Paronimos
5 páginas
63 Document
Aún no hay calificaciones
63 Document
276 páginas
La Paternidad de Dios
Aún no hay calificaciones
La Paternidad de Dios
2 páginas
Puntos Sobresalientes de Biblia - Daniel 10 A 12
100% (3)
Puntos Sobresalientes de Biblia - Daniel 10 A 12
4 páginas
Himno Nacional Paraguayo
Aún no hay calificaciones
Himno Nacional Paraguayo
12 páginas
Ensayo sobre Árboles Binarios en Informática
Aún no hay calificaciones
Ensayo sobre Árboles Binarios en Informática
13 páginas
Ejercicios Resueltos de Conveccion Forzada
Aún no hay calificaciones
Ejercicios Resueltos de Conveccion Forzada
3 páginas
Each Every Whole All
Aún no hay calificaciones
Each Every Whole All
3 páginas
Plan Lector de Aula 2024 para Primaria
100% (1)
Plan Lector de Aula 2024 para Primaria
66 páginas
Pésaj: La Pascua Judía y su Significado
Aún no hay calificaciones
Pésaj: La Pascua Judía y su Significado
2 páginas
Tesis - El Templo de Dios y La Fidelidad Del Pueblo
Aún no hay calificaciones
Tesis - El Templo de Dios y La Fidelidad Del Pueblo
6 páginas
Mapeos y Transformaciones Conformes
Aún no hay calificaciones
Mapeos y Transformaciones Conformes
24 páginas
Taller de Álgebra Lineal: Vectores y Espacios
Aún no hay calificaciones
Taller de Álgebra Lineal: Vectores y Espacios
2 páginas
Aristófanes y el Origen de la Comedia
Aún no hay calificaciones
Aristófanes y el Origen de la Comedia
40 páginas
Hablar en Lenguas
100% (1)
Hablar en Lenguas
19 páginas
Novena de Navidad: Tradición y Oraciones
Aún no hay calificaciones
Novena de Navidad: Tradición y Oraciones
8 páginas
Teorías del Aprendizaje Comparadas
100% (2)
Teorías del Aprendizaje Comparadas
2 páginas
Funciones de Excel: Fecha y Lógica
100% (1)
Funciones de Excel: Fecha y Lógica
101 páginas