Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El acceso al servicio está limitado en países como China, Rusia,[5] Irán, y partes de África.[6]
Características
Editar
ChatGPT, cuyas siglas proceden del inglés Generative Pre-trained Transformer (en español
Transformador Preentrenado Generativo), se perfeccionó sobre GPT-3.5 mediante el
aprendizaje supervisado y el aprendizaje por refuerzo.[7] Ambos enfoques utilizaron
entrenadores humanos para mejorar el rendimiento del modelo. En el caso del aprendizaje
supervisado, se dotó al modelo de conversaciones en las que los formadores jugaban en
ambos lados: el usuario y el asistente de IA. En el caso de refuerzo, los entrenadores humanos
primero clasificaron las respuestas que el modelo había creado en una conversación anterior.
Estas clasificaciones se usaron para crear “modelos de recompensa” en los que el modelo se
ajustó aún más usando varias iteraciones de optimización de política próxima (PPO).[1][8] Los
algoritmos de optimización de políticas proximales presentan un beneficio rentable para
confiar en los algoritmos de optimización de políticas de región; niegan muchas de las
operaciones computacionalmente costosas con un rendimiento más rápido.[9][10] Los
modelos fueron entrenados en colaboración con Microsoft en su infraestructura de
supercomputación Azure.
El 17 de enero de 2023 Microsoft anunció que van a implementar ChatGPT como API en sus
servicios de Azure.[15]