0 calificaciones0% encontró este documento útil (0 votos)
17 vistas1 página
ChatGPT funciona mediante el aprendizaje por refuerzo con retroalimentación humana, donde los formadores de IA mantienen conversaciones con el chatbot y clasifican las mejores respuestas para que aprenda patrones del lenguaje a partir de un gran conjunto de datos de texto.
ChatGPT funciona mediante el aprendizaje por refuerzo con retroalimentación humana, donde los formadores de IA mantienen conversaciones con el chatbot y clasifican las mejores respuestas para que aprenda patrones del lenguaje a partir de un gran conjunto de datos de texto.
ChatGPT funciona mediante el aprendizaje por refuerzo con retroalimentación humana, donde los formadores de IA mantienen conversaciones con el chatbot y clasifican las mejores respuestas para que aprenda patrones del lenguaje a partir de un gran conjunto de datos de texto.
ChatGPT se creó a partir de la técnica de inteligencia artificial conocida
como Human Feedback Reinforcement Learning (RLHF). Según OpenAI, el proceso de entrenamiento de la herramienta consiste en alimentar al chatbot con un gran conjunto de datos de texto y luego usar esa información para aprender patrones dentro del lenguaje. Para ello, formadores de IA humana realizaron conversaciones en las que participaban ambos lados, tanto el usuario (pregunta) como si fuera el asistente virtual (respuestas). Después de varias interacciones, los capacitadores clasifican las mejores conversaciones para que la herramienta aprenda a generar textos similares.