El aprendizaje reforzado humano podría significar una IA ‘más veraz y menos tóxica’

AI ha estado dando grandes saltos en términos de investigación científica, y compañías como Nvidia y Meta continúan dedicando más recursos a la tecnología. Pero el aprendizaje de IA puede tener un revés bastante grande cuando adopta los prejuicios de quienes lo hacen. Como todos esos chatbots que terminan arrojando discursos de odio gracias a su exposición a los delincuentes en línea.

Según Golem, OpenAI podría haber avanzado en eso con su nuevo sucesor del GPT-3, el modelo de lenguaje autorregresivo que utiliza el aprendizaje profundo en un esfuerzo por parecer humano en el texto. Escribió este artículo, si quieres un ejemplo de cómo funciona.

Sugerencias y consejos

El aprendizaje reforzado humano podría significar una IA ‘más veraz y menos tóxica’

(Crédito de la imagen: futuro)

Cómo comprar una tarjeta gráfica : consejos para comprar una tarjeta gráfica en el árido paisaje de silicio que es 2021

Pero GPT-3 también tiene una tendencia a repetir nociones incorrectas, sesgadas o directamente tóxicas gracias a todas las fuentes de información. Estos sesgos afectarían el idioma, lo que provocaría que GPT-3 hiciera suposiciones o implicaciones intolerantes en su redacción. No es muy diferente de los humanos, en el sentido de que todas estas ideas reforzadas pueden parecer verdades fácilmente, y hay muchas nociones obsoletas para elegir. GPT-3 se parece un poco al tío raro con el que no hablas en Facebook.

Se dice que el nuevo InstructGPT es una mejora ya que sus respuestas son “más veraces y menos tóxicas”. Esto se ha logrado gracias al trabajo de los investigadores de Open AI, cuya investigación de alineación ayuda a que la máquina procese las instrucciones con mayor precisión, a pesar de ser mucho más pequeño. InstructGPT utiliza 1.300 millones de parámetros, que es una fracción de los 175.000 millones utilizados por el modelo GPT-3 anterior, pero gracias al aprendizaje reforzado con comentarios humanos, simplemente se ha entrenado mejor. La calidad de las respuestas de InstructGPT es evaluada e informada por los investigadores. , con suerte dándole forma para que sea un mejor bot en general.

See also  Ícaro suaviza su postura sobre la muerte permanente con el seguro de la misión

Dicho esto, aunque InstructGPT parece un paso adelante prometedor, todavía está lejos de ser perfecto. “Todavía generan resultados tóxicos o sesgados, fabrican hechos y generan contenido sexual y violento sin una solicitud explícita”, según los investigadores de OpenAI, pero aún es menor que el GPT-3 anterior. Quizás en unas pocas generaciones veamos una IA de lenguaje que se desenrede un poco más de algunos de los peores aspectos de la humanidad. 

bullfight-doc
bullfight-doc