OpenAI quiere prevenir el riesgo de la superinteligencia artificial… haciendo que otras IAs la supervisen

OpenAI, la empresa de IA desarrolladora de ChatGPT, habla —en un artículo publicado hace unas horas— de apostar por el 'superalineamiento'. Recordemos que 'alineamiento' es el nombre que designa al proceso de asegurarnos de que el comportamiento de una IA se ajusta a las expectativas humanas (de cara a evitar un potencial comportamiento 'poco ético' de la misma o, peor, una rebelión a lo Skynet).

Pero, ¿qué es el 'superalineamiento', entonces? Pues el alineamiento de la 'superinteligencia artificial' o ASI, claro. El divulgador de IA español Carlos Santana señala en un hilo de Twitter que, "desde hace un par de artículos, [OpenAI] ya no habla tanto de AGI, sino del siguiente escalón que es la ASI. Dicen que la ven lejos… pero que se podría alcanzar en esta década".

"Como siempre con OpenAI, este post cae en esa franja difusa en la que no sabemos si realmente se creen su relato del desarrollo acelerado de la IA o si es una hipérbole más para atraer atención e interés en lo que realmente quieren, que en este caso es contratar".

'Who watches the watch-AIs?'

Actualmente, este proceso de alineamiento depende en gran medida de la intervención humana, en la que los etiquetadores generan una enorme cantidad de ejemplos de conversaciones y comportamientos deseados… pero al depender de un equipo limitado de personas (y aquí es más importante el término 'personas' que 'limitado') se genera un cuello de botella en el proceso.

Y por eso, el objetivo de OpenAI es lograr la automatización de dicho proceso de en los próximos cuatro años. Es decir, crear IAs que puedan encargarse de 'adiestrar' otras IAs generando los citados ejemplos. Algo parecido a usar GPT-4 para 'descifrar las neuronas' de GPT-2. En palabras de Santana:

"No es nada loco esto de automatizar todos estos procesos. De hecho, es lo más lógico si queremos ser capaces de explicar y alinear el comportamiento de IAs que cada vez serán más potentes".
Un vistazo a…
ZAO, la APP MÓVIL china que a través de DEEPFAKE te convierte en DICAPRIO en SEGUNDOS

Lo importante no es sólo la meta, también el camino

Pero no buscan sólo la automatización, sino algo más importante:

"Supervisar y alinear a la IA ya no sólo en el resultado esperado, sino también en el proceso que le ha llevado a dicho resultado […] para evitar riesgos donde cumpla un objetivo, pero mediante pasos no deseados por nosotros".

Esto, según menciona Santana, nos alejaría del escenario de la 'fábrica automática de clips' planteado por el filósofo Nick Bostrom, que en 2014 explicó que una orden inocente de 'fabricar todos los clips posibles' podría derivar en que la IA responsable de la fábrica decidiera acabar con todos los humanos porque

  1. alguno podría apagarla, impidiendo fabricar clips
  2. están compuestos de átomos, materia prima de los clips.

Imagen | Marcos Merino mediante IA

En Genbeta | Con GPT-4 tenemos una bomba nuclear entre manos. En 2019, OpenAI no permitió acceder a su antepasado por ser "muy peligroso"

Ver todos los comentarios en https://www.genbeta.com

VER 3 Comentarios

Portada de Genbeta