El nuevo modelo de lenguaje de OpenAI sorprende por su rapidez y eficacia a la hora de realizar tareas mucho más complejas
OpenAI presentó ayer mismo por sorpresa una nueva serie de modelos de lenguaje mucho más avanzados a los que estábamos acostumbrados con la serie GPT. Bautizado como ‘o1’, nos promete atajar problemas mucho más difíciles y sofisticados mientras obtiene una mayor ‘capacidad de razonamiento’.
La idea de la empresa es simular el proceso del pensamiento humano, constituyendo un gran avance en comparación al resto de modelos de lenguaje. Google, Meta y compañía estaban peligrosamente cerca con sus modelos de lenguaje y OpenAI ha vuelto a dar un empujón para demostrar que sigue en la vanguardia de las tecnologías de inteligencia artificial generativa.
Desde apps en 10 minutos hasta juegos 3D en menos de 1
La versión ‘preview’ de este nuevo modelo de lenguaje ya la han podido probar algunos usuarios, por lo que en Internet hemos presenciado algunos ejemplos de lo que sería capaz este modelo de lenguaje. Tal y como nos han podido demostrar algunas personas como Ammaar Reshi, jefe de diseño de ElevenLabs (la herramienta que permite clonar la voz de forma muy realista), o1 es todo un prodigio de la programación.
En el ejemplo que ha compartido Reshi, vemos cómo ha desarrollado una aplicación completa para iOS en tan solo 10 minutos. Para ello, solamente ha necesitado o1 y Cursor Composer, que es un IDE diseñado para trabajar en conjunto con IA generativa.
La aplicación que ha diseñado es una app para obtener información del tiempo atmosférico, simple, pero con animaciones y bien limpia. Al principio utilizó o1-mini para comenzar el proyecto, aunque más adelante pasó a la versión más ampliada para completar con todo el código.
Esto no ha sido todo lo que pudo desarrollar con o1 en cuestión de minutos. Y es que Reshi también se animó a desarrollar una versión alternativa del juego Snake en 3D. Esto es más loco aún, ya que tan solo tardó un minuto en tener el juego listo para compilar. Para ello tan solo necesitó un prompt y o1 se encargó de mostrar todo el código y los pasos necesarios para hacer que funcione. En este caso utilizó el IDE online de Replit para compilar el juego.
Estos son solo algunos ejemplos para demostrar que o1 es significativamente más rápido y eficaz a la hora de realizar tareas que requieran de un 'razonamiento más profundo'. En programación demuestra mucho más potencial, y está claro que a partir de este momento será una herramienta muy a tener en cuenta por muchos desarrolladores.
El nuevo modelo o1 ha sido entrenado mediante la técnica ‘aprendizaje por refuerzo’, donde el sistema aprende a resolver problemas recibiendo recompensas y penalizaciones por sus acciones. Según Noam Brown, investigador de OpenAI, lo que diferencia a o1 de otros modelos es su capacidad de 'pensar' antes de responder. En pruebas realizadas por OpenAI, o1 demostró su capacidad para resolver el 83% de los problemas planteados en el examen clasificatorio de la Olimpiada Internacional de Matemáticas, en comparación con el 13% alcanzado por GPT-4o.
Cabe destacar que o1 será más lento que GPT-4o si las tareas no requieren de un razonamiento profundo. Además, el coste para los desarrolladores por cada millón de tokens es significativamente superior: 'o1-preview' cuesta $15 por cada millón de tokens de entrada y $60 por cada millón de tokens de salida, mientras que 'GPT-4o' tiene un precio de $5 y $15, respectivamente.
El modelo o1-preview y o1-mini ya se encuentra disponible para usuarios de ChatGPT Plus y Team. Aún no hay información sobre si este modelo acabará llegando para el resto de usuarios, por lo que toca esperar para conocer más detalles al respecto.
Imagen de portada | OpenAI
En Genbeta | China ya tiene su propio Jarvis: una superapp con IA que acompañará a los usuarios en todo momento
Ver todos los comentarios en https://www.genbeta.com
VER 2 Comentarios