Obviamente, no se trata de la IA lanzada hace cinco años, dado que supera en algunos aspectos a GPT-4
En las últimas horas, lmsys.org (una famosa plataforma de valoración y comparación de modelos de IA) ha presentado una inesperada novedad que está captando la atención de expertos y entusiastas en inteligencia artificial: un modelo denominado "gpt2-chatbot".
A pesar de su nombre, que haría pensar en una versión de GPT-2 (bastante obsoleta, dado que actualmente ChatGPT usa ya GPT-4), realmente las evidencias apuntan a que podría tratarse de una versión experimental mucho más avanzada, quizás incluso del GPT-4.5 o GPT-5.
Y es que el supuesto "gpt2-chatbot" ha demostrado capacidades que superan ampliamente lo esperado para una iteración de GPT-2. Según usuarios de LMSYS, este modelo muestra un nivel de razonamiento y comprensión del lenguaje que podría suponer incluso una mejora con respecto a GPT-4.
Además, maneja con sorprendente éxito preguntas que suponen todo un 'dolor de cabeza' para otros modelos, ya consolidados.
Sospechas de un test encubierto
No existe información oficial sobre este modelo en LMSYS ni en otras fuentes, lo que alimenta la teoría de que podría ser una prueba encubierta de OpenAI.
La empresa podría estar utilizando este lanzamiento discreto para: evaluar su última generación de modelos en un entorno no sesgado, sin revelar su presencia, para obtener respuestas más naturales y evitar la influencia de expectativas previas o la competencia.
Además, el modelo en cuestión utiliza el tokenizador "tiktoken" de OpenAI y muestra resistencia a los tokens especiales utilizados por otros modelos competidores como Claude, Llama o Gemini... esto sugiere un diseño específico y altamente adaptado a los estándares de OpenAI.
Además, cuando se le pregunta amablemente al propio modelo de IA, éste afirma ser "ChatGPT, de OpenAI"... aunque eso podría deberse tanto al uso de datos sintéticos de OpenAI como a que estuviéramos realmente ante un nuevo modelo de IA.
Además, presenta un límite diario de interacciones por usuario (8, concretamente) notablemente más bajo que otros modelos como GPT-4, lo que podría indicar tanto un computacional superior como una preferencia por evaluarlo en modos de interacción más controlados.
¿Cómo probarlo?
- Conéctate a LMSYS, y accede a 'Direct Chat', y selecciona el modelo en cuestión:
- Empieza a escribir tu prompt. Nosotros hemos querido poner a prueba el 'test de la manzana'. Éxito total:
Imagen | Marcos Merino mediante IA
En Genbeta | GPT-4 es brillante pero muy lento. Ahora puedes usar gratis una IA similar cientos de veces más rápida
Ver todos los comentarios en https://www.genbeta.com
VER 4 Comentarios