Meta anunció recientemente su modelo de lenguaje más avanzado hasta la fecha: Llama 3.1. Según las pruebas realizadas por la compañía, la versión más avanzada de su modelo compite hasta con GPT-4o o Claude 3.5 Sonnet, que son hasta ahora las propuestas más completas de la industria. Junto a todo ello, cabe destacar que Meta insiste en el carácter abierto de sus modelos. Y es que a pesar de que muchos usuarios duden de que Llama sea un modelo ‘open-source’, para Mark Zuckerberg, “es el camino a seguir”.
El nuevo modelo de lenguaje ya está presente en Meta AI, el asistente de IA existente en apps como WhatsApp, Instagram o Facebook. Esta herramienta aún no está disponible en países de la Unión Europea, pero Meta ha publicado su código para que podamos instalarlo en local.
Alibaba y Tencent ya han añadido Llama 3.1 a sus respectivas plataformas en la nube
A raíz de este lanzamiento, en China también se han puesto manos a la obra con este modelo. Y es que según el medio South China Morning Post, grandes conglomerados como Alibaba o Tencent ya han incluido a Llama 3.1 en sus plataformas en la nube. Desde hace un tiempo, los modelos de lenguaje de Meta han servido de gran ayuda para que múltiples empresas chinas puedan desarrollar sus herramientas de inteligencia artificial generativa.
En el caso de Alibaba, Llama 3.1 ya se encuentra en su plataforma de entrenamiento de modelos Bailian. De hecho, la compañía ha ofrecido hasta un mes gratis de recursos computacionales que pueden ser utilizados para entrenar y modificar Llama 3.1.
Tencent, por su parte, también ha anunciado que Llama 3.1 se encuentra ya disponible en su plataforma en la nube. El gigante del videojuego aseguraba que el modelo ha sido modificado para que pueda ser utilizado en un buen número de áreas, entre ellas conversaciones, generación de texto y tareas de escritura.
Meta ofrece su modelo en tres versiones: 405B, 70B y 8B. Según Meta, el primero de ellos ha sido entrenado durante meses con 16.000 tarjetas gráficas NVIDIA GPU H100. Es el más potente de todos y cuenta (tal y como nos da pistas su propio nombre) con 405.000 millones de parámetros.
Los modelos de Llama suelen considerarse como los más potentes dentro de la lista de modelos open-source. De hecho, para las empresas chinas se ha convertido como el modelo de lenguaje a utilizar por defecto, ya que les permite desarrollar de forma sencilla sus propios productos basados en IA generativa.
Sin embargo, no es la primera vez que varios expertos del país advierten sobre la dependencia de los modelos de Meta, pues a fin de cuentas es otra gran empresa estadounidense, país del que precisamente quiere alejarse China en un buen número de segmentos.
Para Zuckerberg, los modelos abiertos son “el camino a seguir”, ya que admite que “la descentralización y la innovación” aventajan a Estados Unidos. Si bien los modelos cerrados suelen estar siempre por encima en cuanto a rendimiento, Zuckerberg espera que este margen sea cada vez más pequeño.
Según el ranking de LMSYS, organización especializada en la investigación de modelos de IA que cuenta con el apoyo de la Universidad de California, Berkeley, los últimos modelos de lenguaje de OpenAI, Anthropic y Google se sitúan en las tres primeras posiciones.
Imagen de portada | Meta
En Genbeta | China opta por el secretismo ante sus superordenadores para IA. Tienen razones para temer quedarse atrás
Ver 2 comentarios