Meta acaba de lanzar Llama 3.1, una nueva versión de su modelo de lenguaje con capacidad de hasta 405.000 millones de parámetros
Según Meta, esta IA es open-source y las pruebas la ponen por encima de GPT-4o o Claude 3.5 Sonnet en algunos benchmarks
Meta, empresa detrás de algunas de las aplicaciones más utilizadas en el mundo como WhatsApp, Facebook o Instagram, acaba de lanzar su modelo de lenguaje más avanzado hasta la fecha: Llama 3.1. Desde hace un tiempo, la compañía ha estado trabajando en ampliar sus horizontes en lo que respecta a tecnologías basadas en inteligencia artificial generativa. Si bien OpenAI sigue a la vanguardia de este sector con ChatGPT, Meta es otra de las compañías que apuesta fuertemente por modelos de lenguaje similares que permiten el funcionamiento de herramientas con IA.
El nuevo modelo insignia de Meta rivaliza con las propuestas más avanzadas del mercado, como lo son GPT-4o o Claude 3.5 Sonnet. Además, según Meta, se caracteriza por ser un modelo de lenguaje open-source, lo que implica que cualquiera puede utilizar y modificar su código para todo tipo de propósitos.
Llega Llama 3.1, el modelo de lenguaje más avanzado de Meta hasta la fecha
Este nuevo modelo de lenguaje está ya presente en Meta AI, el asistente de IA que se encuentra en aplicaciones tales como WhatsApp, Facebook o Instagram. Este asistente se encuentra ahora mismo disponible en 22 países, y recientemente se ha incorporado en Argentina, Chile, Colombia, Ecuador, México, Perú y Camerún. Sin embargo, el asistente aún no está disponible para España ni para ningún país de la Unión Europea. Esto no impide que cualquiera pueda instalar Llama 3.1 en local y probar sus funcionalidades.
Sabemos que todos los modelos de lenguaje tienen sus puntos fuertes y otros más flojos. Ninguno es perfecto, pero el nuevo modelo de Meta ha demostrado destacar, sobre todo, en conocimientos generales, matemáticas, uso de herramientas y traducción multilingüe. Y es que según los resultados de las pruebas aportadas por Meta, Llama 3.1 cuenta con una versión de hasta 405.000 millones de parámetros.
Llama 3.1 puede hacer frente a modelos de lenguaje tan avanzados como GPT-4o o Claude 3.5 Sonnet en determinados apartados, según las pruebas realizadas por la compañía. Además, el modelo es completamente escalable, habiendo sido lanzado en otras versiones más pequeñas y con menos parámetros. Por ejemplo, Llama 3.1 70B apunta a la creación de contenido, IA conversacional, comprensión de idiomas y aplicaciones empresariales, entre otros usos.
Por otro lado está Llama 3.1 8B, que es el más pequeño y puede ejecutarse en local en ordenadores algo menos potentes. Según la compañía, este modelo será útil sobre todo para análisis y clasificación de textos, además de que destaca principalmente en la velocidad de las respuestas. Quizá sea la alternativa más eficaz ante la última propuesta de OpenAI en cuanto a modelos de lenguaje reducidos: GPT-4o Mini.
Tampoco es sorpresa que Meta esté celebrando este desarrollo como una propuesta open-source. Si bien muchos usuarios de la comunidad no están de acuerdo en que se utilice este término para los modelos de Meta, Zuckerberg ha publicado una carta expresando que “la IA de código abierto es el camino a seguir” y que los modelos de código abierto son cada vez mejores y que acabarán superando a los modelos cerrados en algún momento.
Para preparar a Llama 3.1 405B se ha requerido de varios meses de entrenamiento a través de 16.000 tarjetas gráficas NVIDIA GPU H100. Meta además permite que las empresas y otros desarrolladores puedan entrenar este modelo con datos personalizados para así ajustarlo a sus necesidades.
A pesar de que exista la posibilidad de ejecutar este modelo en local (algo de lo que requiere de un gran procesamiento gráfico del equipo), el modelo también estará disponible para su uso a través de herramientas de computación en la nube como AWS, Google Cloud, Microsoft Azure o Databricks.
La estricta regulación de la Unión Europea ante las tecnologías de inteligencia artificial hace que todavía no sea posible disfrutar de este modelo en este territorio. Esto no es nuevo, ya que muchas empresas están posponiendo sus lanzamientos en esta región para cerciorarse de que cumplen con toda la normativa antes de su llegada a la Unión Europea.
En el caso de Meta, hace unos días anunciaron que su próximo modelo multimodal no llegaría a la Unión Europea debido a “la naturaleza impredecible del entorno regulatorio europeo”. Para matizar, podremos usar Llama 3.1 en local desde cualquier territorio, pero si queremos acceder al modelo a través de ciertas herramientas, como por ejemplo Meta AI, esto no será posible desde la Unión Europea. De momento queda esperar para conocer más información al respecto.
En Genbeta | Bill Gates pronostica el declive de la IA actual y se prepara para su futuro: una IA "metacognitiva"
Ver todos los comentarios en https://www.genbeta.com
VER 1 Comentario