China ya tiene IA que supera a GPT-4 Turbo, pero destaca en algo más importante: sus modelos abiertos

Los modelos de Qwen, que son la versión open-source de la propuesta de Alibaba, ya superan a GPT-4 Turbo, según un test llevado a cabo por SuperClue

ia
Sin comentarios Facebook Twitter Flipboard E-mail

El lanzamiento de ChatGPT supuso una fuerte disrupción en la industria tecnológica. Tanto fue así, que hoy día es raro que cualquier producto o servicio de muchas empresas del sector no incluyan tecnologías de inteligencia artificial generativa. Los logros cosechados por estas empresas han dado lugar a que Estados Unidos consiga estar a la vanguardia de la innovación en este segmento.

A pesar de que ha sido un duro golpe para China, el dominio de Estados Unidos ha provocado la motivación de este país por conseguir grandes resultados también en este sector. Prueba de ello son su superordenador 100% fabricado a partir de componentes chinos para entrenar sus modelos de lenguaje, el dominio del país en cuanto al número de patentes y documentos científicos publicados sobre la materia, o su cada vez más notoriedad ante el lanzamiento de modelos de lenguaje open-source.

China se acerca cada vez más a los modelos de lenguaje de IA top

Hace un tiempo hablábamos sobre las alternativas que contaba China frente a ChatGPT. Estas alternativas no llegaban al nivel de la herramienta de OpenAI, pero con el tiempo han evolucionado considerablemente. Uno de los grandes conglomerados que ha invertido enormes esfuerzos económicos por elaborar una herramienta a la altura ha sido Alibaba.

Actualmente, Qwen2 es uno de los modelos más destacados del país, y se encuentra a un nivel muy cercano a las últimas propuestas de OpenAI y Anthropic. Concretamente, su versión de 72.000 millones de parámetros y modelo open-source, se ha posicionado tan solo un poco por detrás de GPT-4o y Claude 3.5 Sonnet, que son actualmente los modelos de lenguaje más destacados de las empresas estadounidenses.

El ranking lo ha llevado a cabo SuperClue, una plataforma de benchmarking que evalúa modelos de lenguaje basándose en métricas de calculación, razonamiento lógico, código, comprensión de texto y más parámetros.

Entre el ranking, además del modelo de Alibaba, también se encontraban los de la startup Deepseek, la propuesta de SenseTime, El modelo de Oppo, y una propuesta nacida de la colaboración entre la Universidad de Tsinghua y la startup Zhipu AI. Todos ellos sobrepasaron a GPT-4 Turbo según las pruebas de SuperClue, que si bien no es el modelo más reciente de OpenAI, sí se trata de uno de los más potentes.

Todo indica a que el desempeño de los modelos de lenguaje chinos está acercándose cada vez más a las propuestas más destacadas de OpenAI o Anthropic. Los esfuerzos están dando sus frutos y en tan solo unos meses, China ha conseguido grandes avances en este sector.

Los modelos de Qwen son especialmente buscados dentro de la comunidad open-source. De hecho, en palabras de Clement Delangue, CEO y cofundador de la plataforma Hugging Face, "Qwen 72B es el rey y los modelos abiertos chinos dominan en general". Y es que del top 10 de modelos de lenguaje de Hugging Face, tres modelos de Qwen se encontraban en esta lista.

Cabe destacar que Hugging Face es el hogar de los modelos de lenguaje abiertos, por lo que la plataforma no hace pruebas de modelos cerrados como los de OpenAI o Google. Otro test llevado a cabo por LMSYS, una organización de investigación de modelos de IA apoyada por la Universidad de California, Berkeley, situaba a Qwen2-72B en posición número 20.

Por el momento, está claro que sigue habiendo dominio de los modelos cerrados estadounidenses en cuanto a rendimiento. Sin embargo, la presencia de China en este sector cada vez es más fuerte, y no es la primera vez que el país demuestra un rápido crecimiento en este y muchos otros sectores.

Imagen de portada | Growtika

En Genbeta | China llegó tarde a ChatGPT y otras IA. Pero va ganando a EE.UU y Europa en algo muy importante: usarlas de verdad en el día a día

Inicio