"Hemos llegado al límite": para Elon Musk ya no hay más datos humanos para seguir entrenando IA

El uso de datos sintéticos para entrenar la IA puede causar grandes problemas

Elon Musk
Sin comentarios Facebook Twitter Flipboard E-mail

La inteligencia artificial es realmente útil para todas las tareas cotidianas que hacemos, y también en las tareas más profesionales. Esta capacidad es gracias al entrenamiento que hay detrás de las IA y que desde siempre ha generado una gran polémica por no contar con los permisos de toda la información que se usa de la red. Pero hemos llegado a un punto donde ya no hay suficientes datos para entrenar al modelo de IA.

Tal y como recogió TechCrunch, el CEO de X Elon Musk ha afirmado que hemos llegado al límite de datos del mundo real para poder entrenar a los modelos de IA. Algo que no es de hace unos días, ya que es una situación a la que se llegó ya en el año 2024.

La IA comenzará a entrenarse con datos sintéticos

El propio Musk ha tenido en cuenta las palabras de Ilya Sutskever, antiguo jefe científico de OpenAI determinó que se había llegado a un "pico de datos" que hace referencia a este "techo" al que ha llegado la inteligencia artificial. Incluso las estimaciones apuntan a que el 60% de los datos utilizados eran sintéticos.

Solen Feyissa Gzyelvkomi0 Unsplash

Si ya no hay datos humanos como grabaciones, imágenes o textos con los que entrenar la IA... ¿Qué va a pasar con ella? Lo que vamos a ver a partir de ahora es el uso de datos sintéticos para hacer este entrenamiento, es decir, datos que han sido generados por la propia IA para entrenarse a ella misma. De esta manera, la IA se evaluará "a si misma y pasará por este proceso de autoaprendizaje".

Pero usar la IA no es algo inocuo. El uso de estos datos sintéticos, según los investigadores, puede provocar que los modelos colapsen. Precisamente aquí les faltaría creatividad y aumentarían las distorsiones en las respuestas que van generando, porque se estaría en un auténtico bucle en el que ellas mismas se están entrenando con sus datos.

Y es que si ahora mismo los resultados de la IA presentan distorsiones, al entrenarse con estas va a generar que los resultados cada vez sean de peor calidad. Aquí es donde ahora las grandes empresas de IA tienen un reto para superar este obstáculo.

Imágenes | Flickr

En Genbeta | OpenAI da las claves de ChatGPT: estas son las seis estrategias de uso para conseguir los mejores resultados

Inicio