Meta, la empresa propietaria de Facebook, Instagram y WhatsApp, ha presentado este pasado fin de semana su última gran novedad en el campo de la inteligencia artificial generativa: CM3leon, que promete transformar el mundo de la creación de contenido visual y textual.
¿Y cómo pretende lograr eso en un ámbito en el que ChatGPT lidera la generación de textos y Midjourney hace lo propio en la de imágenes? Pues fácil: siendo un modelo de lenguaje multimodal que permite la generación de texto a partir de imágenes y viceversa.
Esto abre un nuevo abanico de posibilidades en la creación de contenido y permite una mayor personalización y adaptabilidad en el proceso creativo. Por ejemplo:
- Puede interpretar la estructura y el aspecto de una imagen, lo que garantiza modificaciones coherentes con el contexto general.
- Puede describir imágenes mediante texto y responder preguntas sobre el contenido de una imagen.
- Puede editar imágenes preexistentes a partir de indicaciones de texto. Por ejemplo, se puede solicitar al sistema que cambie el color del cielo de una imagen o que agregue elementos específicos.
- Puede realizar todas esas modificaciones logrando acabados de alta resolución.
Más eficiente, sin problemas legales
Pero ése no es su único punto fuerte: CM3leon destaca por su capacidad para ofrecer resultados de alta calidad utilizando cinco veces menos recursos computacionales que otras inteligencias artificiales similares.
Todas estas capacidades (versatilidad en tareas basadas en texto, eficiencia computacional) convierte a CM3leon en una herramienta prometedora para diversos sectores, desde el diseño gráfico hasta la ilustración y la creación de contenido.
Por ahora, CM3leon es una IA dedicada a la investigación y no está claro si Meta la lanzará al mercado (o cuándo lo hará, si finalmente en así). Sin embargo, con sus características, todo apunta a que podría convertirse en una herramienta accesible para usuarios y profesionales.
Por último, hay algo más que lo diferencia de otros modelos de IA: en lugar de simplemente extraer imágenes disponibles en Internet, un método que ya le está causando problemas legales a MidJourney y a OpenAI, Meta ha apostado por un método diferente para esta IA:
"Las implicaciones éticas del abastecimiento de datos de imágenes en el dominio de la generación de texto a imagen han sido un tema de debate considerable. En este estudio, usamos solo imágenes con licencia de Shutterstock. Como resultado, podemos evitar preocupaciones relacionadas con la propiedad y atribución de imágenes, sin sacrificar el rendimiento".
Imágenes | Meta
En Genbeta | Google llega tarde a competir con ChatGPT... pero sin una legendaria innovación suya de 2017 su rival ni existiría
Ver 2 comentarios