Google ha hecho una apuesta por la Inteligencia Artificial integrada a la fotografía desde hace tiempo, con el objetivo de mejorar imágenes. En su última novedad encontramos la posibilidad de convertir fotografías totalmente pixeladas en fotos de alta resolución.
La novedad de Google es una tecnología de escalado de imágenes basada en la IA que mejora la calidad de las imágenes de baja resolución. En un post del blog de IA de Google, los investigadores de Brain Team presentaron dos modelos de difusión para generar imágenes de alta fidelidad. Estos modelos son: la superresolución de imágenes (SR3) la difusión en cascada (CDM).
SR3 para una super-resolución de la imagen
El primero de estos modelos es la Super-Resolución de Imagen vía Refinamiento Repetido o SR3. Este método es definido por el equipo de investigación como "un modelo de difusión de super-resolución que toma como entrada una imagen de baja resolución, y construye una imagen de alta resolución a partir de ruido puro".
Para llevarlo a cabo, la máquina utiliza un proceso que va añadiendo "ruido" de forma constante a una imagen hasta que sólo queda ruido. Cuando hablamos de ruido dentro del mundo de la fotografía, hablamos de efectos no deseados, los píxeles ola alteración arbitraria de brillo y color en una imagen. Con todo esto, la herramienta de Google, invierte totalmente el proceso: elimina el ruido y alcanza una distribución objetivo "mediante la guía de la imagen de baja resolución de entrada".
Gracias a este proceso desarrollado de la mano de la inteligencia artificial, Google puede tomar imágenes con resoluciones de 32 x 32 px y puede llegar a convertirlas en imágenes de hasta 1024 x 1024 px. Hay que recordar que Photoshop, los expertos en imágenes, tienen también una IA capaz de multiplicar por cuatro la resolución de una foto y mejorar el detalle.
CDM o la cascada de múltiples modelos de difusión
Una vez que el modelo SR3 demostró su eficacia, el equipo fue más allá. Los investigadores añadieron la tecnología CDM . Según los investigadores el CDM es "un modelo de difusión condicional de clase entrenado con datos de ImageNet para generar imágenes naturales de alta resolución". Google construyó CDM como "una cascada de múltiples modelos de difusión".
Como explica Business Insider, esta herramienta comienza con un modelo de difusión estándar en la resolución más baja y le sigue una secuencia de modelos de superresolución que pueden escalar sucesivamente la imagen y añadir detalles de mayor resolución.
Con la introducción de estas funciones, Google pretende mejorar la síntesis natural de imágenes. Aún no ha especificado cómo va a implementar estas mejoras en nuestras vidas como usuarios.
Puede ser que encontremos mejores imágenes dentro del buscador Google Imágenes o que incluso podamos acceder a estas herramientas para mejorar nuestras fotografías de baja calidad almacenadas en Google Fotos. Lo que sí ha dicho la firma es que, además del uso cotidiano, también puede ser útil para sectores como la medicina que necesita imágenes de alta calidad para desempeñar ciertas labores.
Ver 6 comentarios