Nvidia ha anunciado la última versión de GauGAN2, la demo de pintura con tecnología de IA que puede convertir textos en imágenes precisas.
NVIDIA GauGAN2, genera imágenes precisas a partir de texto
GauGAN2 se basa en el aprendizaje profundo para realizar esta acción, con imágenes super-nitidez.
Mientras que la versión original sólo podía convertir un boceto en una imagen detallada, GauGAN2 puede generar imágenes a partir de frases como «puesta de sol en una playa». La función de poder crear imágenes de alta calidad mediante un dibujo o boceto sigue estando allí, incluso mejorado, pero la gran novedad es la de poder crear estas imágenes con textos.
GauGAN pueden funcionar de esta manera gracias a las redes generativas adversariales (GAN), sobre las que puedes obtener más información en este artículo de Nvidia.
Nvidia dice: «Con sólo pulsar un botón, los usuarios pueden generar un mapa de segmentación, un esquema de alto nivel que muestra la ubicación de los objetos en la escena. A partir de ahí, pueden pasar a dibujar, retocando la escena con bocetos utilizando etiquetas como cielo, árbol, roca y río, permitiendo que el pincel inteligente incorpore estos garabatos en imágenes impresionantes».
Te recomendamos nuestra guía sobre las mejores tarjetas gráficas del mercado
Al añadir funciones de conversión de texto a imagen, la nueva versión de GauGAN es más personalizable. La última versión es también uno de los primeros modelos de IA que incorpora múltiples modalidades, texto, segmentación semántica, boceto y estilo, dentro de una única red GAN.
Nvidia añade: «Es un proceso iterativo, en el que cada palabra que el usuario escribe en el cuadro de texto añade más a la imagen creada por la IA».
Naturalmente, no es tan precisa como crear una imagen mediante bocetos, pero sirve para generar una imagen ‘random’ con una descripción de lo que realmente queremos ver.
Pueden descargarla desde el siguiente enlace.