¿Qué Es GauGAN? Cómo la IA Convierte tus Palabras e Imágenes en un Arte Asombroso

por Isha Salian

GauGAN, una demostración de IA para la generación de imágenes fotorrealistas, permite a cualquier persona crear paisajes impresionantes utilizando redes generativas antagónicas. Esta demostración se llama así por el pintor postimpresionista Paul Gauguin y fue creada por NVIDIA Research. Se puede experimentar de forma gratuita a través de las Demostraciones de IA de NVIDIA.

Cómo Crear con GauGAN

La última versión de la demostración, GauGAN2, convierte cualquier combinación de palabras y dibujos en una imagen realista. Los usuarios pueden simplemente escribir una frase como «lago frente a la montaña» y presionar un botón para generar una escena en tiempo real. Al ajustar el texto a un «lago frente a una montaña nevada» o un «bosque frente a la montaña», el modelo de IA modifica instantáneamente la imagen.

Los artistas que prefieren dibujar una escena por sí mismos pueden usar el pincel inteligente de la demostración para modificar estas escenas con texto o comenzar desde cero, dibujando rocas, árboles o nubes suaves. Hacer clic en un filtro (o cargar una imagen personalizada) permite a los usuarios experimentar con diferentes iluminaciones o aplicar un estilo de pintura específico a sus creaciones.

La IA Detrás de la Demostración de GauGAN2

En el corazón de GauGAN2 hay redes generativas antagónicas, o GAN, una especie de modelo de deep learning que involucra un par de redes neuronales: un generador y un discriminador. El generador crea imágenes sintéticas. El discriminador, entrenado con millones de imágenes de paisajes reales, brinda a la red de generadores comentarios píxel por píxel sobre cómo hacer que las imágenes sintéticas sean más realistas.

Con el tiempo, el modelo de GAN aprende a crear imitaciones convincentes del mundo real, con montañas reflejadas en lagos y árboles generados por IA que pierden sus hojas cuando una escena se modifica con la palabra «invierno».

Landscape generated by GauGAN2

Cuando los usuarios dibujan su propio garabato o modifican una escena existente en la demostración de GauGAN2, están trabajando con mapas de segmentación: contornos de alto nivel que graban la ubicación de los objetos en una escena. Las áreas individuales se etiquetan con características como arena, río, césped o flor, lo que da a la IA instrucciones sobre cómo llenar la escena.

GauGAN ha sido muy popular desde que debutó en NVIDIA GTC en 2019, ha sido utilizado por maestros de arte en escuelas, en museos como una exposición de arte interactiva y por millones de personas en línea.

Directores de arte y artistas conceptuales de los principales estudios de cine y compañías de videojuegos han estado entre los profesionales creativos interesados en GauGAN como una herramienta para crear prototipos de ideas para su trabajo. Por lo tanto, NVIDIA Studio, una plataforma para ayudar a los creadores, salió con una aplicación de escritorio: NVIDIA Canvas.

NVIDIA Canvas lleva la tecnología detrás de GauGAN a los profesionales en un formato compatible con las herramientas existentes, como Adobe Photoshop, y permite a los artistas usar las GPU NVIDIA RTX para disfrutar de una experiencia más fluida e interactiva.

Obtén más información sobre NVIDIA Research en GTC, que tendrá lugar en línea del 21 al 24 de marzo. Para escuchar las últimas novedades de la investigación de IA, no te pierdas el discurso destacado a cargo del CEO de NVIDIA, Jensen Huang, el 22 de marzo a las 8 a. m. (Hora del Pacífico).

Conoce más a fondo las tecnologías de NVIDIA Research en el blog técnico de NVIDIA.