La IA de NVIDIA RTX acelera FLUX.1 Kontext, disponible para su descarga.

NVIDIA RTX y TensorRT aceleran el nuevo modelo de generación y edición de imágenes de Black Forest Labs; además, Gemma 3n ahora cuenta con la aceleración de RTX y NVIDIA Jetson, y continúa el maratón de desarrollo de complementos G-Assist.
por lmachado

Black Forest Labs, uno de los laboratorios de investigación en inteligencia artificial más importantes del mundo, acaba de revolucionar el mundo de la generación de imágenes.

Los modelos de imagen FLUX.1 del laboratorio han ganado reconocimiento mundial por ofrecer imágenes de alta calidad con una rapidez excepcional. Ahora, con su nuevo modelo FLUX.1 Kontext, el laboratorio está cambiando radicalmente la forma en que los usuarios pueden guiar y perfeccionar el proceso de generación de imágenes.

Para obtener los resultados deseados, los artistas de IA actuales suelen utilizar una combinación de modelos y ControlNets, modelos de IA que ayudan a guiar los resultados de un generador de imágenes. Esto suele implicar la combinación de varios ControlNets o el uso de técnicas avanzadas como la utilizada en el NVIDIA AI Blueprint para la generación de imágenes guiadas en 3D, donde se utiliza un boceto de escena en 3D para determinar la composición de una imagen.

El nuevo modelo FLUX.1 Kontext simplifica este proceso al proporcionar un único modelo capaz de generar y editar imágenes utilizando lenguaje natural.

NVIDIA ha colaborado con Black Forest Labs para optimizar FLUX.1 Kontext [dev] para las GPUs NVIDIA RTX utilizando el kit de desarrollo de software NVIDIA TensorRT y la cuantificación, con el fin de ofrecer una inferencia más rápida con menores requerimientos de VRAM.

Tanto para creadores como para desarrolladores, las optimizaciones de TensorRT se traducen en ediciones más rápidas, repeticiones más fluidas y mayor control, directamente desde sus dispositivos con tecnología RTX.

FLUX.1 Kontext [dev] Flex: Generación de Imágenes en Contexto

Black Forest Labs presentó en mayo la familia de modelos de imagen FLUX.1 Kontext, que admiten tanto entradas de texto como de imagen.

Estos modelos permiten a los usuarios partir de una imagen de referencia y guiar las ediciones con un lenguaje sencillo, sin necesidad de ajustes precisos ni flujos de trabajo complejos con múltiples ControlNets.

tipo abierto diseñado para la edición de imágenes mediante un proceso de generación guiado paso a paso que facilita el control de la evolución de una imagen, ya sea para perfeccionar pequeños detalles o transformar una escena completa. Dado que el modelo acepta tanto entradas de texto como de imagen, los usuarios pueden hacer referencia fácilmente a un concepto visual y guiar su evolución de forma natural e intuitiva. Esto permite realizar ediciones de imágenes coherentes y de alta calidad que se ajustan al concepto original.

Las capacidades clave de FLUX.1 Kontext incluyen:

  • Consistencia de los Personajes: conserva los rasgos únicos en múltiples escenas y ángulos.
  • Edición localizada: modifica elementos específicos sin alterar el resto de la imagen.
  • Transferencia de Estilo: aplica el aspecto y el estilo de una imagen de referencia a nuevas escenas.
  • Rendimiento en Tiempo Real: la generación de baja latencia permite una rápida iteración y respuesta.

Black Forest Labs lanzó la semana pasada FLUX.1 Kontext weights para descargar en Hugging Face, así como las correspondientes variantes aceleradas por TensorRT.

Tres imágenes en paralelo del mismo gráfico de café y aperitivos sobre una mesa con flores, que muestran un ejemplo de la edición multivuelta posible con el modelo FLUX.1 Kontext [dev]. La imagen original (izquierda); la primera edición la transforma en una imagen de estilo Bauhaus (centro) y la segunda edición cambia el estilo de color de la imagen con una paleta pastel (derecha). Tradicionalmente, la edición avanzada de imágenes requería instrucciones complejas y mascarillas, mapas de profundidad o mapas de bordes difíciles de crear. FLUX.1 Kontext [dev] introduce una interfaz mucho más intuitiva y flexible, que combina ediciones paso a paso con una optimización de vanguardia para la inferencia de modelos de difusión.
El modelo [dev] hace hincapié en la flexibilidad y el control. Admite funciones como la coherencia de los caracteres, la conservación del estilo y los ajustes de imagen localizados, con la funcionalidad ControlNet integrada para indicaciones visuales estructuradas.

FLUX.1 Kontext [dev] está disponible en ComfyUI y en Black Forest Labs Playground, y se espera que en agosto se lance una versión NVIDIA NIM microservice.

Optimizado para RTX con Aceleración TensorRT

FLUX.1 Kontext [dev] acelera la creatividad al simplificar los flujos de trabajo complejos. Para optimizar aún más el trabajo y ampliar la accesibilidad, NVIDIA y Black Forest Labs han colaborado para cuantificar el modelo, reduciendo los requisitos de VRAM para que más personas puedan ejecutarlo localmente, y lo han optimizado con TensorRT para duplicar su rendimiento.

El paso de cuantificación permite reducir el tamaño del modelo de 24 GB a 12 GB para FP8 (Ada) y a 7 GB para FP4 (Blackwell). El punto de control FP8 está optimizado para las GPUs GeForce RTX Serie 40, que cuentan con aceleradores FP8 en sus núcleos Tensor. El punto de control FP4 está optimizado para las GPUs GeForce RTX Serie 50 por el mismo motivo, utilizando un nuevo método denominado SVDQuant, que conserva la alta calidad de la imagen al tiempo que reduce el tamaño del modelo.

TensorRT, un marco para accesar a los núcleos Tensor en las GPUs NVIDIA RTX y optimizar el rendimiento, ofrece una aceleración de más del doble en comparación con el modelo BF16 original ejecutado con PyTorch.

Aumento de la velocidad en comparación con la GPU BF16 (izquierda, cuanto mayor, mejor) y uso de memoria necesario para ejecutar FLUX.1 Kontext [dev] con diferentes precisiones (derecha, cuanto menor, mejor).
Obtén más información sobre las optimizaciones de NVIDIA y cómo empezar a utilizar FLUX.1 Kontext [dev] en el blog técnico de NVIDIA.

Empieza con FLUX.1 Kontext

FLUX.1 Kontext [dev] disponible en Hugging Face (Torch y TensorRT).

Los entusiastas de la IA interesados en probar estos modelos pueden descargar las variantes de Torch y utilizarlas en ComfyUI. Black Forest Labs también ha puesto a disposición un campo de pruebas en línea para evaluar el modelo.

Para usuarios avanzados y desarrolladores, NVIDIA está trabajando en código de muestra para facilitar la integración de los procesos de TensorRT en los flujos de trabajo. Echa un vistazo al repositorio DemoDiffusion, que estará disponible a finales de este mes.

Espera, Hay Más

Google anunció la semana pasada el lanzamiento de Gemma 3n, un nuevo modelo de lenguaje multimodal pequeño ideal para funcionar en las GPU NVIDIA GeForce RTX y la plataforma NVIDIA Jetson para IA y robótica de vanguardia.

Los entusiastas de la IA pueden utilizar los modelos Gemma 3n con aceleraciones RTX en Ollama y Llama.cpp con sus aplicaciones favoritas, como AnythingLLM y LM Studio.

Rendimiento evaluado en junio de 2025 con Gemma 3n en Ollama, con 4000 millones de parámetros activos, 100 ISL y 200 OSL.

Además, los desarrolladores pueden implementar fácilmente los modelos Gemma 3n con Ollama y beneficiarse de las aceleraciones RTX. Obtén más información sobre cómo ejecutar Gemma 3n en Jetson y RTX.

Además, el evento Plug and Play: Project G-Assist Plug-In Hackathon de NVIDIA, que funcionará virtualmente hasta el miércoles 16 de julio, invita a los desarrolladores a explorar la IA y crear plug-ins personalizados para G-Assist con la oportunidad de ganar premios. Reserva la fecha para el seminario web sobre el complemento G-Assist, que se celebrará el miércoles 9 de julio, de 10 a 11 a. m. (hora del Pacífico), para obtener más información sobre las capacidades y los fundamentos del Proyecto G-Assist, y para participar en una sesión de preguntas y respuestas en directo.

Únete al servidor Discord de NVIDIA para conectar con desarrolladores de la comunidad y entusiastas de la IA y debatir sobre las posibilidades que ofrece RTX AI.

Cada semana, la serie de blogs RTX AI Garage presenta innovaciones y contenido sobre IA impulsados por la comunidad para aquellos que desean obtener más información sobre los microservicios NVIDIA NIM y los Blueprints de IA, así como sobre la creación de agentes de IA, flujos de trabajo creativos, humanos digitales, aplicaciones de productividad y mucho más en PC y estaciones de trabajo con IA.

Conéctate a NVIDIA AI PC en Facebook, Instagram, TikTok y X, y mantente informado suscribiéndote al boletín informativo de RTX AI PC.

Síguenos en NVIDIA Workstation en LinkedIn y X.

Consultar el aviso sobre la información del producto de software.