NVIDIA Mejora los Agentes de IA Locales en las PCs con RTX y DGX Spark

Los agentes personales están experimentando un auge de popularidad, con proyectos de código abierto como OpenClaw y Hermes que están siendo rápidamente adoptados por las comunidades de desarrolladores de IA en GitHub. Diseñados para adaptarse a las preferencias y flujos de trabajo individuales, estos agentes pueden interactuar con aplicaciones, generar contenido, automatizar procesos repetitivos y gestionar tareas de varios pasos, todo ello mientras se ejecuta localmente en el dispositivo.

Hoy, en NVIDIA GTC Taipei celebrada en el marco de COMPUTEX, NVIDIA ha presentado NVIDIA RTX Spark una nueva clase de PC con Windows diseñados específicamente para agentes personalesjunto con una serie de actualizaciones que amplían los agentes locales a los ecosistemas más amplios de NVIDIA RTX y DGX.

Para ejecutar agentes de forma segura y privada se necesita un hardware a la altura. Con 1 petaflop de potencia de cálculo de IA y 128 GB de memoria unificada, RTX Spark puede satisfacer las necesidades informáticas de los agentes integrados en el dispositivo, ofreciendo una nueva clase de computadora que pasa de ser una simple herramienta para convertirse en un compañero de equipo. Diseñado para la IA, la creación de contenidos y los videojuegos, RTX Spark lleva los 30 años de innovación tecnológica de NVIDIA a las delgadas laptops con Windows, con batería para todo el día, y desktop ultra-eficientes.

La colaboración de NVIDIA con Windows abarca desde soluciones personales hasta soluciones empresariales. También se presentó en la conferencia NVIDIA DGX Station para Windows, el supercomputador de escritorio con IA definitivo para profesionales, que integra una GPU y una CPU de nivel de centro de datos para la inferencia en una desktop con Windows, lo que garantiza facilidad de gestión, seguridad y compatibilidad

Otros anuncios incluyen:

El entorno de ejecución NVIDIA OpenShell llega a Windows, basado en las nuevas funciones de seguridad de Microsoft para agentes, lo que proporciona a los desarrolladores un paquete fácil de implementar para agentes seguros en el dispositivo. Hermes Agent y OpenClaw también integrarán OpenShell y las primitivas de seguridad de Microsoft en sus nuevas aplicaciones para Windows.
El blueprint de NVIDIA NemoClaw se está expandiendo a toda la gama de IA local de NVIDIA GeForce RTX, RTX PRO, RTX y DGX Spark, y DGX Stationcon nuevos instaladores optimizados y compatibilidad con Hermes Agent.
Rendimiento de inferencia duplicado en los principales modelos de agentes con predicción multitoken en llama.cpp y vLLM, así como nuevas optimizaciones multi-GPU para llama.cpp y ComfyUI.
La empresa H está lanzando herramientas informáticas entre las que se incluyen nuevos modelos y un arnés para agentes de desktop que saldrá próximamente— optimizadas para computadoras con RTX y DGX.
Adobe está rediseñando sus aplicaciones Photoshop y Premiere, Blender está incorporando NVIDIA DLSS 4.5 Ray Reconstruction, y NVIDIA ha presentado RTX Video Frame Generation, que llegará a ComfyUI. Todas estas actualizaciones llegarán este otoño con RTX Spark.
La actualización de NVIDIA Broadcast 2.2 incluye optimizaciones de la función Studio Voice y compatibilidad con Elgato Stream Deck. NVIDIA Project G-Assist también agrega integración con Stream Deck.

IA local basada en agentes: Personal, privada y rápida en PCs con Windows RTX

La adopción generalizada de agentes se ha visto limitada por la imposibilidad de ejecutar agentes de forma segura y privada en las PCs principales de los usuarios.

NVIDIA y Microsoft se han asociado para abordar este reto ofreciendo una plataforma Windows robusta y segura para agentes en el dispositivo.

La colaboración parte de una base sólida nuevas funciones de seguridad de Windows y el tiempo de ejecución de NVIDIA OpenShells para garantizar que los agentes se ejecuten de forma segura y bajo el control total del usuario.

Las nuevas funciones de Windows ofrecen capacidades de identidad, contención, políticas y seguridad de extremo a extremo para crear y ejecutar agentes de forma nativa. NVIDIA OpenShell proporciona capacidades de políticas adicionales para que el usuario defina lo que los agentes pueden y no pueden hacer, la capacidad de enrutar de forma inteligente las consultas a modelos locales en función de las políticas de privacidad del usuario, y la capacidad de ocultar la información personal en las consultas enviadas a modelos en la nube.

Esta sólida capa de seguridad y privacidad está siendo adoptada por desarrolladores de agentes líderes, como Hermes Agent y OpenClaw, en sus nuevas aplicaciones para Windows. Estas nuevas aplicaciones facilitarán y harán más seguro el acceso de los usuarios a potentes agentes en el dispositivo que pueden ejecutar tareas en aplicaciones de Windows, razonar a través de flujos de trabajo entre aplicaciones, generar imágenes y video, programar complementos y aplicaciones, y realizar búsquedas semánticas en archivos locales.

Hacer funcionar agentes en dispositivos locales requiere tanto una seguridad sólida como un hardware de alto rendimiento. RTX Spark ofrece hasta 1 petaflop de potencia de cálculo de IA y 128 GB de memoria unificada para satisfacer las exigencias de procesamiento de los agentes en el dispositivo.

NVIDIA también está impulsando el ecosistema de modelos abiertos locales en el que se basan estos agentes.

NVIDIA ha colaborado con la comunidad de llama.cpp para habilitar características y optimizaciones como la predicción multitoken (MTP), una técnica de decodificación especulativa en la que un modelo preliminar más pequeño propone varios tokens a la vez que el modelo de destino verifica en una sola pasada. Esto, junto con otras optimizaciones como el lanzamiento dependiente programático, ofrece el doble de rendimiento en Qwen 3.6 y 3.5 27B, y un aumento de rendimiento de 1.6 veces en Qwen 3.6 y 3.5 35B. Estas actualizaciones están disponibles a través de la interfaz web de llama.cpp y LM Studio.

Mejoras de rendimiento observadas con las últimas optimizaciones de NVIDIA para llama.cpp: Qwen3.6-27B ofrece hasta el doble de rendimiento y Qwen3.6-35B hasta 1.6 veces más en GeForce RTX 5090, lo que acelera las cargas de trabajo de IA agente local gracias a la colaboración de la comunidad de código abierto.

Para los entusiastas de la IA que utilizan equipos con múltiples GPUs, NVIDIA ha colaborado con la comunidad de código abierto para mejorar dos de las herramientas de IA local más populares:

llama.cpp agrega paralelismo tensorial para hasta el doble de memoria y 1.8 veces más potencia de cálculo en dos GPUs equivalentes.
ComfyUI incorpora un nuevo método de orientación sin clasificador que duplica el rendimiento en dos GPUs equivalentes, además de la opción de dividir las cadenas de modelos entre las GPUs para aprovechar la memoria combinada.

Muestra mejoras en el rendimiento de la generación de tokens para la técnica Tensor Parallel Multi-GPU frente a la inferencia en paralelo por canal y con una sola GPU en llama.cpp. Muestra mejoras en el rendimiento del tiempo de generación para técnicas multi-GPU en ComfyUI.

NVIDIA también está ampliando las capacidades de los agentes con H Company. El arnés de uso informático de H Company permite a los agentes navegar por una PC viendo la pantalla y manejando el mouse y el teclado como lo haría un usuario, incluso en aplicaciones sin interfaces de programación de aplicaciones, y pronto estará disponible para PC RTX y DGX con soporte para modelos locales.

NVIDIA ha colaborado con H Company para cuantificar sus modelos de vanguardia Holo Computer Use, así como para acelerar su sistema de control, lo que ha permitido duplicar la velocidad en las GPUs de NVIDIA y reducir el consumo de memoria en un 35%. Los modelos están disponibles para su descarga, y la aplicación Holo Desktop estará disponible próximamente.

Optimizaciones de agentes para Linux

Para los desarrolladores que necesitan agentes locales siempre accesibles, NVIDIA DGX Spark es la computadora de IA con agente personal más potente para aquellos que necesitan un entorno Linux, ya que combina gran capacidad de memoria, cálculo rápido y compatibilidad con el ecosistema NVIDIA CUDA.

La versión de DGX Spark OS de este mes ofrece la experiencia más optimizada desde el primer momento con un instalador NemoClaw optimizado, junto con una inferencia más rápida en los principales modelos de agentes.

NemoClaw ya está disponible para todos las PCs NVIDIA RTX y DGX en Linux y el Subsistema de Windows para Linux. Implemente de forma segura agentes locales en Linux con los nuevos instaladores optimizados, que ofrecen sandboxing automático y compatibilidad agregada con Hermes Agent.

NVIDIA ha colaborado con vLLM para optimizar la inferencia de los agentes, con optimizaciones en vLLM y nuevos puntos de control NVFP4 optimizados para Qwen 3.6 35B. Las actualizaciones ofrecen un rendimiento 2.6 veces superior en DGX Spark en comparación con los puntos de control NVFP4 de Unsloth disponibles anteriormente, e incluyen mejoras en el kernel, así como precisión mixta y compatibilidad con CUDA Graph para MTP.

Lee el blog de vLLM para ver una guía completa paso a paso sobre cómo implementar modelos NVFP4 de mezcla de expertos en DGX Spark, desde el ajuste de la memoria unificada hasta una configuración de referencia funcional de NVIDIA Nemotron 3 Super.

Ofreciendo potentes experiencias creativas con Adobe

NVIDIA se ha asociado con Adobe para rediseñar Adobe Premiere y Photoshop para RTX Spark. Generative Fill en Photoshop y Generative Extend en Premiere, ambos impulsados por Firefly, se encuentran entre los cientos de herramientas aceleradas que ofrecen potencia creativa, precisión y control. RTX Spark lleva estas capacidades aún más lejos, ofreciendo una IA, edición, coloración y efectos hasta dos veces más rápidos en todos los flujos de trabajo creativos.

Adobe Premiere contará con un nuevo flujo de trabajo de video que aprovecha la memoria unificada de RTX Spark, la GPU Blackwell y el software TensorRT, ofreciendo rendimiento en tiempo real para la edición y la corrección de color, rendimiento de IA acelerado por GPU y un renderizado más eficiente de líneas de tiempo complejas. Además, Substance 3D Painter y Stager de Adobe se ejecutarán de forma nativa en RTX Spark para ofrecer flujos de trabajo de texturizado 3D y creación de escenas más fluidos y con mayor capacidad de respuesta.

El motor de Photoshop de última generación de Adobe se optimizará para la composición acelerada por GPU, lo que permitirá filtros en directo, alto rango dinámico y pinceladas naturales modernas. El flujo de trabajo nativo de IA está diseñado para aprovechar toda la potencia de RTX Spark, incluido TensorRT.

Adobe ampliará aún más Premiere y Photoshop para permitir a los usuarios crear, editar y diseñar con agentes de Windows, proporcionando a los creadores un compañero de equipo colaborativo para acelerar sus flujos de trabajo.

Se espera que las actualizaciones de las aplicaciones creativas de Adobe, como Premiere, Photoshop y Substance, comiencen a implementarse junto con la disponibilidad de RTX Spark.

Nuevas herramientas y actualizaciones de aplicaciones para creadores

Las nuevas actualizaciones de la plataforma NVIDIA y las optimizaciones de las aplicaciones de los socios se están implementando en todo el ecosistema RTX: algunas se lanzan hoy y otras llegarán con RTX Spark este otoño.

NVIDIA Broadcast 2.2 saca de la fase beta a partir de hoy Studio Voice, una función de IA que hace que cualquier micrófono suene con calidad de estudio. Studio Voice ahora funciona en GPU GeForce RTX 3060 y superiores con un rendimiento mejorado. La aplicación también incorpora la integración con Elgato Stream Deck y atajos de teclado configurables.

Project G-Assist también agrega compatibilidad con Stream Deck a través del servidor Elgato MCP, lo que permite a los usuarios habilitar funciones de asistente de IA para su configuración de streaming.

Además, Blender Cycles está integrando DLSS 4.5 Ray Reconstruction como un nuevo denoiser, convirtiendo la ventana de trazado de rutas en un visor interactivo en tiempo real. Esto permite a los artistas 3D navegar por una escena mientras ven una calidad de renderizado casi final, transformando el flujo de trabajo de iluminación y desarrollo de looks. La actualización se lanzará con Blender 5.3 este otoño, junto con RTX Spark.

RTX Video Frame Generation, que también se lanzará con RTX Spark, es un nuevo efecto de IA que duplica o cuadruplica la velocidad de fotogramas de video en tiempo real, ideal para mejorar las salidas de 15-20 fotogramas por segundo (fps) que suelen generar los modelos de IA. Llega como un paquete Python y un nodo ComfyUI, lo que permite a los artistas de IA generar videos más rápido a bajos fps y luego interpolar hasta alcanzar velocidades de reproducción fluidas.

#ICYMI: Lo último de RTX AI Garage

Lee el anuncio completo de NVIDIA RTX Spark para conocer los detalles sobre el superchip, el trabajo de NVIDIA con Windows en agentes y laptops y pequeños desktops de nuestros socios.

Las laptops para creadores ASUS ProArt ahora incluyen FLUX.2 Klein 4B de Black Forest Labs, un modelo de imagen destilado preinstalado a través de la aplicación MuseTree, optimizado con el formato NVFP4 y el kit de desarrollo de software NVIDIA TensorRT para RTX. Los creadores obtienen una aceleración de hasta 2.5 veces y una reducción de la memoria del 560%, con una experiencia de primera ejecución que va directamente desde el desembalaje hasta la generación de imágenes de forma local, sin necesidad de descargar modelos ni configurar ComfyUI.

El kit de desarrollo de software NVIDIA AI for Media presenta nuevas actualizaciones, entre las que se incluyen los nuevos microservicios LipSync de NVIDIA NIM, optimizados para francés, alemán y español. El microservicio Active Speaker Detection de NIM también incluye compatibilidad con múltiples cámaras mediante la correlación de hablantes entre videos.

Echa un vistazo a la última entrada del blog de RTX AI Garage sobre Hermes Agent y la IA con autoaprendizaje en PC con RTX y DGX Spark.

Conéctate a RTX Spark en Facebook, Instagram, TikTok y X, y mantente informado suscribiéndote al boletín de RTX Spark.

Consulta el aviso sobre la información de los productos de software.