Hermes lleva agentes de IA autoaprendibles a PCs NVIDIA RTX y DGX Spark

El sistema desarrollado por Nous Research se ejecuta de forma local y continua en PCs y workstations NVIDIA RTX, con soporte para DGX Spark, y se apoya en modelos Qwen 3.6 de Alibaba para acelerar tareas de agentes con menor latencia, un avance que apunta a mejorar flujos de trabajo de desarrollo y productividad

spot_img

Hermes, un sistema de agentes de inteligencia artificial con capacidad de autoaprendizaje, se incorpora como una nueva clase de agentes para su ejecución en PCs y estaciones de trabajo NVIDIA RTX, con soporte también para workstations NVIDIA RTX PRO y para NVIDIA DGX Spark. El desarrollo está a cargo de Nous Research y apunta a combinar fiabilidad con aprendizaje autónomo en entornos locales.

Los agentes de IA se integran con aplicaciones de mensajería, acceden a archivos y aplicaciones locales y pueden operar de manera continua. En ese contexto, Hermes está optimizado para un uso local permanente, con funcionamiento “las 24 horas del día, los 7 días de la semana”. El diseño busca independencia de proveedor y de modelo, con foco en sostener la ejecución en el dispositivo.

En paralelo, la adopción de entornos de trabajo de código abierto basados en agentes se aceleró tras OpenClaw. Hermes Agent superó las 140.000 GitHub stars en menos de tres meses y, según datos de la semana pasada, figura como “el agente más utilizado del mundo” de acuerdo con OpenRouter.

Publicidad

Hermes se diferencia por cuatro características. La primera es la evolución autónoma de habilidades: “Hermes crea y perfecciona sus propias habilidades”. La segunda es el uso de subagentes contenidos, definidos como “trabajadores aislados y de corta duración dedicados a una subtarea”, con contexto y herramientas específicas, para reducir confusión y operar con ventanas de contexto más pequeñas. La tercera es la “fiabilidad desde el diseño”, ya que Nous Research selecciona y somete a pruebas de estrés cada habilidad, herramienta y complemento. La cuarta apunta a resultados comparativos: “Hermes es una capa de orquestación activa, no una simple envoltura”.

El esquema de ejecución local se apoya en modelos Qwen 3.6, una serie de modelos de lenguaje a gran escala de “peso abierto” de Alibaba. Qwen 3.6 35B funciona con aproximadamente 20 GB de memoria y supera a modelos de más de 120.000 millones de parámetros que requieren más de 70 GB. Además, Qwen 3.6 27B iguala la precisión de modelos de 400.000 millones de parámetros como Qwen 3.5 397B, con un tamaño 16 veces menor.

Para acelerar la inferencia —el proceso de ejecutar un modelo para producir respuestas—, se utiliza hardware con GPU NVIDIA RTX. Los NVIDIA Tensor Cores aceleran la inferencia para reducir latencia y permitir que Hermes complete tareas de varios pasos o perfeccione habilidades “en segundos, en lugar de minutos”.

En el segmento de hardware dedicado, NVIDIA DGX Spark se presenta como una computadora compacta para flujos de trabajo de agentes continuos durante todo el día. Cuenta con 128 GB de memoria unificada y 1 petaflop de rendimiento de IA, y ya está disponible para su compra a través de socios fabricantes de NVIDIA.

Para comenzar, Hermes puede ejecutarse combinándolo con Qwen 3.6 mediante llama.cpp, LM Studio u Ollama, a partir del repositorio de GitHub de Hermes.

spot_img
spot_img
spot_img
spot_img
spot_img
spot_img
spot_img
spot_img
spot_img
spot_img

CONTENIDO RELACIONADO