Commmonn Ground

Tech & AI

NVIDIA GTC 2026: La industria de la IA acaba de pasar del entrenamiento a la ejecución

Jensen Huang acaba de subir al escenario del SAP Center en San José para ofrecer lo que podría ser el discurso de apertura (keynote) más trascendental en la historia de NVIDIA. No por la revelación de un solo chip, sino porque el GTC 2026 es el momento en que la industria de la IA pivota formalmente de la construcción de modelos a su despliegue masivo.

Treinta mil personas de 190 países abarrotaron el centro de San José. El discurso fue una declaración de intenciones de "pila completa" (full-stack): nuevo silicio, nuevo software, nueva física y nueva economía. Esto es lo que realmente importa y por qué.

Vera Rubin: La inferencia 10 veces más barata lo cambia todo

La pieza central del GTC 2026 es Vera Rubin, la sucesora de NVIDIA para la arquitectura Blackwell que dominó el periodo 2024-2025. Nombrada en honor a la astrónoma que demostró la existencia de la materia oscura, es una plataforma de seis chips: GPU Rubin, CPU Vera, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU y Spectrum-6 Ethernet Switch.

Las cifras principales son asombrosas:

  • Reducción de 10 veces en el costo de tokens de inferencia en comparación con Blackwell.
  • 4 veces menos GPUs necesarias para entrenar modelos Mixture-of-Experts.
  • 50 petaflops de cómputo NVFP4 por GPU para inferencia.
  • 288GB de memoria HBM4 con un ancho de banda de más de 3.0 TB/s por unidad.
  • 260 TB/s de ancho de banda de rack, más que todo el internet.

La reducción de 10 veces en el costo de inferencia es la cifra que reescribe los planes de negocio. Las aplicaciones que eran demasiado caras para ejecutarse continuamente —agentes de IA siempre activos, procesamiento de video en tiempo real, revisión continua de código— se vuelven económicamente viables de la noche a la mañana. Esto no es una mejora incremental; es un salto cualitativo que se reflejará en los precios de los proveedores de la nube durante los próximos 18 meses.

Vera Rubin está en plena producción. AWS, Google Cloud, Microsoft Azure y Oracle desplegarán instancias basadas en Rubin en el segundo semestre de 2026. Las "superfábricas de IA Fairwater" de próxima generación de Microsoft escalarán a cientos de miles de Superchips Vera Rubin. Los nombres más grandes en IA —OpenAI, Anthropic, Meta, xAI— ya se han comprometido.

NemoClaw: NVIDIA entra en la capa de software de agentes

El hardware fue el aperitivo. El anuncio más significativo estratégicamente es NemoClaw, una plataforma de código abierto para construir y desplegar agentes de IA empresariales.

NVIDIA está realizando el mismo movimiento que convirtió a CUDA en una ventaja competitiva de 20 años: dar a los desarrolladores herramientas gratuitas y profundamente integradas, convertirlas en el camino de menor resistencia y monetizar cuando las cargas de trabajo escalen en el hardware de NVIDIA. NemoClaw permite a las empresas construir agentes autónomos que interactúan con archivos, aplicaciones y flujos de trabajo localmente, sin dependencia de la nube.

Los asistentes al GTC pudieron construir su propio asistente de IA siempre activo en las estaciones "Build-a-Claw" por todo el centro de convenciones. Ponerle nombre, definir su personalidad, otorgarle acceso a herramientas y desplegarlo en una laptop DGX Spark o GeForce RTX en el acto. Es una jugada maestra: miles de desarrolladores se van con agentes funcionando en hardware de NVIDIA.

Junto con NemoClaw, NVIDIA lanzó Nemotron 3 Super, un modelo abierto de 120 mil millones de parámetros con solo 12 mil millones de parámetros activos, diseñado específicamente para cargas de trabajo agénticas. Tiene una ventana de contexto de 1 millón de tokens, suficiente para que un agente mantenga un código base completo o semanas de historial de conversación en memoria sin perder el hilo.

El modelo ya está desplegado en Perplexity, Google Cloud, Oracle, AWS, CoreWeave y docenas de proveedores de inferencia. Empresas como Palantir, Siemens y Cadence lo están personalizando para la automatización empresarial.

IA Física: De Chatbots a Robots

El GTC 2026 consolidó la "IA Física" como la próxima tesis de un billón de dólares de NVIDIA. La conferencia contó con sesiones de robótica de Tesla, Disney, Agility Robotics, KUKA, Universal Robots y Waabi. Disney incluso mostró robots humanoides impulsados por IA que se autoequilibran mediante aprendizaje por refuerzo entrenado en la simulación Omniverse de NVIDIA.

La arquitectura de "tres computadoras" cuenta la historia: una computadora entrena el cerebro (DGX), una simula el mundo (Omniverse) y una se ejecuta en el robot (Jetson/IGX). Los robots especialistas aprenden habilidades atómicas —agarrar, equilibrarse, navegar— y con el tiempo las combinan en capacidades compuestas. Refleja cómo aprenden los niños: primero especialistas, luego generalistas.

Thinking Machines Lab anunció un despliegue a escala de gigavatios de sistemas Vera Rubin. Eso no es un laboratorio de investigación; es un compromiso a escala industrial con la infraestructura de IA física.

El factor Groq y el adelanto de Feynman

Dos señales más del GTC merecen atención.

Primero, la integración de Groq. NVIDIA licenció la arquitectura de flujo de datos (dataflow) de Groq el año pasado por una cifra reportada de 20 mil millones de dólares. La tecnología de Groq genera tokens a una velocidad extrema —miles por segundo— lo que la hace ideal para agentes de IA en tiempo real. El GTC insinuó productos de inferencia que incorporan tecnología Groq, pero los detalles concretos siguen siendo escasos. La implicación: NVIDIA está construyendo una pila de inferencia por capas en lugar de tratar cada carga de trabajo como un problema puro de GPU.

Segundo, Jensen adelantó chips que "el mundo nunca ha visto antes". El candidato más fuerte es Feynman, la generación de arquitectura posterior a Rubin, potencialmente construida sobre el proceso de 1.6nm de TSMC con fotónica de silicio. Si se confirma en futuros eventos, extendería la visibilidad de la hoja de ruta de NVIDIA a tres generaciones, una señal sin precedentes de que la compañía tiene la intención de superar el silicio personalizado de los gigantes de la nube durante años.

Qué significa esto realmente

El GTC 2026 no es un evento de lanzamiento de GPUs disfrazado de conferencia. Es una declaración de que la industria de la IA ha pasado del "entrenamiento" a la "ejecución".

La era de la inferencia ha llegado. Los modelos son cada vez más baratos de ejecutar. Los agentes están obteniendo marcos de trabajo para operar de forma autónoma. Los robots están obteniendo motores de física para aprender. Y NVIDIA se está posicionando como el proveedor integral para todo ello, desde el átomo hasta la aplicación.

Para los desarrolladores: la economía de la inferencia se traducirá en precios de API más baratos para mediados de 2027. Planifiquen aplicaciones que ejecuten IA de forma continua, no solo bajo demanda.

Para los inversores: la nueva métrica no es FLOPS por dólar, sino tokens por megavatio. Las empresas que controlen la pila de inferencia acumularán valor.

Para todos los demás: la IA con la que interactúan a diario está a punto de volverse significativamente más rápida, barata y capaz. La infraestructura anunciada hoy impulsará los productos que usarán en 2027.

Preguntas Frecuentes

¿Qué es NVIDIA Vera Rubin?

Vera Rubin es la plataforma de cómputo de IA de próxima generación de NVIDIA, sucesora de Blackwell. Cuenta con seis nuevos chips —incluyendo la GPU Rubin y la CPU Vera— que ofrecen costos de tokens de inferencia hasta 10 veces menores y requieren 4 veces menos GPUs para el entrenamiento. Los productos basados en Rubin se enviarán en el segundo semestre de 2026 a través de los principales proveedores de la nube.

¿Qué es NemoClaw?

NemoClaw es la plataforma de código abierto de NVIDIA para construir agentes de IA empresariales: sistemas autónomos que ejecutan tareas de varios pasos sin supervisión humana constante. Está diseñada para profundizar el ecosistema CUDA al convertir el hardware de NVIDIA en el objetivo de despliegue predeterminado para cargas de trabajo de IA agéntica.

¿Cuándo es el keynote de NVIDIA GTC 2026?

El discurso de apertura de Jensen Huang fue el lunes 16 de marzo de 2026 a las 11 AM PT (2 AM del 17 de marzo, hora de Hong Kong) en el SAP Center de San José. La repetición completa está disponible de forma gratuita en nvidia.com y YouTube.