¿Jensen Huang, el verdugo de los ingresos de Nvidia?

¿Jensen Huang, el verdugo de los ingresos de Nvidia?

Evox News
Por
13 min de lectura

Nvidia Transforma el Panorama de la IA con Innovaciones Disruptivas en la Conferencia GTC

En el evento GTC de este año en San José, el CEO de Nvidia, Jensen Huang, mantuvo a más de 25,000 asistentes cautivados con su visión de la Inteligencia Artificial y su potencial para transformar el mundo. (Entre muchos otros proveedores de semiconductores en el espacio de la IA, Nvidia es cliente de la firma Cambrian-AI Research).

La mayoría de los asistentes estaban pendientes de cada palabra para comprender el potencial futuro de la IA, evaluar la sostenibilidad de la demanda en este campo y determinar si Nvidia se está moviendo demasiado rápido para sus clientes. Adoptar una cadencia tecnológica anual puede ayudar a una empresa a mantenerse por delante de competidores más lentos, pero también puede dificultar la adopción de la última tecnología por parte de los clientes que acaban de adquirir grandes cantidades de equipos.

Jensen, en tono de broma, comentó que nadie debería comprar una GPU Hopper ahora que Blackwell está en plena producción, autodenominándose el «Director de Destrucción de Ingresos» de la compañía. Señaló la posible frustración de sus vendedores al escuchar su consejo. Los inversores tampoco apreciaron su sarcasmo, y las acciones han bajado un 2.6% desde el inicio de GTC25. Sin embargo, según Jensen, la inferencia de IA requiere ahora 100 veces más computación que hace un año, gracias principalmente a la introducción del «razonamiento» y la IA agéntica.

¿Es Nvidia Blackwell Tan Avanzado Que Nadie Quiere Hopper?

Aunque Blackwell es increíblemente rápido, con hasta 40 veces más tokens por segundo para inferencia, también requiere importantes actualizaciones de energía en los centros de datos y refrigeración líquida para las «Fábricas de IA» que Jensen está impulsando. Sin embargo, Hopper podría ser suficiente para muchos desarrolladores de IA por ahora. Nvidia ya ha enviado casi tres veces la cantidad de GPU Blackwell en comparación con todos los chips Hopper en 2024. No hay duda de que los 11 mil millones de dólares en sistemas basados en Blackwell que Nvidia envió en el cuarto trimestre son el comienzo de un nuevo ciclo de demanda. El siguiente sistema, que se enviará a finales de este año, el Blackwell Ultra, puede conectarse directamente al chasis Oberon Blackwell NVL72. Por lo tanto, la siguiente transición de ingresos debería ser mucho más fluida.

Pasar a un ciclo de producto anual crea tensión, pero revelar la hoja de ruta es esencial para preparar la cadena de suministro y el ecosistema para los próximos dos años de innovación. Ningún centro de datos puede alimentar un rack de 800 kilovatios requerido para Rubin Ultra hoy, pero necesitarán alimentar y enfriar a la bestia si quieren seguir siendo competitivos cuando Nvidia comience a enviar sus futuros racks.

Jensen explicó que la GPU Blackwell es 40 veces más rápida que Hopper. Luego, en tono jocoso, dijo que nadie debería comprar una GPU Hopper ahora que Blackwell está en plena producción, interpretando el papel del «Director de Destrucción de Ingresos» de la compañía. Pero Jensen les dijo a todos lo rápido que sería Blackwell hace un año, por lo que los vendedores y compradores no deberían sorprenderse. El año pasado, dijo 30X, pero el nuevo software Dynamo tuvo un impacto significativo.

Nvidia Dynamo: ¿Otro Foso Defensivo?

Mientras el resto de la industria intenta igualar (sin éxito) el rendimiento de la GPU de Nvidia, la compañía está optimizando toda la «fábrica de IA». El nuevo «Sistema Operativo de Fábrica de IA» Dynamo y la red óptica co-empaquetada son dos ejemplos.

Nvidia ha reescrito por completo su software de inferencia Triton para gestionar y optimizar el procesamiento de inferencia distribuida necesario para realizar IA agéntica y de razonamiento. Nvidia Dynamo es un marco de inferencia modular de código abierto para servir modelos de IA generativa en entornos distribuidos. Piense en ello como el sistema operativo o el Kubernetes para una fábrica de IA. Permite escalar las cargas de trabajo de inferencia en grandes flotas de GPU (potencialmente millones) con programación dinámica de recursos, enrutamiento inteligente de solicitudes, gestión optimizada de la memoria y transferencia de datos acelerada. El concepto de gestión de memoria en Dynamo es la distribución de la caché de valores clave (KV Cache). Permite que toda la fábrica de IA acceda a resultados de razonamiento previos y los sirva instantáneamente, evitando costosos recálculos.

Al servir el modelo de razonamiento de código abierto DeepSeek-R1 671B en Nvidia GB200 NVL72, Nvidia Dynamo aumentó el número de solicitudes hasta en 30 veces, ayudando a las fábricas de IA a reducir los costos para maximizar la generación de ingresos por token.

Escalabilidad Fotónica Óptica Co-empaquetada

Esta innovación implica que la óptica co-empaquetada, que no se esperaba que estuviera lista por ningún proveedor hasta dentro de un par de años, ahora será enviada por Nvidia para la escalabilidad a millones de GPU a finales de este año.

La Hoja de Ruta de Hardware Actualizada de Nvidia

Aquí está la nueva línea de GPU de Nvidia hasta 2028. El aumento anual en la potencia de computación, la memoria y las redes debería ser impresionante, pero la audiencia en GTC parecía no esperar menos de la compañía que prácticamente reinventó la computación.

Primero, Blackwell Ultra, que llegará a finales de este año:

Después de otro año, a finales de 2026, Rubin aparece en el mismo rack Oberon. Así que Nvidia está entregando tres generaciones de GPU en la misma infraestructura de rack. En este punto, la nomenclatura cambia para identificar el número de GPU en el rack conectado a NVLink (144) en lugar del número de paquetes de doble CPU (72), todo en preparación para Rubin Ultra.

Rubin Ultra será un gran paso adelante en densidad con 576 GPU en un solo rack «Kyber» con cuatro matrices de GPU de tamaño completo en un paquete, una nueva CPU Arm Vera y el nuevo NVlink7 con doce veces el rendimiento. Este rack ofrecerá unos 15 Exaflops de rendimiento FP4 (14 veces más que el próximo Blackwell GB300) y 4.6 Petabytes de memoria HBM4e.

Rubin será 900 veces más rápido que Hopper del año pasado, con un 3% del costo total de propiedad. La industria nunca ha visto un ritmo de aumento de rendimiento como este en dos años.

Agregando el nuevo DGX Spark de 1 PFlop, DGX Station de 20 PFlop, etc., esta es la línea de IA empresarial de Nvidia de este año. Tenga en cuenta que todos estos productos están disponibles a través de los socios de Nvidia.

Nvidia: La Compañía Fundamental de la IA

Cuando se le preguntó en qué se está convirtiendo Nvidia en una sesión de analistas de grupo pequeño, Jensen dijo que la compañía ya está en transición a su futuro lugar en la industria como LA compañía fundamental de IA. Jensen mostró diapositivas de muchos clientes empresariales grandes que respaldaban este punto; cada uno tenía iconos verdes con hasta una docena de módulos de Microservicios de Inferencia de Nvidia (NIMS) y hardware integrados en sus pilas de IA; una vez que estos iconos verdes están allí, no saldrán fácilmente.

Si bien Nvidia ciertamente enfrentará una creciente competencia de sus clientes de hiperescala y proveedores de chips, el panorama general es el siguiente: Mientras que el resto de la industria está tratando de igualar el rendimiento de su GPU, y no lo logran, Nvidia está renovando por completo el panorama de la industria. Todavía hay mucho por explorar, como todo el nuevo software que Jensen anunció en su discurso de apertura, ni las nuevas PC y estaciones de trabajo con IA que superan a cualquier otra PC con IA en uno o dos órdenes de magnitud.

Insights de Evox News: Cómo la Estrategia de Nvidia Puede Impactar tu Negocio

La serie de anuncios y lanzamientos de Nvidia en la conferencia GTC tiene implicaciones significativas para las empresas en diversos sectores:

Ventaja Competitiva a través de la Adopción Temprana: La rápida cadencia de innovación de Nvidia, con ciclos de productos anuales y mejoras exponenciales en el rendimiento, presenta una oportunidad y un desafío. Las empresas que adopten rápidamente las nuevas tecnologías de Nvidia, como Blackwell y Rubin, podrán obtener una ventaja competitiva significativa en términos de capacidad de procesamiento de IA, eficiencia y costos. Aquellas que se queden atrás corren el riesgo de quedar obsoletas.
Transformación de la Infraestructura de TI: La demanda de mayor potencia y refrigeración para las nuevas generaciones de GPU de Nvidia requerirá que las empresas inviertan en la modernización de sus centros de datos. Esto implica considerar la adopción de refrigeración líquida y la planificación para racks de alta densidad energética.
Optimización de Costos y Eficiencia con Software: Las innovaciones de software de Nvidia, como Dynamo, ofrecen oportunidades para optimizar los costos y la eficiencia de las operaciones de IA. La capacidad de gestionar y optimizar la inferencia distribuida puede traducirse en una reducción significativa de los costos operativos y un aumento de la rentabilidad.
Nuevos Modelos de Negocio basados en IA: La plataforma de Nvidia no solo proporciona hardware, sino que es la base de la computación orientada a la IA. Las empresas deben usar esta capacidad para apalancar las capacidades y crear una estrategia de negocios basada en IA. Esto puede significar desde la creación de nuevos productos hasta la transformación de procesos internos.
* Monitoreo del Ecosistema de Nvidia: La estrategia de Nvidia de convertirse en la «compañía fundamental de la IA» implica la creación de un ecosistema robusto de hardware, software y servicios. Las empresas deben estar atentas a las nuevas ofertas y asociaciones de Nvidia, ya que estas podrían proporcionar oportunidades para la innovación y la colaboración.

En resumen, la estrategia de Nvidia está redefiniendo el panorama de la IA y presenta tanto oportunidades como desafíos para las empresas. La adopción temprana, la adaptación de la infraestructura y la exploración de nuevos modelos de negocio basados en la IA serán clave para aprovechar al máximo el potencial de esta tecnología disruptiva

Compartir este artículo