Recomendado por Jensen Huang Para llevar la inteligencia artificial a todos los centros de datos, The nvidia El cofundador y CEO dijo hoy durante Computex en Taipei. Durante el primer discurso público de Huang en casi cuatro años, hizo varios anuncios, incluidas las fechas de lanzamiento del chip, su supercomputadora DGX GH200 y asociaciones con empresas importantes. Aquí están todas las noticias del discurso de apertura de dos horas.
1. La GPU GForce RTX 4080 Ti de Nvidia para jugadores ahora está en plena producción y «producida en masa» con socios en Taiwán.
2. Huang anunció Nvidia Avatar Cloud Engine (ACE) para juegos, un servicio personalizable de AI Model Foundry con modelos preentrenados para desarrolladores de juegos. Le dará a los NPC un carácter adicional a través de interacciones de lenguaje impulsadas por IA.
3. El modelo informático Nvidia Kuta ahora sirve a cuatro millones de desarrolladores y más de 3000 aplicaciones. Cuda ha visto más de 40 millones de descargas, incluidas 25 millones de descargas solo el año pasado.
4. Ha comenzado la producción a gran escala del servidor GPU HGX H100 y «está siendo fabricado por empresas de todo Taiwán», dijo Huang. También afirmó que fue la primera computadora del mundo con un motor transformador.
5. Huang calificó la adquisición del fabricante de chips de supercomputadoras Mellanox por parte de Nvidia en 2019 por 6.900 millones de dólares como «una de las decisiones estratégicas más importantes».
6. La producción de la próxima generación de GPU Hopper comenzará en agosto de 2024, exactamente dos años después de que comenzara la producción de la primera generación.
7. La GH200 Grace Hopper de Nvidia ya está en plena producción. El SuperChip 4 PetaFIOPS TE aprovecha 72 CPU ARM, 96 GB HBM3 y 576 GPU de memoria conectados a través de conectividad de chip a chip. Huang lo describió como el primer procesador de computadora acelerado del mundo, que también tiene una memoria gigante: «Es una computadora, no un chip». Está diseñado para aplicaciones de centros de datos de alta resistencia.
8. Si la memoria de Grace Hopper no es suficiente, Nvidia tiene una solución: la DGX GH200. Se creó conectando primero ocho Grays Hoppers a tres conmutadores NVLINK y luego conectando los módulos a 900 GB. Finalmente, 32 están conectados entre sí con otra capa de interruptores para conectar un total de 256 chips tolva gris. El ExaFLOPS Transformer Engine resultante tiene 144 TB de memoria GPU y actúa como una GPU gigante. Grace Hopper es tan rápida que puede ejecutar la capa 5G en el software, dijo Huang. Google Cloud, Meta y Microsoft estarán entre las primeras empresas en obtener acceso al DGX GH200 y explorar sus capacidades.
9. Nvidia y SoftBank se asociaron para presentar el Superchip Grace Hopper en los nuevos centros de datos distribuidos de SoftBank en Japón. Aloje aplicaciones inalámbricas y de inteligencia artificial generativa en una plataforma de servidor común para múltiples inquilinos, lo que reduce los costos y la energía.
10. La asociación SoftBank-Nvidia se basa en la arquitectura de referencia Nvidia MGX, que actualmente utilizan empresas en Taiwán. Proporciona un marco de referencia modular que permite a los fabricantes de computadoras crear más de 100 variantes de servidor para IA, computación acelerada y aplicaciones omniversas. Las empresas conjuntas incluyen ASRock Rack, Asus, Gigabyte, Pegatron, QCT y Supermicro.
11. Huang anunció la plataforma de red acelerada Spectrum-X para acelerar las nubes basadas en Ethernet. Tiene un switch Spectrum 4 con 128 puertos a 400GB/s y 51.2T/s. El conmutador está diseñado para ejecutar un nuevo tipo de Ethernet y está diseñado de extremo a extremo para el enrutamiento adaptativo, el aislamiento del rendimiento y la computación en la estructura, dijo Huang. Tiene un nick inteligente BlueField 3 que se conecta a un interruptor Spectrum 4 para controlar la congestión.
12. WPP, la agencia de publicidad más grande del mundo, se asoció con Nvidia para construir un motor de contenido basado en Nvidia Omniverse. Será capaz de crear contenido de fotos y videos para ser utilizado en publicidad.
13. La plataforma robótica Nvidia Isaac ARM ahora está disponible para cualquiera que quiera construir robots y tiene una pila completa desde chips hasta sensores. Isaac ARM comienza en un chip llamado Nova Orin y es la primera pila de referencia completa de robótica, dijo Huang.
Gracias a su prominencia en la computación de IA, las acciones de Nvidia se dispararon el año pasado y actualmente tiene una valoración de mercado de alrededor de $ 960 mil millones, lo que la convierte en una de las compañías más valiosas del mundo (solo Apple, Microsoft, Saudi Aramco, Alphabet y Amazon clasifica más alto).
El negocio chino está paralizado
No hay duda de que las empresas de inteligencia artificial de China están vigilando de cerca el silicio de vanguardia que Nvidia trae a la mesa. Mientras tanto, temen otra ronda de prohibiciones de chips en EE. UU. que amenazan con socavar su progreso en la IA generativa, que requerirá mucha más potencia informática y datos que las generaciones anteriores de IA.
El año pasado, el gobierno de EE. UU. prohibió a Nvidia vender sus unidades de procesamiento de gráficos A100 y H100 a China. Ambos chips se utilizan para entrenar modelos de lenguaje grandes como GPT-4 de OpenAI. El H100, su chip de última generación basado en la arquitectura de computación Hopper GPU de Nvidia con su motor Transformer incorporado, está experimentando una demanda particularmente fuerte. Comparado con el A100H100 puede proporcionar un entrenamiento de IA 9 veces más rápido y una inferencia de IA 30 veces más rápida en LLM.
China es obviamente un mercado enorme que no se puede perder. La prohibición de exportación de chips le costó a Nvidia $ 400 millones en ventas potenciales solo en el tercer trimestre del año pasado. Así que Nvidia recurrió a vender un chip más lento a China que cumpliría con las normas de control de exportaciones de EE. UU. Pero a la larga, China buscará alternativas aún más sólidas, y la prohibición sirve como un claro recordatorio para que China se vuelva autosuficiente en sectores tecnológicos clave.
Como dijo Huang recientemente Entrevista Con el Financial Times: “Si [China] No se puede comprar en USA, lo hacen ellos mismos. Así que Estados Unidos debe tener cuidado. China es un mercado muy importante para el sector tecnológico.