Nvidia DGX : un énorme échec
Je vous avais parlé du Nvidia DGX Spark aussi appelé "Project Digit" : basé sur la nouvelle architecture Blackwell et supportant un encodage fp4 (virgule flottante avec 4+1 bits d'informations au total), 128 Go de RAM permettant de supporter des modèles d'IA jusqu'à probablement 200 milliards de paramètres (weight). Avec les performances Nvidia pour l'IA.
Autour de 3000$ USD le bout.
L'annonce comportait aussi une DGX station, avec 768 Go de RAM, pouvant supporter les meilleurs grands modèles de langages (LLM) dans leurs plus grandes tailles comme DeepSeek, même avec 1000 milliards de paramètres/weights, là aussi avec des performances incroyables attendues avec du Nvidia. Mais moins accessible évidemment.
Ce DGX Spark avait été annoncé il y a 6 mois, en mars 2025 pour sortir ou au moins être précommandable en avril 2025...
Mon boss avait précommandé 2 DGX Spark à 3000$ USD l'unité. On en a reparlé hier.
Six mois plus tard, on ne voit rien venir, un échec cuisant pour Nvidia et ses partenaires dont HP ou Dell, et la raison semble être des problèmes de production des puces nécessaires, de la génération Blackwell, chez TSMC !
Nvidia lui aussi est frappé de la malédiction du contrôle sur la fabrication de ses puces, comme Intel !
Heureusement, Apple propose des Mac Studio M4 Max avec 128 Go de RAM, et des Mac Studio M3 Ultra avec 512 Go de RAM (jusqu'à 600-700 milliards de paramètres/weights).
Probablement un des meilleurs choix existant