Nvidia må ha fått lägga sitt uppköp av ARM på hyllan till följd av konkurrensmyndigheters motstånd, men bolaget har sannerligen inte gett upp utvecklingen av produkter baserade på ARM:s teknik. Under bolagets konferens GTC 2022 presenterades en av de stöddigaste pjäserna i CPU-väg som någonsin existerat, den 144-kärniga processorn Grace och även nästa generations beräkningskort Hopper.
Med ett gross kärnor över två separata chip om 72 kärnor är siktet för Grace inställt på serverhallarna, vilket görs med hjälp av instruktionsuppsättningen ARMv9. Dubbla Grace sammanfogade över Nvlink bildar Grace CPU Superchip, Nvidias första renodlade CPU byggd på ARM:s teknik. Enligt bolaget är prestandan hela 1,5 gånger högre än vad två av AMD:s senaste 64-kärniga Epyc-processorer i samverkan mäktar med vid prestandatester i Spec.
Stora framsteg utlovas även inom energieffektivitet, med dubbel prestanda per watt ställt mot dagens bästa serverprocessorer. Detta möjliggörs genom tillverkning på 5 nanometer, dit varken AMD eller Intel nått med processorer, och plattformen som står värd för Grace CPU Superchip är ARM:s Neoverse N2 Perseus. Plattformen i sig erbjuder stöd för PCI Express 5.0, DDR5, HBM3, CCIX 2.0 och CXL 2.0.
Enligt Nvidia kommer Grace CPU Superchip vara marknadens snabbaste processor när den når marknaden tidigt år 2023. Vad Intels kommande 56-kärniga serverprocessorer i Sapphire Rapids-familjen och AMD:s arkitektur Zen 4 med upp till 96 kärnor per processor har att säga om saken återstår att se. Nvidia Grace delar sannolikt med AMD:s Zen 4 TSMC:s produktionslinor på 5 nanometer.
Under GTC 2022 premiärvisades också Nvidias kommande grafikarkitektur Hopper, där beräkningskortet H100 var dragplåstret. Möjligheterna att para CPU:n Grace med GPU:n Hopper lät inte vänta på sig, utan Nvidia visade också beräkningskortet Grace Hopper Superchip. Här talar de två kretsarna med varandra över Nvlink i 900 GB/s, och delar utöver HBM3 dessutom LPDDR5X-minne med ECC-stöd mellan varandra.
Grafikprocessorn eller beräkningskortet Hopper imponerar av flera anledningar. Nvidia har utlovat att kretsen H100 kommer tillverkas på 4 nanometer, och med fjärde generationens Tensor-kärnor menar bolaget att AI-upplärning går nio gånger snabbare än Ampere-baserade A100. Antalet transistorer är 80 miljarder, CUDA-kärnorna är 16 896 stycken till antalet och siktet är inställt på ”arbetslaster hos mindre storbolag till HPC-beräkningar i exascale”.
Nvidia talar också om en H100-krets med ”600 GB minne”. Denna siffra är uppnåelig i Grace Hopper Superchip, där 512 GB LPDDR5X kan kan kombineras med Hopper-grafikkretsens HBM3-minne om 80 GB i 4,8 Gbps. Strömförbrukningen för det fristående beräkningskortet H100 specificeras till 700 watt – vilket innebär att Grace Hopper Superchip kan landa på svårkylda 960 watt.
Med Grace och Hopper ser Nvidia alltså ut att ha en duo produkter redo att utmana Intel och AMD i serverhallarna på allvar. Bolagets beräkningskort må de facto vara dominanta i högprestandaapplikationer redan idag, men CPU:er värda sitt salt har hittills saknats i produktutbudet. Det blåser upp till storm i serverhallarna år 2023 om Nvidia kan leverera.