HemArtiklarReportageNvidia Geforce RTX 4090 "Ada Lovelace" – 78 miljarder transistorer

Nvidia Geforce RTX 4090 ”Ada Lovelace” – 78 miljarder transistorer

Semi14 bjuder på en längre genomgång av nyheterna i Geforce RTX 4000-serien, som tar vid efter långköraren RTX 3000.

Specifikationer: Geforce RTX 4090, RTX 4080 16 GB och RTX 4070 Ti

RTX 4090RTX 3090 TiRTX 4080 16 GBRTX 4070 TiRTX 3080 Ti
Teknik4nm TSMC8nm Samsung4nm TSMC4nm TSMC8nm Samsung
KretsAD102GA102AD103AD104GA102
Kretsyta608 mm²628 mm²379 mm²295 mm²628 mm²
Transistorer76 miljarder28,3 miljarder45,9 miljarder35,8 miljarder28,3 miljarder
ArkitekturAda LovelaceAmpereAda LovelaceAda LovelaceAmpere
CUDA-kärnor16 384 st.10 752 st.9 728 st.7 680 st.10 240 st.
RT-kärnor128 st.84 st.76 st.60 st.80 st.
Tensor-kärnor512 st.336 st.304 st.240 st.320 st.
Texturenheter512 st.336 st.304 st.240 st.320 st.
Rasterenheter192 st.112 st.112 st.80 st.112 st.
Klockfrekvens2 230 MHz1 560 MHz2 210 MHz2 310 MHz1 365 MHz
GPU Boost2 520 MHz1 860 MHz2 510 MHz2 610 MHz1 665 MHz
Beräkningskraft82 575 GFLOPS39 997 GFLOPS48 835 GFLOPS40 090 GFLOPS34 099 GFLOPS
Minnesmängd24 GB GDDR6X24 GB GDDR6X16 GB GDDR6X12 GB GDDR6X12 GB GDDR6X
Minnesfrekvens21 200 MHz21 000 MHz23 000 MHz21 000 MHz19 000 MHz
Minnesbuss384-bit384-bit256-bit192-bit384-bit
Minnesbandbredd1 017,6 GB/s1 008 GB/s736 GB/s504 GB/s912 GB/s
PCI Expressv4.0 x16v4.0 x16v4.0 x16v4.0 x16v4.0 x16
Strömförsörjning12VHPWR1×12-pin12-pin12VHPWR12VHPWR12-pin
SLI-anslutningNejNVLink 3.0 x4NejNej
TBP450 W450 W320 W285 W350 W
Pris vid lansering21 990 kronor
1 599 USD
23 990 kronor
1 999 USD
16 490 kronor
1 199 USD
12 490 kronor*
899 USD
12 900 kronor
1 199 USD
* Det svenska priset för kommande Geforce RTX 4070 Ti är en uppskattning

Först ut att äntra scen med arkitekturen Ada Lovelace är flaggskeppet Geforce RTX 4090, vilken som brukligt baseras på toppkretsen AD102 vi gick igenom på föregående sida. Det handlar om en 608 mm² stor krets tillverkad på TSMC:s N4, en förfinad 5-nanometersteknik, med 76 miljarder transistorer. Detta är att jämföra med 628 mm² och 28,3 miljarder hos GA102 i RTX 3090 Ti.

Nvidia Geforce RTX 4090 har 12,5 procent av beräkningsenheterna i AD102 inaktiverade, det vill säga 16 av 144 SM-kluster. Det resulterar i 16 384 CUDA-kärnor, 128 RT-kärnor för ray tracing, 512 Tensor-kärnor för maskininlärning, 512 texturenheter och 176 rasterenheter. Till detta hör 72 MB L2-cacheminne och en minnesbuss på 384 bitar med stöd för GDDR6X.

Ökningen i CUDA-kärnor är i sammanhanget relativt blygsamma 52,4 procent, men detta vägs upp av flytten till TSMC:s moderna tillverkningsteknik som möjliggör högre klockfrekvenser. Den specificerade boost-frekvensen går upp med 660 MHz till 2 520 MHz, en ökning med 35,5 procent jämfört mot föregående flaggskepp Geforce RTX 3090 Ti. Tillsammans med ökningen i antalet CUDA-kärnor ger det en ökad teoretisk beräkningskraft om 106,5 procent – mer än en dubblering. Sett till Tensor- och RT-kärnorna som dessutom dubblerats i kapacitet är den faktiska ökningen betydligt större.

På minnesfronten har inga stordåd ägt rum jämfört mot förra generationens flaggskepp. Det handlar om samma bredd på minnesbussen, 384 bitar, och minnesstandarden är fortsatt GDDR6X. Grafikminnet har fått en symbolisk ökning med en effektiv klockfrekvens om 21 200 MHz, upp från tidigare 21 000 MHz, vilket motsvarar knappt 1 procent. Att mängden L2-cacheminne sexdubblats från 12 till 72 MB bidrar desto mer till att öka den praktiska bandbredden som behövs för att göda beräkningsenheterna i en på pappret dubbelt så snabb grafikkrets.

Slutledning

Med Geforce RTX 3000-serien introducerade Nvidia en unik kylardesign, med en fläkt på fram- och baksidan av grafikkort, något bolaget fortsätter med även denna generation. I fronten sitter en fläkt i fronten på grafikkortets baksida, som blåser mot en kylfläns och ut genom framsidan. På grafikkortets bakre del sitter fläkten i på framsidan och blåser rakt mot kretskortet och ut ur chassits baksida. Nvidia Geforce RTX 4090 mäter in på 305 × 136 × 61 mm (L × B × D) och är därmed något kortare (8 mm) och tjockare (7 mm) än RTX 3090 Founders Edition.

Grafikkortet har ett Total Board Power (TBP) om 450 W, vilket är strömförbrukningen för allt som sitter på kretskortet. Det är samma nivå som för föregångaren Geforce RTX 3090 Ti. För att mata modellen med ström har grafikkortet en ensam 12VHPWR1×12-pin, den så kallade PCI Express 5.0-anslutningen, och då denna knappt finns på nätaggregat idag skickar Nvidia med en adapter. Till denna är det möjligt att ansluta upp till fyra stycken 8-pins PCI Express-anslutningar, vilka enligt ATX-specifikationen kan leverera upp till 150 W vardera. Enligt Nvidia krävs dock endast tre stycken, medan den fjärde rekommenderas vid överklockning.

Nvidias nya Geforce RTX 4000-serie tar inte klivet till PCI Express 5.0, trots att både AMD och Intel har plattformar med stöd för detta, utan stannar kvar vid version 4.0. Nu tar Nvidia även en gång för alla död på SLI och slopar NVLink, som gjorde det möjligt att koppla samman två grafikkort. För bildanslutningar har Founders Edition-modellen tre stycken Displayport 1.4a och en HDMI 2.1.

Avslutningsvis har vi priset, som likt föregående generation i i konsumentled är i klassen skyhögt. Rekommenderat pris är 1 599 USD, vilket är 400 USD lägre än Geforce RTX 3090 Ti och 100 USD över ursprungliga RTX 3090. Likt senaste tidens lanseringar handlar det dock om en rejäl prisökning här i Sverige, då den svenska kronan tappat rejält i värde. Svenska rekommenderade priser ligger på hela 21 990 kronor och här är det verkligen värt att betona att det är en startnivå – billigaste listade modell i svensk handel i början av december 2022 kostar 24 999 kronor.

Jacob Hugosson
Jacob Hugosson
Chefredaktör och medgrundare av Semi14. Datornörd som med åren utvecklat en fallenhet för halvledarbranschen. Har sedan 2008 år skrivit för tidningar i print och online, hos vilka han verkat som alltifrån chefredaktör till community manager.
Relaterade artiklar
Annons

Läs också