Specifikationer: Geforce RTX 4090, RTX 4080 16 GB och RTX 4070 Ti
RTX 4090 | RTX 3090 Ti | RTX 4080 16 GB | RTX 4070 Ti | RTX 3080 Ti | |
---|---|---|---|---|---|
Teknik | 4nm TSMC | 8nm Samsung | 4nm TSMC | 4nm TSMC | 8nm Samsung |
Krets | AD102 | GA102 | AD103 | AD104 | GA102 |
Kretsyta | 608 mm² | 628 mm² | 379 mm² | 295 mm² | 628 mm² |
Transistorer | 76 miljarder | 28,3 miljarder | 45,9 miljarder | 35,8 miljarder | 28,3 miljarder |
Arkitektur | Ada Lovelace | Ampere | Ada Lovelace | Ada Lovelace | Ampere |
CUDA-kärnor | 16 384 st. | 10 752 st. | 9 728 st. | 7 680 st. | 10 240 st. |
RT-kärnor | 128 st. | 84 st. | 76 st. | 60 st. | 80 st. |
Tensor-kärnor | 512 st. | 336 st. | 304 st. | 240 st. | 320 st. |
Texturenheter | 512 st. | 336 st. | 304 st. | 240 st. | 320 st. |
Rasterenheter | 192 st. | 112 st. | 112 st. | 80 st. | 112 st. |
Klockfrekvens | 2 230 MHz | 1 560 MHz | 2 210 MHz | 2 310 MHz | 1 365 MHz |
GPU Boost | 2 520 MHz | 1 860 MHz | 2 510 MHz | 2 610 MHz | 1 665 MHz |
Beräkningskraft | 82 575 GFLOPS | 39 997 GFLOPS | 48 835 GFLOPS | 40 090 GFLOPS | 34 099 GFLOPS |
Minnesmängd | 24 GB GDDR6X | 24 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 12 GB GDDR6X |
Minnesfrekvens | 21 200 MHz | 21 000 MHz | 23 000 MHz | 21 000 MHz | 19 000 MHz |
Minnesbuss | 384-bit | 384-bit | 256-bit | 192-bit | 384-bit |
Minnesbandbredd | 1 017,6 GB/s | 1 008 GB/s | 736 GB/s | 504 GB/s | 912 GB/s |
PCI Express | v4.0 x16 | v4.0 x16 | v4.0 x16 | v4.0 x16 | v4.0 x16 |
Strömförsörjning | 12VHPWR1×12-pin | 12-pin | 12VHPWR | 12VHPWR | 12-pin |
SLI-anslutning | Nej | NVLink 3.0 x4 | Nej | Nej | – |
TBP | 450 W | 450 W | 320 W | 285 W | 350 W |
Pris vid lansering | 21 990 kronor 1 599 USD | 23 990 kronor 1 999 USD | 16 490 kronor 1 199 USD | 12 490 kronor* 899 USD | 12 900 kronor 1 199 USD |
Först ut att äntra scen med arkitekturen Ada Lovelace är flaggskeppet Geforce RTX 4090, vilken som brukligt baseras på toppkretsen AD102 vi gick igenom på föregående sida. Det handlar om en 608 mm² stor krets tillverkad på TSMC:s N4, en förfinad 5-nanometersteknik, med 76 miljarder transistorer. Detta är att jämföra med 628 mm² och 28,3 miljarder hos GA102 i RTX 3090 Ti.
Nvidia Geforce RTX 4090 har 12,5 procent av beräkningsenheterna i AD102 inaktiverade, det vill säga 16 av 144 SM-kluster. Det resulterar i 16 384 CUDA-kärnor, 128 RT-kärnor för ray tracing, 512 Tensor-kärnor för maskininlärning, 512 texturenheter och 176 rasterenheter. Till detta hör 72 MB L2-cacheminne och en minnesbuss på 384 bitar med stöd för GDDR6X.
Ökningen i CUDA-kärnor är i sammanhanget relativt blygsamma 52,4 procent, men detta vägs upp av flytten till TSMC:s moderna tillverkningsteknik som möjliggör högre klockfrekvenser. Den specificerade boost-frekvensen går upp med 660 MHz till 2 520 MHz, en ökning med 35,5 procent jämfört mot föregående flaggskepp Geforce RTX 3090 Ti. Tillsammans med ökningen i antalet CUDA-kärnor ger det en ökad teoretisk beräkningskraft om 106,5 procent – mer än en dubblering. Sett till Tensor- och RT-kärnorna som dessutom dubblerats i kapacitet är den faktiska ökningen betydligt större.
På minnesfronten har inga stordåd ägt rum jämfört mot förra generationens flaggskepp. Det handlar om samma bredd på minnesbussen, 384 bitar, och minnesstandarden är fortsatt GDDR6X. Grafikminnet har fått en symbolisk ökning med en effektiv klockfrekvens om 21 200 MHz, upp från tidigare 21 000 MHz, vilket motsvarar knappt 1 procent. Att mängden L2-cacheminne sexdubblats från 12 till 72 MB bidrar desto mer till att öka den praktiska bandbredden som behövs för att göda beräkningsenheterna i en på pappret dubbelt så snabb grafikkrets.
Slutledning
Med Geforce RTX 3000-serien introducerade Nvidia en unik kylardesign, med en fläkt på fram- och baksidan av grafikkort, något bolaget fortsätter med även denna generation. I fronten sitter en fläkt i fronten på grafikkortets baksida, som blåser mot en kylfläns och ut genom framsidan. På grafikkortets bakre del sitter fläkten i på framsidan och blåser rakt mot kretskortet och ut ur chassits baksida. Nvidia Geforce RTX 4090 mäter in på 305 × 136 × 61 mm (L × B × D) och är därmed något kortare (8 mm) och tjockare (7 mm) än RTX 3090 Founders Edition.
Grafikkortet har ett Total Board Power (TBP) om 450 W, vilket är strömförbrukningen för allt som sitter på kretskortet. Det är samma nivå som för föregångaren Geforce RTX 3090 Ti. För att mata modellen med ström har grafikkortet en ensam 12VHPWR1×12-pin, den så kallade PCI Express 5.0-anslutningen, och då denna knappt finns på nätaggregat idag skickar Nvidia med en adapter. Till denna är det möjligt att ansluta upp till fyra stycken 8-pins PCI Express-anslutningar, vilka enligt ATX-specifikationen kan leverera upp till 150 W vardera. Enligt Nvidia krävs dock endast tre stycken, medan den fjärde rekommenderas vid överklockning.
Nvidias nya Geforce RTX 4000-serie tar inte klivet till PCI Express 5.0, trots att både AMD och Intel har plattformar med stöd för detta, utan stannar kvar vid version 4.0. Nu tar Nvidia även en gång för alla död på SLI och slopar NVLink, som gjorde det möjligt att koppla samman två grafikkort. För bildanslutningar har Founders Edition-modellen tre stycken Displayport 1.4a och en HDMI 2.1.
Avslutningsvis har vi priset, som likt föregående generation i i konsumentled är i klassen skyhögt. Rekommenderat pris är 1 599 USD, vilket är 400 USD lägre än Geforce RTX 3090 Ti och 100 USD över ursprungliga RTX 3090. Likt senaste tidens lanseringar handlar det dock om en rejäl prisökning här i Sverige, då den svenska kronan tappat rejält i värde. Svenska rekommenderade priser ligger på hela 21 990 kronor och här är det verkligen värt att betona att det är en startnivå – billigaste listade modell i svensk handel i början av december 2022 kostar 24 999 kronor.