Nvidia Geforce RTX 4090 ”Ada Lovelace” – 78 miljarder transistorer

Semi14 bjuder på en längre genomgång av nyheterna i Geforce RTX 4000-serien, som tar vid efter långköraren RTX 3000.

7 december 2022

Specifikationer: Geforce RTX 4090, RTX 4080 16 GB och RTX 4070 Ti

	RTX 4090	RTX 3090 Ti	RTX 4080 16 GB	RTX 4070 Ti	RTX 3080 Ti
Teknik	4nm TSMC	8nm Samsung	4nm TSMC	4nm TSMC	8nm Samsung
Krets	AD102	GA102	AD103	AD104	GA102
Kretsyta	608 mm²	628 mm²	379 mm²	295 mm²	628 mm²
Transistorer	76 miljarder	28,3 miljarder	45,9 miljarder	35,8 miljarder	28,3 miljarder
Arkitektur	Ada Lovelace	Ampere	Ada Lovelace	Ada Lovelace	Ampere
CUDA-kärnor	16 384 st.	10 752 st.	9 728 st.	7 680 st.	10 240 st.
RT-kärnor	128 st.	84 st.	76 st.	60 st.	80 st.
Tensor-kärnor	512 st.	336 st.	304 st.	240 st.	320 st.
Texturenheter	512 st.	336 st.	304 st.	240 st.	320 st.
Rasterenheter	192 st.	112 st.	112 st.	80 st.	112 st.
Klockfrekvens	2 230 MHz	1 560 MHz	2 210 MHz	2 310 MHz	1 365 MHz
GPU Boost	2 520 MHz	1 860 MHz	2 510 MHz	2 610 MHz	1 665 MHz
Beräkningskraft	82 575 GFLOPS	39 997 GFLOPS	48 835 GFLOPS	40 090 GFLOPS	34 099 GFLOPS
Minnesmängd	24 GB GDDR6X	24 GB GDDR6X	16 GB GDDR6X	12 GB GDDR6X	12 GB GDDR6X
Minnesfrekvens	21 200 MHz	21 000 MHz	23 000 MHz	21 000 MHz	19 000 MHz
Minnesbuss	384-bit	384-bit	256-bit	192-bit	384-bit
Minnesbandbredd	1 017,6 GB/s	1 008 GB/s	736 GB/s	504 GB/s	912 GB/s
PCI Express	v4.0 x16	v4.0 x16	v4.0 x16	v4.0 x16	v4.0 x16
Strömförsörjning	12VHPWR1×12-pin	12-pin	12VHPWR	12VHPWR	12-pin
SLI-anslutning	Nej	NVLink 3.0 x4	Nej	Nej	–
TBP	450 W	450 W	320 W	285 W	350 W
Pris vid lansering	21 990 kronor 1 599 USD	23 990 kronor 1 999 USD	16 490 kronor 1 199 USD	12 490 kronor* 899 USD	12 900 kronor 1 199 USD

* Det svenska priset för kommande Geforce RTX 4070 Ti är en uppskattning

Först ut att äntra scen med arkitekturen Ada Lovelace är flaggskeppet Geforce RTX 4090, vilken som brukligt baseras på toppkretsen AD102 vi gick igenom på föregående sida. Det handlar om en 608 mm² stor krets tillverkad på TSMC:s N4, en förfinad 5-nanometersteknik, med 76 miljarder transistorer. Detta är att jämföra med 628 mm² och 28,3 miljarder hos GA102 i RTX 3090 Ti.

Nvidia Geforce RTX 4090 har 12,5 procent av beräkningsenheterna i AD102 inaktiverade, det vill säga 16 av 144 SM-kluster. Det resulterar i 16 384 CUDA-kärnor, 128 RT-kärnor för ray tracing, 512 Tensor-kärnor för maskininlärning, 512 texturenheter och 176 rasterenheter. Till detta hör 72 MB L2-cacheminne och en minnesbuss på 384 bitar med stöd för GDDR6X.

Ökningen i CUDA-kärnor är i sammanhanget relativt blygsamma 52,4 procent, men detta vägs upp av flytten till TSMC:s moderna tillverkningsteknik som möjliggör högre klockfrekvenser. Den specificerade boost-frekvensen går upp med 660 MHz till 2 520 MHz, en ökning med 35,5 procent jämfört mot föregående flaggskepp Geforce RTX 3090 Ti. Tillsammans med ökningen i antalet CUDA-kärnor ger det en ökad teoretisk beräkningskraft om 106,5 procent – mer än en dubblering. Sett till Tensor- och RT-kärnorna som dessutom dubblerats i kapacitet är den faktiska ökningen betydligt större.

På minnesfronten har inga stordåd ägt rum jämfört mot förra generationens flaggskepp. Det handlar om samma bredd på minnesbussen, 384 bitar, och minnesstandarden är fortsatt GDDR6X. Grafikminnet har fått en symbolisk ökning med en effektiv klockfrekvens om 21 200 MHz, upp från tidigare 21 000 MHz, vilket motsvarar knappt 1 procent. Att mängden L2-cacheminne sexdubblats från 12 till 72 MB bidrar desto mer till att öka den praktiska bandbredden som behövs för att göda beräkningsenheterna i en på pappret dubbelt så snabb grafikkrets.

Slutledning

Med Geforce RTX 3000-serien introducerade Nvidia en unik kylardesign, med en fläkt på fram- och baksidan av grafikkort, något bolaget fortsätter med även denna generation. I fronten sitter en fläkt i fronten på grafikkortets baksida, som blåser mot en kylfläns och ut genom framsidan. På grafikkortets bakre del sitter fläkten i på framsidan och blåser rakt mot kretskortet och ut ur chassits baksida. Nvidia Geforce RTX 4090 mäter in på 305 × 136 × 61 mm (L × B × D) och är därmed något kortare (8 mm) och tjockare (7 mm) än RTX 3090 Founders Edition.

Grafikkortet har ett Total Board Power (TBP) om 450 W, vilket är strömförbrukningen för allt som sitter på kretskortet. Det är samma nivå som för föregångaren Geforce RTX 3090 Ti. För att mata modellen med ström har grafikkortet en ensam 12VHPWR1×12-pin, den så kallade PCI Express 5.0-anslutningen, och då denna knappt finns på nätaggregat idag skickar Nvidia med en adapter. Till denna är det möjligt att ansluta upp till fyra stycken 8-pins PCI Express-anslutningar, vilka enligt ATX-specifikationen kan leverera upp till 150 W vardera. Enligt Nvidia krävs dock endast tre stycken, medan den fjärde rekommenderas vid överklockning.

Nvidias nya Geforce RTX 4000-serie tar inte klivet till PCI Express 5.0, trots att både AMD och Intel har plattformar med stöd för detta, utan stannar kvar vid version 4.0. Nu tar Nvidia även en gång för alla död på SLI och slopar NVLink, som gjorde det möjligt att koppla samman två grafikkort. För bildanslutningar har Founders Edition-modellen tre stycken Displayport 1.4a och en HDMI 2.1.

Avslutningsvis har vi priset, som likt föregående generation i i konsumentled är i klassen skyhögt. Rekommenderat pris är 1 599 USD, vilket är 400 USD lägre än Geforce RTX 3090 Ti och 100 USD över ursprungliga RTX 3090. Likt senaste tidens lanseringar handlar det dock om en rejäl prisökning här i Sverige, då den svenska kronan tappat rejält i värde. Svenska rekommenderade priser ligger på hela 21 990 kronor och här är det verkligen värt att betona att det är en startnivå – billigaste listade modell i svensk handel i början av december 2022 kostar 24 999 kronor.

Relaterade artiklar

Nvidia Geforce RTX 4090 ”Ada Lovelace” – 78 miljarder transistorer

Specifikationer: Geforce RTX 4090, RTX 4080 16 GB och RTX 4070 Ti

Slutledning

Racet mot ångström – Intel, Samsung och TSMC växlar upp

Analys: 2024 året då EUV-litografi lämnar Kina på efterkälken

Analys av SMIC:s 7 nanometer och vägen framåt för Kina

Nyhetsbrev

Läs också

Nederländskt universitet satsar 200 miljoner euro på halvledarforskning

Mycronic receives order for three mask writers

Mediatek överväger flytta produktion till USA för att undgå tullar

Minnespriser ökar med upp till 30 procent

Om Semi14

In English