HemNyheterHårdvaraHuawei lanserar Atlas 350 AI med kinesiskt High-Bandwidth Memory

Huawei lanserar Atlas 350 AI med kinesiskt High-Bandwidth Memory

Kina-tillverkat High-Bandwidth Memory ett genombrott för landets ambitioner om teknologisk självförsörjning.

Kinas tidigare långsiktiga mål om teknologisk självförsörjning har accelererat till följd av USA:s allt hårdare handelsrestriktioner inom framförallt halvledare. Nu har landet och dess teknikjätte Huawei nått en ny milstolpe, då den senare lanserat den helt nya beräkningskretsen Ascend 950PR som tar plats i acceleratorn Atlas 350.

Nya Atlas 350 upp visades under Huawei China Partner Conference 2026 och enligt bolaget levererar det 2,87 gånger beräkningskraften hos Nvidia H20, den kraftigt nedskalade versionen av H200 som var det bäst presterande Nvidia under lång tid fick leverera till Kina. En av de stora nyheterna som möjliggör detta är stöd för flyttalsberäkningar med FP4-precision (4-bit floating-point), eller rättare sagt lågprecision, som lämpar sig särskilt väl för inferens där en redan tränad AI-modell används för att analysera data och generera innehåll.

Huawei lyfter fram just att Atlas 350 i första hand är ämnad inferens snarare än träning, vilket sannolikt är en avvägning sett till Kinas inhemska produktionsförmåga. Med tillverkning begränsad till 7 nanometer har Huawei krasst en begränsad transistorbudget och behöver prioritera funktioner i en bit kisel, samtidigt som landet ännu inte har High-Bandwidth Memory (HBM) vars kapacitet och bandbredd som Nvidia, AMD och andra bolag i ”väst” har till förfogande. Likt andra AI-tillämpningar behöver inferens tillgång till hög kapacitet och bandbredd, men inte i samma utsträckning som vid träning av AI-modeller. Stöd för och användning av FP4-precision sänker också minneskraven.

På specifikationssidan har Huawei Atlas 350 en teoretisk beräkningskraft om 1 560 teraflops sekund (TFLOPS) vid FP4-beräkningar och 780 TFLOPS vid FP8, att jämföra med 296 TFLOPS (FP8) för Nvidia H20. Värt att betona är att Nvidia H20 och dess icke nedskalade dito H200 helt saknar stöd för FP4, och måste använda FP8 även vid beräkningar som fungerar med FP4-precision. Nackdel Huawei är att beräkningskortet har en specificerad effektförbrukning om 600 watt, vilket är 50 procent högre än Nvidias bakbundna Kina-alternativ H20.

Jämte själva slutprodukten är en av de stora nyheterna det primärminne som driver Atlas 350. Här använder Huawei en egenutvecklad variant av HBM kallad ”HiBL 1.0”, som uppges vara mer kostnadseffektivt än traditionellt HBM. Med detta erbjuder AI-acceleratorn Atlas 350 totalt 112 GB minne med en bandbredd om 1,4 TB/s, vilket är betydligt lägre än de 3,2 TB/s som Ascend 910C med 128 GB HBM2E förmår.

Där Huawei Ascend 910C använder HBM2E, som Huawei i strid med USA:s handelsrestriktioner importerade från SK Hynix och Samsung via avancerade upplägg, är det HBM som används i Atlas 350 tillverkat i Kina. Under hösten rapporterade Semi14 att Huawei fått allt svårare att anskaffa just HBM från utlandet och att inhemsk produktion blir helt avgörande för bolagets – men även landets – AI-ambitioner. Inte nog med detta tycks det numera finnas inhemsk förmåga för paketering, det vill säga att paketera ihop en AI-krets och HBM-minne med en interposer.

Samtidigt som Huawei presenterade Atlas 350 som en faktisk slutprodukt talade bolaget även om Ascend 950PR som chip, vilket ger en föraning om framtiden. Enligt bolaget kan Ascend 950PR leverera maximal teoretisk beräkningsprestanda om upp till 2 000 TFLOPS (FP4), en minneskapacitet om 128 GB och 1,6 TB/s bandbredd – motsvarande 28,2 procent högre beräkningsprestanda och 14,2 procent bättre på minnesfronten. Då Huawei officiellt talar om dessa siffror är det sannolikt endast en tidsfråga innan ett nytt beräkningskort med beräkningskretsens fulla potential lanseras.

Förutom att lansera beräkningskretsen Ascend 950PR som införlivats i Atlas 350 planerar Huawei för ytterligare en krets i samma generation. Här handlar det om Ascend 950DT, som istället för inferens är ämnat träning av AI-modeller. Att Ascend 950DT inte lanseras redan nu kan ha flera orsaker, där det enkla svaret är att den ännu inte är färdig. Det andra mer spekulativa från Semi14:s håll är att Huawei inväntar ytterligare framsteg på minnesfronten, för att ha nog med kapacitet och bandbredd för att förse en kraftfulla AI-accelerator med tillräcklig data.

KällaITHome
Jacob Hugosson
Jacob Hugosson
Chefredaktör och medgrundare av Semi14. Datornörd som med åren utvecklat en fallenhet för halvledarbranschen. Har sedan år 2008 skrivit för tidningar i print och online, hos vilka han verkat som alltifrån chefredaktör till community manager.
Relaterade artiklar
Annons

Nyhetsbrev

Prenumerera på vårt nyhetsbrev – våra nyheter i din inkorg cirka en gång i veckan.

Läs också