Vijesti o Tehnologiji, Recenzije i Savjeti!

El Računalo superračunalo Detaljno: AMD CPU-i i GPU-ovi za pogon 2 Exaflops Compute

Još u kolovozu, američko Ministarstvo energetike i Cray objavilo je planove za treći raketni superkompjuter Sjedinjenih Država, El Capitan. Planiran da bude instaliran u Nacionalnom laboratoriju Lawrence Livermore (LLNL) početkom 2023., sustav je namijenjen prvenstveno (ali ne isključivo) za uporabu od strane Nacionalne uprave za nuklearnu sigurnost (NNSA), koja koristi superračunala u svom trenutnom modeliranju nuklearnog oružja. U vrijeme kada je sustav najavljen, DOE i LLNL potvrdili su da će kupiti Shasta sustav od Craya (koji je sada dio HPE-a), no tadašnja najava nije ulazila u detalje o tome koji će se hardver zapravo puniti jedno od Crayjevih vrlo fleksibilnih superračunala.

Ali od danas, čekanje je gotovo. Danas popodne DOE i HPE objavljuju arhitektonske detalje superračunala, otkrivajući da će AMD pružati i CPU i ubrzava (GPU), kao i reviziju procjene performansi superračunala. Već se očekivalo da će biti najbrži od američkih eksaskalnih sustava, El Capitan je prvobitno naručen kao 1,5 Sustav exaflop prije sedam mjeseci. Međutim, zahvaljujući nekim kasnim promjenama u konfiguraciji, DOE sada očekuje da će sustav dostići 2 nakon što je u potpunosti instaliran, čime bi se učvrstilo mjesto na vrhu američkog inventara superračunala.

Sve u svemu, El Capitan je drugi (i naizgled završni) sustav koji je izgrađen u sklopu američkog DOAL-a CORAL-2 program za superračunala. Kao i sličan Frontier sustav, El Capitan dolazi s cijenama u iznosu od 600 milijuna dolara i ima za cilj osigurati američko vodstvo u superračunalima u doba ekspasiranja. LLNL će koristiti sustav za zamjenu Sierre, njihove trenutne IBM Power 9 + Superračunalo NVIDIA Volta. Sve u svemu, El Capitan će biti 16 puta moćniji od sustava koji zamjenjuje. LLNL će ga primarno koristiti za modeliranje nuklearnog oružja – zamjenu za stvarno testiranje oružja – dok će sustav također vidjeti sekundarnu uporabu kao istraživački sustav u drugim poljima, posebno onim u kojima se može primijeniti strojno učenje.

Američko Ministarstvo nadračunavanja za supermarkete
El Capitan Granica zora
CPU Arhitektura AMD EPYC "Genova"
(Zen 4)
AMD EPYC
(Budući zen)
Skalabilna Intel Xeon
GPU Arhitektura Radeon Instinkt Radeon Instinkt Intel Xe
Izvedba (RPEAK) 2,0 EFLOPS 1,5 EFLOPS 1 EFLOPS
Potrošnja energije <40MW ~ 30MW N / A
čvorovi N / A 100 ormara N / A
Laboratorija Lawrence Livermore Hrastov greben Argonne
prodavač Cray Cray Intel
Godina 2023 2021 2021

El Capitan je druga izvrsna pobjeda superračunala za AMD, koja također nudi CPU i GPU iza 1,5 exaflops Frontier sustav za nacionalni laboratorij Oak Ridge. I doista, El Capitan na visokoj razini djeluje prilično poput Frontiera iz hardverske perspektive. Budući da Cray služi kao glavni izvođač na oba sustava, El Capitan i Frontier su Cray Shasta sustavi, koji zapošljavaju AMD-ove procesore, zajedno s Crayjevim ormarićima i njihovom tehnologijom za međusobno povezivanje. Međutim, u zanimljivom preokretu događaja, LLNL tek malo više očekuje kakav će konkretni hardver biti u njihovom novom superračunalu.

El Računalo superračunalo Detaljno: AMD CPU-i i GPU-ovi za pogon 2 Exaflops Compute 1

Što se tiče CPU-a, AMD će isporučivati ​​standardnu ​​verziju svog Zen-a 4EPYC procesor na bazi „Genove“. Budući da je od AMD-ovog dosadašnjeg roba još uvijek dvije generacije, količina informacija o Zen-u 4/ Genova je ograničena, ali AMD obećava podršku za memoriju sljedeće generacije, Infinity Fabric 3, kao i široka obećanja i jednosatnih i višeslojnih vodstva za izvedbu. Značajno je da se radi o većoj razini detalja o CPU-u nego što to trenutno imamo za Frontier, a koji koristi neodređeni i prilagođeni EPYC CPU sljedeće generacije.

El Računalo superračunalo Detaljno: AMD CPU-i i GPU-ovi za pogon 2 Exaflops Compute 2

U međuvremenu, na strani GPU-a, AMD i Cray nastavljaju držati svoje kartice prilično blizu. Iako tvrtke potvrđuju da će ovo upotrebljavati AMD GPU nove generacije koristeći novu arhitekturu, oni ne nazivaju arhitekturu ili nude previše u obliku detalja o njoj. Zasad, ono što oni govore jest da će ovi GPU-ovi koristiti HBM sljedeće generacije za pamćenje i da će im pružiti podršku za računanje mješovite preciznosti za poboljšane performanse dubokog učenja.

U cjelini, ove široke specifikacije su vrlo bliske GPU-ovoj plohi koja će se koristiti u Frontier-u, tako da El Capitan možda vrlo dobro koristi isti GPU ili barem daljnji njegov derivat. Iz prirode AMD-ovih komentara o dijelu, zvuči kao da jest, trebali bismo očekivati ​​da ćemo uskoro saznati više arhitektonskih detalja.

El Računalo superračunalo Detaljno: AMD CPU-i i GPU-ovi za pogon 2 Exaflops Compute 3

Ali možda je najveći dio današnjeg otkrića međusobno povezivanje. AMD po prvi put naziva svoju Infinity Fabric 3,0, koji će se koristiti za povezivanje procesora unutar svake lopatice. Kao i Frontier, El Capitan će se kandidirati na a 4:1 konfiguracija, s četiri GPU-a spojena na svaki CPU. Za tkaninu beskonačnosti 3,0AMD obećava daljnja poboljšanja propusne širine i kašnjenja između čipova. Ipak najzanimljivija je tvrdnja da su ovi IF 3,0 čvorovi uređaja podržat će objedinjenu memoriju na čitavom CPU-u i GPU-u, što AMD ne nudi danas. Zapravo, čak je i Frontier namijenjen koherenciji između procesora, što je korak ispod pravog jedinstvenog modela memorije. Đavo je u pojedinostima naravno – objedinjeni memorijski sustav ne znači nužno brz pristup memoriji drugih uređaja – ali ovo je glavni korak za AMD jer objedinjeni memorijski sustav može poboljšati jednostavnost programiranja takvog sustava , i poboljšanje njegovih performansi tijekom izvođenja heterogenih radnih opterećenja.

Konačno, kao što je ranije spomenuto, povezivanje čvorova bit će Crayeva međusobna povezanost. Između ostalog, Slingshot podržava prilagodljivo usmjeravanje, upravljanje zagušenjima i značajke kvalitete usluge. Interkonekcija može imati 200Gb / sec po priključku, pri čemu pojedinačni noževi sadrže priključak za svaki GPU u lopatici kako bi ostali čvorovi mogli izravno čitati i pisati podatke u memoriju GPU-a.

El Računalo superračunalo Detaljno: AMD CPU-i i GPU-ovi za pogon 2 Exaflops Compute 4

Nažalost, DOE i Cray ne istražuju toliko detalje o završenom izgledu sustava. El Capitan planira potrošiti manje od 40MW snage – a rečeno nam je da će biti "prilično značajno ispod toga" – međutim DOE u ovom trenutku ne otkriva ukupni broj ormara. Ali za usporedbu, Frontier planira koristiti 100 Shasta ormara, s ukupnim proračunom snage nižim od El Capitana. Tako da ne bismo bili previše iznenađeni da na kraju otkrijemo da je dio razloga zbog kojeg je El Capitan 33% brži od Frontiera, to što DOE baca više hardvera na njega i naručuje više ormara. Ali bez obzira na broj, to će biti dovoljno da El Capitan koristi izravno tekuće hlađenje.

U međuvremenu, zanimljivo je primijetiti da je na svojoj konferenciji za novinare LLNL uzeo vremena da spominje da je dio poboljšanja performansi El Capitana u odnosu na prvobitnu narudžbu nastao zbog plana nabave grupe. LLNL je primijetio da su za El Capitan koristili strategiju „kasno obvezujućeg“, odlučujući se na (Shasta) arhitekturu rano, a zatim su odabrali određene procesore u kasnijoj točki – vjerojatno otprilike onoliko dugo koliko su mogli čekati da donesu odluku. U konačnici LLNL to navodi kao postizanje boljih rezultata na kraju, jer su uspjeli odabrati najbrži hardver koji je mogao biti dostupan. Drugim riječima, dok su DOE i LLNL u kolovozu najavili El Capitan, tek su nedavno odlučili da ga AMD ispuni.

Sveukupno, El Capitan obilježava važnu drugu pobjedu superračunala Exascale za AMD, dok će Cray sada biti uključen u sva tri američka sustava exascale. Dakle, to je velika pobjeda za oba prodavača i nastavak zamaha AMD-u, koji je tek nedavno postigao svoju prvu veliku superkompjutersku pobjedu u dugom roku s Frontierom prošle godine.

El Računalo superračunalo Detaljno: AMD CPU-i i GPU-ovi za pogon 2 Exaflops Compute 5

Činjenica da je El Capitan izvedenica Frontier-a također znači da će sa sva tri sustava za pretjerivanje u zatvorenom sustavu sada biti NVIDIA koja se nalazi izvana koja traži ovu generaciju. Kao što smo napomenuli uz najavu Frontier, Intel Aurora i AMD Frontier / El Capitan dolaze iz dobavljača procesora punih usluga koji opskrbljuju i CPU i GPU. Sustavi trenutne generacije poput Summita koriste mješovite dobavljače – npr. IBM + NVIDIA – tako da je prelazak na integrirane dobavljače velik pomak za ove CPU + sustave ubrzavanja. I premda LLNL ima puno smisla naručiti kopiju nekog drugog sustava za pretjerivanje u ime učinkovitosti, valja imati na umu da su ugovori o američkom superračunalu DOE toliko politički koliko i tehnički. SAD imaju veliki interes podržati domaću industriju superračunala i osigurati da postoje održivi konkurenti kako bi se smanjili troškovi (nekada ih je bilo nekoliko), pa je s tri glavna saveza / dobavljača procesora u SAD-u netko morao završiti uljez.

U svakom slučaju, El Capitan zakazan je za isporuku početkom 2023. godine. S AMD-ovim godišnjim danom financijskih analitičara zakazanom za sutra, nadamo se da ćemo dobiti bolju sliku o tome gdje se Genova uklapa u AMD-ove putne karte, a možda i malo više o tome što učiniti očekujte hardver koji će napokon napajati najbrži superračunalo na svijetu.

Izvori: LLNL, HPE