Europese exaschaalsupercomputer JUPITER zet nieuwe standaard voor energie-efficiëntie en topt GREEN500-lijst

17 mei 2024

JEDI, de eerste module van de exaschaal­su­per­com­puter JUPITER, staat op de eerste plaats van de Green500-lijst met meest energie-effi­ci­ënte super­com­pu­ters wereld­wijd. Dat kondigden het Forschungs­zen­trum Jülich en de Gemeen­schap­pe­lijke Onder­ne­ming EuroHPC vandaag aan samen met het super­com­pu­ter­con­sor­tium ParTec-Eviden tijdens de Inter­na­ti­onal Super­com­pu­ting Confe­rence (ISC) in Hamburg. Het JUPITER Exascale Devel­op­ment Instru­ment is in april geïn­stal­leerd door het Duits-Franse consor­tium en beschikt over dezelfde hardware als de JUPITER-boos­ter­mo­dule, waaraan momenteel gewerkt wordt in het Forschungs­zen­trum Jülich.

De snelle digi­ta­li­se­ring en het toene­mende gebruik van arti­fi­ciële intel­li­gentie vereisen een toene­mende compu­ter­kracht, maar ook steeds meer energie. Data­cen­ters zijn vandaag goed voor 4% van het totale Duitse elek­tri­ci­teits­ver­bruik en de ener­gie­be­hoeften gaan crescendo. Energie-effi­ci­ëntie is de voorbije jaren dan ook een steeds belang­rij­kere factor geworden. Hierdoor is er een toename op het vlak van maat­re­gelen en research inzake energiezuinigheid.

De JUPITER-super­com­puter van het Europese super­com­pu­ter­ini­ti­a­tief ‘Gemeen­schap­pe­lijke Onder­ne­ming EuroHPC’ is een echte pionier. JEDI (JUPITER Exascale Devel­op­ment Instru­ment), de eerste module geïn­stal­leerd in april, haalt 72 miljard floating point-bere­ke­ningen per seconde per watt. De vorige nummer één daar­en­tegen haalde ongeveer 65 miljard berekeningen.

De door­slag­ge­vende factor voor de uitmun­tende effi­ci­ëntie van de module ligt in het gebruik van GPU’s (graphics proces­sing units) en het feit dat het mogelijk is om weten­schap­pe­lijke toepas­singen te opti­ma­li­seren voor bere­ke­ningen op GPU’s. Vandaag maken vrijwel alle toon­aan­ge­vende systemen op de Green500-rang­schik­king uitge­breid gebruik van GPU’s, die ontwik­keld zijn om bere­ke­ningen veel energie-effi­ci­ënter uit te voeren dan klassieke CPU’s (central proces­sing units).

JEDI beschikt als een van de eerste systemen ter wereld over de nieuwste generatie super­chips van NVIDIA: de NVIDIA GH200 Grace Hopper, die de NVIDIA Hopper-GPU en de NVIDIA Grace-CPU combi­neert in één module.

Het systeem is gebaseerd op Evidens recentste Bull­Se­quana XH3000-archi­tec­tuur en uitgerust met het uiterst effi­ci­ënte warm­wa­ter­koel­sys­teem Direct Liquid Cooling, dat substan­tieel ener­gie­zui­niger is dan klassieke lucht­koe­ling en het bovendien mogelijk maakt om de gepro­du­ceerde warmte in een latere fase te benutten.

De JUPITER-precursor JEDI beschikt al over dezelfde appa­ra­tuur als de JUPITER-boos­ter­mo­dule, die momenteel in aanbouw is. Voor codeop­ti­ma­li­satie hebben weten­schap­pers al in een vroege ontwik­ke­lings­fase toegang tot de hardware in het kader van JUREAP, het JUPITER Research and Early Access Program. Daarbij krijgen ze onder­steu­ning van deskun­digen van het Jülich Super­com­pu­ting Centre.

GREEN500

“Deze memo­ra­bele mijlpaal, waarbij de eerste modules van de Jupiter-exascale-super­com­puter JEDI de GREEN500-lijst aanvoeren, vervult ons met een enorme trots. Ons part­ner­schap in dit streven benadrukt onze vast­be­raden toewij­ding om onze klanten te helpen innoveren en hen tege­lij­ker­tijd de kans te geven om hun duur­zaam­heids­doel­stel­lingen te behalen. Een uitzon­der­lijke reken­kracht bereiken en tege­lij­ker­tijd ener­gie­ver­bruik vermin­deren is een opmer­ke­lijke prestatie. Direct Liquid Cooling, onze baan­bre­kende warm­wa­ter­koe­lings­tech­no­logie die naadloos is geïn­te­greerd in ons Bull­Se­quana XH3000-systeem, speelt een cruciale rol in dit succes. Ze brengt niet alleen een aanzien­lijke verbe­te­ring op gebied energie-effi­ci­ëntie teweeg, maar herge­bruikt ook op een vinding­rijke manier afval­warmte”, zegt Emmanuel Le Roux, Group SVP, Global Head of HPC, AI & Quantum bij Eviden, Atos Group.

JUPITER wordt de eerste super­com­puter in Europa die de drempel zal halen van één exaflop, wat over­een­komt met een triljoen (‘1’ gevolgd door 18 nullen) zweven­de­kom­ma­be­re­ke­ningen per seconde. Het uitein­de­lijke systeem wordt tijdens de tweede jaarhelft in verschil­lende fases geïn­stal­leerd en zal initieel in het kader van het Early Access Program beschik­baar zijn voor weten­schap­pe­lijke gebrui­kers, vooraleer het begin 2025 wordt vrij­ge­geven voor algemeen gebruik.

De enorme reken­kracht van JUPITER zal grens­ver­leg­gend zijn op het vlak van weten­schap­pe­lijke simu­la­ties en de training van complexe AI-modellen. Het modulaire exaschaal­sys­teem maakt gebruik van dMSA (dynamic modular system archi­tec­ture), een tech­no­logie ontwik­keld door ParTec en het Jülich Super­com­pu­ting Centre. De JUPITER-boos­ter­mo­dule, die op dit moment geïn­stal­leerd is, telt ongeveer 125 Bull­Se­quana XH3000-racks en zo’n 24.000 NVIDIA GH200-super­chips, die gelinkt zijn via het Quantum‑2 Infi­ni­Band-netwerk­plat­form van NVIDIA. Voor 8‑bitberekeningen, die courant zijn bij het trainen van AI-modellen, zal de reken­kracht zeker meer dan 70 exaflops bedragen. Hierdoor zou JUPITER vandaag de snelste computer ter wereld zijn voor AI.

Energiegebruik

De ener­gie­be­hoefte van JUPITER zal naar schatting ongeveer 11 megawatt bedragen. Aanvul­lende metingen zullen helpen om te zorgen voor een nog duurzamer ener­gie­ge­bruik. Het modulaire data­center waarin JUPITER wordt gehuis­vest, is ontwik­keld om de tijdens het koelen gepro­du­ceerde warmte te benutten om de gebouwen op de campus van het Forschungs­zen­trum Jülich te verwarmen.

Alle hardware- en soft­wa­re­on­der­delen van JUPITER worden geïn­stal­leerd en beheerd door de unieke JUPITER Mana­ge­ment Stack. Het gaat om een combi­natie van Para­Sta­tion Modulo (ParTec), SMC xScale (Eviden) en JSC-software.

Het JUPITER-ontwik­ke­lings­sys­teem JEDI is veel kleiner dan de uitein­de­lijke exaschaal­com­puter. Het bestaat uit één rack van de nieuwste Bull­Se­quana XH3000-reeks en omvat momenteel 24 afzon­der­lijke computers, die ‘reken­nodes’ worden genoemd. Die zijn met elkaar verbonden via vier NVIDIA Quantum‑2 Infi­ni­Band-switches en worden in de loop van de maand mei aangevuld met nog eens 24 rekennodes.

Tijdens de metingen voor de Green500-rang­schik­king van meest energie-effi­ci­ënte super­com­pu­ters haalde het JEDI-systeem een reken­kracht van 4,5 biljard zweven­de­kom­ma­be­re­ke­ningen per seconde of 4,5 petaflops, met een gemiddeld ener­gie­ver­bruik van 66 kilowatt. Tijdens de geop­ti­ma­li­seerde werking daalde het ener­gie­ver­bruik tot 52 kilowatt.

Pin It on Pinterest

Share This