OCP Summit: industrie spreekt standaardisatie van dataformaten voor efficiënte AI-infrastructuren af

19 oktober 2023

Tijdens de OCP Summit die deze week in Calfornië wordt gehouden heeft een aantal bedrijven afspraken gemaakt over AI-data­for­maten. Het reali­seren van het volledige poten­tieel van de volgende generatie deep learning vereist een zeer effi­ci­ënte AI-infra­struc­tuur. Voor een reken­sys­teem om schaal­baar en kosten­ef­fec­tief te zijn, is opti­ma­li­satie van elke laag van de AI-stack nood­za­ke­lijk, van algo­ritmen tot hardware. 

Voor­uit­gang in nauw­keu­rige AI-data­for­maten en de bijbe­ho­rende geop­ti­ma­li­seerde algo­ritmen zijn cruciaal geweest voor deze ontwik­ke­ling. Zo kon de industrie de overstap maken van de tradi­ti­o­nele 32-bits drijvende-komma­ge­tal­pre­cisie naar slechts 8 bits (bijvoor­beeld OCP FP8).

Deze smallere formaten stellen chips in staat om effi­ci­ën­tere AI-bere­ke­ningen per clock cycle uit te voeren, waardoor de training en infe­ren­tie­tijden van modellen worden versneld. AI-modellen nemen hierdoor minder ruimte in beslag, wat betekent dat er minder data­ver­zoeken vanuit het geheugen nodig zijn en dat ze beter en effi­ci­ënter kunnen draaien. Bovendien vermin­dert het aantal bitover­drachten de gege­vens­be­we­ging via de inter­con­nect, wat de pres­ta­ties van appli­ca­ties kan verbe­teren of netwerk­kosten kan verlagen.

Samenwerking in de industrie

Eerder dit jaar hebben AMD, Arm, Intel, Meta, Microsoft, NVIDIA en Qualcomm Tech­no­lo­gies de Micro­scaling Formats (MX) Alliance gevormd met het doel om de volgende generatie 6- en 4‑bits datatypes voor AI-training en ‑infe­rentie te creëren en te stan­daar­di­seren. De sleu­tel­tech­no­logie die deze sub 8‑bits formaten mogelijk maakt, staat bekend als ‘micro­scaling’ en is gebaseerd op jaren van onderzoek en ontwerp­ver­ken­ning. MX verbetert de robuust­heid en gebruiks­vrien­de­lijk­heid van bestaande 8‑bits formaten zoals FP8 en INT8, waardoor de drempel voor een bredere accep­tatie van enkel­cij­fe­rige bittrai­ning en ‑infe­rentie lager wordt.

De eerste MX-speci­fi­catie intro­du­ceert vier concrete datatypes gebaseerd op floating point-getallen en gehele getallen (MXFP8, MXFP6, MXFP4 en MXINT8) die compa­tibel zijn met huidige AI-stacks. Ze onder­steunen imple­men­ta­tie­flexi­bi­li­teit op zowel hardware- als soft­ware­ni­veau en maken fijn­ma­zige micro­scaling op hard­ware­ni­veau mogelijk. Uitge­breide studies tonen aan dat MX-formaten eenvoudig kunnen worden ingezet voor diverse real-world toepas­singen zoals grote taal­mo­dellen, computer vision en aanbevelingssystemen.

Democratisering van AI-Capaciteiten

In het zich ontwik­ke­lende landschap van AI zijn open stan­daarden cruciaal om innovatie, samen­wer­king en brede adoptie te bevor­deren. Deze stan­daarden bieden een vere­ni­gend kader dat consis­tente tool­chains, model­ont­wik­ke­ling en inter­o­pe­ra­bi­li­teit in het AI-ecosys­teem mogelijk maakt. Hierdoor kunnen ontwik­ke­laars en orga­ni­sa­ties het volledige poten­tieel van AI benutten, terwijl ze de frag­men­tatie en tech­no­lo­gi­sche beper­kingen die anders de voor­uit­gang zouden kunnen belem­meren, verminderen.

In deze geest heeft de MX Alliance de Micro­scaling Formats (MX) Speci­fi­catie v1.0 vrij­ge­geven in een open, licen­tie­vrij formaat via de Open Compute Project Foun­da­tion (OCP). Dit om brede indu­striële adoptie mogelijk te maken en te stimu­leren en een fundament te leggen voor mogelijke toekom­stige inno­va­ties in smalle formaten. Een white­paper en emula­tie­bi­bli­o­theken zijn ook gepu­bli­ceerd om details te verstrekken over de bena­de­ring van data­we­ten­schap en gese­lec­teerde resul­taten van MX in actie.

De vorming van de MX Alliance en de daar­op­vol­gende stan­daar­di­satie van smallere data­for­maten vormen een cruciale stap in het reali­seren van het volledige poten­tieel van de volgende generatie diep-lerende systemen. Het bundelt de krachten van sleu­tel­spe­lers in de industrie, bevordert effi­ci­ënte bere­ke­ningen en effent het pad voor toegan­ke­lij­kere, schaal­bare en kosten­ef­fec­tieve AI-oplossingen.

Pin It on Pinterest

Share This