‘Eén petabyte aan opslag met een lager energieverbruik dan vijf oude gloeilampen’

4 december 2020

Energie-effi­ci­ënte initi­a­tieven hebben in de afgelopen decennia de ener­gie­con­sumptie aanzien­lijk doen dalen. Heden­daagse huizen verbruiken waar­schijn­lijk evenveel energie voor verlich­ting als wat nodig is voor twee of drie oude gloei­lampen van 100 W. Maar wie had ooit gedacht dat met de nieuwste generatie hard disk drives (HDD) één petabyte aan opslag­ca­pa­ci­teit ook nog eens minder energie vereist dan vijf van diezelfde oude gloeilampen?

Met een nog altijd toene­mende vraag naar online opslag­ca­pa­ci­teit voor databases die altijd bena­der­baar zijn, is het van groot belang om opslag­sys­temen te ontwik­kelen die deze groeiende gege­vens­stroom kunnen bijbenen en tege­lij­ker­tijd aan bepaalde criteria voldoen. Gezien de enorme hoeveel­heid gegevens is de directe kostprijs per capa­ci­teit ($/​TB) één van de voor­naamste selec­tie­cri­teria. Ener­gie­ver­bruik is een ander belang­rijk aspect, aangezien dit gedurende de hele levens­duur impact heeft op de opera­ti­o­nele kosten. Energie hoort dan ook efficiënt gebruikt te worden. Het verlaagt de ener­gie­re­ke­ning en vermin­dert bovendien de koelings­be­hoefte, waar ook weer kosten mee gemoeid zijn. Ook moet er rekening worden gehouden met de fysieke afme­tingen van de eind­op­los­sing. Meer schijven vereisen een grotere behuizing. De server­kast is idealiter een eenvoudig standaard 19” rack-systeem die in de bestaande infra­struc­tuur van 1000 mm lange racks past. Prestatie is uiteraard een andere factor. Maar wanneer er gese­lec­teerd wordt op een maximale capa­ci­teit bij een minimaal stroom­ver­bruik, dan heeft dit wel een lagere IOPS (Input/​Output Operaties per Seconde) tot gevolg.

In een onderzoek uitge­voerd door het Toshiba Elec­tro­nics Europe GmbH research­team werd onder­zocht of het mogelijk was om 1 PB aan gege­vens­op­slag in één systeem in te bouwen dat minder dan 500 W aan vermogen verbruikt. 

Keuze in opslag

De meest kosten­ef­fec­tieve tech­no­logie voor massaca­pa­ci­teit is nog altijd het gebruik van HDD’s. De beste $/TB-ratio’s bieden Toshiba’s 12 TB‑, 14 TB- en 16 TB-modellen. Om echter zeker te stellen dat het eind­sys­teem in een standaard 19” rack paste, werden voor het onderzoek 16 TB-drives gese­lec­teerd om zo het benodigde fysieke volume tot een absoluut minimum te beperken. Deze keuze sluit ook aan op de stroom­ver­bruiks­doel­stel­ling, aangezien het vermo­gens­ver­lies per unit­ca­pa­ci­teit succes­sie­ve­lijk is gedaald met de intro­ductie van nieuwe HDD-modellen (tabel 1). Dit komt niet alleen door de geïm­ple­men­teerde, nieuwe tech­no­logie, maar ook dankzij een verschui­ving naar helium-gevulde drives (figuur 1). 

JaarModelCapa­ci­teit (TB)Actief maximaal vermogen (W)Actief vermogen Power W/​TB
2013MG040CA611,31,9
2015MG05ACA811,41,4
2017MG06ACA1010,61,1
2018MG07ACA147,80,6
2019MG08ACA167,70,5
Tabel 1: Vermo­gens­ver­lies en capa­ci­teit van enter­prise-capa­ci­teit HDD’s (bron: Toshiba-datas­heets en ‑product­hand­lei­dingen; voor random read/​write QD = 1 en 64kB blokken, single drive)

Figuur 1: Het vermo­gens­ver­lies per TB-capa­ci­teit voor verschil­lende HDD-gene­ra­ties en de verdeling tussen met lucht en met helium gevulde modellen.

Figuur 2: De MG08-serie, met helium gevuld, 16 TB HDD.

De 16 TB-modellen van Toshiba’s MG08-serie zijn verkrijg­baar met zowel SAS- en SATA-inter­faces. De SAS-interface biedt twee 12 GB/​s‑kanalen, ideaal voor systemen waarbij hoge beschik­baar­heid en snelheid belang­rijk zijn. Deze optie gaat echter gepaard met hogere ener­gie­kosten, omdat SAS-drives ongeveer één tot twee watt meer verbruiken dan hun SATA-tegen­han­gers. De doel­stel­ling was om stroom­ver­bruik te vermin­deren, en dus werd het SATA-inter­fa­ce­model MG08ACA16TE de gekozen kandidaat voor dit project.

De indi­vi­duele speci­fi­ca­ties voor deze speci­fieke drive qua vermo­gens­ver­lies staan in tabel 2.

Use caseVermo­gens­ver­lies 
Random Read – 4 kB blokken, QD = 168,60 W
Random Write – 4 kB blokken, QD = 165,83 W
Sequen­tial Read7,50 W
Sequen­tial Write6,83 W
Idle_​A4,00 W
Spin-up (maximaal 500 ms)16,85 W
Tabel 2: Vermo­gens­ver­lies voor de MG08ACA16TE bij diverse use cases

Een behuizing selecteren

Nu de opslag was gede­fi­ni­eerd, was de volgende stap het selec­teren van een geschikte behuizing. Toploader-modellen zijn praktisch en verkrijg­baar als JBOD in een vier unit hoog 19” rack­for­maat. Voor dit project viel de keuze op een 60-bay-model van AIC, de AIC-J4060-02. Passend bij de speci­fi­ca­ties van een één-kanaals SATA-interface, leverde de single expander-versie de grootste bespa­ringen op voor wat betreft kosten en vermo­gens­ver­liezen. Eenmaal gevuld met 16 TB HDD’s heeft deze confi­gu­ratie een bruto opslag van 960 TB, bijna één petabyte. Vervol­gens werd de JBOD met één enkele mini SAS-HD-kabel aange­sloten op de host bus adapter (HBA) of RAID-controller van de server.

Deze JBOD met een lengte van slechts 810 mm past in elk bestaand rack. 

Figuur 4: De gese­lec­teerde 4 unit hoge 19” rack-oplossing van AIC – de AIC-J4060-02 JBOD

Baseline testen

Een eerste stroom­ver­bruiks­me­ting werd uitge­voerd zonder de HDD’s via de 220 V ingangen naar de redun­dante twin stroom­toe­voer. De eerste meting van 80 W vond plaats zonder aange­sloten HDD’s, maar wel met de JBOD- en SAS-link-up. De volgende stap was het meten van het stroom­ver­bruik met één enkele drive onder verschil­lende belas­tings­om­stan­dig­heden. De keuze viel op sequen­tiële schrijf­be­las­tings­si­mu­la­ties voor archi­ve­ring, video-opnamen en back-up met blokken van 64 kB. Met dezelfde blok­grootte werden ook sequen­tiële lees­op­drachten uitge­voerd, equi­va­lent aan een back-up-recovery en media-streaming belasting. Voor een volgend gege­vens­punt werden ook 4KB random read/writes-opdrachten uitge­voerd die over­een­komen met de agile ‘hot-data’ workload van databases. Deze corre­latie is zeker niet volledig ten opzichte van doorsnee belas­tings­vormen voor dit systeem­type, maar maakte het mogelijk om voldoende refe­ren­tie­ge­ge­vens te verza­melen voor vergelijkingsdoeleinden.

Naast deze border­line cases werd ook een test met een bena­de­ring van een echte belasting uitge­voerd. Een mix van verschil­lende blokaf­me­tingen werd wille­keurig gelezen en geschreven (4kB: 20%, 64kB: 50%, 256kB: 20%, 2MB: 10%). Om de maximaal haalbare prestatie te bereiken, werden alle synthe­ti­sche loads uitge­voerd met een queue depth (QD) van 16. Bovenop deze testen werd een standaard kopie­proces op een logische drive onder Windows in gang gezet en werd het vermo­gens­ver­lies gemeten.

De resul­taten voor de indi­vi­duele drive use case toonden conse­quent een lager stroom­ver­bruik dan vermeld in de datasheet voor de gese­lec­teerde drive (tabel 3). Een ander opmer­ke­lijk punt is dat, in tegen­stel­ling tot de datasheet, sequen­tiële loads tot een hoger stroom­ver­bruik leiden dan wille­keu­rige access loads. Dit kan worden terug­ge­voerd op de stroom­be­hoeften van de JBOD, aangezien de SAS-expanders meer stroom vereisen bij hoge band­breedtes in sequen­tiële operatie.

Use CaseVermo­gens­ver­lies
Random Read – 4 kB blokken, QD = 1684,0 W
Random Write – 4 kB blokken, QD = 1683,6 W
Sequen­tiële Read – 64 kB blokken86,0 W
Sequen­tiële Write – 64 kB blokken85,0 W
Mix van read/​write workload84,2 W
Windows-kopie85,0 W
Tabel 3: Vermo­gens­ver­lies van één enkele MG08A­CA16TE-disk voor de JBOD in diverse use cases.

Systeemtesten van diverse configuraties

Toen alle sleuven van de JBOD waren opgevuld, kwam het maximale stroom­ver­bruik bij een idling systeem op een respec­ta­bele 420 W. Dit is ietwat hoger dan verwacht (80 W + 60 x 4 W = 320 W) en kan worden herleid naar het feit dat de controller soms de HDD’s aanspreken, zelfs in de idle-modus. Ander­zijds was de gemeten piek tijdens het opstarten van de stroom slechts 720 W, aanzien­lijk lager dan de som van de JBOD plus de spin-up datas­heet­waarden voor de HDD’s (80 W + 60 x 16,85 W = ~1100 W). Dit kan worden terug­ge­voerd naar de door het systeem gebruikte staggered spin-up bena­de­ring, waarbij de HDD’s één voor één worden bekrachtigd. 

Het systeem werd opnieuw getest met dezelfde workloads die voor de single drive operatie werden gebruikt. Het hoogst gemeten stroom­ver­bruik van 500 W vond plaats tijdens het sequen­tiële reads van 64kB blokken. De laagste meting van 445 W vond plaats bij zowel sequen­tiële 64 kB als random 4 kB schrijf­be­las­ting (figuur 5).


Figuur 5: Stroom­ver­bruik van petabyte opslag­sys­teem in vari­ë­rende testscenario’s

Twee andere confi­gu­ra­ties werden ook onder de loep genomen. De eerste confi­gu­ratie combi­neerde de 60 harde schijven tot een lokale RAID10 met 5 sub-arrays om een netto opslag van 480 TB te reali­seren. Deze werd daarna onder Windows Server 2016 gefor­mat­teerd tot twee logische drives van elk 240 TB. Hierbij vroegen sequen­tiële bena­de­ringen minder stroom, terwijl random bena­de­ringen in essentie over­een­kwamen met wat er in de JBOD-modus werd gemeten. 

Het imple­men­teren van een software-gede­fi­ni­eerd zettabyte file system (ZFS) middels JovianDSS van Open‑E leidde ook tot verbe­te­ringen in stroom­ver­bruik voor lees­testen, maar ietwat hogere metingen bij schrijven. In deze confi­gu­ratie werden er ook twee 800 GB enter­prise SSD’s toege­voegd als een read cache en een write log buffer. De resul­te­rende 240 TB logische drives waren bena­der­baar via iSCSI.

Conclusie

Toshiba Elec­tro­nics Europe GmbH schat de totale capa­ci­teit van alle in 2019 verscheepte enter­prise (Nearline) HDD’s op circa 500 exabytes (500.000 petabytes). Wanneer al deze HDD’s als 16TB-modellen in 60-bay JBOD’s zouden zijn uitge­voerd, dan zou dit leiden tot een continu stroom­ver­bruik van 225MW (gelijk aan een gemid­delde kolen­ge­stookte centrale). Aangezien de meeste in 2019 geleverde HDD’s echter een nóg lagere capa­ci­teit hadden, kan men aannemen dat het stroom­ver­bruik zelfs nóg hoger lag. Er is duidelijk veel ruimte voor verbe­te­ring om de cijfers van W/TB-stroom­ver­bruik van de industrie te reduceren. De onder­zoeken en testen die door Toshiba Elec­tro­nics Europe GmbH zijn uitge­voerd laten zien dat dankzij de energie-effi­ci­ëntie van de nieuwste generatie met helium gevulde hoge capa­ci­teits­disks, een petabyte-opslag met een opgenomen vermogen beneden de 500 W haalbaar is. Dit is een belang­rijk gegeven voor data­cen­ters die willen groeien met minimale inves­te­ringen en opera­ti­o­nele kosten. Bovendien kan dit met verschil­lende confi­gu­ra­ties worden bereikt, variërend van puur JBOD, middels RAID, tot en met software-gede­fi­ni­eerde oplos­singen, allemaal passend in een standaard 19” rack. 

Pin It on Pinterest

Share This