Machine Learning radicaal groener met Leafcloud!

Machine Learning radicaal groener met Leafcloud!

Binnen het data domein wordt machine learning qua energieverbruik wel eens vergeleken met het rijden in een SUV. In dit blog staat het vergroenen van machine learning centraal. Daarbij bespreek ik 3 knoppen om de CO2 footprint naar CO2 negatief te krijgen: energieverbruik reduceren, hernieuwbare energie gebruiken en hergebruik van server restwarmte.

Vooral het hergebruik van server restwarmte is voor velen een onbekende optie. Ik heb hierover inspiratie opgedaan bij Leafcloud en heb gesproken met Niek de Jong (Co-CEO van Leafcloud) en Jegor van Opdorp (CTO en co-founder van Leafcloud).

Leafcloud levert disruptieve cloud services door hergebruik van server restwarmte voor klanten zoals Milieudefensie, Mobiel.nl, Enabl.ist (Enabling Sustainable IT), Globescope, Tiltshift en FeedbackFruits.

Korte introductie van Machine Learning

Machine Learning wordt meestal ingezet om patronen te ontdekken in grote datasets en daar de output op af te stemmen. Met Machine Learning kun je simpelweg het volgende: voorspellen, ontdekken en detecteren. Denk aan online shoppen. Als je ergens naar zoekt worden ook producten aangeboden die passen bij jou als persoon: “anderen kochten ook”. Hierachter zitten algoritmes die deze suggesties bepalen aan de hand van een steeds verfijnder aankoopprofiel.

Met de exponentiele toename van data in gestructureerde vorm (tabellen met data) en ongestructureerde vorm (bijv. spraak en video) en de steeds grotere rekenkracht die beschikbaar komt wordt machine learning steeds populairder.

Energieverbruik en CO2 uitstoot van Machine Learning inzichtelijk maken

Maar juist voor deze rekenkracht is energie nodig. Deze rekenkracht wordt tegenwoordig vaak ‘virtueel’ afgenomen uit Cloud datacenters. Het probleem is dat we als gebruikers eigenlijk niet stilstaan hoeveel energie verbruikt wordt omdat we hiervoor niet zelf de energierekening ontvangen.

Etsy heeft in 2020 voor duurzaamheidsrapportage doeleinden onderzoek gedaan naar het energieverbruik van hun Cloud infrastructuur. Voor dit blog gaat het te ver hun onderzoek en resultaten in detail toe te lichten. Lees hier hun blog. Belangrijke constatering is dat de meeste Cloud dienstverleners niet transparant zijn over het energie verbruik en de CO2 uitstoot die dit voor jou als klant meebrengt. Dit hangt af van de Cloud dienstverlener want Microsoft stelt voor gebruikers van Azure wel een sustainability calculator beschikbaar.

Werk je als Data scientist en wil je even snel en makkelijk je eigen CO2 uitstoot inschatten dan raad ik de Machine Learning Emissions Calculator op Github aan.

3 knoppen om de CO2 footprint van Machine Learning naar CO2 negatief te krijgen

  1. Energieverbruik reduceren:

    Voor pure rekenkracht zijn GPUs sneller dan CPUs. Daarom worden voor Machine Learning (en Deep Learning) tegenwoordig meestal GPUs gebruikt. Het begint ermee om zo min mogelijk GPU capaciteit in te zetten gedurende het trainen en operationeel inzetten van het algoritme. Denk hierbij o.a. de keuze van het benodigde Machine Learning of Deep Learning model, de hoeveelheid data waarop het algoritme getraind moet worden, de benodigde precisie tijdens het trainen, etc.

  2. Hernieuwbare energie gebruiken:

    De Datacenter branche zet vol in op het gebruik van hernieuwbare energie (bijv. zonne energie of windenergie).

    Maar nu schijnt niet altijd de zon of waait niet altijd de wind dus om effectief zo veel mogelijk te profiteren wordt ‘grid load balancing’ toegepast waarbij rekenkracht ingezet wordt op momenten dat er veel hernieuwbare energie is, of dat je juist op zoek gaat naar de Cloud regio’s voor gebieden met veel hernieuwbare stroom.

    Google wil in 2030 voor 24/7 op “Carbon-Free Energy” (CFE) draaien en meet daarvoor de CFE Score: de mate waarin elk uur het energieverbruik in het regionale electriciteitsnet van het datacenter gevoed wordt met eigen of gekochte “Carbon-Free Energy” op uurbasis. Per uur kleurt de klok daarmee bij Google groen of grijs.

  3. Hergebruik server restwarmte:

Een bijkomend nadeel van het energieverbruik van Datacenters is dat de servers gekoeld moeten worden. Voor koeling is energie nodig en afhankelijk of gekozen is voor luchtkoeling of waterkoeling is soms ook weer koelwater nodig.

Maar dan doe je nog niks met de restwarmte zelf. In Scandinavië wordt restwarmte van datacenters op grote schaal hergebruikt. In Stockholm staat bijvoorbeeld een datacenter dat aangesloten is op de stadsverwarming. Nederland heeft relatief veel datacenters maar we hergebruiken de restwarmte bijna nog niet. Hier ligt een grote kans.

Adviesbureau Berenschot heeft grondig onderzoek gedaan naar de Wieringermeer met o.a. datacenters van Google en Microsoft. De nabijgelegen tuinbouw is daar de meest logische afnemer van de restwarmte. Nu gebruiken de meeste datacenters luchtkoeling waardoor restwarmte ongeveer 25 graden heeft en je met een warmtepomp moet gaan verwarmen om het te kunnen gebruiken in de kassen. Zelfs als de telers de restwarmte gratis krijgen moeten ze eerst investeringen doen in o.a. de warmtepompen. Mede door de huidige goedkope aardgasprijzen voor de tuinbouw is de business case er niet om vol op restwarmte van datacenters in te zetten.

Leafcloud heeft een radicaal andere insteek genomen. Zij hergebruiken server restwarmte en verwarmen daarmee tapwater in appartementen in Amsterdam. Ik sprak hierover met Niek de Jong (Co-CEO van Leafcloud) en Jegor van Opdorp (CTO en co-founder van Leafcloud).

Wie is Leafcloud en wat doen jullie?

Niek: “Wij zijn een jonge Cloud aanbieder uit Amsterdam. Wij opereren diverse Leaf sites (mini-datacenters) in appartementencomplexen waarmee we restwarmte van de servers gebruiken voor het verwarmen van tapwater. We zijn trots hiermee een echte groene Cloud aanbieder te zijn en een alternatief te bieden op de Tech giganten.”

Jegor: “Naast groener is privacy van data beter te garanderen omdat we enkel in Nederland opereren. Waar andere Cloud aanbieders vaak een ‘lock-in’ creëren zijn wij erg flexibel. Wij geloven in transparantie en gebruiken daarom bewust open source software.”

Niek: “Leafcloud is een doorstart van de Delftse start-up Nerdalize. Uiteindelijk bleek Nerdalize niet market-ready en is het failliet gegaan. Wij zetten tientallen krachtige computerservers neer in de ketelruimte van een appartementencomplex om genoeg warmte op te wekken voor het ‘tapwater’ dat de flatbewoners gebruiken uit kraan en douche. Voor de verwarming van hun huis blijven ze aangewezen op een warmtepomp of een collectieve verwarmingsketel op aardgas. Waar Nerdalize het concept toepaste bij consumenten en het verwarmen van tapwater op kleine schaal, kiezen wij bewust voor grotere appartementen waardoor we professioneel beheer van de Leaf sites kunnen waarborgen en waarmee de eenmalige inrichting makkelijker gaat. Hierdoor kunnen we sneller en goedkoper opschalen.”

Wat maakt het Leafcloud concept zo bijzonder?

Niek: “Doordat de afgelopen jaren datacenters steeds groter worden kiezen ze afgelegen locaties. Wij doen het juist andersom: wij zoeken met onze Leaf sites (mini-datacenters) juist de bebouwde wereld op zodat de vraag naar restwarmte er wel is. Daarnaast koelen wij met water op server rekken waardoor wij nu 80% van de restwarmte afvangen en via boilers tapwater kunnen verwarmen tot 60-70 graden.”

Jegor: “Wij combineren een Tier-II datacenter met verschillende Leaf sites waar wij het energie intensieve rekenwerk uitvoeren. Een Leaf site is verbonden met het datacenter met een directe, zogenaamde ‘dark-fiber’ glasvezelverbinding. Data is geheel encrypted op de Leafsites waardoor we de data ondanks ons decentrale netwerk goed kunnen beschermen voor onze klanten.”

Interessant duurzaam voordeel voor Machine Learning dus?

Jegor: “Dat is juist. Onze Leaf sites zijn daardoor radicaal groener in energieverbruik. Daarnaast maken we gebruik van bestaande kelderruimte in appartementen. Hiervoor hoeft geen nieuw datacenter gebouwd te worden. Qua Tier-II datacenter, apparatuur en gebruik van hernieuwbare stroom zijn we vergelijkbaar met de markt. Als we alle restwarmte van alle Nederlandse datacenters zouden gebruiken kunnen we naar schatting 42% van het tapwater in Nederland dagelijks verwarmen. Dat zou behoorlijk minder gasverbruik zijn!”

Wat levert het Leafcloud concept aan CO2 reductie op?

Jegor: “Doordat we 80% van restwarmte van de rekenservers kunnen hergebruiken reduceren we fors de CO2 footprint ten opzichte van de ‘traditionele’ Cloud aanbieders. Omdat wij ook hernieuwbare energie gebruiken kun je het zelfs CO2 negatief noemen.”

Rekenvoorbeelden (bron: Leafcloud):

  • 1 virtuele CPU configuratie bespaart per jaar: 172 kg CO2 per jaar
  • 1 GPU configuratie bepaart per jaar: 2.114 kg CO2 per jaar

Gebruik je als data scientist 1 GPU server op jaarbasis dan komt dat al gauw overeen met 10.000 km rijden met een benzine auto of 1,5 jaar grijs electriciteitsverbruik van een gemiddeld Nederlands huishouden. Voor deze omrekening heb ik me gebaseerd op de cijfers van het Climateneutralgroup.com.

Duurzame inspiratie?

Een wereld zonder data is bijna niet meer in te beelden. Het brengt ons veel goeds. Gebruik je veel rekenkracht om de data te analyseren dan kan dit vaak groener. Niek en Jegor van Leafcloud hebben me geïnspireerd hoe je restwarmte kunt gebruiken door juist servers naar de bebouwde omgeving te halen. Interessant is dat de overheid in de BENG normen toestaat om datacenter restwarmte mee te laten tellen als ‘hernieuwbare energie’. Dat maakt de Win-Win situatie voor eigenaren van appartementsgebouwen in een samenwerking met Leafcloud alleen maar groter.”

SDG11

Gebruik jij je data ook duurzaam?

Ik geloof in een duurzame datawereld en maak daarvoor een inspiratiereis en deel mijn ervaringen in blogs op social media. Gebruik jij je data ook duurzaam? Ik kom graag met je in contact.