5 manieren om meer waarde te halen uit een open source analytics-model

25 november 2021

Een Machine Learning-model bouwen, het is nooit eenvoudiger geweest dan vandaag. Met open source kiest iedereen de gewenste taal om een model te schrijven en bij problemen is er altijd een uitgebreide community waarop je kunt terugvallen. Toch blijft het de vraag wat je nadien met je model wil doen en hoe je er waarde voor het bedrijf uithaalt. Een platform zoals SAS is daarom de perfecte aanvulling. Het zorgt ervoor dat open source meer dan een leuke speeloefening wordt.

Wie data analytics wil inschakelen, moet eerst beseffen dat het niet volstaat om een knap model te bouwen. Zelfs het sterkste model levert pas waarde voor de organisatie wanneer het operationeel is en in productie draait. Nadien blijft het noodzakelijk om een model te monitoren en voortdurend na te gaan of het nog altijd even performant is als voordien.

Het eerste luik, de bouwfase van een model, kan je perfect met open source oplossen. Meer zelfs, de mogelijkheden in open source zijn tegenwoordig zo uitgebreid dat veel bedrijven er standaard voor kiezen. De volgende stappen, het operationaliseren en monitoren, zijn met open source weliswaar geen garantie op succes. Tenzij je beschikt over een platform dat je opensourcemodel ondersteunt en helpt om zoveel mogelijk uit je data te halen.

Hieronder geven we vijf redenen waarom een analytics-platform, zoals SAS Viya, een onmisbare schakel is voor ieder bedrijf dat met open source aan de slag gaat:

1. Maak je data vlot toegankelijk

Bij het bouwen van een model komen heel wat verborgen technische kwesties kijken waar de data scientist zich niet altijd van bewust is. Het begint al bij de data zelf die in grote organisaties vaak van allerlei uiteenlopende bronnen en bestanden afkomstig is. Als de data zich op specifieke filesystemen of in zogenaamde silo’s bevindt, dan moet je daar vanuit open source vaak nog een hele constructie voor opzetten.

Met een platformaanpak maakt het weinig uit waar je data gelokaliseerd is. SAS Viya managet alle data zodat gebruikers deze gegevens kunnen consumeren op de manier zoals ze in de database staan. Het is dus niet nodig om een kopie te maken, waardoor je altijd zeker bent dat iedere gebruiker met dezelfde en meest recente data werkt. Bovendien moet er niet eerst nog iemand toegang tot de data verlenen. Met een platform verlopen autorisatie en connectie automatisch.

2. Laat meer mensen met analytics-modellen werken

Om met open source te werken, moet je een programmeur zijn of in elk geval kunnen coderen. Dat spreekt voor zich, maar nadien wil je ook dat zoveel mogelijk mensen het model gebruiken. Bij de meeste medewerkers in een bedrijf ontbreekt het echter aan een technische achtergrond. En als het gebruik van modellen beperkt blijft tot de kleine groep die programmeertalen kent, kan je onmogelijk het volle potentieel van je data benutten. Je moet modellen dus voor een ruimere gemeenschap in het bedrijf toegankelijk maken, iets wat we ook wel de democratisering van analytics noemen.

Ook dit kan een platform heel eenvoudig oplossen. Van zodra een programmeur zijn magie in open source voltooid heeft, zorgt het platform ervoor dat de functionaliteiten voor een breed publiek beschikbaar zijn, dus ook voor wie helemaal geen codeervaardigheden heeft. Op die manier is SAS Viya eigenlijk een soort facilitator voor open source. Er bestaat tegenwoordig geen twijfel over het feit dat open source een meerwaarde biedt. Een platform helpt om al die mooie toepassingen tot bij meer mensen in het bedrijf te krijgen en data analytics een stuk breder in te zetten.

3. Verhoog de productiviteit in je organisatie

Wanneer een data scientist een model bouwt, blijft die in veel organisaties verantwoordelijk voor het onderhoud van dat model. Governance is immers erg belangrijk om ervoor te zorgen dat een model na bepaalde tijd nog even performant is al bij de implementatie. Wie een paar modellen gebouwd heeft, zit zo al gauw met een serieuze werklast. Uiteindelijk dreigt een data scientist zelfs dagelijks bezig te zijn met onderhoud en is er geen tijd om iets nieuws te bouwen. Helaas lopen ze hierdoor het risico dat ze hun werk minder interessant vinden en zullen ze op termijn misschien voor een boeiender project kiezen – data scientists zijn nog steeds een vrij schaars ras.

Een platform neemt de governance van een model grotendeels uit handen van de data scientist. Het is perfect mogelijk om een aantal automatische stappen te definiëren voor als blijkt dat een model niet meer naar behoren presteert. Op voorwaarde dat de bronfiles aanwezig zijn, kan het platform zelf naar de beginfase terugkeren, het model updaten en snel weer in productie zetten.

Dat kan uiteraard ook vanuit open source, maar een platform maakt het leven van data scientists zo gemakkelijk mogelijk. Het doet er zelfs niet toe welke vorm van Machine Learning je precies toepast. Een predictiemodel, een computer vision-model, tekstanalyse, … SAS Viya beschikt over alle functionaliteiten om voor het onderhoud van het model te zorgen. En dat bevordert niet alleen de productiviteit, maar ook de tevredenheid en motivatie van je teamleden. Data scientists mogen zich immers terug bezig houden met de waardevolle taken die ze graag doen: modellen bouwen.

4. Neem je modellen sneller in productie

Het is altijd aanbevolen om je niet tot één model per project te beperken en meteen ook een paar reserves te voorzien. Als de prestaties van een gebruikt model achteruitgaan, dan kan zo’n reserve het meteen overnemen. Tenminste als de operationalisering snel genoeg kan gebeuren, maar dat duurt vaak erg lang omdat er nog een paar tests aan voorafgaan.

De data die bedrijven gebruiken in ontwikkeling en productie zijn niet altijd dezelfde. Aangezien een model in een ontwikkelingsomgeving wordt gebouwd en de finale versie op een productieserver moet draaien, zijn tests noodzakelijk om te zien of het gebouwde model wel valide is om in productie te worden genomen. Bij open source zijn die validatietests nog belangrijker om te verzekeren dat de productieserver dezelfde versie van open source gebruikt en dezelfde packages geïnstalleerd heeft.

Je kunt dat allemaal zelf inbouwen, maar dan dreig je met een lappendeken van verschillende dingen te zitten. Bij een platform zoals SAS Viya is al die technologie ingebakken. Ook opensourcemodellen kunnen zo dus veel sneller in productie worden genomen.

5. Geniet van alle voordelen van de cloud

Zowat ieder bedrijf heeft intussen de voordelen van cloudtechnologie ontdekt. Ook open source kan je op een cloudomgeving installeren, maar dat is geen garantie om van alle functionaliteiten van die cloud gebruik te kunnen maken. De cloud biedt je bijvoorbeeld veel flexibiliteit zodat je heel snel  kunt opschalen als je merkt dat een analytische taak erg zwaar is of wanneer je een succesvol model wil repliceren. Een platform kan dit andermaal allemaal van je overnemen.

Het is niet meer dan logisch dat bedrijven de dag van vandaag inzetten op open source om modellen te bouwen, maar het mag natuurlijk niet stoppen bij de ontwikkeling van een model. Een platform zoals SAS Viya kan op het vlak van interoperabiliteit echt een verschil maken. Het zorgt ervoor dat opensourcemodellen sneller operationeel geraken én blijven, zodat de organisatie altijd maximale waarde uit haar data kan halen.

Veronique Van Vlasselaer

Véronique Van Vlasselaer werkt als Data & Decision Scientist bij SAS

Pin It on Pinterest

Share This