5 manieren om meer waarde te halen uit een open source analytics-model

25 november 2021

Een Machine Learning-model bouwen, het is nooit eenvou­diger geweest dan vandaag. Met open source kiest iedereen de gewenste taal om een model te schrijven en bij problemen is er altijd een uitge­breide community waarop je kunt terug­vallen. Toch blijft het de vraag wat je nadien met je model wil doen en hoe je er waarde voor het bedrijf uithaalt. Een platform zoals SAS is daarom de perfecte aanvul­ling. Het zorgt ervoor dat open source meer dan een leuke speel­oe­fe­ning wordt.

Wie data analytics wil inscha­kelen, moet eerst beseffen dat het niet volstaat om een knap model te bouwen. Zelfs het sterkste model levert pas waarde voor de orga­ni­satie wanneer het opera­ti­o­neel is en in productie draait. Nadien blijft het nood­za­ke­lijk om een model te monitoren en voort­du­rend na te gaan of het nog altijd even perfor­mant is als voordien.

Het eerste luik, de bouwfase van een model, kan je perfect met open source oplossen. Meer zelfs, de moge­lijk­heden in open source zijn tegen­woordig zo uitge­breid dat veel bedrijven er standaard voor kiezen. De volgende stappen, het opera­ti­o­na­li­seren en monitoren, zijn met open source weliswaar geen garantie op succes. Tenzij je beschikt over een platform dat je opens­our­ce­model onder­steunt en helpt om zoveel mogelijk uit je data te halen.

Hieronder geven we vijf redenen waarom een analytics-platform, zoals SAS Viya, een onmisbare schakel is voor ieder bedrijf dat met open source aan de slag gaat:

1. Maak je data vlot toegankelijk

Bij het bouwen van een model komen heel wat verborgen tech­ni­sche kwesties kijken waar de data scientist zich niet altijd van bewust is. Het begint al bij de data zelf die in grote orga­ni­sa­ties vaak van allerlei uiteen­lo­pende bronnen en bestanden afkomstig is. Als de data zich op speci­fieke file­sys­temen of in zoge­naamde silo’s bevindt, dan moet je daar vanuit open source vaak nog een hele constructie voor opzetten.

Met een plat­for­maanpak maakt het weinig uit waar je data gelo­ka­li­seerd is. SAS Viya managet alle data zodat gebrui­kers deze gegevens kunnen consu­meren op de manier zoals ze in de database staan. Het is dus niet nodig om een kopie te maken, waardoor je altijd zeker bent dat iedere gebruiker met dezelfde en meest recente data werkt. Bovendien moet er niet eerst nog iemand toegang tot de data verlenen. Met een platform verlopen auto­ri­satie en connectie automatisch.

2. Laat meer mensen met analytics-modellen werken

Om met open source te werken, moet je een program­meur zijn of in elk geval kunnen coderen. Dat spreekt voor zich, maar nadien wil je ook dat zoveel mogelijk mensen het model gebruiken. Bij de meeste mede­wer­kers in een bedrijf ontbreekt het echter aan een tech­ni­sche achter­grond. En als het gebruik van modellen beperkt blijft tot de kleine groep die program­meer­talen kent, kan je onmo­ge­lijk het volle poten­tieel van je data benutten. Je moet modellen dus voor een ruimere gemeen­schap in het bedrijf toegan­ke­lijk maken, iets wat we ook wel de demo­cra­ti­se­ring van analytics noemen.

Ook dit kan een platform heel eenvoudig oplossen. Van zodra een program­meur zijn magie in open source voltooid heeft, zorgt het platform ervoor dat de func­ti­o­na­li­teiten voor een breed publiek beschik­baar zijn, dus ook voor wie helemaal geen codeer­vaar­dig­heden heeft. Op die manier is SAS Viya eigenlijk een soort faci­li­tator voor open source. Er bestaat tegen­woordig geen twijfel over het feit dat open source een meer­waarde biedt. Een platform helpt om al die mooie toepas­singen tot bij meer mensen in het bedrijf te krijgen en data analytics een stuk breder in te zetten.

3. Verhoog de productiviteit in je organisatie

Wanneer een data scientist een model bouwt, blijft die in veel orga­ni­sa­ties verant­woor­de­lijk voor het onderhoud van dat model. Gover­nance is immers erg belang­rijk om ervoor te zorgen dat een model na bepaalde tijd nog even perfor­mant is al bij de imple­men­tatie. Wie een paar modellen gebouwd heeft, zit zo al gauw met een serieuze werklast. Uitein­de­lijk dreigt een data scientist zelfs dagelijks bezig te zijn met onderhoud en is er geen tijd om iets nieuws te bouwen. Helaas lopen ze hierdoor het risico dat ze hun werk minder inte­res­sant vinden en zullen ze op termijn misschien voor een boeiender project kiezen – data scien­tists zijn nog steeds een vrij schaars ras.

Een platform neemt de gover­nance van een model groten­deels uit handen van de data scientist. Het is perfect mogelijk om een aantal auto­ma­ti­sche stappen te defi­ni­ëren voor als blijkt dat een model niet meer naar behoren presteert. Op voor­waarde dat de bronfiles aanwezig zijn, kan het platform zelf naar de beginfase terug­keren, het model updaten en snel weer in productie zetten.

Dat kan uiteraard ook vanuit open source, maar een platform maakt het leven van data scien­tists zo gemak­ke­lijk mogelijk. Het doet er zelfs niet toe welke vorm van Machine Learning je precies toepast. Een predic­tie­model, een computer vision-model, tekst­ana­lyse, … SAS Viya beschikt over alle func­ti­o­na­li­teiten om voor het onderhoud van het model te zorgen. En dat bevordert niet alleen de produc­ti­vi­teit, maar ook de tevre­den­heid en motivatie van je teamleden. Data scien­tists mogen zich immers terug bezig houden met de waar­de­volle taken die ze graag doen: modellen bouwen.

4. Neem je modellen sneller in productie

Het is altijd aanbe­volen om je niet tot één model per project te beperken en meteen ook een paar reserves te voorzien. Als de pres­ta­ties van een gebruikt model achter­uit­gaan, dan kan zo’n reserve het meteen overnemen. Tenminste als de opera­ti­o­na­li­se­ring snel genoeg kan gebeuren, maar dat duurt vaak erg lang omdat er nog een paar tests aan voorafgaan.

De data die bedrijven gebruiken in ontwik­ke­ling en productie zijn niet altijd dezelfde. Aangezien een model in een ontwik­ke­lingsom­ge­ving wordt gebouwd en de finale versie op een produc­tie­server moet draaien, zijn tests nood­za­ke­lijk om te zien of het gebouwde model wel valide is om in productie te worden genomen. Bij open source zijn die vali­da­tie­tests nog belang­rijker om te verze­keren dat de produc­tie­server dezelfde versie van open source gebruikt en dezelfde packages geïn­stal­leerd heeft.

Je kunt dat allemaal zelf inbouwen, maar dan dreig je met een lappen­deken van verschil­lende dingen te zitten. Bij een platform zoals SAS Viya is al die tech­no­logie inge­bakken. Ook opens­our­ce­mo­dellen kunnen zo dus veel sneller in productie worden genomen.

5. Geniet van alle voordelen van de cloud

Zowat ieder bedrijf heeft intussen de voordelen van cloud­tech­no­logie ontdekt. Ook open source kan je op een cloudom­ge­ving instal­leren, maar dat is geen garantie om van alle func­ti­o­na­li­teiten van die cloud gebruik te kunnen maken. De cloud biedt je bijvoor­beeld veel flexi­bi­li­teit zodat je heel snel  kunt opschalen als je merkt dat een analy­ti­sche taak erg zwaar is of wanneer je een succesvol model wil repli­ceren. Een platform kan dit andermaal allemaal van je overnemen.

Het is niet meer dan logisch dat bedrijven de dag van vandaag inzetten op open source om modellen te bouwen, maar het mag natuur­lijk niet stoppen bij de ontwik­ke­ling van een model. Een platform zoals SAS Viya kan op het vlak van inter­o­pe­ra­bi­li­teit echt een verschil maken. Het zorgt ervoor dat opens­our­ce­mo­dellen sneller opera­ti­o­neel geraken én blijven, zodat de orga­ni­satie altijd maximale waarde uit haar data kan halen.

Pin It on Pinterest

Share This