De Belgische applicatie Cake verzamelt en koppelt de bankrekeningen van verschillende banken in één mobiele app met als ultieme doel de financiële gezondheid van de gebruiker te verbeteren. Het gebruik van de app levert bovendien financiële beloningen op. Bovenop het overzichtelijk weergeven van alle financiële transacties worden deze gecategoriseerd en verrijkt met inzichten. De ontwikkelaars zochten een oplossing om deze transacties die als ruwe, ongestructureerde data binnenkomen, in real time te verwerken en te categoriseren. Samen met ondersteuning van het Leuvense Dataroots werd een gefundeerde data engineering pipeline uitgebouwd. Dankzij dit model geniet het groeiend aantal Cake-gebruikers steeds van een schaalbare en stabiele gebruikerservaring.
Cake werd in 2018 opgericht door Davy Kestens met een klein team van data scientists. Ondertussen is het team van de start-up een twintigtal mensen sterk en telt de publieke beta van de gelijknamige mobiele applicatie meer dan 31.000 gebruikers. Zij koppelen hun verschillende bankrekeningen aan de app waarbij alle transacties overzichtelijk worden weergegeven en verrijkt met categorieën en spendeerinzichten. De app fungeert dus als financiële coach. Gebruikers krijgen bij aangesloten handelaren automatisch kortingen of cashbacks toegekend alsook een deel van de opbrengsten van de applicatie. De gemiddelde Cake-gebruiker verdiende zo al 8,79 euro.
Sinds de start van de publieke beta van Cake eind 2019, werden al meer dan 13,5 miljoen transacties door het platform verwerkt. Deze komen bij Cake initieel als ruwe, ongestructureerde data binnen en worden voor de gebruiker omgezet in inzichtelijke transacties. Het is essentieel dat dit in real time gebeurt om onmiddellijk inzicht te hebben in de uitgaven of om kortingen te bekomen. Dit vereist een model dat enerzijds heel snel en efficiënt die ruwe data kan verwerken en dit bovendien kan blijven doen met een steeds toenemend gebruikersaantal.
Externe expertise
Het data science team van Cake werkte initieel zelf een werkende oplossing uit. Anticiperend op het sterk toenemende aantal transacties en gebruikers is het fundamenteel dat deze oplossing schaalbaar is. Om hieraan te voldoen werd gekeken naar externe expertise. Het model van Cake werd achter een API of software-interface geplaatst en Dataroots ontwikkelde een technisch element die de link vormt tussen deze API en de front-end. Deze component stuurt de binnenkomende transacties naar het Cake-model dat de ruwe data verwerkt en vervolgens naar de interface van de applicatie. Hier krijgt de gebruiker de verrijkte data in real time te zien. Wanneer de gebruiker bijvoorbeeld een brood koopt met een bankkaart van een aangesloten rekening, verschijnt deze transactie meteen in de app. Ze krijgt de categorie ‘Food’ toegewezen en de gebruiker krijgt een overzicht van de wekelijkse of maandelijkse voedingsuitgaven en de volledige uitgavehistoriek bij die handelaar.
Co-founder en head of data science van Cake, Jessica Ruelens licht toe: “Hoewel onze eigen oplossing in essentie functioneel was, botsten we al snel op de limieten van de capaciteit. Van zodra het gebruikersaantal groeide en de hoeveelheid data toenam, crashte het systeem regelmatig. Dataroots bouwde een oplossing met het Spark framework die een uitstekende schaalbaarheid garandeert bij data processing. De oplossing is volledig maatwerk maar berust op de ontwerpprincipes van Dataroots. Hierbij wordt het model losgekoppeld van de technische implementatie waardoor het mogelijk wordt om ontwikkelingen aan beide kanten onafhankelijk te laten evolueren.”
Deel van het team
Initieel werden een aantal workshops ingericht om de huidige technologie en de stand van zaken te analyseren. De lijnen werden samen uitgestippeld en machine learning engineer Nick Schouten van Dataroots werkte vanaf dat moment exclusief in-house voor Cake. Daarnaast kon Cake rekenen op permanente ondersteuning van het Dataroots expertisecentrum.
Davy Kestens, founder en CEO van Cake koos bewust om op deze manier te werken: “Op vlak van data science zijn we heel goed in het ontwikkelen van onze modellen maar dit inpassen in het bredere businessgeheel is een andere metier. Gezien we met Cake lean and nimble willen blijven, vonden we een uitstekende match bij Dataroots als externe partner. Ondertussen is Nick echt een deel van het team geworden en bouwen we samen verder aan nieuwe projecten.”
Data science
Zo hebben ze steeds meer data voorhanden naarmate de Cake-gebruikers toenemen. Dit opent deuren op vlak van data science. Cake kan zo na het anonimiseren van deze data rapporten genereren voor retailers rond inzichten in aankoopgedrag waarop diepgaande verfijning mogelijk is. De helft van de opbrengsten die deze rapporten genereren gaat naar de gebruikers via een maandelijkse storting. Ook voor de uitwerking van deze functionaliteiten werkt Cake samen met Dataroots.
“Dataroots heeft ook de expertise op vlak van data science dus kunnen we ook hiervoor op hen rekenen. Het is heel fijn om samen te werken met een team dat zoveel expertise in huis heeft”, vertelt Jessica Ruelens. “Ze zijn even geïnvesteerd in ons succes dan wijzelf. We zijn dan ook al meteen in de eerste workshop in de code gekropen terwijl je met andere partijen eerst heel high level blijft en niet in de diepte gaat. Dit past uitstekend bij onze doenersmentaliteit als start-up.”