Paneldiscussie van Altair: ‘We hebben behoefte aan een nieuwe generatie data scientists’

8 oktober 2020

Steeds meer bedrijven gebruiken machine learning en AI om klanten beter te bedienen en werk- en produc­tie­pro­cessen verder te stroom­lijnen. De tools die hierbij worden ingezet, zijn inmiddels dermate krachtig dat een nieuwe generatie data scien­tists nodig is om maximaal van de moge­lijk­heden gebruik te maken. Doen we dat niet, dan is de kans groot dat ML en AI vooral gezien wordt als een black box waar we geen grip op hebben. 

Altair is een aanbieder van simulatie- en analyse-tools, met AI en ML voor data science, die veel­vuldig worden toegepast. Het bedrijf zette in 2019 zo’n half miljard dollar om en levert software aan klanten in de wereld van onder andere manu­fac­tu­ring, lucht- en ruim­te­vaart, retail en finance.

Lastig uit te leggen

Altair had enkele mede­wer­kers van vijf Europese gebrui­kers­or­ga­ni­sa­ties uitge­no­digd voor een discussie over de vraag of er een nieuwe generatie data scien­tists nodig is – daar was men het snel over eens: ja – en aan welke eisen deze func­ti­o­naris dan dient te voldoen.

Het was Pedro Pinto Coelho, CEO van de Portugese Banco BNI Europa, die tijdens het webinar misschien wel het duide­lijkst uitlegde waarom deze nextgen data scientist zo nodig is. “Als bank gebruiken wij al geruime tijd data science om op basis van tal van gegevens tot aanbe­ve­lingen te komen. Dat werkt heel goed, maar levert tege­lij­ker­tijd ook een probleem op. Het wordt voor ons steeds lastiger om uit te leggen aan bijvoor­beeld toezicht­hou­ders en aandeel­hou­ders hoe onze machine learning- en arti­fi­cial intel­li­gente-modellen nu precies werken. Dit soort partijen willen niet met black box’s worden gecon­fron­teerd waarvan ze niet precies weten hoe die func­ti­o­neren. Maar echt goed uitleggen hoe een aanbe­ve­ling precies tot stand komt, is vaak niet zo eenvoudig uit te leggen.”

Hoe ziet de nextgen data scientist er uit?

Tot nu toe zien we dat veel data scien­tists vooral een – zeg maar – tech­ni­sche achter­grond hebben. Of zoals Antti Myllymäki van de Finse OP Financial Group het uitdrukte: “Veel data scien­tists waren tot nu toe vooral kenners van een speci­fieke domein die goed met tech­ni­sche tools uit de voeten kunnen. De volgende generatie data scien­tists moet dat uiteraard ook zijn. Maar daarnaast zullen zij vooral heel goed moeten kunnen communiceren.”

Thomas Bern­gruber van de Deense Jyske Bank wilde echter voorkomen dat we van data science een te algemene disci­pline maken. Hij ziet graag drie skill sets in de nestgen data scien­tists verenigt: algemene kennis van data science, branche- of domein­kennis plus tech­ni­sche diepgang op in ieder geval één gebied. Bijvoor­beeld program­meren of juist veel kennis van statis­ti­sche modellen.

Onderscheid maken

Inte­res­sant in de discussie was het feit dat er steeds meer onder­scheid wordt gemaakt tussen data engineers en func­ti­o­na­rissen die over de data kunnen commu­ni­ceren met gebrui­kers. Georges Mans­ou­ratti van Northmill Bank maakte onder­scheid tussen mensen die kunnen model­leren, mensen die ‘the plumbing’ kunnen regelen (het tech­ni­sche proces van verza­melen en beschik­baar maken van data) en de mede­wer­kers die nauw kunnen samen­werken met eind­ge­brui­kers. Het liefst ziet hij dat een aantal van zijn data scien­tists in staat is om op z’n minst twee van deze rollen voor hun rekening te nemen. 

We moeten hierbij echter niet vergeten dat niet iedere orga­ni­satie even ver is in het toepassen van data science. Zo vertelde Daniel Gebler van het nog jonge Picnic dat binnen zijn retail­or­ga­ni­satie nog vooral wordt gewerkt met data scien­tists die ervoor zorgen dat klanten aanbe­ve­lingen voor producten krijgen. Hij heeft daarom tot nu toe vooral full-stack  mensen in dienst. En niet zozeer mede­wer­kers die zich in een van de hiervoor genoemde indi­vi­duele skill sets hebben gespe­ci­a­li­seerd. Hij is daarnaast voor­stander van maatwerk: kijk goed naar de sterktes en zwaktes van je team en zoek daar vervol­gens mensen bij die de zwakkere punten kunnen aanvullen. 

Kwaliteit en beschikbaarheid

Een belang­rijke uitdaging, zo bleek tijdens het Altair-webinar, is nog altijd de kwaliteit en de beschik­baar­heid van data. Myllymäki van de OP Financial Group gaf aan met 700 bron­sys­temen te werken, waarvan de data­kwa­li­teit nogal eens wil variëren. Net als veel andere orga­ni­sa­ties probeert hij die kwaliteit te verbe­teren of ontbre­kende gegevens aan te vullen door klanten te vragen deze gegevens in te vullen of op te geven. Daar zitten echter wel grenzen aan, meent hij. Zeker als je je richt op consu­menten is het belang­rijk niet te over-vragen, anders haakt men af. Zelfs – zoals bij OP – als het gaat om hypotheekaanvragen. 

Ook voor Northmill Bank over­heersen nog altijd de bekende issues die we uit de tijd van BI kennen: kwaliteit en beschik­baar­heid zijn zelden op het gewenste niveau. “Het model­leren zelf levert zelden serieuze problemen op”, vertelde Mans­ou­ratti. “Waar we veel tijd in moeten inves­teren is uitleggen aan onze interne gebrui­kers hoe dit soort processen verlopen. Welke data hebben we beschik­baar, hoe goed of slecht is die data, hoe verloopt het opzetten van een goede data-infra­struc­tuur, hoe kunnen we eventueel goede externe data inte­greren en wat mogen zij vervol­gens als resultaat van analyses verwachten?”

Enorme kansen

Data science biedt enorme kansen om tot nieuwe business modellen te komen, daar waren de panel­leden het duidelijk over eens. Maar het is vaak een flinke uitdaging om de theorie in de praktijk om te zetten. Data science biedt de kans om als bank een adviseur te worden van de klant, vertelde Bern­gruber van Jyske Bank bijvoor­beeld. Maar het is een flinke klus om een tradi­ti­o­neel business model om te vormen tot een op advi­se­ring en nauwe samen­wer­king met de klant gebaseerd model.

Data science-tools helpen zeer zeker bij deze omvorming van tradi­ti­o­nele business modellen. Maar dat kan alleen als we data science uit de hoek van de – zeg maar – techniek halen. Anders gezegd: model­leren is belang­rijk voor een succesvol project. Maar met de almaar krach­tiger wordende tools is het zo mogelijk nog belang­rijker dat we uitleggen wat de modellen die hiermee gebouwd worden precies doen en kunnen. Die uitleg dient bovendien gericht te zijn op alle stake­hol­ders: de klanten, de interne gebrui­kers (zeg maar: verwach­tin­gen­ma­na­ge­ment), maar natuur­lijk ook aandeel­hou­ders en toezichthouders.

Pin It on Pinterest

Share This