Elke organisatie is erbij gebaat snel op uitdagingen te anticiperen of problemen preventief aan te pakken. Daarvoor is het cruciaal dat zij de actualiteit, precisie en relevantie van bedrijfsdata en analysemodellen monitoren. Beperkt houdbare data en modellen maken het namelijk veel moeilijker om passend op verschillende situaties te reageren en aan de veranderende vraag naar diensten en producten te voldoen. Kloppen de prijzen en de beschikbaarheid van je grondstoffen nog wel? Is dat ene uitgevoerde marktonderzoek nog actueel? Het zijn slechts twee voorbeelden van relevante vragen die binnen sommige organisaties te vaak onbeantwoord blijven.
Ondernemingen die hun data en modellen up-to-date houden, kunnen niet alleen hun overlevingskansen vergroten. Ze kunnen hun omzet en winst ook verhogen door altijd op de hoogte te zijn van de ‘datakwaliteit’. Hoe nauwkeuriger de inzichten zijn, des te beter kan men intern en extern waarde toevoegen voor het bedrijf. Denk bijvoorbeeld aan een retailer die in kaart brengt welke producten het best presteren tijdens de huidige pandemie. Deze retailer kan altijd zorgen dat hij deze producten op voorraad heeft en op de juiste plek in de winkel legt. Zo vergroot deze winkelier de omzet per klant. De data waar hij mee werkt gaan veel verder dan naam-geslacht-leeftijd. Bret Greenstein, SVP en Global Head of Data bij Cognizant, geeft uitleg.
Data die actueel genoeg is
Actuele data is up-to-date wat betreft de meest recente veranderingen die een significante impact op de business kunnen hebben. Denk bijvoorbeeld aan de maatregelen rondom corona; de regering kan maatregelen rondom de pandemie per week aanpassen. Maar ook social media kan je waardevolle, actuele data geven. Word er bijvoorbeeld een protest in de buurt georganiseerd? Of erger: staat je bedrijf een storm van kritiek te wachten? Vraag dat maar aan Rumag, dat zijn populariteit na één aflevering van ‘Zondag met Lubach’ enorm zag kelderen. Daar moet je van op de hoogte zijn. Artificial intelligence (AI) en ‘machine learning’ kunnen je helpen die data te identificeren en modellen te bouwen om data te analyseren.
Die modellen veranderen en verfijnen voortdurend en vormen een deel van de input voor virtual twins, digitale kopieën van ‘iets’ in de echte wereld. Die twins zijn, doordat de data continu up-to-date wordt gebracht, een veel beter stuk gereedschap dan modellen die eenmalig van statische data worden voorzien. Om terug te komen op corona: veel voorspellende modellen in de retail, die gebouwd zijn met data van vóór de crisis, volstaan logischerwijs niet meer. Modellen waarin het koopgedrag van vandaag automatisch vormgeeft aan dat model, maar dat ook rekening houdt met de huidige restricties, het aantal infecties en andere factoren, doen het altijd beter.
Data die nauwkeurig is
Schone, gevalideerde data uit een nauwkeurige bron is volledig en bruikbaar. Dat wil zeggen: deze is niet door derden aangetast en wordt geleverd in een format waar je systeem mee kan werken. Dit is vooral belangrijk voor data in onconventionele vormen, zoals ongestructureerde data of data afkomstig uit nieuwe bronnen als social media of IoT. Deze data is vaak rijk aan potentiële inzichten, zoals je bijvoorbeeld de locatiegegevens van telefoons kunt inzetten om verspreiding van corona in de gaten te houden.
Nauwkeurige modellen zijn niet alleen onder de huidige omstandigheden accuraat. Door geavanceerde AI te gebruiken maken de modellen ook betere voorspellingen, en bieden ze betere aanbevelingen, voor de toekomst. Je model zou bijvoorbeeld een scenario kunnen schetsen waarin millennials massaal uit de stad vertrekken door zorgen om COVID-19. Zo’n voorspelling kan, als hij uitkomt, enorme impact hebben. Als bedrijf kun je dan werken aan een scenario waarin deze voorspelling werkelijkheid werkt. Zo blijf je andere bedrijven altijd een stap voor. Tegelijk worden analytische modellen die iedereen al heeft minder waardevol. Als al je concurrenten dezelfde seizoensinvloeden gebruiken om de verkoop van dezelfde producten te voorspellen, in hoeverre kun je jezelf dan nog onderscheiden? De accurate modellen leren dus ook informatie te negeren zodra die irrelevant wordt.
Data die relevant is
Relevante data is omvangrijk en causatief genoeg om impact te hebben op voorspellingen of toekomstige omstandigheden (en hoe daarmee om te gaan). Met andere woorden: relevante data doet ‘iets’ met je model. Om social media als voorbeeld te nemen: vroeger was een slechte, ongepaste grap geen stukje data dat iets deed voor je bedrijf. Tegenwoordig is een ongepaste tweet van je CEO dus veel relevanter, omdat deze invloed kan hebben op je omzet, marktaandeel en merkwaarde. Relevante data kan overal vandaan komen, van binnen of buiten de organisatie en het kan je bedrijf helpen als eerste een trend te spotten of op veranderingen in te springen.
Door relevante modellen te ontwikkelen en deze te blijven verfijnen kunnen organisaties (door inzet van AI) zelf leren welke data het meest bruikbaar is, en irrelevante data negeren. Zo kunnen zij onnodige uitgaven voorkomen, tijd en moeite besparen, en onderaan de streep meer omzet en winst overhouden.