Een team van het Pacific Northwest National Laboratory van het Amerikaanse ministerie van Energie, Purdue University, Carnegie Mellon University en Boise State University heeft een AI-model in natuurlijke taal ontwikkeld dat kwetsbaarheden automatisch koppelt aan specifieke aanvalslinies. Dit zou security professionals moeten helpen aanvallen vaker en sneller te herkennen en te voorkomen. Dat meldt de website EENews Europe.
Het model wordt VWC-MAP genoemd. Het is open source en een deel is nu al beschikbaar op GitHub. Het team zal de rest van de code binnenkort vrijgeven. Het model koppelt kwetsbaarheden automatisch aan de juiste zwakheden met een nauwkeurigheid tot 87 procent, en koppelt zwakheden aan geschikte aanvalspatronen met een nauwkeurigheid tot 80 procent.
Een hindernis hierbij is het gebrek aan gelabelde gegevens voor training. Zo zijn er momenteel maar heel weinig kwetsbaarheden – minder dan 1% – gekoppeld aan specifieke aanvallen. Er is dus maar een beperkte hoeveelheid gegevens beschikbaar voor training.
Daarom hebben de onderzoekers vooraf getrainde natuurlijke taalmodellen verfijnd met behulp van zowel een auto-encoder (BERT) als een sequentie-naar-sequentie-model (T5). De eerste benadering gebruikte een taalmodel om CVE’s (Common Vulnerabilities and Exposures) te associëren met CWE’s (Common Weakness Enumeration) en vervolgens CWE’s met CAPEC’s (Common Attack Pattern Enumeration and Classification).
De tweede benadering gebruikte sequentie-naar-sequentie technieken om CWE’s te vertalen naar CAPEC’s met intuïtieve aanwijzingen voor het rangschikken van de associaties. De benaderingen genereerden zeer vergelijkbare resultaten, die vervolgens werden gevalideerd door de cyberbeveiligingsexpert van het team.
Het nieuwe AI-model maakt gebruik van natuurlijke taalverwerking en begeleid leren om informatie in drie afzonderlijke cyberbeveiligingsdatabases te overbruggen.