Retrieval-augmented generation (RAG) wordt steeds belangrijker bij GenAI

19 september 2024

Retrieval-augmented gene­ra­tion (RAG) speelt een steeds grotere rol in de discus­sies binnen bedrijven over gene­ra­tieve AI (GenAI), blijkt uit een analyse van onder­zoeks­bu­reau GlobalData. Bedrijven willen deze tech­no­logie benutten om in realtime externe data te inte­greren en zo de nauw­keu­rig­heid en rele­vantie van door AI gege­ne­reerde antwoorden te verbeteren. 

Deze trend weer­spie­gelt de toene­mende focus op het combi­neren van eigen, dyna­mi­sche gegevens met AI-modellen, zo blijkt uit de gegevens van GlobalData’s Company Filings Analytics Database.

Wat is Retrieval-augmented gene­ra­tion (RAG)?

Retrieval-augmented gene­ra­tion (RAG) is een AI-techniek waarbij een gene­ra­tief AI-model wordt gecom­bi­neerd met een retrieval-systeem dat externe data kan opvragen. In plaats van alleen te vertrouwen op een vooraf getraind model, kan een RAG-systeem tijdens het genereren van een antwoord ook actuele en relevante infor­matie opzoeken in externe databases of bronnen. Dit zorgt ervoor dat de gege­ne­reerde output niet alleen gebaseerd is op bestaande kennis van het model, maar ook wordt verrijkt met realtime gegevens. Hierdoor zullen antwoorden accurater en rele­vanter worden voor speci­fieke vragen, terwijl de kans op AI-hallu­ci­na­ties – het genereren van onjuiste of mislei­dende infor­matie – afneemt.

Volgens Misa Singh, bedrijfs­ana­list bij GlobalData, richten veel bedrijven zich nog altijd op tradi­ti­o­nele gene­ra­tieve AI-modellen. Maar een aantal pioniers ziet in RAG een kans om betere resul­taten te behalen. “De gesprekken gaan vooral over het verbe­teren van resul­taten, het mini­ma­li­seren van AI-hallu­ci­na­ties en het versterken van tech­ni­sche onder­steu­ning voor producten”, aldus Singh. Bedrijven werken ook steeds vaker samen om hun diensten te inte­greren en zogeheten ‘RAG pipelines’ te ontwik­kelen waarmee vragen sneller en nauw­keu­riger kunnen worden beantwoord.

Een voorbeeld hiervan is Amazon, dat het Amazon Bedrock-platform heeft ontwik­keld. Dit platform biedt niet alleen een brede selectie van large language models (LLMs), maar maakt ook gebruik van RAG om de kennis­basis van deze modellen te verrijken. Hierdoor kunnen appli­ca­ties beter contro­leren welke vragen ze beant­woorden en kunnen AI agents complexere taken uitvoeren.

Progress Software presen­teerde onlangs hun nieuwe Progress Data Platform, dat de tech­no­lo­gieën van MarkLogic en Progress combi­neert. Dit platform inte­greert zowel seman­ti­sche als vector-geba­seerde capa­ci­teiten om RAG te onder­steunen. Hierdoor kunnen gebrui­kers precies zien waar antwoorden vandaan komen en hoe deze relevant zijn. Dit leidt volgens Progress tot betere resul­taten en vermin­dert het risico op AI-hallu­ci­na­ties aanzienlijk.

Inno­va­tion Tech­no­logy Group heeft aange­geven zich te richten op de verdere ontwik­ke­ling van RAG- en zogeheten ‘agent engi­nee­ring frame­works’, met als doel tech­ni­sche onder­steu­ning te bieden voor de continue verbe­te­ring van producten zoals ChatDoc en ChatRobot Pro. Ook Pure Storage bena­drukte in hun recente winst­be­spre­king dat ze RAG als een veel­be­lo­vende kans zien.

Daarnaast werkt een bedrijf als Confluent samen met Pinecone aan de ontwik­ke­ling van de vector-database archi­tec­tuur, Pinecore server­less geheten. Deze samen­wer­king stelt klanten in staat om RAG pipelines te bouwen die hun realtime, eigen data kunnen combi­neren met algemene AI-modellen. Dit biedt de moge­lijk­heid om op maat gemaakte, actuele antwoorden te genereren, gebaseerd op de meest recente gegevens.

De toene­mende aandacht voor RAG toont aan dat deze tech­no­logie een belang­rijke rol zal spelen in de evolutie van gene­ra­tieve AI, aldus Global Data. Door de moge­lijk­heid om realtime data te inte­greren, biedt RAG bedrijven de kans om de nauw­keu­rig­heid van AI-antwoorden te verbe­teren en trans­pa­rantie te bieden over de herkomst van infor­matie. Dit maakt RAG aantrek­ke­lijk voor orga­ni­sa­ties die streven naar betere AI-oplos­singen en een betere gebruikerservaring.

Pin It on Pinterest

Share This