’76% van zakelijk LLM-gebruik is open source’

16 juli 2024

Bedrijven kiezen doorgaans voor open source bij het gebruik van LLM’s. Dit blijkt uit het State of Data & AI 2024-rapport van Data­bricks. Bedrijven van iedere omvang inves­teren in gene­ra­tieve AI om hun orga­ni­sa­ties te trans­for­meren en hun data beter aan te wenden om zakelijke doel­stel­lingen te behalen.

De belang­rijkste onderzoeksresultaten:

  • In 2023 werden 11 keer zoveel AI-modellen in productie genomen als het voor­gaande jaar. Gemiddeld is het in productie nemen meer dan drie keer zo efficiënt geworden. Daarbij is natuur­lijke taal­ver­wer­king (NLP) de meest gebruikte en snelst groeiende machine learning-toepassing.
  • 70% van de bedrijven die gene­ra­tieve AI gebruiken, zetten tools en vector databases in om basis­mo­dellen aan te vullen. Bedrijven zijn sterk gericht op het aanpassen van LLM’s met hun eigen data via retrieval augmented gene­ra­tion (RAG). RAG vereist vector databases, waarvan het gebruik met 377% steeg op jaarbasis (zowel in het geval van open source- als gesloten LLM’s).
  • 76% van de bedrijven die LLM’s gebruiken kiest voor open source, vaak in aanvul­ling op prop­ri­ë­taire modellen. Slechts 4 weken na de lancering is Meta Llama 3 al goed voor 39% van het gehele open source model­ge­bruik. Sterk gere­gu­leerde sectoren zijn de verras­sende early adopters van gene­ra­tieve AI: finan­ciële dienst­ver­le­ners lopen voorop in GPU-gebruik, dat in slechts 6 maanden steeg met 88%.

De top 10 Data- en AI-oplossingen

Naast trends in AI-gebruik, brengt het onderzoek de 10 meest gebruikte data en AI-oplos­singen in kaart. 9 van de 10 producten in de lijst zijn open source. Orga­ni­sa­ties kiezen vaak voor meer flexi­bi­li­teit, waardoor ze prop­ri­ë­taire beper­kingen proberen te vermijden. Een drietal producten vallen op in de top 10, gebaseerd op hun ontwik­ke­ling in het afgelopen jaar en het groeiende zakelijke gebruik:

  • Plotly Dash: Plotly Dash is een low-code platform waarmee data­we­ten­schap­pers data-appli­ca­ties kunnen bouwen, opschalen en imple­men­teren. Producten zoals Plotly Dash helpen bedrijven sneller en eenvou­diger appli­ca­ties te leveren om aan dyna­mi­sche bedrijfs­be­hoeften te voldoen.
  • Hugging Face: Hugging Face Trans­for­mers is het op één na popu­lairste product. Veel bedrijven gebruiken het open source platform met vooraf getrainde trans­for­mer­mo­dellen in combi­natie met hun zakelijke data om foun­da­tion models te bouwen en te verfijnen. Dit onder­steunt een groeiende trend die Data­bricks ziet met RAG-toepassingen.
  • LangChain: LangChain is een open source-toolchain voor de ontwik­ke­ling en het gebruik van prop­ri­ë­taire LLM’s. Wanneer bedrijven hun eigen LLM-appli­ca­ties bouwen en werken met gespe­ci­a­li­seerde trans­for­mer­ge­re­la­teerde Python-library’s om modellen als deze te trainen, stelt LangChain hen in staat prompt inter­faces of inte­gra­ties met andere systemen te ontwikkelen.

“We kunnen uit het rapport conclu­deren dat bedrijven met behulp van data­we­ten­schap en AI grotere effi­ci­ën­tie­slagen beoogt, en dat gene­ra­tieve AI daar nieuwe moge­lijk­heden voor biedt”, aldus Kevin Jonker­gouw, Regional VP Benelux bij Data­bricks. “Daar is wel één samen­han­gende beheer­om­ge­ving voor nodig, zodat de gehele orga­ni­satie data en AI veilig en verant­woord kan gebruiken. Dat kan met behulp van data intel­li­gence-platforms. De onder­zoeks­re­sul­taten laten zien dat bedrijven in alle sectoren deze tools omarmen, waarbij early adopters vaak uit sterk gere­gu­leerde sectoren komen zoals de finan­ciële sector.”

Pin It on Pinterest

Share This