Belgisch AI-bedrijf ReBatch biedt alternatief voor ChatGPT en traint Nederlandstalig taalmodel

20 juni 2024

In 24 uur tijd een Nederlands taalmodel trainen dat op termijn moet kunnen wedijveren met ChatGPT. Dat is wat ReBatch – een bedrijf dat op maat gemaakte AI-oplossingen bouwt voor én met organisaties – zopas verwezenlijkt heeft. ‘Zonder miljoenen te investeren zijn we erin geslaagd een model te ontwikkelen dat fatsoenlijk Nederlands spreekt.’

Een nieuw Nederlands open-source LLM-model, afgestemd op meer dan een half miljoen Nederlandse gesprekken. Maak kennis met Reynaerde 7B, een uniek Nederlandstalig taalmodel, ontwikkeld door ReBatch en vernoemd naar het eeuwenoude verhaal over de vos Reynaert, een van dé meesterwerken van de Nederlandse literatuur. 

Jorge De Corte

Door het model te voeden met eigen data is het in principe perfect mogelijk om een taalmodel te ontwikkelen dat gerichte antwoorden geeft, aangepast aan de Belgische en Vlaamse realiteit. Het potentieel van zo’n eigen (taal)model is dus enorm. 

Dat een Belgisch bedrijf met een Nederlands taalmodel op de proppen komt, is niet zonder reden. AI-pionier en medeoprichter van ReBatch Jorge De Corte: “Het is onze missie om AI-oplossingen te ontwikkelen die op zichzelf staan en niet gecontroleerd worden door grote techgiganten. Door dit model te ontwikkelen, willen we organisaties tonen dat het mogelijk is om AI-modellen gericht te trainen, zonder daarbij afhankelijk te zijn van de grote spelers en – niet onbelangrijk – zonder al te grote investeringen.”

Met het open-source model Mistral van de gelijknamige Franse start-up als basis, trainde ReBatch het taalmodel met zo’n 500.000 conversaties – data die automatisch werden gegenereerd. Op die manier is het mogelijk om, zonder miljoenen te investeren in servers, een taalmodel te ontwikkelen dat meer dan fatsoenlijk Nederlands ‘spreekt’.

Kloof verkleinen

​In staat zijn om AI-modellen specifiek te trainen, dus te voorzien van ‘eigen’ data van een organisatie of bedrijf, kan niet onderschat worden. Het laat onder meer toe om gevoelige informatie in eigen beheer te houden en het wapent een organisatie ook tegen hogere prijzen, wijzigende licenties en andere mogelijke beperkende factoren.

“Met een systeem zoals dat van ons kunnen we veel kleinere modellen, gevoed door en voor een organisatie, operationeel houden zonder dat daar te hoge kosten aan verbonden zijn. Zo slagen we er nu al in om met onze domeinspecifieke modellen resultaten te halen die in de buurt komen van een speler als Microsoft. Op termijn zal de kloof tussen kleinere modellen en die van grotere spelers alleen maar kleiner worden. Ik acht het zelfs mogelijk dat we binnenkort betere resultaten halen, omdat we onze modellen gerichter kunnen voeden”, besluit De Corte.

redactie@belgiumcloud

redactie@belgiumcloud

Persberichten, blogs en andere content kunt u mailen naar robbert@belgiumcloud.com

Pin It on Pinterest

Share This