Belgisch AI-bedrijf ReBatch biedt alternatief voor ChatGPT en traint Nederlandstalig taalmodel

20 juni 2024

In 24 uur tijd een Neder­lands taalmodel trainen dat op termijn moet kunnen wedij­veren met ChatGPT. Dat is wat ReBatch – een bedrijf dat op maat gemaakte AI-oplos­singen bouwt voor én met orga­ni­sa­ties – zopas verwe­zen­lijkt heeft. ‘Zonder miljoenen te inves­teren zijn we erin geslaagd een model te ontwik­kelen dat fatsoen­lijk Neder­lands spreekt.’

Een nieuw Neder­lands open-source LLM-model, afgestemd op meer dan een half miljoen Neder­landse gesprekken. Maak kennis met Reynaerde 7B, een uniek Neder­lands­talig taalmodel, ontwik­keld door ReBatch en vernoemd naar het eeuwen­oude verhaal over de vos Reynaert, een van dé mees­ter­werken van de Neder­landse literatuur. 

Jorge De Corte

Door het model te voeden met eigen data is het in principe perfect mogelijk om een taalmodel te ontwik­kelen dat gerichte antwoorden geeft, aangepast aan de Belgische en Vlaamse realiteit. Het poten­tieel van zo’n eigen (taal)model is dus enorm. 

Dat een Belgisch bedrijf met een Neder­lands taalmodel op de proppen komt, is niet zonder reden. AI-pionier en mede­op­richter van ReBatch Jorge De Corte: “Het is onze missie om AI-oplos­singen te ontwik­kelen die op zichzelf staan en niet gecon­tro­leerd worden door grote tech­gi­ganten. Door dit model te ontwik­kelen, willen we orga­ni­sa­ties tonen dat het mogelijk is om AI-modellen gericht te trainen, zonder daarbij afhan­ke­lijk te zijn van de grote spelers en – niet onbe­lang­rijk – zonder al te grote investeringen.”

Met het open-source model Mistral van de gelijk­na­mige Franse start-up als basis, trainde ReBatch het taalmodel met zo’n 500.000 conver­sa­ties – data die auto­ma­tisch werden gege­ne­reerd. Op die manier is het mogelijk om, zonder miljoenen te inves­teren in servers, een taalmodel te ontwik­kelen dat meer dan fatsoen­lijk Neder­lands ‘spreekt’.

Kloof verkleinen

​In staat zijn om AI-modellen specifiek te trainen, dus te voorzien van ‘eigen’ data van een orga­ni­satie of bedrijf, kan niet onder­schat worden. Het laat onder meer toe om gevoelige infor­matie in eigen beheer te houden en het wapent een orga­ni­satie ook tegen hogere prijzen, wijzi­gende licenties en andere mogelijke beper­kende factoren.

“Met een systeem zoals dat van ons kunnen we veel kleinere modellen, gevoed door en voor een orga­ni­satie, opera­ti­o­neel houden zonder dat daar te hoge kosten aan verbonden zijn. Zo slagen we er nu al in om met onze domein­spe­ci­fieke modellen resul­taten te halen die in de buurt komen van een speler als Microsoft. Op termijn zal de kloof tussen kleinere modellen en die van grotere spelers alleen maar kleiner worden. Ik acht het zelfs mogelijk dat we binnen­kort betere resul­taten halen, omdat we onze modellen gerichter kunnen voeden”, besluit De Corte.

Pin It on Pinterest

Share This