Mistral zet nieuwe stap in document-AI met OCR 3

19 december 2025

Mistral AI heeft een nieuwe versie van zijn OCR-tech­no­logie aange­kon­digd: Mistral OCR 3. Volgens het bedrijf betekent deze release een duide­lijke sprong voor­waarts in het auto­ma­tisch herkennen en struc­tu­reren van tekst uit uiteen­lo­pende docu­ment­typen, variërend van formu­lieren en gescande docu­menten tot complexe tabellen en hand­ge­schreven aante­ke­ningen. In interne bench­marks behaalt de nieuwe versie een totale win-rate die 74 procent beter is ten opzichte van Mistral OCR 2.

OCR, oftewel Optical Character Recog­ni­tion, vormt voor veel orga­ni­sa­ties een cruciale schakel tussen onge­struc­tu­reerde docu­menten en digitale workflows. Mistral OCR 3 is ontworpen om niet alleen tekst te extra­heren, maar ook de onder­lig­gende docu­ment­struc­tuur te behouden. Het model onder­steunt markdown-uitvoer die is verrijkt met HTML-geba­seerde tabellen, inclusief kolom- en rijhi­ë­rar­chieën, samen­ge­voegde cellen en kopstruc­turen. Daarmee kunnen down­stream­sys­temen beter begrijpen hoe infor­matie in een document is opgebouwd.

Volgens Mistral presteert OCR 3 beter dan zowel tradi­ti­o­nele enter­prise-oplos­singen voor docu­ment­ver­wer­king als meer AI-native OCR-systemen. De verbe­te­ringen zijn vooral zichtbaar bij lastig te verwerken input, zoals formu­lieren met dicht op elkaar geplaatste velden, hand­ge­schreven aanvul­lingen op gedrukte teksten, lage-reso­lu­ties­cans en docu­menten met vervor­ming of compressie-arte­facten. Ook bij complexe tabellen, bijvoor­beeld uit finan­ciële of weten­schap­pe­lijke rapporten, zou de nieuwe versie nauw­keu­riger zijn in het recon­stru­eren van de oorspron­ke­lijke lay-out.

Een opvallend punt is dat Mistral OCR 3 relatief compact is in verge­lij­king met concur­re­rende modellen. Dat vertaalt zich volgens het bedrijf in lagere gebruiks­kosten: de prijs ligt volgens het bedrijf op twee dollar per duizend pagina’s, met een korting van vijftig procent bij gebruik van de Batch API. Daarmee komt de prijs uit op één dollar per duizend pagina’s, wat het model ook inte­res­sant maakt voor groot­scha­lige verwerkingspijplijnen.

Devel­o­pers kunnen Mistral OCR 3 inte­greren via de API (mistral-ocr-2512). Daarnaast is het model nu geïn­te­greerd in de Document AI Playground binnen Mistral AI Studio. Deze interface biedt een drag-and-dropom­ge­ving waarin gebrui­kers PDF’s of afbeel­dingen direct kunnen omzetten naar schone tekst of gestruc­tu­reerde JSON-uitvoer, zonder zelf code te hoeven schrijven. De nieuwe OCR-versie is volledig backward compa­tible met Mistral OCR 2.

Mistral ziet uiteen­lo­pende toepas­singen voor de tech­no­logie, van het auto­ma­tisch verwerken van facturen en opera­ti­o­nele docu­menten tot het digi­ta­li­seren van archieven en het ontsluiten van tech­ni­sche en weten­schap­pe­lijke rapporten voor zoek- en kennis­sys­temen. Ook voor end-to-end document under­stan­ding pipelines en toepas­singen rond gene­ra­tieve en agentic AI speelt OCR volgens het bedrijf een funda­men­tele rol.

Mistral OCR 3 is per direct beschik­baar via de API en de Document AI Playground in Mistral AI Studio. Daarmee verste­vigt Mistral zijn positie in de snel groeiende markt voor AI-gedreven docu­ment­ver­wer­king, waar nauw­keu­rig­heid, schaal­baar­heid en kosten­be­heer­sing steeds belang­rijker worden.

Pin It on Pinterest

Share This