Mistral OCR 4: nový standard pro rozpoznávání dokumentů
Mistral vydal Mistral OCR 4, svůj nejnovější model pro extrakci a porozumění dokumentům.
Co je nového?
Oproti předchozím generacím OCR 4 nevrací jen čistý text, ale strukturovanou reprezentaci celého dokumentu – každý blok je lokalizován pomocí ohraničujícího rámečku (bounding box), klasifikován podle typu (nadpisy, tabulky, rovnice, podpisy) a doplněn o skóre jistoty na úrovni stránky i jednotlivých slov.
Výkon
Nezávislí hodnotitelé preferovali výstup OCR 4 před všemi testovanými systémy v průměru v 72 % případů. Na veřejném benchmarku OlmOCRBench model dosáhl skóre 85,20, což je nejlepší výsledek mezi testovanými modely.
Klíčové vlastnosti
- 170 jazyků ve 10 jazykových skupinách – včetně vzácných a méně rozšířených jazyků, kde konkurenční systémy výrazně zaostávají.
- Nasazení na vlastní infrastruktuře – model je dostatečně kompaktní, aby běžel v jediném kontejneru, což umožňuje plně soukromé nasazení pro firmy s požadavky na datovou suverenitu.
- Integrace se Search Toolkit – OCR 4 je součástí Mistral open-source frameworku pro podnikové vyhledávání a RAG (Retrieval-Augmented Generation).
Cena
Přístup přes API stojí $4 za 1 000 stran, při použití Batch API pak $2 za 1 000 stran. Document AI (s pokročilými funkcemi jako vlastní JSON schémata) vychází na $5 za 1 000 stran.
Dostupnost
Model je dostupný přes Mistral Studio, Amazon SageMaker a Microsoft Foundry.
… reposted this!