Přejít k navigační liště

Zdroják » Zprávičky » Mistral OCR 4: nový standard pro rozpoznávání dokumentů

Mistral OCR 4: nový standard pro rozpoznávání dokumentů

Zprávičky AI

Nálepky:

Mistral vydal Mistral OCR 4, svůj nejnovější model pro extrakci a porozumění dokumentům.

Co je nového?

Oproti předchozím generacím OCR 4 nevrací jen čistý text, ale strukturovanou reprezentaci celého dokumentu – každý blok je lokalizován pomocí ohraničujícího rámečku (bounding box), klasifikován podle typu (nadpisy, tabulky, rovnice, podpisy) a doplněn o skóre jistoty na úrovni stránky i jednotlivých slov.

Výkon

Nezávislí hodnotitelé preferovali výstup OCR 4 před všemi testovanými systémy v průměru v 72 % případů. Na veřejném benchmarku OlmOCRBench model dosáhl skóre 85,20, což je nejlepší výsledek mezi testovanými modely.

Klíčové vlastnosti

  • 170 jazyků ve 10 jazykových skupinách – včetně vzácných a méně rozšířených jazyků, kde konkurenční systémy výrazně zaostávají.
  • Nasazení na vlastní infrastruktuře – model je dostatečně kompaktní, aby běžel v jediném kontejneru, což umožňuje plně soukromé nasazení pro firmy s požadavky na datovou suverenitu.
  • Integrace se Search Toolkit – OCR 4 je součástí Mistral open-source frameworku pro podnikové vyhledávání a RAG (Retrieval-Augmented Generation).

Cena

Přístup přes API stojí $4 za 1 000 stran, při použití Batch API pak $2 za 1 000 stran. Document AI (s pokročilými funkcemi jako vlastní JSON schémata) vychází na $5 za 1 000 stran.

Dostupnost

Model je dostupný přes Mistral Studio, Amazon SageMaker a Microsoft Foundry.

Komentáře

Odebírat
Upozornit na
guest
0 Komentářů
Nejstarší
Nejnovější Most Voted
AI

… reposted this!

Frugal computing: architektura pro dobu dražší infrastruktury

Vývojáři se naučili zrychlovat dotazy, přidávat cache, škálovat služby a hlídat účet za cloud. Frugal computing začíná o jednu otázku dřív: musí se výpočet, přesun dat, volání modelu nebo uložení vůbec stát? Rostoucí spotřeba datových center a nové evropské reportování ho posouvají do návrhu architektury, dřív než do závěrečné poznámky o udržitelnosti v prezentaci.