Mistral представила OCR 4 для распознавания документов
Mistral выпустила OCR 4 — не просто распознавалку текста, а нормальный разбор документов: модель возвращает текст, bounding boxes, типы блоков вроде заголовков, таблиц, формул и подписей, плюс confidence-скоры по странице и словам. Для OCR это уже ближе к инженерному инструменту, чем к “сфоткал и получил текст”.
Поддержка 170 языков и self-hosting выглядят сильнее, чем очередной API для демо. Для компаний с архивами, сканами и редкими языками это может быть куда интереснее, чем чисто облачный сценарий. Цена API — $4 за 1000 страниц, есть батч и Document AI поверх.
Источник: AI Product | Igor Akimov
Все новости: ai.popovs.tech