Новости за последний час
Mistral снова выкатила OCR 4, и на этот раз это уже не просто «распознать текст со скана». Модель умеет вытаскивать структуру документа: блоки, таблицы, формулы, подписи, bounding boxes и confidence score по страницам и словам. Поддержка 170 языков делает её полезной не только для англоязычных архивов, а для вполне реальных корпоративных завалов.
Самое интересное здесь — не OCR ради OCR, а нормальная заготовка под RAG, enterprise search и агентные пайплайны. Плюс self-hosted в одном контейнере: для компаний, которые не хотят гонять документы через чужой API, это весомее любой презентации. Цена при этом выглядит агрессивно: $4 за 1000 страниц через API и $2 через Batch.
Источники: Machinelearning, Neurogen, TechCrunch, Anthropic News, The Verge
Все новости: ai.popovs.tech
В этом посте были ссылки, но мы их удалили по правилам Сетки