Новая модель Mistral преобразует документы в структурированные данные: французская лаборатория ИИ выпустила OCR 4. Она возвращает не только чистый текст, но и ограничивающие рамки, набранные блоки и оценки достоверности для каждого региона. Эти данные напрямую поступают в RAG и конвейеры обработки данных. Это позволяет командам получать готовые к цитированию фрагменты текста вместо необработанных данных. Модель работает в одном контейнере и поддерживает 170 языков. Доступ к API начинается от 4 долларов за 1000 страниц. Подробнее об API.