Нашёл бесплатный опенсорс инструмент, который за секунды превращает любые PDF, Word, Excel или отсканированные изображения в чистый Markdown:
• текст в правильном порядке • таблицы в HTML • формулы в LaTeX • OCR • 109 языков
Работает через CLI, Python или веб (mineru.net). Запускается локально на твоём компьютере. 100% приватно. Больше 70000 звёзд на GitHub. 😋