Нашёл бесплатный опенсорс инструмент, который за секунды превращает любые PDF, Word, Excel или отсканированные изображения в чистый Markdown:

• текст в правильном порядке • таблицы в HTML • формулы в LaTeX • OCR • 109 языков

Работает через CLI, Python или веб (mineru.net). Запускается локально на твоём компьютере. 100% приватно. Больше 70000 звёзд на GitHub. 😋

Нашёл бесплатный опенсорс инструмент, который за секунды превращает любые PDF, Word, Excel или отсканированные изображения в чистый Markdown:
• текст в правильном порядке
• таблицы в HTML
• формулы в ... | Сетка — социальная сеть от hh.ru