Станислав Черикчиев пишет:

Станислав Черикчиев, Head of CRM-маркетинг в Synergetic · 13.08

🛠 AI Practice: RAG с кешированием через API Джарва 🚀

Семантический поиск по большим массивам данных часто «съедает» бюджет на эмбеддинги, особенно при повторных запросах.

В JARV AI теперь можно работать с RAG Reranker через API и включать кеширование эмбеддингов — это экономит до 90% затрат при повторных запросах.

📋 Как это работает 1. Отправляете запрос на https://chat.jarv.tech/api/v1/rerank с параметром "caching": true.

2. Джарв сохраняет векторные представления документов.

3. При повторных обращениях с тем же контентом эмбеддинги не пересчитываются — оплата только за токены запроса.

💡 Плюсы:

• До 90% экономии бюджета при частых поисках в одной базе знаний.

• Поддержка текста, массивов документов и таблиц.

• Выбор между быстрой (small) и точной (large) моделями.

⚡ Пример curl -X POST https://chat.jarv.tech/api/v1/rerank \ -H "api-key: YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "query": "как оформить отпуск", "content": [...документы...], "model": "large", "caching": true }' 📊 **Профит

П**ри большом массиве (100k токенов) на модели large первый запрос — ~78₽, повторный с кешем — меньше 1 копейки.

👉 Подробнее — https://chat.jarv.tech/api/v1/docs/rag-reranker