🛠 AI Practice: RAG с кешированием через API Джарва 🚀
Семантический поиск по большим массивам данных часто «съедает» бюджет на эмбеддинги, особенно при повторных запросах.
В JARV AI теперь можно работать с RAG Reranker через API и включать кеширование эмбеддингов — это экономит до 90% затрат при повторных запросах.
📋 Как это работает 1. Отправляете запрос на https://chat.jarv.tech/api/v1/rerank с параметром "caching": true.
2. Джарв сохраняет векторные представления документов.
3. При повторных обращениях с тем же контентом эмбеддинги не пересчитываются — оплата только за токены запроса.
💡 Плюсы:
• До 90% экономии бюджета при частых поисках в одной базе знаний.
• Поддержка текста, массивов документов и таблиц.
• Выбор между быстрой (small) и точной (large) моделями.
⚡ Пример curl -X POST https://chat.jarv.tech/api/v1/rerank \ -H "api-key: YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "query": "как оформить отпуск", "content": [...документы...], "model": "large", "caching": true }' 📊 **Профит
П**ри большом массиве (100k токенов) на модели large первый запрос — ~78₽, повторный с кешем — меньше 1 копейки.
👉 Подробнее — https://chat.jarv.tech/api/v1/docs/rag-reranker
еще контент автора
еще контент автора
войдите, чтобы увидеть
и подписаться на интересных профи