🛠 AI Practice: RAG с кешированием через API Джарва 🚀

Семантический поиск по большим массивам данных часто «съедает» бюджет на эмбеддинги, особенно при повторных запросах.

В JARV AI теперь можно работать с RAG Reranker через API и включать кеширование эмбеддингов — это экономит до 90% затрат при повторных запросах.

📋 Как это работает 1. Отправляете запрос на https://chat.jarv.tech/api/v1/rerank с параметром "caching": true.

2. Джарв сохраняет векторные представления документов.

3. При повторных обращениях с тем же контентом эмбеддинги не пересчитываются — оплата только за токены запроса.

💡 Плюсы:

• До 90% экономии бюджета при частых поисках в одной базе знаний.

• Поддержка текста, массивов документов и таблиц.

• Выбор между быстрой (small) и точной (large) моделями.

Пример curl -X POST https://chat.jarv.tech/api/v1/rerank \ -H "api-key: YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "query": "как оформить отпуск", "content": [...документы...], "model": "large", "caching": true }' 📊 **Профит

П**ри большом массиве (100k токенов) на модели large первый запрос — ~78₽, повторный с кешем — меньше 1 копейки.

👉 Подробнее — https://chat.jarv.tech/api/v1/docs/rag-reranker

repost

28

input message

напишите коммент

еще контент автора

еще контент автора

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь