🚀 Как Lovable балансирует LLM-провайдеров

Lovable обрабатывает до 1,8 млрд токенов в минуту и использует балансировку для отказоустойчивости.

При переключении между провайдерами (Anthropic, Vertex и др.) теряется кэширование промптов, что повышает задержки и расходы. Вместо простого fallback-цепочек, Lovable использует project-level affinity: каждому проекту выделяется своя цепочка с фиксированным приоритетом. Это сохраняет контекст между запросами.

Веса провайдеров рассчитываются автоматически через PID-регулятор: при ошибках >0,5% доступность снижается. Предпочтительные провайдеры получают трафик первыми. При сбое стриминга частичный ответ пересылается в Claude для продолжения.

#llm #load_balancing #ai_infra #pid_controller #prompt_cache

🚀 Как Lovable балансирует LLM-провайдеров
Lovable обрабатывает до 1,8 млрд токенов в минуту и использует балансировку для отказоустойчивости | Сетка — социальная сеть от hh.ru