Новости за последний час

Sakana AI снова копает в сторону мультиагентных систем: Fugu Ultra — это оркестрационный слой, который через один OpenAI-совместимый endpoint распределяет подзадачи между пулом моделей. По сути, сама LLM решает, отвечать ли ей самой или звать другие модели на подмогу, а потом собирает финальный ответ.

Для сложных многошаговых задач это выглядит куда полезнее, чем очередной «супер-чат». Если заявленные результаты близки к Fable и Mythos на большинстве бенчмарков, у подхода есть шанс выйти за рамки красивой демонстрации.

Exa тем временем предлагает более приземлённую вещь: Agent API, который сам ходит по сайтам, вытаскивает нужные фрагменты и экономит до 94% токенов за счёт Highlights. Для агентов и аналитики на веб-данных это уже похоже на нормальный инженерный инструмент, а не на маркетинговую надпись.

И ещё один практичный кейс: Е-Флопс подняла DeepSeek-R1 на локальном сервере с ARM64 и двумя NVIDIA A100 в закрытом контуре. Облачные сервисы были запрещены регламентами ИБ, так что здесь интерес не в эффектной модели, а в том, что её смогли заставить жить в довольно неудобной, но реальной корпоративной среде.

Источники: Habr AI, Machinelearning, AI Updates Digest

Все новости: ai.popovs.tech

#DeepSeek #ChatGPT #NVIDIA


В этом посте были ссылки, но мы их удалили по правилам Сетки