Infusion Labs выпустил самую быструю рассуждающую LLM в мире Mercury 2 основана на диффузионной архитектуре. Если говорить упрощённо, то она генерирует все токены сразу параллельно

Infusion Labs выпустил самую быструю рассуждающую LLM в мире

Mercury 2 основана на диффузионной архитектуре. Если говорить упрощённо, то она генерирует все токены сразу параллельно. Из-за этого пропадает узкое место традиционных LLM, когда текст генерируется последовательно, токен за токеном.

В Infusion Labs говорят, что Mercury 2 в пять раз быстрее всех существующих аналогов. Качество при этом конкурентоспособное, если сравнивать с другими быстрыми моделями типа Haiku 4.5 и GPT-5 Mini.

Попробовать можно бесплатно в чате https://chat.inceptionlabs.ai/. Для доступа к API нужно оставить заявку на сайте.

еще контент в этом сообществе