🧠 MiniMax M3: не просто длинный контекст, а быстрый и дешёвый

Китайский стартап MiniMax показал архитектуру MiniMax Sparse Attention (MSA) для новой модели M3. Вместо того чтобы честно перебирать милл

читать далее
🧠 MiniMax M3: не просто длинный контекст, а быстрый и дешёвый
Китайский стартап MiniMax показал архитектуру MiniMax Sparse Attention (MSA) для новой модели M3 | Сетка — социальная сеть от hh.ru