🧠 SparK: новый метод сжатия KV-кэша в LLM
AMD представила SparK — метод сжатия кэша ключей и значений без переобучения.
SparK устраняет избыточность на уровне фич-каналов в KV-кэше с помощью «обрезки
читать далее#sparse_attention
Менеджер по привлечению талантов в МТС
Директор по ИИ в Т-Банк (ex. Тинькофф)
HR-бизнес-партнер (HR BP) в Золотое яблоко Екатеринбург
PR-директор в Авиасейлс
IM Lead / Influence marketing Lead в Додо Пицца
можете перейти, но сначала проверьте ссылку и будьте аккуратны: не вводите по ссылке пароли, номера телефонов и банковских карт, и другие личные данные
https://
уверены, что хотите выйти?
придется авторизоваться заново, а заполненные данные будут удалены
что-то пошло не так — попробуйте снова чуть попозже
ссылка скопирована