⚡ Агенты научились писать CUDA-ядра
Hugging Face выпустил навык для агентов, генерирующих production-ready CUDA-ядра.
Навык объясняет агентам архитектурные особенности GPU (H100, A100), шаблоны доступа к памяти, векторизацию и интеграцию с transformers и diffusers. Агенты на его основе создали оптимизированные ядра RMSNorm и attention с привязками к PyTorch, build.toml и бенчмарками. Проект структурирован и готов к сборке.
В тестах — до 2.47x ускорения RMSNorm на длинных последовательностях, end-to-end ускорение LTX-Video до 1.43x с torch.compile.
#cuda #huggingface #llm_agents #kernel_optimization #pytorch #gpu