🚀 Как малым моделям писать CUDA-ядра
Hugging Face показал, как простые модели научились писать сложные CUDA-ядра с помощью особых навыков.
Навыки (skills) — это файлы с инструкциями в формате SKILL.md, которые передают экспертизу от мощных моделей (например, Claude Opus 4.5) к локальным и дешёвым. Инструмент upskill создаёт такие навыки, анализируя действия сильной модели, генерирует тесты и проверяет, насколько навык улучшает другую модель. Например, навык включает структуру проекта, настройки build.toml, оптимизации под H100 и привязки к PyTorch — всё это умещается в ~500 токенов.
Точные результаты: на локальной модели unsloth/GLM-4.7-Flash-GGUF точность выросла с 40% до 85% (+45%), а на других — на 35%.