πŸš€ ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡ MoE-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° GPU AMD

AMD прСдставила Π»ΡƒΡ‡ΡˆΠΈΠ΅ ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠΈ для обучСния MoE-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° GPU Instinct MI300/MI355 с использованиСм экосистСмы ROCm.

Π’ основС ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π° β€” Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊ Primus-LM с оптимизациями, Ρ‚Π°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ Turbo Grouped GEMM, DeepEP ΠΈ Sync-Free MoE. РСшСния ΡΠ½ΠΈΠΆΠ°ΡŽΡ‚ Π·Π°Π΄Π΅Ρ€ΠΆΠΊΠΈ ΠΏΡ€ΠΈ ΠΎΠ±ΠΌΠ΅Π½Π΅ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ экспСртом ΠΈ Ρ€ΠΎΡƒΡ‚Π΅Ρ€ΠΎΠΌ, ΡƒΡΡ‚Ρ€Π°Π½ΡΡŽΡ‚ CPU-GPU ΡΠΈΠ½Ρ…Ρ€ΠΎΠ½ΠΈΠ·Π°Ρ†ΠΈΡŽ ΠΈ ΡƒΡΠΊΠΎΡ€ΡΡŽΡ‚ вычислСния Π·Π° счёт слияния ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΉ. ΠšΠ»ΡŽΡ‡Π΅Π²Ρ‹Π΅ инструмСнты: TraceLens для Π°Π½Π°Π»ΠΈΠ·Π° Π±ΡƒΡ‚Ρ‹Π»ΠΎΡ‡Π½Ρ‹Ρ… Π³ΠΎΡ€Π»Ρ‹ΡˆΠ΅ΠΊ ΠΈ Memory Projection для ΠΎΡ†Π΅Π½ΠΊΠΈ использования памяти.

На модСлях Π΄ΠΎ 2 Ρ‚Ρ€Π»Π½ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² DeepEP Π΄Π°Ρ‘Ρ‚ ускорСниС Π΄ΠΎ 7,66Γ— ΠΏΡ€ΠΎΡ‚ΠΈΠ² AllToAll, Π° ΠΈΠ½Ρ‚Π΅Ρ€Π»ΠΈΠ²ΠΈΠ½Π³ ΠΊΠΎΠΌΠΌΡƒΠ½ΠΈΠΊΠ°Ρ†ΠΈΠΉ (1F1B A2A) ΠΏΠΎΠ²Ρ‹ΡˆΠ°Π΅Ρ‚ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΠΈΠ·ΠΌΠ°. Для ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Ρ€ΡƒΡ‡Π½ΠΎΠΉ GC ΠΈ NUMA-привязка.

#amd #moe #rocm #ai_training #gpu_optimization #primus

πŸš€ ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡ MoE-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° GPU AMD
AMD прСдставила Π»ΡƒΡ‡ΡˆΠΈΠ΅ ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠΈ для обучСния MoE-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° GPU Instinct MI300/MI355 с использованиСм экосистСмы ROCm | Π‘Π΅Ρ‚ΠΊΠ° β€” ΡΠΎΡ†ΠΈΠ°Π»ΡŒΠ½Π°Ρ ΡΠ΅Ρ‚ΡŒ ΠΎΡ‚ hh.ru