🚀 AMD MI355X показала высокую производительность в LLM-тренировке

AMD анонсировала высокую эффективность GPU MI355X при обучении LLM на ROCm 7.0.

В тестах с PyTorch и JAX (MaxText) MI355X превосходит NVIDIA B200 в ряде сценариев. В PyTorch с Primus достигается до 1.16x производительности в Llama3 70B BF16 и 1.15x в Mixtral 8x7B. В JAX MaxText — 1.11x в Llama3.1 70B FP8. Поддержка Primus-Turbo и оптимизированные докеры v25.9 обеспечивают стабильное масштабирование в одно- и многонодных конфигурациях.

В мультиузловых испытаниях MI355X демонстрирует 1.14x преимущество в Mixtral 8x22B и сохраняет паритет в моделях до 405B параметров.

#amd #mi355x #llm_training #rocm #pytorch #jax

🚀 AMD MI355X показала высокую производительность в LLM-тренировке
AMD анонсировала высокую эффективность GPU MI355X при обучении LLM на ROCm 7.0 | Сетка — социальная сеть от hh.ru