⚔️ MiniMax 2.5 vs GLM-5: кто лучше кодит?
Open‑weight модели почти догнали топов: GLM‑5 (90.5/100) и MiniMax 2.5 (88.5/100) прошли сложные coding‑тесты автономно. Это реальная альтернатива GPT‑5.2 и Claude Opus 4.6 дешевле — можно тестировать в прод‑CLI уже сейчас.
В бенчмарке — 3 задания: поиск 8 багов (race condition, SQL‑инъекция, JWT), рефакторинг legacy Express и реализация 27 API из OpenAPI‑спеки. Обе модели работали до 23 минут без вмешательства. MiniMax быстрее (21 vs 44 мин) и лучше следует инструкциям, GLM‑5 — сильнее в архитектуре и типизации.
На SWE‑bench Verified: 80.2% (MiniMax) против 77.8% (GLM‑5). Разрыв с проприетарными моделями сокращается — open‑weight уже конкурентоспособны для реального бэкенда.