🤖 DeepSeek V4: слухи и реальные факты
Вокруг DeepSeek V4 разгорелся хайп: утечки бенчмарков, 1M+ токенов контекста и демпинг цен. Но подтверждённых данных пока меньше, чем шума.
Из реального — архитектура Engram с разделением памяти и вычислений: статические знания хранятся в RAM, а GPU занимается логикой, что может снизить VRAM на ~30%. Плюс переработанное DSA‑внимание для контекста 1M+ токенов и работы с целым репозиторием. Обсуждается цена около $0.27 за 1M токенов — в разы дешевле топовых API.
Слухи о 83,7% на SWE‑Bench пока не подтверждены. При этом рынок уже перегрет релизами Gemini 3.1, Claude 4.6 и MiniMax M2.5.