Подписка — это хорошо, но не надолго
Ну что, Max подписка на Claude окупилась за два дня! На скрине вы можете видеть стоимость потраченых токенов, которую я бы заплатил, если бы использовал Claude через API. Если у вас стоит Claude Code как терминальный CLI или приложение, то вы можете вызвать команду npx ccusage@latest и она вам покажет всю статистику по моделям, токенам и их стоимость.
Вообще, это конечно интересная история, потому что тем, кто использует сервис по максимому токены субсидируются за счет тех, кто использует мощности по минимуму. Миллионы платящих пользователей формируют большую базу денег, которая распределяется каждому по потребностям, этакий технокоммунизм. А те, кто сидят на API, платят за каждый токен сами. Логика простая: API используют обычно те, кто зарабатывает с помощью Claude деньги, то есть бизнес, а ценник для бизнеса всегда дороже, потому что в него закладывается реальные затраты на инференс (работа обученой модели для подготовки ответа на запрос) + маржа компании (~50%). Ну и да, для корпоративных клиентов Антропик уже ввел тарифы базовой стоимости + реального использования токенов. Персональные подписки все еще держатся на лимитах, но надолго ли?
Лимиты в Max прям очень хорошие. После Pro, я дышу свободной грудью, но все же смог упереться в лимит сессии за 2 минуты ее окончания. Потом продолжил работу и в какой-то момент у меня сбросились вообще все лимиты до нуля. Сначала подумал, что какой-то баг, а потом оказалось, что это подгон от Антропик в честь их подписания сделки со SpaceX: они получают полный доступ до датацентра Colossus 1 — это 300+ мегаватт и больше 220 000 NVIDIA GPU. По факту, это верхняя граница мощностей, которые сейчас есть в принципе у техногигантов. На радостях, они удваивают лимиты 5-ти часовых сессий, поднимают API-лимиты для Opus и обещают снижение лимитов в часы пиковой нагрузки для Pro и Max подписок. Надеемся, что Claude перестанет тупить после 16 по МСК.)
Все это здорово, но энергия и мощности не бесконечны, а спрос растет. Ник Турли, глава ChatGPT, уже как-то намекал про грядущие изменения в подкасте: «Возможно, в нынешнюю эпоху безлимитный тариф — это как безлимитный тариф на электричество. Это просто не имеет смысла». Так что подписка с субсидированием — это точно временный эффект. Лимиты точно будут резать, вероятно, будет история, что будет базовая подписка для тех, кому не надо много + реальный usage токенов сверх лимита. Датацентры — это долго и дорого. Энергия тоже не бесплатная. Пользуемся подписками пока можем.