Как сэкономить токены Claude: 7 хаков 1. Убираем вежливость Claude по умолчанию слишком вежливый. Этот промпт убирает всю воду: From now on, remove all filler words. No 'the', 'is', 'am', 'are'. Direct answer only. Use short 3-6 word sentences. Run tools first, show the result, then stop. Do not narrate. Example: Instead 'The solution is to use async', say 'Use async'.
2. Используй Code Review Graph Не заставляй Claude перечитывать весь проект. Этот инструмент делает карту кода: модель видит структуру, не вчитываясь в каждую строку.
Ссылка на GitHub: github.com/tirth8205/code-review-graph
3. Выбирай модель под задачу Opus в 5 раз дороже Sonnet. Sonnet: код, тексты, таблицы, обычные вопросы. Opus: только самая сложная архитектура и логические тупики. Haiku: быстрые простые задачи.
4. PDF - главный пожиратель лимитов Напрямую загруженный PDF может съесть 80% сессии. Лайфхак: прогони PDF через ChatGPT с просьбой сделать «clean plain text summary» и вставь этот текст в Claude обычным сообщением.
5. Трюк с таймингом Окно лимитов в 5 часов открывается с первым сообщением. Напиши привет в 7 утра. Начни работать в 9 утра. В 12 дня лимиты обнулятся прямо в разгар процесса, и у тебя будет свежая порция сообщений.
6. Скилл «Compact» для длинных чатов Чем длиннее чат, тем дороже каждое сообщение. Чтобы не терять контекст при переходе в новый чат, используй это:
Create this skill: When I say 'COMPACT', summarize our entire conversation into 5-7 key bullet points with all critical context, decisions, & code snippets. Format for easy copy-paste into new chat.
7. Избегай час-пик Будни с 16:00 до 22:00 по Москве самое загруженное время. Лимиты тают быстрее, а Claude может начать тупить. В идеале работать утром или в выходные.
@pgcaseclub