AI-предприниматель основатель Avato AI / 12AI
· 15.07🌩 Шум прошёл, а Грок остался
Согласно бенчмаркам по Humanity и другим параметрам он стоит на 1 месте, но бенчмарки всё меньше вызывают доверие. Он даже выигрвает по бенчмарку, который имеет динамические вопросы, а значит на него сложнее натаскать модель, но сложно — не значит незможно, поэтому нужно проверять модель в деле, даже если она официально считается самой самой мощной моделью на данный момент. Что я могу сказать по своему опыту использования Grok 4?
— Сперва нужно знать, что это думающая модель. У неё есть варианты grok 4 и grok 4 heavy, которые соответствуют по ценам и силе Claude Sonnet 4 и Claude Opus 4, но мини-модели для grok 4 не создали. По API пока доступен только обычный grok 4.
Доступ к нему есть пока только на сайте и в openrouter. За $30 в месяц можно получить доступ к grok 4 с контекстым окном в 128 тыс токенов, за $300 — grok 4 heavy (скорее всего контекстное окно — 256 тыс, так как оно указано как максимальное. Прорыва тут нет)
1. Он своенравный, но тексты лучше пишет Claude 4 или GPT-4.5 (который через несколько дней исчезнет навсегда). Также он плохо пишет стихи на русском. Важно! Не спрашивайте его "Какое твоё мнение по поводу...". За своё мнение он считает мнение Илона Маска, и сверяется с его постами (по крайней мере работает так, пока не изменят). Если же его спросить абстрактно, а не личное мнение — то всё как обычно.
2. В решении логических задач он также не сильно выделяется среди конкурентов.
3. Он неплохо ищет в интернете, но его ценность — что внутри интерфейса сайта хорошо ищет по соцсети X. То есть он легко находит нужные посты, парсит информацию со всего Твиттера, и для кого-то это будет супер-ценно.
4. Grok заточен на использование инструментов. Он лучше своих конкурентов справляется с использованием тулзов, однако это важно, когда нужно делать что-то через сервисы. Допустим, ему сказали, что надо поставить встречу в календаре и пригласить коллег — и он это сделает хорошо. Но вот как ИИ-агент для общения он показал себя очень плохо.
5. В кодинге он достаточно хорошо себя проявляет при создании игр, веб-анимаций, визуала. В бэкенде я бы всё-таки предпочёл больше Claude. Также создатели Grok грозятся выпустить отдельную модель для кодинга, причём даже чуть ли не через месяц.
6. Приятный бонус — с выходом grok-4, прошлая модель grok-3 стала опенсорсной. Тем самым Маск показывает OpenAI приверженность принципам открытости, которые последние утратили.
7. Создаёт/распознаёт/изменяет изображения он хуже gpt4o, даже Маск в этом признался и сказал, что скоро это изменят.
Таким образом, это не прорыв, но здоровая конкуренция.
Причём уже только что вышла Kimi2, которую тоже сегодня рассмотрим. А также в X появились сплетни о Gemini-3 и GPT-5
#опыт #разборымой канал: https://t.me/oh_my_zen
еще контент автора
еще контент автора
AI-предприниматель основатель Avato AI / 12AI
· 15.07войдите, чтобы увидеть
и подписаться на интересных профи