🌩 Шум прошёл, а Грок остался

Согласно бенчмаркам по Humanity и другим параметрам он стоит на 1 месте, но бенчмарки всё меньше вызывают доверие. Он даже выигрвает по бенчмарку, который имеет динамические вопросы, а значит на него сложнее натаскать модель, но сложно — не значит незможно, поэтому нужно проверять модель в деле, даже если она официально считается самой самой мощной моделью на данный момент. Что я могу сказать по своему опыту использования Grok 4?

— Сперва нужно знать, что это думающая модель. У неё есть варианты grok 4 и grok 4 heavy, которые соответствуют по ценам и силе Claude Sonnet 4 и Claude Opus 4, но мини-модели для grok 4 не создали. По API пока доступен только обычный grok 4.

Доступ к нему есть пока только на сайте и в openrouter. За $30 в месяц можно получить доступ к grok 4 с контекстым окном в 128 тыс токенов, за $300 — grok 4 heavy (скорее всего контекстное окно — 256 тыс, так как оно указано как максимальное. Прорыва тут нет)

1. Он своенравный, но тексты лучше пишет Claude 4 или GPT-4.5 (который через несколько дней исчезнет навсегда). Также он плохо пишет стихи на русском. Важно! Не спрашивайте его "Какое твоё мнение по поводу...". За своё мнение он считает мнение Илона Маска, и сверяется с его постами (по крайней мере работает так, пока не изменят). Если же его спросить абстрактно, а не личное мнение — то всё как обычно.

2. В решении логических задач он также не сильно выделяется среди конкурентов.

3. Он неплохо ищет в интернете, но его ценность — что внутри интерфейса сайта хорошо ищет по соцсети X. То есть он легко находит нужные посты, парсит информацию со всего Твиттера, и для кого-то это будет супер-ценно.

4. Grok заточен на использование инструментов. Он лучше своих конкурентов справляется с использованием тулзов, однако это важно, когда нужно делать что-то через сервисы. Допустим, ему сказали, что надо поставить встречу в календаре и пригласить коллег — и он это сделает хорошо. Но вот как ИИ-агент для общения он показал себя очень плохо.

5. В кодинге он достаточно хорошо себя проявляет при создании игр, веб-анимаций, визуала. В бэкенде я бы всё-таки предпочёл больше Claude. Также создатели Grok грозятся выпустить отдельную модель для кодинга, причём даже чуть ли не через месяц.

6. Приятный бонус — с выходом grok-4, прошлая модель grok-3 стала опенсорсной. Тем самым Маск показывает OpenAI приверженность принципам открытости, которые последние утратили.

7. Создаёт/распознаёт/изменяет изображения он хуже gpt4o, даже Маск в этом признался и сказал, что скоро это изменят.

Таким образом, это не прорыв, но здоровая конкуренция.

Причём уже только что вышла Kimi2, которую тоже сегодня рассмотрим. А также в X появились сплетни о Gemini-3 и GPT-5

#опыт #разборы

мой канал: https://t.me/oh_my_zen

🌩 Шум прошёл, а Грок остался | Сетка — новая социальная сеть от hh.ru
repost

4

input message

напишите коммент

еще контент автора

еще контент автора

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь