AI для Продакта
19.02
✨Grok-3 уже здесь, и это новый уровень
xAI выкатила свежую версию своей ИИ-модели, и есть о чём поговорить. Посмотрим, что изменилось:
▪️Две версии на выбор. Есть тяжеловес Grok-3 для сложных задач, где нужна максимальная точность, и компактный Grok-3 mini — он шустрее, но немного проще в плане глубины. ▪️Король арены. Grok-3 обошёл всех — GPT-4o, Gemini 2 Pro, DeepSeek — и стал первой моделью, которая набрала больше 1400 баллов в рейтинге Chatbot Arena. ▪️Режим "подумаем как следует". Теперь можно включить Thinking или Thinking Hard. Модель начинает глубже копать, а ты видишь весь процесс, как она думает, сомневается, ищет ответ. ▪️ Grok-3 стал увереннее в математике, науке и программировании. Особенно заметно, как режимы рассуждений помогают ему не просто выдать ответ, а реально разобраться в вопросе. ▪️Deep (Re)search — встроенный ИИ-агент, который сам ищет инфу в интернете, проверяет источники и корректирует запросы.
❗️Мы сами протестили Grok-3 на Chatbot Arena. Поставили две задачи:
1) Написать философский текст на тему – справился уверенно, поискал неожиданные смысловые связи, живо изложил идеи. Специально не задавали направление мысли и стиль, и в этом проявилось его преимущество: в отличие от GPT-4o и Claude, которые действовали более шаблонно, Grok-3 подошел сбоку.
2) Решить задачу международной олимпиады по математике – мы сами не решали (да и не собирались), но у нас был готовый разбор. Grok-3 долго перебирал варианты, отбрасывал неподходящие, ушел в дебри, но в конце выплыл. Ответ сошелся.
Весь этот праздник доступен только подписчикам X Premium+ за $40 в месяц. Стоит ли оно того? Наверно, если часто нужны сложные решения. Но если задачи попроще, можно протестировать без подписки на Арене.
#ИИ #AI #Нейросети #Grok——— #Инструменты
✍️Подписывайтесь: @aiforproduct
еще контент в этом сообществе
еще контент в этом соообществе
AI для Продакта
19.02
войдите, чтобы увидеть
и подписаться на интересных профи