Рейтинг AI

Первый уровень сравнения нейросетей – спросить у ChatGPT и Алисы по случайному запросу. Один ответ понравится, другой нет, ну вот значит и понятно, кто молодец, а кто отстой.

Второй уровень сравнения нейросетей – LMSYS Chatbot Arena. Тысячи людей вводят свои вопросы, две нейросети им отвечают, пользователь определяет лучший ответ, не зная, кто его дал. Статистика побед и поражений агрегируется, возникает красивый рейтинг. В эту секунду лидер – GPT-4o, но Sonnet не так уж далеко.

Третий уровень сравнения – #стартапдня Artificial Analysis. Он собрал и поддерживает с десяток таблиц, показывающих сильные и слабые стороны нейросетей. Кроме трансляции данных с Арены проект выводит результаты других тестов – например, по умению программировать. Кроме того, он следит за ценами API и мониторит его скорость – и там тоже много чего интересного. Llama-3, например, в исполнении Groq в 10 раз дешевле и в 10 раз быстрее, чем на Microsoft Azure.

Монетизации у Artificial Analysis нет, и, наверное, никогда не будет. Но спасибо основателям сказать можно.

#насвои #сша #ai
repost

178

input message

напишите коммент

еще контент в этом сообществе

О СМИ

Новости бывают важные – такие, которые непосредственно влияют на поведение читателя. Такие новости случаются редко,... читать далее
repost

75

input message

напишите коммент

Поговорить о здоровье

Если диабетика чаще спрашивать, какой у него сахар и не забыл ли он о процедурах, то он проживет дольше, а система... читать далее
repost

95

input message

напишите коммент

Бизнес на нейронных сетях

22 ноября мы запускаем пятый поток нашего курса о том, как применить ChatGPT и другие генеративные нейронки в вашем... читать далее
repost

909

input message

напишите коммент

Недавняя новость

Весной 2023 года 23-летняя девушка зарегистрировалась на Wildberries и обнаружила необычный сбой в системе. Все, что... читать далее
repost

60

input message

напишите коммент

Денежный запрос

Возвраты на покупки через App Store всегда проходят через Apple. Именно его сотрудник решает, должно ли приложение... читать далее
repost

62

input message

напишите коммент

еще контент в этом соообществе

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь