⚡️LLM Arena — это первая независимая русскоязычная платформа для оценки качества больших языковых моделей (LLM) на основе пользовательских задач.🤖

Как работает платформа:

- В режиме реального времени тестируются русскоязычные нейросети и оценивается качество их ответов в соответствии с запросом.
- Для сравнения пользователю предлагаются две случайные модели — при оценке он не будет знать, кем разработаны нейросети.
- Можно написать любой запрос, сравнить ответы моделей и выбрать тот, который пользователь посчитает лучшим (например, если он содержит больше фактов или является более развёрнутым и подкрепленным примерами).
- На основе полученных оценок формируется рейтинг генеративных нейросетей на русском языке.

На платформе доступны для тестирования как иностранные модели (ChatGPT, LLaMa), так и российские (YandexGPT, GigaChat, Saiga). Список доступных нейросетей регулярно пополняется: новые модели смогут добавить и их разработчики.

#сетка #ии #ai #сервис #chatgpt #llama #yandexGPT #GigaChat #Saiga

⚡️LLM Arena — это первая независимая русскоязычная платформа для оценки качества больших языковых моделей (LLM) на основе пользовательских задач | Сетка — социальная сеть от hh.ru