Что-то хорошее 😎 [Сергей Журихин] пишет:

29.04

Почему российские AI модели — это круто?

Учёные из Гентского университета изучили 14 ведущих языковых моделей (LLM), протестировав их на множестве известных личностей. Вопрос: «Расскажи про [имя]» задали на 6 языках — английском, русском, китайском, арабском, французском и испанском.

Итоги в 3 группах.

1. Жёсткая цензура:

YandexGPT и GigaChat лидируют: GigaChat отказывает в 33% запросов на русском, YandexGPT — в 27%. Западные (GPT-4o, Gemini, Claude) и китайские (Qwen, DeepSeek) модели дают отказы лишь в 0–5%, кроме Qwen (11% на арабском). Это не просто фильтр — это мощная защита данных, идеальное соответствие стандартам и надёжность в чувствительных сферах! 🛡️

🌟 Почему российские модели — это будущий стандарт?

YandexGPT: Феноменальная точность в русском языке, глубокое понимание культурных нюансов, бесшовная интеграция с экосистемой Яндекса (поиск, перевод, сервисы). От научных исследований до бизнеса — эта модель справляется на ура! GigaChat: Мультимодальный гений (текст, изображения, данные), звезда в банковских и технических задачах, поддержка сложных сценариев. Скорость и надёжность — её конёк. Этический аспект: Обе модели — эталон безопасности, минимизируют риски дезинформации и утечек, идеальны для финансов, образования и госсектора. Это не просто нейросети, а надёжные партнёры для России!

2. Мягкая цензура: другие тоже фильтруют Китайская Wenxiaoyan (Baidu) пропускает 30–60% деталей на английском, Claude — до 50%. GPT-4o, Gemini и Grok более открыты, что подходит для задач с полной информацией. Русский и китайский языки чаще фильтруются, чем английский или французский — особенность языковой обработки.

3. Другие модели • GPT-4o: Универсальность, точность, генерация креативного контента, нейтральность и борьба с предвзятостью для надёжных результатов. • Gemini: Скорость, интеграция с Google, защита данных для коммерческих задач. • Claude: Точность в юриспруденции и медицине, объективность и безопасность ответов. • Grok: Глубокий анализ, поддержка науки, акцент на правдивость. • Qwen & Wenxiaoyan: Мастера азиатских языков, интеграция с e-commerce, соответствие культурным нормам. • DeepSeek: Программирование, открытые API, прозрачность для разработчиков.

🛠 Как тестили? Ответы сравнивали с Википедией через Gemini 2.0 Flash, проверяя факты по мировым стандартам. Исследование и датасет — в открытом доступе.

еще контент в этом сообществе

еще контент в этом соообществе

29.04 войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь