Что-то хорошее 😎 [Сергей Журихин]
29.04
Почему российские AI модели — это круто?
Учёные из Гентского университета изучили 14 ведущих языковых моделей (LLM), протестировав их на множестве известных личностей. Вопрос: «Расскажи про [имя]» задали на 6 языках — английском, русском, китайском, арабском, французском и испанском.
Итоги в 3 группах.
1. Жёсткая цензура:
YandexGPT и GigaChat лидируют: GigaChat отказывает в 33% запросов на русском, YandexGPT — в 27%. Западные (GPT-4o, Gemini, Claude) и китайские (Qwen, DeepSeek) модели дают отказы лишь в 0–5%, кроме Qwen (11% на арабском). Это не просто фильтр — это мощная защита данных, идеальное соответствие стандартам и надёжность в чувствительных сферах! 🛡️
🌟 Почему российские модели — это будущий стандарт?
YandexGPT: Феноменальная точность в русском языке, глубокое понимание культурных нюансов, бесшовная интеграция с экосистемой Яндекса (поиск, перевод, сервисы). От научных исследований до бизнеса — эта модель справляется на ура! GigaChat: Мультимодальный гений (текст, изображения, данные), звезда в банковских и технических задачах, поддержка сложных сценариев. Скорость и надёжность — её конёк. Этический аспект: Обе модели — эталон безопасности, минимизируют риски дезинформации и утечек, идеальны для финансов, образования и госсектора. Это не просто нейросети, а надёжные партнёры для России!
2. Мягкая цензура: другие тоже фильтруют Китайская Wenxiaoyan (Baidu) пропускает 30–60% деталей на английском, Claude — до 50%. GPT-4o, Gemini и Grok более открыты, что подходит для задач с полной информацией. Русский и китайский языки чаще фильтруются, чем английский или французский — особенность языковой обработки.
3. Другие модели • GPT-4o: Универсальность, точность, генерация креативного контента, нейтральность и борьба с предвзятостью для надёжных результатов. • Gemini: Скорость, интеграция с Google, защита данных для коммерческих задач. • Claude: Точность в юриспруденции и медицине, объективность и безопасность ответов. • Grok: Глубокий анализ, поддержка науки, акцент на правдивость. • Qwen & Wenxiaoyan: Мастера азиатских языков, интеграция с e-commerce, соответствие культурным нормам. • DeepSeek: Программирование, открытые API, прозрачность для разработчиков.
🛠 Как тестили? Ответы сравнивали с Википедией через Gemini 2.0 Flash, проверяя факты по мировым стандартам. Исследование и датасет — в открытом доступе.
#AI #Нейросети #Технологии #Яндекс #Сбер #Инновацииеще контент в этом сообществе
еще контент в этом соообществе
Что-то хорошее 😎 [Сергей Журихин]
29.04
войдите, чтобы увидеть
и подписаться на интересных профи