#grpo

AI Open Space

37 подписчиков

· 17.03

GRPO упрощает RLHF без value-сети

GRPO заменяет Critic на средний результат нескольких ответов — это удешевляет и упрощает обучение LLM, сохраняя стабильность; стоит рассмотреть его для RLHF и задач с

GRPO упрощает RLHF без value-сети
GRPO заменяет Critic на средний результат нескольких ответов — это удешевляет и упрощает обучение LLM, сохраняя стабильность; стоит рассмотреть его для RLHF и задач с... | Сетка — социальная сеть от hh.ru

звёзды индустрии

Анастасия Стрижкова

Менеджер по привлечению талантов в МТС

Виктор Тарнавский

Директор по ИИ в Т-Банк (ex. Тинькофф)

Андрей Сивцев

HR-бизнес-партнер (HR BP) в Золотое яблоко Екатеринбург

Янис Дзенис

PR-директор в Авиасейлс

Максим Дворянчиков

IM Lead / Influence marketing Lead в Додо Пицца

посмотреть всех

медиа

Дизраптор

Алексей Подклетнов про компании, инновации и продукты, меняющие мир (пусть даже чуть-чуть).

Русский маркетинг

digital, медиа и бизнес

Продукторий

Взгляд на мир глазами менеджера продукта

DNative — блог Ткачука про SMM

Авторский блог Алексея Ткачука. SMM-стратегия и осознанный подход к ведению проектов в соцсетях

👨🏻‍💻/ Марат Юсупов

С 17 лет батрачу в маркетинге. Защитил диплом, чтобы вести этот канал. Просто и с юморком разжевываю инсайты, кейсы, тренды и прочие умные слова 🤌🏻 Продуктовый маркетолог VK ex. Сбер, МегаФон, X5 Group t.me/maratyus

посмотреть всех

компании

Alfa Digital

Рассказываем о работе в Альфа-Банке, делимся интересными вакансиями, новостями и полезными советами, иногда шутим 🤓

VK Team

Пишем код, тюним рекомендации, чистим вёрстку, делаем ВКонтакте, ОК, Дзен, Почту, VK Play и ещё более 200 проектов. Вступить в клуб: vk.cc/vacancy

Ozøn Design

👋🏻 Коллективный аккаунт ведущих дизайнеров Ozon: делимся опытом, мыслями и крутыми подборками про дизайн и продуктивность. Авторы канала: все дизайнеры Ozon

МТС Банк | Карьера

Рассказываем о работе в МТС Финтех, делимся вакансиями, новостями и полезностями. Мы в Telegram: https://t.me/+3Cu3j1S7vQ41ZmYy ⬅️

Карьера в Сбере

Карьера в Сбере — это уникальное комьюнити, в котором ты откроешь секреты успешной карьеры, получишь советы от наших HR-экспертов, первым узнаешь об открытых вакансиях, новостях и мероприятиях мира IT-технологий. Присоединяйся к команде лучших!

посмотреть всех

37 подписчиков

звёзды индустрии

войдите, чтобы продолжить

мы не знаем, безопасна ли ссылка