GPT-4o vs YandexGPT: как мы отлаживали метрики в DeepEval

📍Друзья, вышла моя новая статья на Habr: “GPT-4o vs YandexGPT: как мы отлаживали метрики в DeepEval из-за требований ИБ”!

Рассказал, как в Raft столкнулись с “характерами” разных LLM при оценке класси

читать далее