GPT-4o vs YandexGPT: как мы отлаживали метрики в DeepEval
📍Друзья, вышла моя новая статья на Habr: “GPT-4o vs YandexGPT: как мы отлаживали метрики в DeepEval из-за требований ИБ”!
Рассказал, как в Raft столкнулись с “характерами” разных LLM при оценке класси
читать далее