Ученые из AIRI, НИУ ВШЭ и Constructor University представили бенчмарк GeomMotif для оценки способности ИИ-моделей работать с геометрией белковых структур Он включает 57 задач и позволяет выявлять, на ...

Ученые из AIRI, НИУ ВШЭ и Constructor University представили бенчмарк GeomMotif для оценки способности ИИ-моделей работать с геометрией белковых структур

Он включает 57 задач и позволяет выявлять, на каком этапе модели допускают ошибки. Работа представлена на конференции ICLR в Рио-де-Жанейро.

Задача бенчмарка — проверить способность модели достраивать белок вокруг заданного структурного фрагмента с сохранением его точной 3D-геометрии. Ранее отдельного инструмента для такой оценки не существовало. В GeomMotif фрагменты отбираются по геометрическим и физико-химическим свойствам, а не по функции, что критично, поскольку даже отклонение на один ангстрем может резко снизить вероятность успешного проектирования.

В тестировании участвовали 10 моделей двух типов: работающие напрямую со структурой (RFdiffusion, Genie2, La-Proteina, Protpardelle-1c, FrameFlow, RFdiffusion2) и генерирующие последовательности (ESM3 и DPLM). Лидерами стали структурные модели Genie2, La-Proteina и RFdiffusion, последовательностные модели уступили более чем на порядок.

Результаты показали, что при почти полном прохождении функциональных бенчмарков лучшая модель набирает лишь 40 из 100 на GeomMotif. Наиболее сложными оказались задачи с несколькими фрагментами и двумя мотивами.

‣ Подробности в релизе**.

‣ Данные для бенчмаркинга, скрипты для построения задач и код для оценки доступны на** GitHub и HuggingFace.

#AIRI #ИИ #бенчмарки

💬 MAX | 💬 TG | 💙 VK |🔗Сайт🎁 Розыгрыш для Boost-еров

В этом посте были ссылки, но мы их удалили по правилам Сетки