🎯 NVIDIA представила Nemotron ColEmbed V2

NVIDIA выпустила новое семейство многомодальных моделей для точного поиска по тексту и изображениям.

Модели используют late-interaction архитектуру ColBERT: каждый токен запроса сравнивается со всеми токенами документа через оператор MaxSim, что обеспечивает детальное сопоставление. Архитектура основана на Qwen3-VL и Llama-3.2, с би-направленным вниманием и многомодальными эмбеддингами. Обучение проводилось на текстовых и текстово-изображеничных парах с hard negative mining.

Крупнейшая версия достигла 63.42 NDCG@10, став лидером в бенчмарке ViDoRe V3.

#nvidia #multimodal_search #retrieval #rag #colbert #nemotron

🎯 NVIDIA представила Nemotron ColEmbed V2
NVIDIA выпустила новое семейство многомодальных моделей для точного поиска по тексту и изображениям | Сетка — социальная сеть от hh.ru