🚀 Ray Data ускорил обработку AI-данных

Ray Data представил крупные обновления для масштабной обработки AI-нагрузок.

Библиотека получила поддержку MCAP для робототехники, выражения для загрузки файлов и интеграцию с vLLM/SGLang. Появились columnar expressions — вместо UDFs, что позволило включить pushdown-оптимизации. Hash-shuffle стал стандартом, ускорив агрегации в 7 раз.

На тестах обработка изображений ускорилась в 2 раза, расчёт квантилей — в 4.8 раз. Чтение Parquet из 10k+ файлов стало быстрее в 3 раза. Добавлена поддержка Unity Catalog с политиками доступа.

#ray_data #ai_data #distributed_computing #mcap #vllm #optimization

🚀 Ray Data ускорил обработку AI-данных
Ray Data представил крупные обновления для масштабной обработки AI-нагрузок | Сетка — социальная сеть от hh.ru