Ekleft
22.08
🍃 🔖 Вакансия: ML Platform Engineer 🍃 🔖 Формат: удаленно, полная занятость 🍃 🔖 Куда: Крупная металлургическая компания
Ищем: от 5 лет ML, с опытом в инфраструктуре (сети, kubernetes), python, эксплуатации ML платформ, Big Data (Hadoop, spark)
🍃 🔖 Требования:
- Опыт администрирования linux, работающих сервисов на базе Open Source;
- Опыт настройки, отладки, мониторинга и оптимизации производительности систем, начиная с уровня hardware, продолжая уровнем сети, виртуализации, оркестрации и заканчивая конечными сервисами;
- Опыт разработки современных распределенных software system, основы Web, микро сервисная архитектура и т.д.;
- Опыт развертывания и эксплуатации разработанных software system;
- Опыт работы с DevOps инструментами, Git, CI/CD и т.д.;
- Опыт разработки в команде по SCRUM Kanban методологиям;
- Умение сочетать гибкие принципы Agile, с дисциплиной для эксплуатации, обеспечение SLA;
- Опыт разработки на языках: python, bash; опыт отладки кода на java, а также желательно С/С++, JavaScript, scala и др.;
- Опыт развертывания, эксплуатации и применения K8s инфраструктуры (кластеров);
- Опыт настройки и экcплуатации сетевых сервисов, nginx или других балансировщиков;
- Опыт работы со spark и распределенными хранилищами S3/HDFS;
- Опыт безопасной разработки: аутентификация, авторизация, шифрование и т.д.;
- Быть сторонником принципов DevOps/SRE, Cloud Native архитектуры;
- Понимание MLOps практик: ML pipeline, Model Serving, Experiment Management, версионирования данных, моделей, экспериментов, воспроизводимость;
- Готовность, разрабатывая код, отвечать за его эксплуатацию в продуктовой среде;
- Готовность, как инженер и разработчик, отстаивать интересы Data Scientist-ов;
- Уметь следовать и культивировать в компании стандарты вокруг разработки, готовность документировать результаты своего труда.
Плюсом будет:
- Опыт работы с Cloud платформами типа Amazon, Azure, Google, Yandex;
- Опыт настройки CI на базе Gitlab;
- Опыт работы с hadoop;
- Опыт эксплуатации сервисных шин (MQ, Kafka);
- Опыт работы с Windows Servers, Active Directory, Kubernetes.
🍃 🔖 Обязанности:
- Разрабатывать и эксплуатировать инфраструктуру вычислительных мощностей ML платформы: вычислительное облако + облако данных. Эксплуатировать VMWare сервера (CPU, GPU, RAM, Disks) платформы, cеть. Экcплуатацией cобственно cерверного/сетевого hardware и VMWare ESXI серверов мы не занимаемся;
- Разрабатывать и эксплуатировать набор взаимосвязанных K8s кластеров для вычислительного облака ML платформы
- Разрабатывать и эксплуатировать масштабируемое облако данных платформы на базе Apache Ozone, HDFS, S3;
- Разрабатывать и эксплуатировать инструменты для мониторинга и диагностики работы моделей, на базе Spark, Kafka. Экcплуатацией cобственно Kafka кластеров мы не занимаемся. Участие в разработке и применении типовых DataFlow продуктов для мониторинга моделей (Model Services);
- Разрабатывать эксплуатировать и поддерживать экземпляры DSML платформы на базе SinaraML на языке Python
- Разрабатывать эксплуатировать и поддерживать типовые среды разработки моделей для Сlassic ML, Copmuter Vision, Natural Language Processing;
- Разрабатывать эксплуатировать и поддерживать инструменты безопасности:
- Интегрировать компоненты платформы между собой и c корпоративной инфраструктурой включая GitLab, Nexus, Kafka и др.;
- Обеспечение бесперебойной работы платформы;
- Создание и поддержка процессов провижнинга пользователей, продуктов, подрядчиков на платформу;
- Развивать и продвигать в компании сloud-native архитектуру и другие современные инструменты, и подходы к разработке;
- Вести разработку на языке Python. Читать, отлаживать и вносить изменения в код на других языках: Java, C/C++, JavaScript и т.д.
🍃 🔖 Мы предлагаем:
- Оформление в штат аккредитованной IT компании
🍃 🔖Хочешь откликнуться? @kochetkovalizzz
еще контент в этом сообществе
еще контент в этом соообществе
Ekleft
22.08
войдите, чтобы увидеть
и подписаться на интересных профи