На проект в крупный банк требуется Data Science 👨💻
О проекте: Мы — сплочённая и энергично развивающаяся команда, которая обеспечивает безопасность данных в группе компаний.
В частности, мы занимаемся сканированием баз данных на наличие персональных данных, используя комбинированный подход, который включает в себя как ML-модели, так и стандартные программные инструменты. Затем мы обезличиваем эти данные и подтверждаем их безопасность.
Наши задачи: 1. Определение чувствительных данных и анализ структур данных для выявления закономерностей; 2. Подготовка данных для обучения моделей, включая LLM; 3. Организация разметки данных для наших моделей; 4. Проведение экспериментов для обучения моделей; 5. Разработка и реализация новых решений на основе ML/LLM для решения поставленных задач.
Задачи: 1. Выстраивание стратегии по DS-части продуктов, развитие архитектуры ML-модели продуктов; 2. Определение требований к перечню, объему и качеству данных, необходимых для решения бизнес-задач; 3. Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения; 4. Оценка, как полученное решение достигает поставленных целей; 5. Участие в разработке решения на основе GigaChat, LLAMA2; 6. Организация процесса мониторинга качества LLM; 7. Взаимодействие с другими участниками команды для совместной работы (проверки гипотез, исследований, внедрения); 8. Внедрение успешных гипотез/моделей в промышленную эксплуатацию; 9. Следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике.
Требования: 1. Опыт работы в области DS; 2. Знания в области теории вероятностей, статистики, оптимизации, численных методов; 3. Хорошие навыки программирования, знание Python, SQL; 4. Свободное владение основными DS библиотеками на Python, опыт применения алгоритмов машинного обучения, понимание их преимуществ, недостатков и ограничений; 5. Знание методов классического NLP, навыки Prompt Engineering; 6. Опыт работы с LLM-моделями (LLama, ChatGPT, GigaChat) и библиотеками LLM разработки LangChain, GigaChat; 7. Уметь адаптировать в in-house формате доступные на рынке open source LLM-модели под задачи компании.
Формат работы: офис/гибрид (Москва) Работа в аккредитованной IT-компании
Для получения дополнительной информации о вакансии, пожалуйста, свяжитесь со мной через личные сообщения в Telegram: @Shulman13
Вакансия №21 #IT #вакансия #вакансии #работа #data_science #ds #datascience