Обязанности:
- Поддержка и развитие ML-инфраструктуры: Обеспечение бесперебойной работы и масштабирования систем хранения и обработки данных для ML-команды.
- Разработка пайплайнов данных: Реализация, оптимизация и поддержка пайплайнов для подготовки, трансформации и поставки данных для тренировки и инференса ML-моделей.
- Автоматизация MLOps: Автоматизация процессов сборки, тестирования и развертывания (CI/CD) ML-проектов.
- Поддержка сред разработки: Обеспечение стабильности и доступности среды разработки для дата-сайентистов и аналитиков данных.
- Поддержка BI-инструментов: Администрирование и поддержка BI-систем.
- Управление окружениями: Развертывание, конфигурирование и поддержка серверов, виртуальных сред и контейнеров.
- Оптимизация производительности: Работа с распределенными вычислениями и оптимизация производительности ML-моделей.
- Обеспечение безопасности: Применение принципов безопасности и управления данными, в том числе в корпоративных и локальных средах.
- Взаимодействие с командой: Тесное сотрудничество с инженерами, аналитиками данных и data scientists.
- Образование: Высшее техническое образование в сфере компьютерных наук, математики, машинного обучения или смежных областях.
- Опыт работы: От 3 лет в сфере Data Engineering, DevOps, MLOps, с практическим опытом работы с инфраструктурой ML-разработки.
- Понимание основ жизненного цикла ML-приложений.
- Понимание устройства и принципов работы систем хранения данных.
- Опыт работы с Docker, сборка Docker-контейнеров (включая под GPU Nvidia с PyTorch, TensorFlow, Ultralytics). Опыт работы с Kubernetes (on-premise deployment – плюс)
- Знание принципов CI/CD, опыт работы с инструментами автоматизации и конвейерами.
- Уверенное знание GNU/Linux и опыт администрирования серверов.
- Опыт разработки и сопровождения пайплайнов с использованием оркестраторов (Airflow).
- Умение настраивать и сопровождать системы мониторинга.
- Отличное знание Python и Bash, опыт работы с SQL.
- Опыт работы с ClickHouse, PostgreSQL.
- Опыт работы с Git, MLflow, JupyterHub.
- Навыки коммуникации и эффективного сотрудничества с аналитическими подразделениями.
Приветствуется (плюсом будет):
- Опыт развертывания систем on-premise.
- Удалённый формат работы
- Официальное оформление по ТкРФ, белая ЗП (по договорённости);
- График работы 5/2 с 8:30 до 17:30 по Москве;
- Премии за эффективную работу и достижение результатов;
- Различные программы обучения для прокачки профессиональных скиллов;
- ДМС программа