Кого мы ищем? Мы в Банке строим ML-платформу нового поколения – инфраструктуру, которая обеспечивает полный MLOps-цикл: от экспериментов до продакшн-инференса. Это не просто среда для Data Scientists – это полноценная экосистема, в которой уже преднастроены фреймворки для анализа, обработки данных, мониторинга и оркестрации ML-процессов. Сейчас мы в поиске DevOps-инженера, который станет частью команды и поможет спроектировать и развернуть отказоустойчивую, масштабируемую ML-платформу на базе Kubernetes с нуля. У нас масштабные задачи, свежий стек и высокий уровень свободы в реализации идей.
Наш стек:
- Runtime: Kubernetes (self-hosted), Airflow, Spark, Hadoop (HDFS, YARN, Hive), Seldon, Kubeflow
- ML сервисы: Kubeflow, MLFlow, Airflow
- БД и очереди: HDFS, PostgreSQL, Kafka, Redis, Minio
- Управление инфраструктурой: Ansible, ArgoCD
- CI/CD: Bitbucket, Teamcity, Nexus
- Мониторинг: Grafana, Zabbix
Чем предстоит заниматься?
- Разворачивать и настраивать инфраструктуру для тренировки и сервинга ML-моделей;
- Внедрять и развивать ML-компоненты в концепции Model-as-a-Service;
- Разрабатывать backend-часть для моделей: API, обработку запросов, масштабирование, мониторинг;
- Автоматизировать развёртывание сервисов через CI/CD пайплайны;
- Настраивать логирование, мониторинг и алерты;
- Проводить R&D и внедрять перспективные open-source решения.
Что мы ожидаем?
- Опыт администрирования Linux (RHEL, CentOS) от 2-х лет;
- Глубокие знания Kubernetes (развертывание, обновление в закрытых средах);
- Опыт работы с GPU;
- Понимание MLOps практик;
- Уверенное владение инструментами CI/CD;
- Навыки автоматизации с помощью Python/Bash;
- Опыт эксплуатации систем мониторинга (Prometheus, Grafana, Zabbix, ELK).