АО «ОТП Банк» (JSC «OTP Bank»)

DevOps-инженер (Трайб Data Office)

Не указана

Москва
Полная занятость
Удаленная работа
От 3 до 6 лет

Кого мы ищем? Мы в Банке строим ML-платформу нового поколения – инфраструктуру, которая обеспечивает полный MLOps-цикл: от экспериментов до продакшн-инференса. Это не просто среда для Data Scientists – это полноценная экосистема, в которой уже преднастроены фреймворки для анализа, обработки данных, мониторинга и оркестрации ML-процессов. Сейчас мы в поиске DevOps-инженера, который станет частью команды и поможет спроектировать и развернуть отказоустойчивую, масштабируемую ML-платформу на базе Kubernetes с нуля. У нас масштабные задачи, свежий стек и высокий уровень свободы в реализации идей.

Наш стек:

Runtime: Kubernetes (self-hosted), Airflow, Spark, Hadoop (HDFS, YARN, Hive), Seldon, Kubeflow
ML сервисы: Kubeflow, MLFlow, Airflow
БД и очереди: HDFS, PostgreSQL, Kafka, Redis, Minio
Управление инфраструктурой: Ansible, ArgoCD
CI/CD: Bitbucket, Teamcity, Nexus
Мониторинг: Grafana, Zabbix

Чем предстоит заниматься?

Разворачивать и настраивать инфраструктуру для тренировки и сервинга ML-моделей;
Внедрять и развивать ML-компоненты в концепции Model-as-a-Service;
Разрабатывать backend-часть для моделей: API, обработку запросов, масштабирование, мониторинг;
Автоматизировать развёртывание сервисов через CI/CD пайплайны;
Настраивать логирование, мониторинг и алерты;
Проводить R&D и внедрять перспективные open-source решения.

Что мы ожидаем?

Опыт администрирования Linux (RHEL, CentOS) от 2-х лет;
Глубокие знания Kubernetes (развертывание, обновление в закрытых средах);
Опыт работы с GPU;
Понимание MLOps практик;
Уверенное владение инструментами CI/CD;
Навыки автоматизации с помощью Python/Bash;
Опыт эксплуатации систем мониторинга (Prometheus, Grafana, Zabbix, ELK).

Источник вакансии

Вернуться, к списку вакансий