АО «ОТП Банк» (JSC «OTP Bank»)

DevOps-инженер (Трайб Data Office)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет

Кого мы ищем? Мы в Банке строим ML-платформу нового поколения – инфраструктуру, которая обеспечивает полный MLOps-цикл: от экспериментов до продакшн-инференса. Это не просто среда для Data Scientists – это полноценная экосистема, в которой уже преднастроены фреймворки для анализа, обработки данных, мониторинга и оркестрации ML-процессов. Сейчас мы в поиске DevOps-инженера, который станет частью команды и поможет спроектировать и развернуть отказоустойчивую, масштабируемую ML-платформу на базе Kubernetes с нуля. У нас масштабные задачи, свежий стек и высокий уровень свободы в реализации идей.

Наш стек:

  • Runtime: Kubernetes (self-hosted), Airflow, Spark, Hadoop (HDFS, YARN, Hive), Seldon, Kubeflow
  • ML сервисы: Kubeflow, MLFlow, Airflow
  • БД и очереди: HDFS, PostgreSQL, Kafka, Redis, Minio
  • Управление инфраструктурой: Ansible, ArgoCD
  • CI/CD: Bitbucket, Teamcity, Nexus
  • Мониторинг: Grafana, Zabbix

Чем предстоит заниматься?

  • Разворачивать и настраивать инфраструктуру для тренировки и сервинга ML-моделей;
  • Внедрять и развивать ML-компоненты в концепции Model-as-a-Service;
  • Разрабатывать backend-часть для моделей: API, обработку запросов, масштабирование, мониторинг;
  • Автоматизировать развёртывание сервисов через CI/CD пайплайны;
  • Настраивать логирование, мониторинг и алерты;
  • Проводить R&D и внедрять перспективные open-source решения.

Что мы ожидаем?

  • Опыт администрирования Linux (RHEL, CentOS) от 2-х лет;
  • Глубокие знания Kubernetes (развертывание, обновление в закрытых средах);
  • Опыт работы с GPU;
  • Понимание MLOps практик;
  • Уверенное владение инструментами CI/CD;
  • Навыки автоматизации с помощью Python/Bash;
  • Опыт эксплуатации систем мониторинга (Prometheus, Grafana, Zabbix, ELK).