Flowwow

DevOps инженер (ML-платформа)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • Более 6 лет
  • Kubernetes
  • DevOps
  • Redis
  • Kafka
  • qdrant
  • Spark
  • FastAPI
  • bento ml
  • MLflow
  • Apache Airflow

Мы ищем DevOps-инженера, который в первую очередь силён в работе с высоконагруженной инфраструктурой, а также имеет практический опыт с современным ML-стеком для продакшн-систем.

Что нужно делать:

  • Проектировать и создавать комплексную ML-платформу на базе Kubernetes

  • Разрабатывать инфраструктуру для непрерывного обучения и развертывания ML-моделей

  • Создавать масштабируемые и отказоустойчивые решения для онлайн-инференса моделей

  • Настраивать мониторинг работы моделей и дрейфа данных

  • Автоматизировать пайплайны машинного обучения от сбора данных до деплоя модели

  • Интегрировать ML-платформу с существующими системами (Data Platform на базе S3/Iceberg, Trino, Spark)

  • Обеспечивать высокую доступность и низкую задержку сервисов рекомендаций

  • Внедрять системы для версионирования данных, моделей и конфигураций

  • Разрабатывать решения для A/B тестирования моделей.

Ожидания от кандидата:

  • Глубокое понимание масштабирования сервисов в k8s (HPA, лимиты, квоты).
  • Опыт проектирования инфраструктуры для сервисов с нагрузкой десятки / сотни тысяч RPS.

  • Умение строить резервирование, репликацию и масштабируемые архитектуры.

  • Опыт работы с GitOps/ArgoCD/Helm/Terraform.

  • Построение пайплайнов для деплоя сервисов и ML-моделей.

  • Практический опыт с MLflow, ClearML, BentoML, Airflow.

  • Понимание задач развёртывания и обслуживания inference-сервисов.

  • Умение интегрировать ML-сервисы с backend-системами.

Будет плюсом

  • Опыт с Trino, Spark, Iceberg (DLH-архитектуры).

  • Оптимизация Python-сервисов под async/highload.

  • Знание принципов A/B-тестирования и онлайн-рекомендаций.

Наши ценности

Забота и любовь

Наш продукт основан на желании людей радовать друг друга и быть вместе. Пока любовь жива, у Flowwow будут пользователи.

Развитие и рост

Flowwow быстро развивается и с радостью поддерживает инициативы сотрудников.

Культура взаимопомощи

У нас работают люди, вовлеченные в процесс и небезразличные к тому, что они делают.

Открытость к изменениям

Каждый может проявлять инициативу, предлагать и быстро видеть свой вклад в общий успех.

Благотворительность

Одна из целей Flowwow — помогать людям. Нас объединяют социальная ответственность и готовность участвовать в специальных благотворительных мероприятиях.