Napoleon IT

MLops engineer

Не указана
  • Москва
  • Проектная работа
  • Удаленная работа
  • От 3 до 6 лет
  • LLM
  • LLMOps
  • DevOps
  • MLops

Мечтай о большем с Napoleon IT

Мы — не просто IT-компания, а место, в котором искусственный интеллект объединяется с человеческим.

Мы - это более 200 сотрудников, 3 офиса в России, 3 разных направления развития: заказная разработка, outstaffing, собственные продукты.

Помимо уже существующих продуктов и решений на основе AI, мы активно развиваем разработку с использованием технологий LLM и Generative AI. Мы строим мультиагентные системы и платформенные решения для брендов, ритейла и маркетплейсов.

Реализовывая принцип LLM First, мы стараемся внедрять LLM-технологии во все внутренние процессы, чтобы освободить ресурс для смелых идей, уникальных проектов и амбициозных целей.

Наша цель — упростить доступ к передовым технологиям и позволить людям мечтать о большем, и для этого нам необходима твоя экспертиза.

Ищем MLOps - Senior! Проект: разворачивание корпоративной LLM системы для крупного Ритейлера.

Стек: Docker, Kubernetes, Apache Hadoop, Apache Spark, ClearML, Jenkins, GitLab CI/CD.

Срок привлечения: 3 месяца, с возможным продлением.

Тебе предстоит:

  • Разворачивать и поддерживать ML-инфраструктуру в Kubernetes (ML-модели, сервисы, базы данных).
  • Автоматизировать деплоймент ML-сервисов с помощью Helm, ArgoCD.
  • Разворачивать и настраивать инструменты мониторинга (Grafana, Prometheus, Litellm, Sentry).
  • Разворачивать и оптимизировать инференс-серверы (Triton, vLLM).
  • Настраивать и мониторить базы данных (PostgreSQL, Redis, Qdrant) в Kubernetes.
  • Работать с облачными сервисами (Yandex Cloud) и управлять инфраструктурой через Terraform.
  • Оптимизировать CI/CD-процессы и логику развертывания ML-моделей.
  • Участвовать в разработке и улучшении инструментов для экспериментов и мониторинга ML-моделей.
  • Поддерживать ClearML для управления ML-экспериментами и пайплайнами.
  • Взаимодействовать с ML-командой, помогая автоматизировать процесс обучения, тестирования и деплоя моделей и сервисов.

Мы ждем от тебя:

  • Опыт 3+ лет в DevOps/MLOps или ML-разработке с переходом в Ops

  • Глубокое понимание Kubernetes, работы сервисов в облаке

  • Опыт работы с Helm, ArgoCD

  • Опыт написания Terraform-модулей

  • Понимание мониторинга (Grafana, Prometheus) и логирования (Loki)

  • Опыт работы с ML-инференс серверами (Triton, vLLM или аналогов)

  • Опыт работы с Python-сервисами (FastAPI, AIOHTTP)

  • Понимание CI/CD-процессов

  • Знание MLOps-методологий: мониторинг моделей, трекинг экспериментов, управление ML-пайплайнами

  • Опыт работы с ClearML или аналогами (MLflow, Kubeflow)

Будет плюсом:

  • Опыт разработки на Python

  • Опыт работы с GPU-инфраструктурой

  • Опыт оптимизации ML-инференса (TensorRT, ONNX, Quantization)

  • Опыт работы с распределёнными базами (Qdrant)

  • Опыт работы с ML-оркестрацией (Clearml, Airflow)

Рассматриваем вариант удаленки в формате full time, либо гибридный формат работы в офисе, в одном из городов присутствия (Челябинск, Санкт-Петербург, Москва).