Мечтай о большем с Napoleon IT
Мы — не просто IT-компания, а место, в котором искусственный интеллект объединяется с человеческим.
Мы - это более 200 сотрудников, 3 офиса в России, 3 разных направления развития: заказная разработка, outstaffing, собственные продукты.
Помимо уже существующих продуктов и решений на основе AI, мы активно развиваем разработку с использованием технологий LLM и Generative AI. Мы строим мультиагентные системы и платформенные решения для брендов, ритейла и маркетплейсов.
Реализовывая принцип LLM First, мы стараемся внедрять LLM-технологии во все внутренние процессы, чтобы освободить ресурс для смелых идей, уникальных проектов и амбициозных целей.
Наша цель — упростить доступ к передовым технологиям и позволить людям мечтать о большем, и для этого нам необходима твоя экспертиза.
Ищем MLOps - Senior! Проект: разворачивание корпоративной LLM системы для крупного Ритейлера.
Стек: Docker, Kubernetes, Apache Hadoop, Apache Spark, ClearML, Jenkins, GitLab CI/CD.
Срок привлечения: 3 месяца, с возможным продлением.
Тебе предстоит:
- Разворачивать и поддерживать ML-инфраструктуру в Kubernetes (ML-модели, сервисы, базы данных).
- Автоматизировать деплоймент ML-сервисов с помощью Helm, ArgoCD.
- Разворачивать и настраивать инструменты мониторинга (Grafana, Prometheus, Litellm, Sentry).
- Разворачивать и оптимизировать инференс-серверы (Triton, vLLM).
- Настраивать и мониторить базы данных (PostgreSQL, Redis, Qdrant) в Kubernetes.
- Работать с облачными сервисами (Yandex Cloud) и управлять инфраструктурой через Terraform.
- Оптимизировать CI/CD-процессы и логику развертывания ML-моделей.
- Участвовать в разработке и улучшении инструментов для экспериментов и мониторинга ML-моделей.
- Поддерживать ClearML для управления ML-экспериментами и пайплайнами.
- Взаимодействовать с ML-командой, помогая автоматизировать процесс обучения, тестирования и деплоя моделей и сервисов.
Мы ждем от тебя:
-
Опыт 3+ лет в DevOps/MLOps или ML-разработке с переходом в Ops
-
Глубокое понимание Kubernetes, работы сервисов в облаке
-
Опыт работы с Helm, ArgoCD
-
Опыт написания Terraform-модулей
-
Понимание мониторинга (Grafana, Prometheus) и логирования (Loki)
-
Опыт работы с ML-инференс серверами (Triton, vLLM или аналогов)
-
Опыт работы с Python-сервисами (FastAPI, AIOHTTP)
-
Понимание CI/CD-процессов
-
Знание MLOps-методологий: мониторинг моделей, трекинг экспериментов, управление ML-пайплайнами
-
Опыт работы с ClearML или аналогами (MLflow, Kubeflow)
Будет плюсом:
-
Опыт разработки на Python
-
Опыт работы с GPU-инфраструктурой
-
Опыт оптимизации ML-инференса (TensorRT, ONNX, Quantization)
-
Опыт работы с распределёнными базами (Qdrant)
-
Опыт работы с ML-оркестрацией (Clearml, Airflow)
Рассматриваем вариант удаленки в формате full time, либо гибридный формат работы в офисе, в одном из городов присутствия (Челябинск, Санкт-Петербург, Москва).