Задачи, которые ты будешь выполнять:
- Развёртывание, автоматизация и поддержка инфраструктуры для AI/ML-проектов (на базе Kubernetes, Docker).
- Настройка CI/CD-конвейеров для сервисов машинного обучения и API.
- Оптимизация и мониторинг вычислительных ресурсов (GPU/CPU-кластеры, облачные и on-prem решения).
- Поддержка MLOps-процессов: версионирование моделей, управление пайплайнами обучения и деплоя (MLflow, Airflow, Kubeflow).
- Настройка логирования, алертинга и мониторинга (Prometheus, Grafana, ELK).
- Обеспечение безопасности, отказоустойчивости и масштабируемости AI-инфраструктуры.
- Развёртывание и сопровождение MCP-серверов и Agentic AI-систем (LangGraph, MCP, multi-agent orchestration).
- Взаимодействие с командами Data Science и backend-разработки для ускорения релизов и стабильной работы сервисов.
Требования:
- Опыт работы DevOps / Cloud / System Engineer от 3 лет.
- Уверенные знания Python, Linux, Docker, Kubernetes.
- Опыт работы с CI/CD-инструментами (GitLab CI, Jenkins, ArgoCD и др.).
- Опыт использования Terraform, Ansible, Helm.
- Навыки автоматизации и написания скриптов на Python или Bash.
- Опыт настройки мониторинга и логирования (Prometheus, Grafana, Loki, ELK).
Будет плюсом:
- Опыт работы с MLflow, DVC, Kubeflow, Airflow.
- Понимание CI/CD-процессов для ML-моделей.
- Опыт оптимизации GPU-ресурсов и контейнеризации AI-моделей.
- Практический опыт с Agentic AI-архитектурами (LangGraph, MCP, multi-agent pipelines).
Мы предлагаем тебе:
-
Конструктор льгот OLZHA: кэшбек на здоровье, спорт, путешествия и саморазвитие в рамках утвержденных лимитов.
-
Продукты компании для сотрудников на выгодных условиях.
-
Внутреннее и внешнее обучение, корпоративный доступ к образовательной платформе Udemy.
-
Merch Store: брендированная продукция с корпоративной символикой.
-
Отсутствие дресс-кода.
-
Ультрасовременный и уютный офис HCB HUB.
-
Массаж в офисе, йога-классы, корпоративные скидки в фитнес-клубы, клиники, магазины.
-
Яркая корпоративная жизнь: мероприятия, клубы по интересам.