Ищем Python разработчика на проект AlfaGen в команду разработки технологических продуктов на базе ИИ
Чем предстоит заниматься
- Разработка и сопровождение платформы: реализация новых функциональных возможностей, рефакторинг существующего кода, обеспечение CI/CD и качества посредством тестирования и code‑review
- Автоматизация жизненного цикла моделей: автоматизированная загрузка модельных артефактов в объектное хранилище (S3 / Artifactory); деплой сервисов inference‑runtime через CR‑контроллеры и пайплайны Argo
- Provisioning & Capacity Planning: разработка алгоритмов распределения пропускной способности и резервирования ресурсов GPU/CPU с учётом целевых TPS и допуска на запас
- Квотирование и биллинг: интеграция со службой биллинга и middleware для учёта потребления (GPU‑h, tokens/sec, req/day)
- Observability и алёртинг: экспорт Prometheus‑метрик, создание Grafana‑дашбордов, проксирование событий Alertmanager через шину событий для авто‑rollback
- Событийная интеграция: стандартизация схем сообщений о моделях, деплоях и бенчмарках; публикация статусов жизненного цикла через хуки Argo
Что мы ждем от вас
- Высшее образование в Computer Science, Data Engineering, Applied Math или смежных направлениях
- Опыт работы в ML / MLOps / DevOps, включая продакшн поддержку GPU кластеров и LLM сервисов от 3х лет
- Практический опыт работы с GitOps подходом (Argo CD / Flux), Kubernetes и объектным хранилищем (S3 совместимые)
- Уверенное владение Python (fastapi, pydantic), Bash, Helm/Kustomize
- Глубокое знание Docker и Kubernetes: CRD, HPA, KEDA, CSI плагины, OPA, NetworkPolicy
- Опыт эксплуатации sglang, vLLM, TensorRT LLM или аналогичных фреймворков для высокопроизводительных LLM решений
- Навыки настройки CI/CD (GitHub Actions, GitLab CI, Argo Workflows) и мониторинга (Prometheus, Grafana, Alertmanager)
- Знание систем потоковой обработки данных (Kafka) и принципов Event Driven архитектур
- Понимание биллинга облачных ресурсов, расчёта квот и лимитов GPU
Будет плюсом:
- Опыт с сервисами AWS (EKS, S3, IAM IRSA), GCP или Yandex Cloud
- Участие в open source проектах, написание Kubernetes операторов
- Знание best practice по безопасности в облачных средах (CIS benchmarks, supply chain security)
Что мы предлагаем взамен
- Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования + квартальная премия по результатам KPI
- Гибкий график работы: вы сможете планировать время так, как удобно вам и вашей команде
- Полную удалёнку или гибрид на выбор, а также уютный ИТ-хаб в Москве, Санкт-Петербурге, Екатеринбурге и сезонный коворкинг в Сочи
- Сложные и интересные задачи, современный стек технологий
- Заботу о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного
- Возможность вертикального и горизонтального карьерного роста: регулярно проходят тренинги, вебинары, митапы и демо-дни
- Оплату посещения профильных конференций и курсов, помогаем с подготовкой к публичным выступлениям и написанием статей на Хабр
- Доступ к бесплатным корпоративным библиотекам Alpina Digital, MyBook и бизнес-изданий
- Предложения от Банка только для сотрудников: собственные спортзалы (Москва, Санкт-Петербург, Екатеринбург), а также скидки на услуги туристических агентств, продукты питания, в рестораны, бары, магазины