Arteus LLM
О компании
Мы занимаемся применением данных и ML для эффективности бизнеса. Наши проекты достигали выручки более миллиарда рублей, оценивались в десятки миллионов долларов, работали с крупнейшими датасетами в России. Сегодня наш главный фокус - применение передовых LLM-моделей для автоматизации бизнес-общения. Наши продукты обрабатывают неструктурированные клиентские данные, с их помощью общаются с клиентами и повышают конверсию, обучают и проверяют сотрудников, автоматизируют систему маркетинга. Мы реализуем проекты для крупных рекламодателей, работаем с компаниями из ОАЭ, России, Великобритании.
Наша цель - построить действительно глобальную компанию, в основе которой - лучшая команда, сфокусированная на новых LLM-технологиях. Для этого нам нужен ты. У нас открыта позиция для опытного DevOps инженера.
Вакансия: DevOps-инженер
Компания Arteus Software LTD приглашает к сотрудничеству опытного DevOps-инженера для развития и сопровождения собственной LLM RAG мультиагентской AI-системы.
Кого мы ищем
Нам нужен специалист с реальным практическим опытом работы в DevOps / Infrastructure Engineering более 2 лет.
Важно:
- опыт работы в ИТ-компаниях;
- уверенное администрирование Linux-серверов;
- практический опыт работы с Docker, Docker Compose, Docker Swarm;
- опыт настройки и сопровождения CI/CD на GitHub Actions, включая self-hosted runners;
- опыт работы с private Docker registry, сборкой, публикацией и версионированием Docker-образов;
- опыт сборки, настройки и сопровождения dev / test / prod окружений и клиентских сетапов;
- опыт настройки Nginx, reverse proxy, доменов, SSL и сетевой маршрутизации;
- практический опыт автоматизации deploy-процессов и инфраструктурных операций с помощью shell- и Python-скриптов;
- понимание микросервисной архитектуры и межсервисного взаимодействия;
- опыт эксплуатации RabbitMQ, Kafka, MongoDB, ClickHouse;
- практический опыт работы с Prometheus и Grafana: сбор метрик, построение дашбордов, настройка alerting и мониторинга;
- умение разбираться в проблемах production-среды, находить узкие места и доводить инфраструктурные задачи до устойчивого результата.
Будет преимуществом
- опыт сопровождения Python / FastAPI / Celery сервисов;
- знание JavaScript / TypeScript, Node.js;
- опыт поддержки AI / LLM / RAG систем;
- опыт построения процессов release management, rollback-сценариев и безопасного обновления сервисов;
- опыт повышения надежности и скорости CI/CD пайплайнов;
- опыт настройки централизованного логирования, health checks и service monitoring.
Чем предстоит заниматься
Ваша деятельность будет преимущественно сосредоточена на развитии и эксплуатации инфраструктуры платформы Arteus.
Основные задачи:
- поддержка и развитие deploy service для автоматического развертывания клиентских сетапов;
- сопровождение многосервисных окружений платформы для разработки, тестирования и production;
- развитие шаблонов Docker Compose / Docker Swarm под разные сценарии поставки и эксплуатации;
- доработка CI/CD: сборка и публикация образов, запуск тестов, автоматический deploy, улучшение стабильности self-hosted runners;
- настройка и поддержка Nginx, reverse proxy, доменных маршрутов, сетевого взаимодействия и внешних точек входа;
- настройка и сопровождение инфраструктуры очередей, фоновых воркеров и внутренних сервисов платформы;
- настройка и развитие мониторинга на базе Prometheus и Grafana;
- построение дашбордов и alerting по микросервисам, очередям, базам данных, ресурсам серверов и процессам развертывания;
- обеспечение воспроизводимости окружений, прозрачности поставки и эксплуатационной надежности системы;
- участие в разборе инцидентов, технической диагностике и улучшении отказоустойчивости инфраструктуры.
О проекте
Ваша работа будет напрямую связана с инфраструктурой собственной AI-платформы компании: микросервисной LLM RAG мультиагентской системы, в которой используются Python-сервисы, фоновые воркеры, очереди, базы данных, внутренние API и сценарии автоматического развертывания клиентских инсталляций.
У нас важны не только базовые навыки эксплуатации серверов, но и умение системно выстраивать процессы сборки, выкладки, мониторинга и сопровождения сложной продуктовой платформы.
Что для нас особенно важно
Обязательно наличие опыта работы в ИТ-проектах, понимание принципов эксплуатации production-систем и практическое умение:
- собирать и поддерживать рабочие инфраструктурные сетапы;
- обеспечивать надежный CI/CD для микросервисной платформы;
- контролировать стабильность сервисов через мониторинг, метрики и алерты;
- улучшать архитектуру поставки, наблюдаемость и эксплуатационные процессы.