ТЛ Групп

SRE / DevOps Platform Engineer

250 000 - 350 000 RUR
  • Москва
  • От 3 до 6 лет
  • Linux
  • Docker
  • Kubernetes
  • Python
  • Администрирование серверов Linux
  • Bash
  • Ansible
  • Zabbix
  • Prometheus
  • Grafana
  • CI/CD

​​​​​​Проект FlexCard — сервис виртуальных банковских карт для оплаты рекламы и онлайн-сервисов. Мы создаём удобные и безопасные платёжные решения для рекламодателей, маркетинговых команд и бизнеса, которым нужны стабильные инструменты для закупки трафика и работы с международными площадками.

Основные задачи:

  • Проектирование и поддержание отказоустойчивой инфраструктуры продукта (виртуальные серверы, сети, базы данных).
  • Внедрение и развитие CI/CD пайплайнов для автоматического и безопасного развертывания кода.
  • Перевод конфигураций серверов в код (Infrastructure as a Code) для исключения ручных правок на продуктивном контуре (Terraform, Ansible).
  • Построение проактивного мониторинга, сбор метрик и настройка алертинга (чтобы узнавать о проблемах до клиентов).
  • Разработка стратегии миграции сервисов в контейнерную среду (Docker, Kubernetes) по мере роста нагрузки.
  • Администрирование критических компонентов: MariaDB (Galera Cluster), Kafka (при внедрении).
  • Расследование инцидентов, работа над повышением отказоустойчивости сервиса (SLO/SLA, error budget).

Знания, необходимые для выполнения данной работы:

  • Устройство сетей в Linux (TCP/IP, iptables, маршрутизация).
  • Принципы построения отказоустойчивых систем (репликация, резервирование).
  • Понимание жизненного цикла разработки ПО и роли инфраструктуры в нем.
  • Основы SRE: SLA, SLO, управление инцидентами, post-mortem анализ.
  • Важно: Понимание, что инфраструктура — это код, а не набор ручных конфигураций.

Будет плюсом:

  • Docker, опыт с системами оркестрации (Kubernetes), знание Terraform/Ansible.

Необходимые навыки:

  • Умение «копать» глубоко: диагностировать проблемы не по поверхностным симптомам, а на уровне ядра или запросов.
  • Навыки написания скриптов для автоматизации рутины.
  • Умение читать и понимать чужой код (чтобы помогать разработчикам с деплоем).