Р.О.С.Т. - Информационные Технологии

Инженер по надежности SRE

Не указана
  • Москва
  • От 3 до 6 лет

Обязанности:

  • Взаимодействие с архитекторами, техлидами, разработкой, инфраструктурой — внедрение лучших практик в области стабильности, безопасности и CI/CD

  • Разработка инструментов для повышения надежности информационных систем

  • Обеспечение надежности, производительности и доступности сервисов на уровне SLA/SLO/SLI

  • Реакция на инциденты, корректировка ошибок, восстановление работоспособности инфраструктуры, устранение сбоев и расследование их причин

  • Активное участие в оперативном устранении инцидентов

  • Повышение Observability приложений

  • Проектирование, внедрение и поддержка метрик для мониторинга, помощь продуктовым командам в организации их метрик

  • Развитие инфраструктуры, управление конфигурациями и обновлениями

  • Поддержание актуальной документации по всей инфраструктуре

  • Проектирование отказоустойчивых систем с учетом растущих нагрузок

  • Исследование и внедрение новых инфраструктурных решений

  • Автоматизация процессов развертывания и эксплуатации

  • Ведение регулярной отчетности и ретроспективы

  • Внедрение стандартов и best practices и повышение инженерной культуры команд

Требования:

  • Экспертное знание Linux и практик DevOps/SRE
  • Экспертиза Redis, Kafka, Elasticsearch
  • Практический опыт с Doker
  • Опыт работы в высоконагруженных проектах
  • Опыт построения CI/CD и практик непрерывной доставки
  • Опыт с Terraform/IaC и автоматизации инфраструктуры
  • Опыт в написании ролей в Ansible
  • Опыт построения и тестирования Disaster Recovery планов
  • Опыт эксплуатации Opentelemetry
  • Опыт эксплуатации PostgreSQL, Oracle Database
  • Умение документировать инфраструктуру и процессы
  • Опыт работы с системами контроля версий Git
  • Опыт работы с системами мониторинга Prometheus и Grafana, агрегаторами логов Splunk, ELK и Graylog
  • Опыт работы с системами контейнеризации и оркестрации Docker и k8s
  • Умение быстро принимать решения во время сбоя, не теряться и не сдаваться

Будет плюсом будет:

  • Владение одним из языков программирования: Python, Java и другие

Условия:

  • Аккредитованная it-компания
  • Полное соблюдение ТК РФ: с нами вы будете уверены в стабильности заработной платы, оплачиваемых больничных и отпусках, в начислении стажа, налоговых и пенсионных отчислениях
  • Чай, кофе, ДМС
  • Конкурентный уровень заработной платы