
Яндекс
Руководитель дежурной смены SRE Финтеха
- Linux
- Руководство коллективом
- Kubernetes
- Golang
- Ansible
- CI/CD
Мы — команда SRE Финтеха — делаем платежи в сервисах (Маркет, Такси, Музыка, Еда) быстрыми, безопасными и бесперебойными. Отвечаем за надёжность финансовых сервисов, масштабируем инфраструктуру и внедряем лучшие практики DevOps. Сейчас у нас больше 100 сервисов, десятки кластеров баз данных и тысячи виртуальных машин. Мы работаем с Kubernetes, Terraform/Terragrunt, Ansible и GitLab, следуя принципам open-source и автоматизации.
Ищем руководителя дежурной смены, который поможет нам выстроить процессы, улучшить реагирование на инциденты и сделать работу команды ещё эффективнее
Какие задачи вас ждут:Управление дежурной сменой
Вы организуете работу команды и будете контролировать качество и эффективность. Важно улучшать процессы взаимодействия внутри команды и с другими подразделениями.
Решение инцидентов и постмортемы
Понадобится участвовать в разборах сбоев, искать root cause и внедрять решения, которые предотвратят повторные проблемы.
Оптимизация мониторинга и алертинга
Настраивать алерты, уменьшать количество ложных срабатываний, повышать скорость реакции на критические события.
Автоматизация рутинных процессов
Внедрять скрипты и инструменты (Bash, Python, Ansible), которые ускорят рутинные задачи.
Дежурства и экстренное реагирование
Будьте готовы участвовать в дежурствах (включая ночные смены) и быстро решать проблемы.
Мы ждём, что вы:
- Получили высшее техническое образование (бакалавр/магистр)
- Свободно читаете техдокументацию на английском
- Уверенно работаете в Linux (CLI, диагностика, сетевые утилиты)
- Знаете основы сетевых протоколов и маршрутизации
- Пишете скрипты на Bash/shell (или готовы быстро их освоить)
- Больше двух лет управляли командой SRE/DevOps
- Умеете выстраивать коммуникацию между командами, отстаивать решения
- Готовы дежурить и работать в нестандартных ситуациях
- Стрессоустойчивы, самостоятельны в кризисных сценариях
Будет плюсом, если вы:
- Понимаете принципы работы высоконагруженных веб-сервисов
- Знакомы с Kubernetes, nginx, облачными инфраструктурами (Terraform, Terragrunt)
- Работали с Ansible, Puppet или другими инструментами автоматизации
- Писали код на Python или Go