МТС Финтех
SRE инженер / Эксперт по обеспечению надежности
                        Не указана
                    
                    
                    - Linux
 - SRE
 - SLA
 - SLO
 - ELK
 - Grafana
 - OSI
 
МТС Финтех – одно из ключевых направлений экосистемы МТС.
Мы используем современные цифровые решения и развиваем технологичные банковские сервисы, доступные каждому.
Наши команды совершенствуют финтех-продукты для В2В и В2С. Создают сайты на TypeScript + React + Next.js с SSR. И реализуют проекты в Kubernetes-среде, чтобы обеспечивать надёжность для миллионов клиентов МТС Финтех.
Наш стек:
- Linux, PostgreSQL, RDBMS Oracle, ELK, Grafana, Zabbix, BCP/DRP, RTO, RPO, SLA/SLO/SLI, Bash, OSI.
 
Что для нас важно:
- опыт внедрения практик и инструментов SRE
 - знание принципов формирования SLA/SLI/SLO
 - умение работать с высоконагруженными сервисами
 - знание принципов и методов обеспечения качества и надёжности ИТ сервисов
 - навыки работы в Grafana – создание дашбордов, настройка Alerting
 - опыт работы с ELK (запросы, визуализация, дашборды)
 - навыки работы в ОС Linux, в том числе опыт написания bash-скриптов
 - опыт участия в ИТ-проектах или работы в продуктовых командах (взаимодействие с аналитиками, разработчиками, QA)
 - высшее техническое образование
 
Ты будешь:
- внедрять практики SRE на уровне продуктов и систем Банка
 - формировать и контролировать реализации нефункциональных требований к доработкам
 - прорабатывать и описывать методики диагностики, подготовку эксплуатационных инструкций, обучений L1 и L2
 - улучшать метрики надежности, наблюдаемости в продуктах/системах совместно с продуктовыми командами или администраторами систем
 - выстраивать процессы управления уровнем сервиса на основе SLA/SLO/SLI
 - обеспечивать формирование планов и мероприятий по обеспечению непрерывности (DRP/DRT, катастрофоустойчивость, подтверждению заявленных RTO/RPO)
 - проактивно выявлять проблемы и дефекты функционала по продуктовым метрикам, логам, БД
 - устранять аварии и нештатные ситуации, выявлять причины, прорабатывать меры, подготавливать Postmortem-отчёты
 - проводить анализ ИТ-решений, взаимодействовать с командами и подразделениями в рамках анализа ИТ-решений и интеграций