Обязанности:
- Регистрировать и управлять инцидентами на основе данных, полученных от системы мониторинга и бизнес-подразделений
- Обрабатывать и решать единичные клиентские обращения от Call Center
- Создавать Problem на основе инцидентов и искать взаимосвязи между ними (участвовать в автоматизации этого процесса на основе AI)
- Формировать рабочие группы с командами менеджмента и разработки в рамках устранения причин инцидентов
- Вести протоколы встреч, отражать динамику работы с мероприятиями в ITSM-системе (в этом опять же поможет AI и распознавание встреч в текст от KTALK)
- Информировать всех заинтересованных экспертов и бизнес о массовых инцидентах
- Проводить эскалацию при нарушении сроков решения массовых инцидентов (смс, e-mail, звонком)
- Проводить Postmortem с целью выяснения причины, недопущения проблемы в будущем, улучшения процесса (вместе с командами разработки и инфраструктуры)
- Постепенно учиться, чтобы иметь возможность стать в будущем SRE
Требования:
- Опыт работы в роли менеджера управления проблемами, инцидент-менеджера или мониторинга от 2-х лет
- Опыт работы с системами мониторинга (Grafana, Zabbix)
- Опыт trouble-shooting’а IT-инцидентов
- Понимание процессов построения услуг на базе ITIL/ITSM. В частности, понимание процесса управления инцидентами, Problem и мониторинга
- Железные нервы — умение держать удар и не терять самообладание даже в самых напряжённых ситуациях
- Гранитная твёрдость — способность сохранять хладнокровие и эффективность в условиях сильного давления
Плюсик в карму:
- Понимание принципов работы микросервисной архитектуры, эквайринга, маршрутизации смс-сообщений
- Базовые знания языков программирования: Python, PHP, HTML, SQL
- Опыт работы в финтехе
- Желание учиться и развивать свои скиллы, особенно, если интересен потенциальный путь SRE
Условия:
- Удаленный формат работы
- Оформление по трудовому договору
- График работы: 2/2 (день/ночь)
- Работа в команде экспертов