На этой позиции тебе предстоит:
- Определение метрик и порогов, отражающих состояние здоровья ИТ-инфраструктуры (сеть/SDN, серверы, СХД, и связанные с ними системы).
- Постановка задач на создание дашбордов мониторинга.
- Выявление, оценка и снижение рисков надежности и безопасности ИТ-инфраструктуры.
- Анализ и способствование постоянному повышению надежности и безопасности ИТ-инфраструктуры.
- Помощь командам в анализе первопричин критичных сбоев ИТ-инфраструктуры.
- Участие в разборе инцидентов и выработке мер по их недопущению.
- Проведение мероприятий, направленных на ускорение траблшутинга и улучшение мониторинга.
- Оказание содействия командам в ассессменте плановых работ.
- Контроль следования команд правилам компании (стандартам, требованиям, регламентам, процессам, best practices и пр.), касающихся конфигурирования, эксплуатации и кибербезопасности оборудования и систем.
- Лидирование встреч, синков, а также подготовка и контроль исполнения планов в рамках своей зоны ответственности.
- Создание и актуализация документации.
Что мы ждем от кандидата:
- Высшее образование в области ИТ.
- Опыт в решении инцидентов ИТ-инфраструктуры.
- Знание принципов построения ИТ-инфраструктуры центров обработки данных и ее эксплуатации.
- Глубокое понимание принципов построения облачных технологий.
- Знание сетевых технологий на уровне не ниже CCNP. Знание VXLAN, EVPN.
- Опыт эксплуатации сетевого оборудования (Cisco (NX-OS), Huawei), систем хранения данных, серверного оборудования, Wi-Fi, DWDM, межсетевых экранов, балансировщиков нагрузки.
- Знание Linux на уровне уверенного пользователя.
- Опыт работы с платформой виртуализации.
- Опыт работы с системами Netbox, CMDB, ELK, Opensearch, Zabbix, Grafana.