Site Reliability Engineer в HotBox S3
Не указана
- Linux
- Python
- Docker
- Ansible
- Puppet
- TCP/IP
- S3
Задачи
- Обслуживание production-сервисов S3
- Участие в проектировании и внедрении практик управления инфраструктурой
- Разработка и поддержка автоматизированных систем для реагирования на инциденты, мониторинга и оповещения
- Выполнение плановых регламентных работ
- Участие в on-call дежурствах и процессах инцидент-менеджмента
- L3 поддержка пользователей
- Подготовка технической и эксплуатационной документации
Требования
- Опыт системным администратором от двух лет
- Базовое знание: сети, GNU/Linux, мониторинга и логирования (Zabbix/Prometheus/ELK)
- Системы управления конфигурацией (Ansible/Puppet), контейнеризации (Docker/LXC)
- Умение автоматизировать / писать и читать код на базовом уровне (Bash/Python/Go)