Обязанности:
- Поддержка и администрирование серверов, кластеров Kubernetes.
- Мониторинг доступности и производительности систем (Prometheus, Grafana, Zabbix, ELK, Loki и др.).
- Настройка алертинга и реагирование на инциденты, участие в повышении отказоустойчивости и SLA банковских сервисов.
- Разработка и поддержка CI/CD пайплайнов (Jenkins, GitLab CI, ArgoCD).
- Автоматизация развертывания приложений, обновлений и конфигураций (Ansible, Terraform, Helm, Puppet и др.).
- Развертывание и сопровождение тестовых, предпродовых и продуктивных окружений.
- Настройка резервного копирования и планов восстановления (Backup & DR).
- Настройка систем мониторинга, логирования и трассировки (ELK / Loki / Jaeger / OpenTelemetry).
- Поддержка процессов релиз-менеджмента и ведение технической документации (Confluence, Wiki, Runbook).
- от 2 лет в сфере SRE, DevOps или системного администрирования
- Администрирование Linux (CentOS / RHEL / Ubuntu Server).
- Настройка systemd, journald, SELinux, cron.
- Docker: создание, оптимизация, hardening контейнеров.
- Kubernetes: деплой, Helm, Ingress, Secrets, RBAC, Operators.
- CI/CD: GitLab CI/CD, ArgoCD.