Автомакон

SRE инженер

До 442 200 RUR
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 1 года до 3 лет
  • SRE
  • Kubernetes
  • Docker
  • Bash

На данный момент мы ищем Инженера SRE, который будет работать с компанией «ВкусВилл».

Направление «ВкусВилл» занимается комплексной автоматизацией цифровой экосистемы ритейлера уже более 13 лет. В работе используем 1С, MS SQL, GO. В составе направления более 700+ IT-специалистов уровня middle и senior.

Что предстоит делать:​​​​​​

  • Поддержка команд и сервисов направлений со стороны инфраструктуры;

  • Обеспечение надежности и масштабируемости системы;

  • Выявление и устранение узких мест в производительности;

  • Настройка систем мониторинга, логирования и трейсинга;

  • Предотвращение потенциальных сбоев;

  • Оптимизация CI/CD пайплайнов, внедрение инфраструктуры как кода (IaC) и автоматизация рутинных задач;

  • Продвижение практик DevOps в сторону разработки: внедрение best practices DevOps, таких как мониторинг SLA, SLO, SLI, анализ инцидентов (postmortem) и управление изменениями;

  • Обеспечение безопасности, надежности, отказоустойчивости и быстрого восстановления после сбоев платформы;

Мы ждем от вас:

  • Практический опыт в администрировании и поддержке информационных систем семейства Linux (Debian);
  • Владение shell-скриптингом (bash, python) в качестве инструментария для автоматизации рутинной деятельности;
  • практический опыт применения систем оркестрации контейнеров (kubernetes, docker-compose, docker swarm);
  • Практический опыт по работе с контейнерами (docker), основы построения Dockerfile и лучших практик в этой области;
  • Владение системами управления конфигурациями и развертыванием приложений (ansible, terraform) и практический опыт применения таких систем в процессах построения IaC (Infrastructure as Code);
  • Применение инструментов GitLAB CI (написание пайплайнов) и Jenkins;
  • Практический опыт применения в работе и администрирования систем мониторинга на базе Prometheus, Zabbix, Grafana, Alert Manager, BlackBox;
  • Практический опыт взаимодействия с системами потоковой передачи событий (Kafka, RabbitMQ);
  • Знание систем управления agile, тикетных систем (Atlassian Jira, Bookstack и тд) и систем для совместной работы над накопленными знаниями (Atlassian Confluence и другие Wiki);
  • Практический опыт применения web-серверов и балансировщиков нагрузки (Nginx, Haproxy);
  • Практический опыт применения систем управления реляционными базами данных (PostgreSQL и MySQL), их кластеризация на базе Galera Cluster, Patroni, а также колоночной СУБД ClickHouse;
  • Практический опыт применения NoSQL и Key-Value систем (ElasticSearch, ETCD, Redis, Zookeeper);
  • Практический опыт применения систем централизованного сбора и хранения логов на базе стэков ELK (elasticsearch/opensearch, logstash/ fluentd/fluentbit/vector, kibana), Graylog, Loki;
  • Практический опыт применения систем объектного хранения на базе S3 (Minio), а также инструментов доступа к ним.