ATI.SU

Database Administrator - ML Ops

Не указана
  • Санкт-Петербург
  • От 3 до 6 лет
  • PostgreSQL
  • SQL
  • Ansible
  • MongoDB
  • Clickhouse
  • GitLab CI

Мы ищем инженера, который возьмёт на себя архитектурную и операционную ответственность за PostgreSQL-инфраструктуру, лежащую в основе наших аналитических и ML-систем. Эта роль — не администрирование, а проектирование надёжной, масштабируемой и предсказуемой среды для работы с данными, при этом полностью освобождая разработчиков и дата-сайентистов от необходимости взаимодействовать с БД напрямую.

Наши данные — это не просто таблицы. Это:

  • карта грузоперевозок в реальном времени,

  • история взаимодействий с клиентами,

  • обогащённые события, используемые в моделях машинного обучения.

Если поток данных нарушается, даже незаметно, очередь в RabbitMQ исчезает, партиция не создаётся, ETL зависает. Это напрямую влияет на качество решений, принимаемых как системами, так и людьми. Мы не допускаем ситуаций, когда данные молча становятся неполными или устаревшими. Твоя задача — построить систему, в которой такие сценарии либо невозможны, либо мгновенно обнаруживаются.

Основные обязанности:

  • Проектирование и развитие архитектуры PostgreSQL-кластеров (схемы, базы, партиционирование, репликация);

  • Обеспечение целостности, доступности и производительности данных при объёмах >5 ТБ и таблицах >500 ГБ;

  • Разработка и поддержка агрегатных таблиц, материализованных представлений и хранимых процедур, используемых в аналитике и ML;

  • Настройка мониторинга не только инфраструктурных метрик, но и семантической полноты данных (например: «поступают ли новые записи в таблицу X?»);

  • Автоматизация жизненного цикла БД через IaC (Ansible, GitLab CI): развёртывание, бэкапы, восстановление, проверка отказоустойчивости;

  • Ревью изменений в схемах, контроль за качеством запросов, оптимизация производительности (индексы, планировщик, VACUUM/ANALYZE, настройка postgresql.conf);

  • Документирование архитектурных решений, процессов и процедур.

Что мы ожидаем:

  • Глубокое понимание PostgreSQL: внутреннее устройство, управление памятью, WAL, MVCC, работа планировщика, тонкости партиционирования;

  • Практический опыт работы с высоконагруженными кластерами и большими объёмами данных;

  • Умение проектировать масштабируемую структуру БД: грамотное распределение по схемам и базам, избегание анти-паттернов;

  • Опыт автоматизации через IaC, но с пониманием границ применимости — не всё должно быть кодом;

  • Способность чётко объяснять инженерам и аналитикам, почему то или иное решение в БД критично — без жаргона, но без упрощений;

  • Готовность работать на стыке Data Engineering, DevOps и Data Science.

MSSQL, MongoDB, ClickHouse — присутствуют в стеке, но PostgreSQL — основной фокус и зона ответственности.

Почему эта роль значима:

  • Ты не будешь реагировать на инциденты — ты построишь систему, в которой их не возникает;

  • Твои решения напрямую влияют на то, насколько точно продукт «видит» реальность;

  • Разработчики и ML-инженеры не взаимодействуют с БД — потому что ты обеспечиваешь им готовые, надёжные и эффективные интерфейсы к данным.

Бонусы, которые мы предоставляем:

  • Работа в аккредитованной IT-компании с возможностью предоставления отсрочки;
  • Гибридный формат работы в офисе класса А на берегу Большой Невки;
  • ДМС со стоматологией и психотерапевтом, доплата больничных до оклада;
  • Компенсация питания: горячие обеды и здоровые перекусы в офисе;
  • Внутренние мероприятия - хакатоны, мастер-классы, митапы;
  • Постоянно пополняющаяся библиотека с профлитературой;
  • Комнаты отдыха с PlayStation, настольным теннисом и кикером, пещеры для сна;
  • Укомплектованный мини-спортзал, душевые, йога в офисе;
  • Компенсация спорта.

Друзья, пожалуйста, обратите внимание: у нас гибридный формат работы. Это значит, что дважды в неделю нужно будет приезжать в офис, который находится в Петербурге. Полностью удалённая работа у нас не предоставляется.