IEK GROUP

Инженер качества данных /Data Quality Engineer, DQ

Не указана
  • Москва
  • От 3 до 6 лет
  • SQL
  • Python
  • Аналитическое мышление
  • ETL
  • DWH
  • Apache Airflow
  • Power BI
  • TFS
  • Gitlab
  • Английский — A1 — Начальный

IEK GROUP – один из ведущих производителей на рынке электротехнического оборудования. Мы разрабатывает и производим инновационные решения для энергетики, промышленности и инфраструктуры. Сейчас мы расширяем команду и ищем Инженера качества данных.

Вам предстоит работать в отделе Управления данными офиса Данных компании IEK. Отдел - 9 человек с прямым подчинением CDO.

2 daily в неделю по 30 минут + полчаса на работу с тасктрекером.

Удаленка, любые часовые пояса.

Ваша главная задача — гарантировать, что данные, поступающие из различных систем-источников (CRM, ERP и др.) в хранилище, остаются точными, полными и пригодными для принятия стратегических решений.

Вы будете выстраивать процессы кросс-проверок, профилировать сырые данные и внедрять стандарты качества, которые помогут бизнесу доверять каждой цифре в отчетах.

От кандидата ожидаем, что есть релевантный опыт в аналогичных проектах.

Чем предстоит заниматься:

  • Проектирование и внедрение DQ-фреймворка: разработка стратегии тестирования данных и внедрение инструментов автоматизированной проверки;
  • Контроль консистентности: написание тестов для проверки качества данных в DWH и на этапах ETL/ELT процессов;
  • Автоматизация проверок: внедрение мониторинга данных от журналов логов до совместных решений с отделом DS;
  • Автоматизация сбора метаданных: настройка и поддержка инжекторов (ingestion workflows);
  • Data Lineage: Настройка автоматического отслеживания путей движения данных (lineage);
  • Разработка метрик качества;
  • Data Governance: Внедрение и контроль заполнения глоссариев, тегов и описаний владельцами данных (Data Owners).

Наши ожидания:

  • Опыт работы в роли Data Quality Developer, Data Engineer или Data Quality Analyst с сильным бэкграундом в разработке;
  • Опыт построения систем качества данных с нуля: разработка и внедрение автоматизированных фреймворков проверки данных в пайплайны обработки;
  • Успешное участие в миграции данных: опыт написания скриптов валидации на входе/выходе при переносе данных между системами (ETL/ELT/EL);
  • Опыт профилирования данных с использованием Python (pandas, pyspark) и сложных SQL-запросов в DWH (ClickHouse, Greenplum).

Hard Skills:

  • SQL(Advanced): написание сложных аналитических запросов, понимание планов выполнения, опыт работы с оконными функциями;
  • Python: уверенное владение для написания скриптов автоматизации и работы с библиотеками (Pandas, Pytest и т.п.);
  • Опыт работы на проектах DWH / Data Catalog СУБД: SQL SERVER/PostgreSQL Плюсом: Airflow/OpenMetaData/GIT/VS/работа с совместными репозиториями;
  • Опыт применения ИИ в рабочих задачах.

Soft skills:

  • Инженерный подход: склонность автоматизировать рутинные проверки, писать переиспользуемый код и документировать логику валидации;
  • Скептицизм и критическое мышление: «Доверяй, но проверяй»;
  • Готовность аргументированно доказывать необходимость исправления ошибок через код и метрики;
  • Коммуникабельность: умение доносить до владельцев данных и разработчиков требования к чистоте данных, не ограничиваясь «закрытием инцидента»;
  • Стрессоустойчивость: способность быстро локализовать проблему в данных, читая код трансформаций и логи пайплайнов;
  • Документирование: педантичность в ведении документации (Data Catalog, Data Lineage, реестр инцидентов).

Мы предлагаем

  • Удаленный график работы;
  • Достойный уровень дохода (зависит от профессиональных компетенций);
  • Расширенный социальный пакет: ДМС, дополнительные отпускные дни, оплата больничного листа, материальная помощь в критических ситуациях, бесплатные оздоровительные/спортивные мероприятия;
  • Правительственные льготы – мы аккредитованная IT-компания;
  • Комфортная, доброжелательная рабочая атмосфера;
  • Корпоративные традиции и праздники, коллективные мотивационные программы.