Лига Цифровой Экономики

Data Engineer (Spark)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 1 года до 3 лет
  • Apache Kafka
  • SQL
  • Apache Airflow
  • Git
  • ORACLE
  • CI/CD
  • Apache Spark
  • Python

Лига в поисках Разработчика на проект крупного российского банка (ТОП-5). Основное направление продукта – цифровые финансовые активы. Предстоит участвовать в разработке операционной отчетности вместе с аналитиками.

Твои задачи:

  • Перегружать данные (ETL) по маршруту: Источник -> ЕИС -> Ядро -> Витрины (или другие виды маршрутов): пакетная и потоковая загрузка
  • Анализировать и контролировать качество данных
  • Составлять бизнес-требования и вести бэклог по автоматизации отчетности
  • Отрисовывать схемы (в Draw.IO или других приложениях)
  • Общаться с заказчиком

Что мы ждем от тебя:

  • Знание Python (понимание ООП)
  • Опыт работы с PySpark (уровень самостоятельного написания DAG для ETL)
  • Знание SQL на уровне составления сложных sql-запросов (Oracle)
  • Умение переносить бизнесовые требования на технический язык
  • Опыт работы с Apache Airflow, Apache Debezium, Apache Kafka, apache iceberg, S3, Git, работа с CI/CD-пайплайном
  • Понимание Apache Flink / Apache NiFi

Что мы предлагаем:

  • Возможность работы в удаленном формате
  • Сессия профессионального развития персонала дважды в год, результатом которой является план индивидуального развития каждого сотрудника
  • Сообщества по интересам, а также возможность организовать свое сообщество и получить поддержку от компании
  • Корпоративная культура со своими ценностями и традициями, в которой каждый чувствует себя частью команды