
Лига Цифровой Экономики
Data Engineer (Spark)
Не указана
- Apache Kafka
- SQL
- Apache Airflow
- Git
- ORACLE
- CI/CD
- Apache Spark
- Python
Лига в поисках Разработчика на проект крупного российского банка (ТОП-5). Основное направление продукта – цифровые финансовые активы. Предстоит участвовать в разработке операционной отчетности вместе с аналитиками.
Твои задачи:
- Перегружать данные (ETL) по маршруту: Источник -> ЕИС -> Ядро -> Витрины (или другие виды маршрутов): пакетная и потоковая загрузка
- Анализировать и контролировать качество данных
- Составлять бизнес-требования и вести бэклог по автоматизации отчетности
- Отрисовывать схемы (в Draw.IO или других приложениях)
- Общаться с заказчиком
Что мы ждем от тебя:
- Знание Python (понимание ООП)
- Опыт работы с PySpark (уровень самостоятельного написания DAG для ETL)
- Знание SQL на уровне составления сложных sql-запросов (Oracle)
- Умение переносить бизнесовые требования на технический язык
- Опыт работы с Apache Airflow, Apache Debezium, Apache Kafka, apache iceberg, S3, Git, работа с CI/CD-пайплайном
- Понимание Apache Flink / Apache NiFi
Что мы предлагаем:
- Возможность работы в удаленном формате
- Сессия профессионального развития персонала дважды в год, результатом которой является план индивидуального развития каждого сотрудника
- Сообщества по интересам, а также возможность организовать свое сообщество и получить поддержку от компании
- Корпоративная культура со своими ценностями и традициями, в которой каждый чувствует себя частью команды