Amex Development

Data Engineer

До 330 000 RUR

Москва
Полная занятость
Удаленная работа
От 3 до 6 лет

Python
PySpark
Hive
Hadoop
Cassandra
ORACLE
k8s
Gitlab
Docker
Airflow
SQL
PL SQL
Spark
PostgeSQL
Kafka
Git
ETL

Удаленная работа!
Пожалуйста указывайте в сопроводительном письме Вашу локацию в РФ и желаемый/ожидаемый уровень оплаты в рублях.

О проекте:
Формирование данных из разных источников об абоненте в единого экосистемного клиента c эталонной информацией о нём. Cоздание эталонной базы клиентов на основании исходных записей в учётных системах организации и экосистемы.
Состав команды: 4 аналитика, 3 разработчика, 2 QA, Devops.

Задачи:

Разработка и оптимизация ETL-процессов при помощи pyspark;
Разработка витрин и постановка на расписание через Airflow;
Мониторинг целостности данных в БД;
Настройка ETL процессов загрузки данных через стриминги (spark streaming);
Работы по повышения отказоустойчивости и скорости работы дата части сервисов.

Требования:

Опыт 3-6 лет, middle+/senior;
Коммерческий опыт с SQL + PL SQL, Python, Spark, Hive, Hadoop, Airflow, PostgeSQL, Kafka, Git;
Очень желателен опыт с Cassandra, Oracle, k8s.

Стек проекта:
Python, Pyspark, Hive, Hadoop, Gitlab, Docker, Cassandra, Oracle, k8s.

Источник вакансии

Вернуться, к списку вакансий