RWB (Wildberries & Russ)

Data Engineer (Портал Продавцов)

Не указана
  • Москва
  • От 3 до 6 лет

Портал продавцов — это юнит со всеми продуктами WB для продавцов. Здесь есть личный кабинет, загрузка и хранение контента, интеграция с поиском и каталогом, баланс продавца, откгрузка товаров и доставка до покупателя, аналитика и многое другое. Это 1/4 всего бизнеса WB. В сервисе более 1 млн. поставщиков, ежедневный оборот - 5 млрд. рублей.

Вам предстоит:

  • Участвовать в разработке data-transfer инструмента, который позволит автоматизировать процесс перегрузки данных с различных источников;
  • формировать хранилище данных на HDFS и ClickHouse;
  • дорабатывать и оптимизировать существующие, а также писать новые Airflow-операторы;
  • оптимизировать интеграции со стриминговыми источниками данных (Kafka);
  • формировать витрины для аналитики и поставлять их в BI-инструмент.
Вы нам подходите, если:
  • Имеете уверенный опыт программирования на Python (не менее 2-х лет);
  • владеете опытом работы с hadoop (spark/yarn/hdfs/hive), с apache Airflow / Dagster и со Spark (Pyspark);
  • имеете опыт в оптимизации SQL запросов (индексы, партицирование, шардирование и тд);
  • владеете опытом работы с MPP СУБД (ClickHouse/GreenPlum/Vertica).