Портал продавцов — это юнит со всеми продуктами WB для продавцов. Здесь есть личный кабинет, загрузка и хранение контента, интеграция с поиском и каталогом, баланс продавца, откгрузка товаров и доставка до покупателя, аналитика и многое другое. Это 1/4 всего бизнеса WB. В сервисе более 1 млн. поставщиков, ежедневный оборот - 5 млрд. рублей.
Вам предстоит:
- Участвовать в разработке data-transfer инструмента, который позволит автоматизировать процесс перегрузки данных с различных источников;
- формировать хранилище данных на HDFS и ClickHouse;
- дорабатывать и оптимизировать существующие, а также писать новые Airflow-операторы;
- оптимизировать интеграции со стриминговыми источниками данных (Kafka);
- формировать витрины для аналитики и поставлять их в BI-инструмент.
- Имеете уверенный опыт программирования на Python (не менее 2-х лет);
- владеете опытом работы с hadoop (spark/yarn/hdfs/hive), с apache Airflow / Dagster и со Spark (Pyspark);
- имеете опыт в оптимизации SQL запросов (индексы, партицирование, шардирование и тд);
- владеете опытом работы с MPP СУБД (ClickHouse/GreenPlum/Vertica).