X5 Digital

Data Scientist/ML Engineer

Не указана
  • Москва
  • Полная занятость
  • Полный день
  • От 3 до 6 лет
  • Spark
  • Hive
  • MLflow
  • ML
  • AirFlow
  • MLOps
  • Forecasting

Наш стек: классический ML (CatBoost, XGBoost, PyTorch и т.д.), временные ряды.

Чем предстоит заниматься:

  • feature engineering для ML модели;
  • поиском неочевидных подходов к решению задачи прогнозирования (готовность пробовать новые подходы и не зацикливаться на бустингах);
  • внедрением ML-моделей в рабочие процессы;
  • взаимодействие с бизнесом.

Пожелания к опыту:

  • опыт работы в области машинного обучения от 3 лет;
  • отличные знания математического аппарата (теория вероятностей, математическая статистика, линейная алгебра, вычислительная математика);
  • понимание как устроены основные ML-алгоритмы (от линейной регрессии до трансформеров);
  • опыт работы с PySpark;
  • уверенные знания Pandas, CatBoost, PyTorch;
  • уверенные знания Python3, Pytest, алгоритмов и структур данных;
  • опыт работы с SQL.

Будет плюсом:

  • успешное участие в соревнованиях по машинному обучению;
  • опыт в проведении А/Б тестов;
  • опыт с Big Data стеком (Spark, Hive, AirFlow, Kafka);
  • опыт самостоятельного проектирования и внедрения ML моделей;
  • опыт работы с инструментами MlOps (MLFlow, DVC);
  • держите руку на пульсе и интересуетесь, что происходит в ML-мире (интерес к SOTA-подходам к табличным данным, и есть представление о GNN).