Red Petroleum

Senior Data Scientist

От 120 000 KGS
  • Бишкек
  • Полная занятость
  • Полный день
  • От 3 до 6 лет
Обязанности:
  • Транслировать бизнес-цели в DS-задачи; определять метрики успеха и «ограничители» Строить признаки на основе DWH Alfa Oil (лояльность RedPay, POS, продажи топлива);
  • Документировать логику для повторного использования Проводить EDA и строгий статистический анализ; обучать и валидировать модели (приоритет объяснимым моделям (напр., SHAP/LIME) для принятия бизнес-подразделениями).
  • Совместно с Дата инженером обеспечивать бесшовную подачу результатов (сегменты, скоринги) в Power BI через витрины DWH, а также в приложения-клиенты компании (например, систему лояльности RedPay) Планировать и оценивать эксперименты (A/B, при необходимости CUPED/стратификация);
  • Считать uplift и ROI Вместе с Дата инженером обеспечить: пакетирование кода, регистрацию артефактов, расписание batch-скоринга (Airflow), дата контрактов, SLA, мониторинг дрейфа/качества и т.д.
  • Чётко доносить выводы и рекомендации для бизнес-подразделений; передавать playbook’и для BI/маркетинга
Требования:
  • Классические ML-алгоритмы (глубокое понимание): деревья/градиентный бустинг (XGBoost/Catboost и т.д.), линейная/логистическая регрессия, SVM, k-means/DBSCAN и т.д.; Понимание основных терминов и концепций DS/ML (метрики, регуляризация и т.д.)
  • Рекомендательные системы (обязательно): похожесть/implicit MF (ALS/BPR), ранжирование (GBDT, двухбашенные модели + re-rank); MAP@K/NDCG и бизнес-эффект (uplift)
  • Python-стек: scikit-learn, pandas/или polars, numpy и другие типовые библиотеки и фреймворки для анализа данных и классического (табулярного) ML.
  • Статистика: EDA, распределения и пропуски, проверка гипотез, мощности и интервалы, множественные сравнения; диагностика регрессий; основы временных рядов (сезонность/праздники)
  • A/B-тесты: дизайн, выбор главных/страхующих метрик, стратификация/CUPED, корректная интерпретаци.
  • Опыт A/B тестов в продакшене (не только теория)
  • Вывод в прод моделей: упаковка/версионирование моделей и данных, планирование батчевого скоринга (Airflow), сохранение в витрины/API, трекинг с MLflow (или аналогом)
  • Облака и инструменты: опыт ML на Azure/AWS/GCP (GCP — плюс); Git + Docker
    Дополнительным плюсом будет:
    Понимание и возможность применения инструментов DL: PyTorch/TensorFlow; основы по NLP/LLM, CV и табличным DNN (при необходимости)
    Feature store: Feast/Tecton или «feature-store-lite» на базе DWH + dbt
    Потоки: базовое понимание Kafka/Redpanda; умение адаптировать batch-признаки к near-real-time
    DWH/пайплайны: SQL по ClickHouse/Postgres, шаблоны dbt, базовая работа с Airflow
    Доменные знания: ритейл/топливо, опыт работы с клиентской сегментацией и аналитикой, промо-эластичность, аномалии/фрод
    Опыт топливного ритейла или схожих отраслей (FMCG, транспорт)
Условия:
  • Пятидневную рабочую неделю с 8:30 до 17:30

  • Дружелюбный коллектив

  • Комфортный офис в центре города

  • Отлично развитую корпоративную культуру.