WILDBERRIES

Senior Data Scientist в Know Your Employee [Trust and Safety]

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • Машинное обучение
  • SOTA
  • Python
  • PyTorch
  • MLflow

Wildberries и Russ — лидер рынков e-commerce и наружной рекламы в России и странах СНГ.
Ежедневно более 4 тысяч наших IT-специалистов создают цифровую экосистему, состоящую из сотен тысяч продуктов. На сегодня мы создали крупнейшую онлайн-платформу для покупки и продажи товаров в России и странах СНГ.

Вместе с масштабным развитием IT-направления мы формируем культуру Trust and Safety, гарантируя непрерывную безопасность и доверие между компанией, её сотрудниками, пользователями и клиентами.

KYE — платформа многофакторной оценки надёжности и выявления рисков на основе мультимодальных данных (текст, аудио, видео, документы, метаданные). Работаем в реальном времени, держим высокий порог качества и строго соблюдаем privacy/compliance. Сейчас команда в поисках Senior Data Scientist-а.

Наши задачи:

• Исследование и прототипирование SOTA-подходов: fusion-архитектуры, self-/weak-/contrastive learning для аудио/видео/текста/метаданных
• Разработка и вывод в продакшн: подготовка данных и разметки, обучение, калибровка, A/B/AA-тесты, оптимизация latency/throughput
• Построение воспроизводимых ML-пайплайнов, работа с онлайновыми фичами и стримингом; мониторинг дрейфа/качества, план retraining
• Объяснимость и UX: интерпретация выводов (XAI), понятные фичи и артефакты для бизнес-пользователей
• Аналитика данных: генерация гипотез, поиск аномалий/паттернов, улучшение метрик и устойчивости к обходам

Необходимые опыт и навыки:

• 3-5+ лет в ML/DS, продакшн-опыт в задачах классификации/антифрода/поведенческой аналитики и/или в модальностях аудио/видео/текста
• Сильный Python/SQL; опыт с PyTorch/TF; трекинг экспериментов (MLflow/W&B); практики код-ревью и тестирования
• Навыки работы с имбалансом, cost-sensitive метриками, калибровкой вероятностей, контролем FP/FN
• Понимание privacy/compliance и аккуратная работа с чувствительными данными


Будет плюсом, если у тебя есть:

• Опыт антиспуфинга, speaker/face verification, VAD/качество аудио, OCR, графовые признаки и graph ML
• Реальный опыт real-time/stream processing (Kafka/Flink), feature stores, оптимизации инференса под CPU/GPU
• Практика adversarial evaluation, hard-negative mining, data-centric улучшений

Что мы предлагаем:

Полная удаленка или свободное посещение офисов в Москве и Санкт-Петербурге
IT-ипотека и оформление в аккредитованную IT-компанию

• Бесплатное питание в офисах, ДМС со стоматологией (после испытательного срока)
• Корпоративное обучение и IT-мероприятия

Наш процесс найма:

• 30-минутное HR интервью, чтобы рассказать о себе и узнать больше о вакансии
• Техническое интервью длительностью 1.5 часа
• Финальное интервью с лидом длительностью 1 час