Ozon

Senior Data Scientist (NLP, LLM, VLM), Модели матчинга

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • PySpark
  • Python
  • ML
  • NLP
  • LLM

Команда занимается развитием автоматического матчинга (поиска одинаковых товаров) как внутри Ozon, так и между Ozon и другими маркетплейсами. Среди текущих целей команды есть такие, как повышение полноты матчинга за счёт обучения новых текстовых и мультимодальных моделей.

Вам предстоит:

  • Аналитика текущий проблем матчинга.
  • Обучение новых NLP моделей (bi-encoder, late fusion, early fusion).
  • Адаптация новых LLM/VLM моделей.

Что мы ожидаем:

  • Коммерческий опыт в DS от 4 лет.
  • Опыт в NLP от 2 лет.
  • Опыт доведения моделей до прода.
  • Знание как современных, так и классических подходов в NLP.
  • Знание Python и PySpark (bigdata датасеты собираем на hadoop кластере).
  • Знание алгоритмов и структур данных.
  • Проактивность, большое желание развиваться, пробовать новое и добиваться от экспериментов пользы для production.

Будет плюсом:

  • Успешное участие в соревнованиях по ML.
  • Опыт в формировании протоколов разметки данных.
  • Опыт в матчинге.

Мы предлагаем:

  • Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce.
  • Свободу действий в принятии решений.
  • Достойный уровень заработной платы.
  • Профессиональную команду, которой мы гордимся.
  • Возможность развиваться вместе с нашим бизнесом.