Ozon

Senior Data Scientist (NLP, LLM, VLM), Модели матчинга

Не указана

Москва
Полная занятость
Удаленная работа
От 3 до 6 лет

PySpark
Python
ML
NLP
LLM

Команда занимается развитием автоматического матчинга (поиска одинаковых товаров) как внутри Ozon, так и между Ozon и другими маркетплейсами. Среди текущих целей команды есть такие, как повышение полноты матчинга за счёт обучения новых текстовых и мультимодальных моделей.

Вам предстоит:

Аналитика текущий проблем матчинга.
Обучение новых NLP моделей (bi-encoder, late fusion, early fusion).
Адаптация новых LLM/VLM моделей.

Что мы ожидаем:

Коммерческий опыт в DS от 4 лет.
Опыт в NLP от 2 лет.
Опыт доведения моделей до прода.
Знание как современных, так и классических подходов в NLP.
Знание Python и PySpark (bigdata датасеты собираем на hadoop кластере).
Знание алгоритмов и структур данных.
Проактивность, большое желание развиваться, пробовать новое и добиваться от экспериментов пользы для production.

Будет плюсом:

Успешное участие в соревнованиях по ML.
Опыт в формировании протоколов разметки данных.
Опыт в матчинге.

Мы предлагаем:

Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce.
Свободу действий в принятии решений.
Достойный уровень заработной платы.
Профессиональную команду, которой мы гордимся.
Возможность развиваться вместе с нашим бизнесом.

Источник вакансии

Вернуться, к списку вакансий