Ozon

Data Scientist, ML Global

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 1 года до 3 лет
  • Python
  • PyTorch
  • SQL
  • Алгоритмы и структуры данных
  • Математическая статистика
  • Computer Vision
  • Big Data
  • Deep Learning
  • PySpark

Мы ищем талантливого Data Scientist для нашей команды, которая проводит исследования и разработки в области NLP и работает с компьютерным зрением. Нам нужен кандидат, который уже имеет успешный коммерческий опыт обучения генеративных NLP моделей, отлично владеет PyTorch и готов развиваться в этой области.

Наш стек:

  • Для моделей PyTorch, Scikit-learn.
  • NLP: transformers, pymorphy, spacy, NLTK.
  • CV: OpenCV.
  • SQL (ClickHouse, Vertica), Hadoop (PySpark) AirFlow, MLFlow, Grafana.
  • В прод выкатываем через NVIDIA Triton (ONNX, TensorRT).
  • Confluence, Jira.

Задачи:

  • Разработка и обучение моделей машинного обучения для задач NLP и компьютерного зрения.
  • Анализ и обработка данных.
  • Работа с PyTorch.
  • Участие в R&D проектах.
  • Тестирование и оптимизация моделей.
  • Поддержка существующих моделей.

Нам важно:

  • Коммерческий опыт обучения генеративных NLP моделей от 2 лет.
  • Опыт обучения дискриминативных моделей.
  • Уверенное знание Python и PyTorch.
  • Знание алгоритмов и структур данных уровня LeetCode Medium.
  • Отличное знание классического ML и DL.
  • Опыт самостоятельного ведения задач на разных этапах проекта.
  • Опыт работы с большей частью нашего стека.

Будет плюсом:

  • Опыт работы с полным циклом обучения моделей от сбора данных до вывода в прод.
  • Опыт работы с CV задачами.