
Ozon
Data Scientist, ML Global
Не указана
- Python
- PyTorch
- SQL
- Алгоритмы и структуры данных
- Математическая статистика
- Computer Vision
- Big Data
- Deep Learning
- PySpark
Мы ищем талантливого Data Scientist для нашей команды, которая проводит исследования и разработки в области NLP и работает с компьютерным зрением. Нам нужен кандидат, который уже имеет успешный коммерческий опыт обучения генеративных NLP моделей, отлично владеет PyTorch и готов развиваться в этой области.
Наш стек:
- Для моделей PyTorch, Scikit-learn.
- NLP: transformers, pymorphy, spacy, NLTK.
- CV: OpenCV.
- SQL (ClickHouse, Vertica), Hadoop (PySpark) AirFlow, MLFlow, Grafana.
- В прод выкатываем через NVIDIA Triton (ONNX, TensorRT).
- Confluence, Jira.
Задачи:
- Разработка и обучение моделей машинного обучения для задач NLP и компьютерного зрения.
- Анализ и обработка данных.
- Работа с PyTorch.
- Участие в R&D проектах.
- Тестирование и оптимизация моделей.
- Поддержка существующих моделей.
Нам важно:
- Коммерческий опыт обучения генеративных NLP моделей от 2 лет.
- Опыт обучения дискриминативных моделей.
- Уверенное знание Python и PyTorch.
- Знание алгоритмов и структур данных уровня LeetCode Medium.
- Отличное знание классического ML и DL.
- Опыт самостоятельного ведения задач на разных этапах проекта.
- Опыт работы с большей частью нашего стека.
Будет плюсом:
- Опыт работы с полным циклом обучения моделей от сбора данных до вывода в прод.
- Опыт работы с CV задачами.