VK

Senior Data Scientist в VK Predict

Не указана
  • Москва
  • Полная занятость
  • Полный день
  • От 1 года до 3 лет

Мы создаём продукты и сервисы для клиентов на основе предиктивных моделей с использованием методов машинного обучения и собственной платформы обработки больших данных.

Задачи

  • Выполнение ad hoc задач по созданию и применению существующих моделей и сервисов
  • Разработка различных моделей машинного обучения на новых данных
  • Изучение и обработка данных из различных источников
  • Внедрение регулярного расчёта новых признаков, улучшение мониторинга качества данных
  • Генерация и проверка гипотез по повышению качества текущих моделей и созданию новых, более высокого качества
  • Развитие инфраструктуры существующих сервисов
  • Написание продуктивизируемых пайплайн-скриптов (не просто Jupyter Notebook) для внедрения моделей, признаков, а также для создания и поддержки функционирования новых продуктов

Требования

  • Высшее техническое образование (с обязательным IT-профилем). Готовы также рассмотреть кандидатов с экономическим образованием или студентов последних курсов при условии наличия повышения квалификации на специализированных курсах (например, MADE VK, ШАД и так далее)
  • Наличие релевантного коммерческого опыта от года
  • Умение разрабатывать пайплайны для эффективной обработки данных в Python, Pyspark
  • Желание заниматься и развиваться в задачах с классическим ML и DS, а также в задачах с развитием инфраструктуры development и production
  • Глубокие знания классического ML
  • Сильные математические знания (особенно по теории вероятностей и статистике), понимание математических основ алгоритмов машинного обучения
  • Уверенное программирование на Python (базовый ООП и прикладные библиотеки — NumPy, Pandas, Sklearn, LightGBM, CatBoost, Pyspark)
  • Знание SQL и основ баз данных
  • Обязателен опыт в задачах DE/MLE

Будет плюсом

  • Написание bash-скриптов, понимание возможностей интерфейса командной строки unix-подобных операционных систем
  • Опыт решения базовых задач обработки текстовых данных и последовательностей
  • Знание luigi