Мы создаём продукты и сервисы для клиентов на основе предиктивных моделей с использованием методов машинного обучения и собственной платформы обработки больших данных.
Задачи
- Выполнение ad hoc задач по созданию и применению существующих моделей и сервисов
- Разработка различных моделей машинного обучения на новых данных
- Изучение и обработка данных из различных источников
- Внедрение регулярного расчёта новых признаков, улучшение мониторинга качества данных
- Генерация и проверка гипотез по повышению качества текущих моделей и созданию новых, более высокого качества
- Развитие инфраструктуры существующих сервисов
- Написание продуктивизируемых пайплайн-скриптов (не просто Jupyter Notebook) для внедрения моделей, признаков, а также для создания и поддержки функционирования новых продуктов
Требования
- Высшее техническое образование (с обязательным IT-профилем). Готовы также рассмотреть кандидатов с экономическим образованием или студентов последних курсов при условии наличия повышения квалификации на специализированных курсах (например, MADE VK, ШАД и так далее)
- Наличие релевантного коммерческого опыта от года
- Умение разрабатывать пайплайны для эффективной обработки данных в Python, Pyspark
- Желание заниматься и развиваться в задачах с классическим ML и DS, а также в задачах с развитием инфраструктуры development и production
- Глубокие знания классического ML
- Сильные математические знания (особенно по теории вероятностей и статистике), понимание математических основ алгоритмов машинного обучения
- Уверенное программирование на Python (базовый ООП и прикладные библиотеки — NumPy, Pandas, Sklearn, LightGBM, CatBoost, Pyspark)
- Знание SQL и основ баз данных
- Обязателен опыт в задачах DE/MLE
Будет плюсом
- Написание bash-скриптов, понимание возможностей интерфейса командной строки unix-подобных операционных систем
- Опыт решения базовых задач обработки текстовых данных и последовательностей
- Знание luigi