Обязанности:
- Исследование, проектирование и внедрение ML-моделей в областях компьютерного зрения (CV) и обработки естественного языка (NLP).
- Развертывание и оптимизация пайплайнов инференса на GPU-серверах для рабочих нагрузок в продакшне.
- Разработка мультимодальных AI-функций (текст, изображения, видео, аудио) и их интеграция в продукт.
- Масштабирование производительности и пропускной способности моделей для работы с быстро растущей пользовательской базой.
- Тесное взаимодействие с бэкенд-инженерами для создания готовых к продакшну API.
- Проведение экспериментов, A/B-тестов и оценка моделей на основе взаимодействия с реальными пользователями.
- 5+ лет практического опыта в разработке ML/AI.
- Глубокие знания Python и фреймворков машинного обучения (PyTorch или TensorFlow).
- Прочные знания в областях NLP (LLM, эмбеддинги, трансформеры) и CV (генерация изображений, диффузионные модели, обработка видео).
- Опыт работы с обучением и инференсом на GPU.
- Хорошее знание методов оптимизации моделей (квантизация, дистилляция, батчинг, кэширование).
- Практический опыт вывода ML-сервисов в продакшн.
- Опыт работы с видео AI-моделями.
- Английский язык - B2.
- Знание высоконагруженных систем.
- Знакомство с инструментами мониторинга и аналитики (Weights & Biases, MLflow, Grafana и т.д.).
- Опыт работы с чат-ботами, мессенджерами или диалоговыми AI.
Условия:
- Работа в продуктовой компании.
- Удаленный формат работы.
- Атмосфера стартапа.
- Ключевое влияние на продукт.
- Заработная плата + опционы.