Мы — небольшая DS/ML-команда полного цикла внутри большой компании, где всё ещё витает дух стартапа, но уже есть стабильность.
Цель команды — нанести непоправимую пользу бизнесу за счёт модернизации внутренних и внешних бизнес-процессов компании.
Основное направление — NLP и всё, что с ним связано, но жёсткой привязки к проектам и технологиям нет. Мы открыты для всего, что приносит пользу бизнесу.
Сейчас мы в поиске MLOps специалиста, который разберется в текущих CI/CD пайплайнах и внедрит новые практики по мониторингу качества работы моделей и их автоматическому обучению.
Наши проекты
1. Классификация пользовательских обращений по тематикам
2. Умный поиск по документации на основе LLM+RAG технологий
3. Распознавание изображений и документов (в т.ч. NER)
4. Транскрибация аудио файлов в текст
5. Сервинг LLM в контуре компании
Какие будут задачи:
- Организация и поддержка инфраструктуры для развертывания ML/AI моделей на GPU - серверах
- Автоматизация процессов поставки ML/AI-моделей: настройка пайплайнов CI/CD для обучения, тестирования и деплоя
- Настройка мониторинга качества работы ml-сервисов и моделей, drift'ов данных и целевых переменных
- Внедрение фреймворков контроля качества данных, моделей например Deepchecks / Evidently
- Настройка мониторинга качества работы ml-сервисов
- Решение задач по оптимизации инференса ml-моделей
Наши ожидания от Вас:
- Имеете высшее техническое образование
- Опыт работы в MLOps или DevOps со специализацией в области машинного обучения
- Опыт разработки и эксплуатации ML-пайплайнов, понимание жизненного цикла ML моделей
- Знание Docker и Kubernetes: создание, управление и оркестрация контейнеров.
- Знание CI/CD инструментов: Jenkins, Ansible
- Опыт настройки и использования систем мониторинга Prometheus + Grafana
- Опыт интеграции проверок в CI/CD-процессы, ML-инфраструктуру
- Опыт работы с Mlflow, Airflow
- Коммуникабельны, проактивны, организованы и готовы к командной работе
Будет плюсом:
- Опыт работы с Kubeflow
- Опыт внедрения фреймворков контроля качества данных\моделей: Evidently, Deepchecks
- Опыт работы с Inference серверами (vLLM, TGI, Triton)
- Навыки построения тестов качества данных / фичей в ML-продуктах
- Навыки анализа качества данных на входе в модель (drift, feature stability, missing data)