Ecom.tech

Ведущий специалист по машинному обучению

Не указана
  • Москва
  • От 3 до 6 лет
  • Python
  • FastAPI
  • MLflow
  • Apache Airflow
  • PostgreSQL

Ищем Ведущего специалиста по машинному обучению в команду Умного поиска Самоката. Основной фокус: улучшение качества ответов и выдачи, работа с поисковым пайплайном, LLM/RAG и аналитикой качества, плюс реализация изменений в Python-коде сервиса.

Команда занимается:

  • Улучшение качества поиска и ответов: разбор ошибок, поиск паттернов, предложение гипотез;
  • Улучшение и доработка RAG;
  • Доработка эмбеддинг-моделей;
  • Настройка и улучшение метрик качества (precision/recall, offline eval, LLM-as-judge);
  • Проведение offline-экспериментов и подготовка изменений в продовом пайплайне;
  • Написание production-кода на Python (FastAPI, asyncio), тестов, бенчмарков;
  • Анализ влияния изменений на latency/качество/стоимость LLM;
  • Написание промптов.
  • Дообучение эмбеддинг-моделей, классификаторов и PEFT-адаптеров.

Обязательные навыки:

- Высшее образование (бакалавриат);
- Стаж работы по профилю не менее 2 лет;
- Python - Интеграция с внешними системами через API - владение на продвинутом уровне;
- SQL - владение на продвинутом уровне;
- NLP - Глубокий DL в контексте NLP (SoTA подходы, улучшения attention, детальное понимание архитектур и истории их развития) - владение на продвинутом уровне;
- АБ-тесты - владение на продвинутом уровне;
- Проектное управление - Умение вести сложные DS проекты с несколькими взаимозависимыми командами - владение на продвинутом уровне;
- Управление качеством DS продукта - организовывать end-to-end процесс с ориентацией на стратегию компании - владение на продвинутом уровне.

Стек команды:

Разработка: Python, PyTorch, FastAPI, Pydantic, GitLab, Docker, Prometheus, Grafana;
ML инфраструктура: JupyterHub, MLFlow, Airflow, PostgreSQL;
ML: Transformers, SGLang, Triton;
Процессы: Jira, Confluence.