Riverstart (ООО Риверстарт)

ML-инженер (Middle)

Не указана
  • Москва
  • От 1 года до 3 лет
  • Машинное обучение
  • Bash
  • Docker
  • Apache Airflow
  • MLflow
  • SQL
  • Deep Learning
  • Kubernetes

IT компания Riverstart — аккредитованы в Минцифры, входим в реестр МТК,
являемся участником Торгово-промышленной палаты РФ и Нижнего Новгорода.

С 2024г разрабатываем решения в области видео-аналитики, AI и ML. Развиваем собственный R&D центр решений в области прикладной математики и искусственного интеллекта.

В 2025г мы успешно выпустили 3 собственных продукта, основанных на алгоритмах машинного обучения.

Работаем с государством и бизнесом создавая высоконагруженные сервисы для веба и мобайла: сервисы, веб-платформы, мобильные приложения, CRM, LMS и ERP-системы.

Среди наших клиентов: Ассоциация волонтерских центров «Добро.рф», ПФК ЦСКА, Правительство Нижегородской области, Международный аэропорт «Внуково», МТС, Lamoda, «Северная долина», ХК «Спартак» Москва, ХК «Торпедо», «РОС-Химия», ГНИВЦ, ПИМУ, Фонд «Сколково» и другие компании.

Входим в топ-20 разработчиков сложных проектов в России и занимаем первую строку в рейтинге агентств по поддержке и развитию сайтов (Рейтинг Рунета 2025).

Взяли 50 наград в федеральных и международных IT-конкурсах: «Золотой сайт», «Рейтинг Рунета», «МИКС Россия» Workspace Digital Awards, Tagline Awards, Ruward Awards, G8 Creative Awards и других.

__________________

Создаём AI-системы для интеллектуальной обработки документов в закрытом контуре: извлечение структурированных данных из текстов, таблиц, сканов и изображений, построение RAG / graph-RAG, работа с локально развёрнутыми LLM. Ищем Middle ML-инженера, который отвечает за качество извлечения и поиска и доводит модель от сырых данных до продакшена

Обязанности:

  • Строить пайплайны обработки документов: парсинг, OCR, извлечение
    структурированных данных из текста, таблиц, сканов и изображений.
  • Проектировать и развивать RAG / graph-RAG системы: эмбеддинги, гибридный поиск, ранжирование, чанкинг.
  • Работать с self-hosted LLM: сервинг, оптимизация, дообучение (SFT / LoRA) под прикладные задачи.
  • Отвечать за метрики качества и их воспроизводимость — строить полноценный eval, а не оценивать результат «на глаз».

Требования:

  • Опыт коммерческой ML-разработки или эквивалентная сложность петпроектов от 2 лет.
  • Профильное высшее образование с математическим, физико-математическим или IT-профилем (прикладная математика, информатика, CS, ML и смежные). Важна сильная математическая база.
  • Продвинутая математика и статистика (линейная алгебра, оптимизация, проверка гипотез, bias-variance) с умением применять на практике.
  • Industrial Python: кастомные трансформеры, numba, асинхронные FastAPI-сервисы; тесты, профилирование, типизация.
  • Unix как среда обитания: bash-скрипты, Docker-compose, systemd, отладка контейнеров, базовая работа с K8s.
  • Production-ready ML-пайплайны: EDA → инжиниринг → обучение → валидация → деплой + мониторинг дрейфа. Опыт с Airflow, MLflow, DVC.
  • Уверенное построение RAG-систем: векторные БД, эмбеддинги, чанкинг, промптинжиниринг, оценка качества, деплой.
  • Уверенный SQL и работа с большими данными (PySpark / Polars), оптимизация запросов и пайплайнов.
  • Опыт внедрения модели в продакшн или несколько сложных end-to-end проектов в GitHub с документацией и тестами.
  • Опыт code review, написания документации, передачи знаний.

Будет плюсом:

  • Graph-RAG: построение графа знаний, multi-hop поиск, community-detection ретрив.
  • Document intelligence: OCR и layout-анализ сложных сканов, парсинг таблиц, VLM для анализа изображений и чертежей.
  • Опыт с локально развёрнутыми LLM (vLLM / TGI / llama.cpp), квантизация, дообучение.
  • Deep learning (PyTorch), распределённое обучение (DeepSpeed, FSDP).
  • Объективное сравнение моделей: статистические тесты на метриках, bootstrap.
  • Публичные выступления, конференции, поддержка open-source.

Условия:

  • Реальное влияние на то, какие продукты берутся в работу, и как они устроены.
  • Возможность карьерного роста.
  • Трудоустройство в аккредитованной IT-компании, рассматриваем и сотрудничество по ИП.
  • Удалённый или гибридный формат, гибкий график.
  • Конференции и митапы, командные выезды и неформальные посиделки.