Интеллектуальные Системы Управления

ML Engineer (Multi-modal)

Не указана
  • Санкт-Петербург
  • Полная занятость
  • Удаленная работа
  • От 1 года до 3 лет
  • PyTorch
  • HuggingFace
  • OpenCV
  • Whisper
  • Tesseract
  • PaddleOCR
  • LlamaIndex
  • LangChain
  • NLP
  • CV
  • ASR
  • OCR
  • Triton
  • ONNX

Наша компания занимается разработкой и развитием масштабной AI-системы, которая анализирует различные источники данных — внутренние архивы, архивы, веб, соцсети и многое другое — с целью выявления событий, акторов, геоданных и связей между ними.
Система формирует динамическую базу знаний и временные ряды для анализа корреляций, визуализации взаимосвязей и прогнозирования.

Вы будете работать с многоуровневой архитектурой данных (ETL, временные базы, векторные представления, графовые модели), участвовать в построении пайплайнов обработки и интеграции ML-моделей (NLP, NER, ASR, OCR, CV), а также создании инструментов для анализа, визуализации и поиска/

Мы решаем комплексные задачи: от построения data flow и feature store — до проектирования семантических графов и оркестрации пайплайнов моделей.

Приглашаем ML Engineer, который умеет работать с разными моделями и готов создавать передовые AI-решения на современных фреймворках.

Обязанности:

  • Построение и адаптация моделей с различными типами данных: NER, NLP, ASR, OCR, Computer Vision

  • Проведение fine-tuning и разработка inference pipelines

  • Подготовка и аннотирование данных для обучения моделей

  • Работа с HuggingFace для использования и дообучения предобученных моделей

  • Оптимизация моделей с помощью ONNX для ускорения вывода

  • Внедрение и сопровождение моделей в продукционных системах

Необходимый стек:

  • PyTorch, HuggingFace transformers

  • OpenCV для обработки изображений и видео

  • Whisper и OCR инструменты (Tesseract, PaddleOCR)

  • LlamaIndex, LangChain для работы с LLM и цепочками обработки

  • Векторные базы данных для поиска и хранения эмбеддингов

  • Triton Inference Server для развертывания и оптимизации inference

Требования:

  • Опыт разработки и внедрения моделей NLP, CV, ASR, OCR

  • Знание современных архитектур и методов в области мульти-модального машинного обучения

  • Умение работать с библиотеками PyTorch и HuggingFace

  • Опыт создания и оптимизации inference pipeline

  • Навыки подготовки и обработки данных для ML-задач

  • Опыт работы с инструментами для производства и управления моделями (ONNX, Triton)

  • Знание Python, понимание ML-цикла

Условия:
  • Работа над передовыми проектами в области мульти-модального ИИ

  • Участие в масштабных проектах по обработке данных и автоматизации бизнес-процессов

  • Содействие в развитии компании, возможность влиять на продукт и процессы компании,

  • Работа в инновационной команде

  • Достойная, конкурентоспособная заработная плата

  • Удаленная работа, Гибкий график

  • Возможность профессионального развития

Уважаемые соискатели!

В связи с большим количеством поступивших откликов время обработки может быть увеличено. Просим вас отнестись к этому с пониманием.