
Интеллектуальные Системы Управления
ML Engineer (Multi-modal)
- PyTorch
- HuggingFace
- OpenCV
- Whisper
- Tesseract
- PaddleOCR
- LlamaIndex
- LangChain
- NLP
- CV
- ASR
- OCR
- Triton
- ONNX
Наша компания занимается разработкой и развитием масштабной AI-системы, которая анализирует различные источники данных — внутренние архивы, архивы, веб, соцсети и многое другое — с целью выявления событий, акторов, геоданных и связей между ними.
Система формирует динамическую базу знаний и временные ряды для анализа корреляций, визуализации взаимосвязей и прогнозирования.
Вы будете работать с многоуровневой архитектурой данных (ETL, временные базы, векторные представления, графовые модели), участвовать в построении пайплайнов обработки и интеграции ML-моделей (NLP, NER, ASR, OCR, CV), а также создании инструментов для анализа, визуализации и поиска/
Мы решаем комплексные задачи: от построения data flow и feature store — до проектирования семантических графов и оркестрации пайплайнов моделей.
Приглашаем ML Engineer, который умеет работать с разными моделями и готов создавать передовые AI-решения на современных фреймворках.
Обязанности:
-
Построение и адаптация моделей с различными типами данных: NER, NLP, ASR, OCR, Computer Vision
-
Проведение fine-tuning и разработка inference pipelines
-
Подготовка и аннотирование данных для обучения моделей
-
Работа с HuggingFace для использования и дообучения предобученных моделей
-
Оптимизация моделей с помощью ONNX для ускорения вывода
-
Внедрение и сопровождение моделей в продукционных системах
Необходимый стек:
-
PyTorch, HuggingFace transformers
-
OpenCV для обработки изображений и видео
-
Whisper и OCR инструменты (Tesseract, PaddleOCR)
-
LlamaIndex, LangChain для работы с LLM и цепочками обработки
-
Векторные базы данных для поиска и хранения эмбеддингов
-
Triton Inference Server для развертывания и оптимизации inference
Требования:
-
Опыт разработки и внедрения моделей NLP, CV, ASR, OCR
-
Знание современных архитектур и методов в области мульти-модального машинного обучения
-
Умение работать с библиотеками PyTorch и HuggingFace
-
Опыт создания и оптимизации inference pipeline
-
Навыки подготовки и обработки данных для ML-задач
-
Опыт работы с инструментами для производства и управления моделями (ONNX, Triton)
-
Знание Python, понимание ML-цикла
-
Работа над передовыми проектами в области мульти-модального ИИ
-
Участие в масштабных проектах по обработке данных и автоматизации бизнес-процессов
-
Содействие в развитии компании, возможность влиять на продукт и процессы компании,
-
Работа в инновационной команде
-
Достойная, конкурентоспособная заработная плата
-
Удаленная работа, Гибкий график
-
Возможность профессионального развития
Уважаемые соискатели!
В связи с большим количеством поступивших откликов время обработки может быть увеличено. Просим вас отнестись к этому с пониманием.