Газпромбанк

Middle ML Engineer (CV, OCR, NLP)

Не указана
  • Москва
  • От 3 до 6 лет

ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:

  • Обучать модели в OCR-пайплайне: CNN, VLM, LLM;

  • Обучать модели для NLP-пайплайнов: классификация документов, NER, доменная адаптация;

  • Выдвигать и проверять гипотезы при реализации задач машинного обучения;

  • Участвовать в проработке архитектуры ml-пайплайнов;

  • Развивать генератор синтетических данных для обучения OCR-моделей;

  • Готовить модели для инференса и вывода в промышленную эксплуатацию

МЫ ЖДЕМ, ЧТО ВЫ:

  • Имеете коммерческий опыт работы с задачами компьютерного зрения и NLP от 1–2 лет;

  • Работали с задачами: OCR (распознавание текста), детекции объектов, сегментации изображений;

  • Работали с мультимодальными моделями (Vision-Language Models, VLM);

  • Занимались выводом CV-моделей в продакшн (deployment, мониторинг, поддержка);

  • Знаете и имеете опыт решения ключевых задач NLP: классификация текстов, NER, суммаризация, поиск и др.;

  • Применяли классические методы (TF-IDF, word2vec и др.) и современные подходы (transformer-based модели);

  • Работали с Large Language Models (LLM), VLM не менее года;

  • Занимались дообучением моделей: с использованием адаптеров (LoRA, PEFT и др.) и full fine-tuning;

  • Использовали инструменты: ONNX, TensorRT, vLLM, SGLang;

  • Занимались сбором и подготовкой данных для CV и NLP задач: веб-скрапинг, парсинг открытых источников, генерация синтетических данных;

  • Понимаете проблемы качества данных и методы их решения.

БУДЕТ ПЛЮСОМ, ЕСЛИ ВЫ:

  • Занимались построением решений на базе LLM, VLM: чат-боты, RAG-системы, агентные пайплайны;

  • Имеете опыт вывода LLM, VLM в продакшн, ускорения и оптимизации моделей квантизация, pruning, batching и др.;

  • Работали с мультимодальными пайплайнами (CV + NLP + LLM);

  • Занимались построением end-to-end ML систем.

ЧТО МЫ ПРЕДЛАГАЕМ:

  • Достойный уровень вознаграждения;
  • ДМС со стоматологией с первого месяца работы;
  • Отпуск 33 дня;
  • Полное соблюдение ТК РФ.