СберПраво

Team Lead RND / Senior Data Scientist NLP

Не указана
  • Москва
  • Полная занятость
  • Полный день
  • От 3 до 6 лет
  • LLM
  • Natural Language Processing
  • RUG

Мы — R&D команда проекта GigaLegal в СБЕР, создающая решения в правовой сфере на основе LLM для автоматизации юридических процессов.

Наша цель — трансформировать работу юристов, бизнеса и госструктур через:

  • Автоматизацию анализа договоров и юридических документов
  • Интеллектуальную генерацию правовых текстов
  • Разработку специализированных юридических чат-ботов
  • Создание автономных юридических ИИ-агентов

Мы в поиске опытного TL|Senior-специалиста, который возьмет на себя ответственность за разработку и внедрение LLM-решений, способных масштабировать бизнес-процессы наших клиентов.

Чем предстоит заниматься?

LLM-ориентированные решения :

Проектирование и реализация стратегий адаптации LLM (prompting, fine-tuning, LoRA, RLHF) под специфику юридических задач.

Проектирование и разработка пайплайнов для обработки юридических данных (RAG, агентские системы, семантический поиск).

Проектирование навыков и обучение LLM и NLP/Сlassic ML моделей для реализации бизнес-задач

Оптимизация производительности LLM в production (латентность, стоимость, точность).

Продакшен-инжиниринг :

Внедрение DS-моделей в production с использованием MLOps-практик (CI/CD, мониторинг, A/B-тесты).

Интеграция решений с внешними API, работа с векторными базами, поисковыми движками (ElasticSearch).

Проектирование отказоустойчивых систем для обработки конфиденциальных юридических данных.

Работа с SQL/No SQL БД

Лидерство и экспертиза :

Участие в постановке технических требований и взаимодействие с бизнес-заказчиками.

Проработка с юридическими экспертами, системными аналитиками, стороной заказчиков требований и вариантов решения задач

Проработка с отделом обучения тестовой и обучающей разметки для обучения юридическим навыкам GigaChat и других LLM

Менторство младших коллег, code review, разработка best practices для команды.

Анализ рисков и поиск компромиссов между качеством моделей, скоростью и стоимостью.

Возможно лидирование RND команды проекта и позиция TeamLead

Необходимые навыки:

Опыт : 3+ лет в DS/NLP, включая 1+ год работы с LLM, опыт с production.

Технические навыки :

Готовность как писать код, пайплайны, обучать модели, так и писать документацию, проектировать системы и готовить спецификации на модели, данные, пайплайны.

Глубокая экспертиза в адаптации LLM: SFT, RLHF, LoRA, prompt engineering.

Опыт построения RAG-систем, агентских пайплайнов и сервисов на основе LLM.

Знание современных фреймворков (PyTorch, Hugging Face, LangChain, LlamaIndex).

Уверенная работа с инфраструктурой: Docker, Kubernetes, облачные платформы.

Понимание MLOps: CI/CD, мониторинг дрифта данных, логирование.

Бизнес-ориентированность :

Опыт трансформации бизнес-задач в технические требования.

Умение оценивать ROI DS-решений и балансировать между инновациями и практичностью.

Умение быстро делать прототипы решений и искать баланс между скоростью/качеством/производительностью.

Soft Skills :

Умение аргументировать технические решения перед заказчиками.

Опыт управления мини-проектами и координации команд.

Умение коммуницировать с заказчиками и экспертами в различных доменных областях.

Будет преимуществом:

Опыт разработки LLM-приложений (RAG, structured output, JSON Schema, function-calling) и multi-agent систем.

Опыт работы с gRPC, Kafka и др.

Знание юридических стандартов и особенностей обработки данных правового домена.

Опыт работы с облачными платформами (AWS/GCP/Azure), фреймворках (Hugging Face, NVIDIA).

Публикации в области NLP/LLM или участие в хакатонах/kaggle.

Умение быстро прототипировать MVP (FastAPI, Streamlit, React).

Что мы предлагаем:

Высокий уровень влияния: Возможность формировать техническую стратегию продукта уровня enterprise.

Экспертиза: Доступ к закрытым исследованиям СБЕР и коллаборации с командой GigaChat.

Условия: Гибкий график, полная удалёнка, ДМС, корпоративные программы.

Инструменты: Современный стек (LLM, векторные БД, MLOps), доступ к мощным вычислительным ресурсам.

Если вы готовы решать амбициозные задачи и трансформировать юридическую индустрию через ИИ — ждем ваше резюме!