Мы — R&D команда проекта GigaLegal в СБЕР, создающая решения в правовой сфере на основе LLM для автоматизации юридических процессов.
Наша цель — трансформировать работу юристов, бизнеса и госструктур через:
- Автоматизацию анализа договоров и юридических документов
- Интеллектуальную генерацию правовых текстов
- Разработку специализированных юридических чат-ботов
- Создание автономных юридических ИИ-агентов
Мы в поиске опытного TL|Senior-специалиста, который возьмет на себя ответственность за разработку и внедрение LLM-решений, способных масштабировать бизнес-процессы наших клиентов.
Чем предстоит заниматься?
LLM-ориентированные решения :
Проектирование и реализация стратегий адаптации LLM (prompting, fine-tuning, LoRA, RLHF) под специфику юридических задач.
Проектирование и разработка пайплайнов для обработки юридических данных (RAG, агентские системы, семантический поиск).
Проектирование навыков и обучение LLM и NLP/Сlassic ML моделей для реализации бизнес-задач
Оптимизация производительности LLM в production (латентность, стоимость, точность).
Продакшен-инжиниринг :
Внедрение DS-моделей в production с использованием MLOps-практик (CI/CD, мониторинг, A/B-тесты).
Интеграция решений с внешними API, работа с векторными базами, поисковыми движками (ElasticSearch).
Проектирование отказоустойчивых систем для обработки конфиденциальных юридических данных.
Работа с SQL/No SQL БД
Лидерство и экспертиза :
Участие в постановке технических требований и взаимодействие с бизнес-заказчиками.
Проработка с юридическими экспертами, системными аналитиками, стороной заказчиков требований и вариантов решения задач
Проработка с отделом обучения тестовой и обучающей разметки для обучения юридическим навыкам GigaChat и других LLM
Менторство младших коллег, code review, разработка best practices для команды.
Анализ рисков и поиск компромиссов между качеством моделей, скоростью и стоимостью.
Возможно лидирование RND команды проекта и позиция TeamLead
Необходимые навыки:
Опыт : 3+ лет в DS/NLP, включая 1+ год работы с LLM, опыт с production.
Технические навыки :
Готовность как писать код, пайплайны, обучать модели, так и писать документацию, проектировать системы и готовить спецификации на модели, данные, пайплайны.
Глубокая экспертиза в адаптации LLM: SFT, RLHF, LoRA, prompt engineering.
Опыт построения RAG-систем, агентских пайплайнов и сервисов на основе LLM.
Знание современных фреймворков (PyTorch, Hugging Face, LangChain, LlamaIndex).
Уверенная работа с инфраструктурой: Docker, Kubernetes, облачные платформы.
Понимание MLOps: CI/CD, мониторинг дрифта данных, логирование.
Бизнес-ориентированность :
Опыт трансформации бизнес-задач в технические требования.
Умение оценивать ROI DS-решений и балансировать между инновациями и практичностью.
Умение быстро делать прототипы решений и искать баланс между скоростью/качеством/производительностью.
Soft Skills :
Умение аргументировать технические решения перед заказчиками.
Опыт управления мини-проектами и координации команд.
Умение коммуницировать с заказчиками и экспертами в различных доменных областях.
Будет преимуществом:
Опыт разработки LLM-приложений (RAG, structured output, JSON Schema, function-calling) и multi-agent систем.
Опыт работы с gRPC, Kafka и др.
Знание юридических стандартов и особенностей обработки данных правового домена.
Опыт работы с облачными платформами (AWS/GCP/Azure), фреймворках (Hugging Face, NVIDIA).
Публикации в области NLP/LLM или участие в хакатонах/kaggle.
Умение быстро прототипировать MVP (FastAPI, Streamlit, React).
Что мы предлагаем:
Высокий уровень влияния: Возможность формировать техническую стратегию продукта уровня enterprise.
Экспертиза: Доступ к закрытым исследованиям СБЕР и коллаборации с командой GigaChat.
Условия: Гибкий график, полная удалёнка, ДМС, корпоративные программы.
Инструменты: Современный стек (LLM, векторные БД, MLOps), доступ к мощным вычислительным ресурсам.
Если вы готовы решать амбициозные задачи и трансформировать юридическую индустрию через ИИ — ждем ваше резюме!