Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии:
• Core модели – базовые модели;
• Продукты B2C – WEB-версия GigaChat, персонализированные интеллектуальные ассистенты и пр.;
• Внутренние банковские задачи – автоматизация обработки документов, анализ финансовых данных, поддержка сотрудников и пр.;
• Внешние заказчики – кастомные решения для корпоративных клиентов, интеграция LLM в бизнес-процессы и пр.
Обязанности
- cбор данных для alignment обучения моделей: Supervised Finetuning (SFT), Reinforcement Learning (RL, DPO , PPO, GRPO и пр.)
- улучшение пайплайнов предобработки данных для разметки и обучения
- работа в плотной связке с командой ML, LoRA-finetuning
- взаимодействие с командой асессоров/ разметчиков (мониторинг качества, корректировка инструкций и пр.)
- расчет метрик и принятие решений по улучшению качества данных на их основе.
Требования
- знания Python на очень высоком уровне
- опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Google Gemini, OpenAI GPT, Anthropic и пр.)
- понимание процессов работы с данными для больших языковых моделей
- способность решать проблемы и организовывать работу в условиях многозадачности.
Будет плюсом:
- опыт работы с LLM-агентами (LangChain, LangSmith, LangGraph, FAISS, RAG, ChromaDB и пр.).
Условия
- комфортный современный офис рядом с м. Кутузовская
- гибридный формат работы (2 дня в офисе, 3 дня на удалёнке)
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- система обучения для профессионального и карьерного развития
- расширенный полис ДМС с первого дня работы и страхование для семьи
- льготная программа ипотеки для сотрудников
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.